Schneider Electric exploite les LLM de récupération augmentée sur SageMaker pour garantir des mises à jour en temps réel dans ses systèmes ERP

Republié par Platon

Suiveurs: 0

Cet article a été co-écrit avec Anthony Medeiros, responsable de l'ingénierie et de l'architecture de solutions pour l'intelligence artificielle en Amérique du Nord, et Blake Santschi, responsable de la Business Intelligence chez Schneider Electric. Parmi les autres experts de Schneider Electric figurent Jesse Miller, Somik Chowdhury, Shaswat Babhulgaonkar, David Watkins, Mark Carlson et Barbara Sleczkowski.

Les systèmes de planification des ressources d'entreprise (ERP) sont utilisés par les entreprises pour gérer plusieurs fonctions commerciales telles que la comptabilité, les ventes ou la gestion des commandes dans un seul système. Ils sont notamment couramment utilisés pour stocker des informations liées aux comptes clients. Différentes organisations au sein d'une entreprise peuvent utiliser différents systèmes ERP et leur fusion constitue un défi technique complexe à grande échelle qui nécessite des connaissances spécifiques à un domaine.

Schneider Electric est un leader de la transformation numérique de la gestion de l'énergie et de l'automatisation industrielle. Pour répondre au mieux aux besoins de ses clients, Schneider Electric doit assurer le suivi des liens entre les comptes clients associés dans ses systèmes ERP. À mesure que leur clientèle s'agrandit, de nouveaux clients sont ajoutés quotidiennement et leurs équipes de compte doivent trier manuellement ces nouveaux clients et les relier à l'entité mère appropriée.

La décision de liaison est basée sur les informations les plus récentes disponibles publiquement sur Internet ou dans les médias et peut être affectée par des acquisitions récentes, des nouvelles du marché ou une restructuration de division. Un exemple de liaison de compte serait d'identifier la relation entre Amazon et sa filiale Whole Foods Market [la source].

Schneider Electric déploie de grands modèles de langage en raison de leurs capacités à répondre à des questions dans divers domaines de connaissances spécifiques. La date à laquelle le modèle a été formé limite ses connaissances. Ils ont relevé ce défi en utilisant un grand modèle de langage open source Retriever-Augmented Generation disponible sur Amazon SageMaker JumpStart pour traiter de grandes quantités de connaissances externes extraites et exposer les relations d'entreprise ou publiques entre les enregistrements ERP.

Début 2023, lorsque Schneider Electric a décidé d'automatiser une partie de son processus de liaison de comptes grâce à l'intelligence artificielle (IA), l'entreprise s'est associée à l'AWS Machine Learning Solutions Lab (MLSL). Grâce à l'expertise de MLSL en matière de conseil et d'exécution de ML, Schneider Electric a pu développer une architecture d'IA qui réduirait l'effort manuel dans ses flux de travail de liaison et fournirait un accès plus rapide aux données à ses équipes d'analyse en aval.

IA générative

L'IA générative et les grands modèles linguistiques (LLM) transforment la façon dont les organisations commerciales sont capables de résoudre des défis traditionnellement complexes liés au traitement et à la compréhension du langage naturel. Certains des avantages offerts par les LLM incluent la capacité de comprendre de grandes portions de texte et de répondre à des questions connexes en produisant des réponses de type humain. AWS permet aux clients d'expérimenter et de produire facilement des charges de travail LLM en proposant de nombreuses options via Amazon SageMaker JumpStart, Socle amazonienet une Titan d'Amazonie.

Acquisition de connaissances externes

Les LLM sont connus pour leur capacité à compresser les connaissances humaines et ont démontré des capacités remarquables à répondre à des questions dans divers domaines de connaissances spécifiques, mais leurs connaissances sont limitées par la date à laquelle le modèle a été formé. Nous comblons cette coupure d'informations en couplant le LLM avec une API de recherche Google pour fournir un puissant LLM de récupération augmentée (RAG) qui répond aux défis de Schneider Electric. Le RAG est capable de traiter de grandes quantités de connaissances externes extraites de la recherche Google et de présenter des relations d'entreprise ou publiques entre les enregistrements ERP.

Voir l'exemple suivant:

Question: Qui est la société mère de One Medical ?
Requête Google : « Société mère One Medical » → informations → LLM
Réponse One Medical, filiale d'Amazon…

L'exemple précédent (tiré de la base de données clients de Schneider Electric) concerne une acquisition intervenue en février 2023 et qui ne serait donc pas prise en compte par le LLM seul en raison de coupures de connaissances. L'augmentation du LLM avec la recherche Google garantit les informations les plus à jour.

Modèle Flan-T5

Dans ce projet, nous avons utilisé le modèle Flan-T5-XXL du Flan-T5 famille de modèles.

Les modèles Flan-T5 sont adaptés aux instructions et sont donc capables d'effectuer diverses tâches PNL sans tir. Dans notre tâche en aval, il n'était pas nécessaire de prendre en compte une grande quantité de connaissances mondiales, mais plutôt de bien répondre aux questions compte tenu d'un contexte de textes fournis via les résultats de recherche, et par conséquent, le modèle T11 à paramètres 5B a bien fonctionné.

JumpStart permet un déploiement pratique de cette famille de modèles via Amazon SageMakerStudio et le SDK SageMaker. Cela inclut Flan-T5 Small, Flan-T5 Base, Flan-T5 Large, Flan-T5 XL et Flan-T5 XXL. De plus, JumpStart propose quelques versions de Flan-T5 XXL à différents niveaux de quantification. Nous avons déployé Flan-T5-XXL sur un point final pour l'inférence en utilisant Démarrage d'Amazon SageMaker Studio.

Chemin vers Flan-T5 SageMaker JumpStart

Récupération augmentée LLM avec LangChain

LangChaîne est un framework populaire et en croissance rapide permettant le développement d'applications alimentées par des LLM. Il est basé sur la notion de Chaînes, qui sont des combinaisons de différents composants conçus pour améliorer la fonctionnalité des LLM pour une tâche donnée. Par exemple, cela nous permet de personnaliser instructions et intégrez les LLM avec différents outils tels que des moteurs de recherche externes ou des sources de données. Dans notre cas d'utilisation, nous avons utilisé Google Serper composant pour rechercher sur le Web, et déployé le modèle Flan-T5-XXL disponible sur Démarrage d'Amazon SageMaker Studio. LangChain effectue l'orchestration globale et permet aux pages de résultats de recherche d'être introduites dans l'instance Flan-T5-XXL.

La génération de récupération augmentée (RAG) se compose de deux étapes :

Récupération de morceaux de texte pertinents provenant de sources externes
Augmentation des morceaux avec le contexte dans l'invite donnée au LLM.

Pour le cas d'usage de Schneider Electric, le RAG procède comme suit :

Le nom de l'entreprise donné est combiné avec une question du type « Qui est la société mère de X », où X est la société donnée) et transmis à une requête Google à l'aide de l'IA Serper.
Les informations extraites sont combinées avec la question rapide et originale et transmises au LLM pour réponse.

Le schéma suivant illustre ce processus.

Flux de travail RAG

Utilisez le code suivant pour créer un point de terminaison :

# Spin FLAN-T5-XXL Sagemaker Endpoint
llm = SagemakerEndpoint(...)

Outil de recherche instancié :

search = GoogleSerperAPIWrapper()
search_tool = Tool( name="Search", func=search.run, description="useful for when you need to ask with search", verbose=False)

Dans le code suivant, nous enchaînons les composants de récupération et d’augmentation :

my_template = """
Answer the following question using the information. n
Question : {question}? n
Information : {search_result} n
Answer: """
prompt_template = PromptTemplate( input_variables=["question", 'search_result'], template=my_template)
question_chain = LLMChain( llm=llm, prompt=prompt_template, output_key="answer") def search_and_reply_company(company): # Retrieval search_result = search_tool.run(f"{company} parent company") # Augmentation output = question_chain({ "question":f"Who is the parent company of {company}?", "search_result": search_result}) return output["answer"] search_and_reply_company("Whole Foods Market") "Amazon"

L'ingénierie rapide

La combinaison du contexte et de la question s'appelle l'invite. Nous avons remarqué que l'invite générale que nous avons utilisée (variations autour de la demande de société mère) fonctionnait bien pour la plupart des secteurs publics (domaines), mais ne se généralisait pas bien à l'éducation ou à la santé, car la notion de société mère n'y a pas de sens. Pour l’éducation, nous avons utilisé « X » tandis que pour les soins de santé, nous avons utilisé « Y ».

Pour activer cette sélection d'invite spécifique à un domaine, nous avons également dû identifier le domaine auquel appartient un compte donné. Pour cela, nous avons également utilisé un RAG où une question à choix multiples « Quel est le domaine de {compte} ? » dans un premier temps, et sur la base de la réponse que nous avons demandée au parent du compte en utilisant l'invite correspondante dans un deuxième temps. Voir le code suivant :

my_template_options = """
Answer the following question using the information. n
Question :  {question}? n
Information : {search_result} n
Options :n {options} n
Answer: """ prompt_template_options = PromptTemplate(
input_variables=["question", 'search_result', 'options'],
template=my_template_options)
question_chain = LLMChain( llm=llm, prompt=prompt_template_options, output_key="answer") my_options = """
- healthcare
- education
- oil and gas
- banking
- pharma
- other domain """ def search_and_reply_domain(company):
search_result = search_tool.run(f"{company} ")
output = question_chain({ "question":f"What is the domain of {company}?", "search_result": search_result, "options":my_options})
return output["answer"] search_and_reply_domain("Exxon Mobil") "oil and gas"

Les invites spécifiques au secteur ont amélioré les performances globales de 55 % à 71 % de précision. Dans l’ensemble, les efforts et le temps investis pour développer des instructions semblent améliorer considérablement la qualité de la réponse LLM.

RAG avec données tabulaires (SEC-10k)

Les dépôts SEC 10K sont une autre source d'informations fiable pour les filiales et subdivisions déposées chaque année par une société cotée en bourse. Ces dépôts sont disponibles directement sur SEC EDGAR Ou à travers CorpWatch API.

Nous supposons que les informations sont fournies sous forme de tableau. Ci-dessous un pseudo csv ensemble de données qui imite le format original de l’ensemble de données SEC-10K. Il est possible de fusionner plusieurs csv sources de données dans une trame de données pandas combinée :

# A pseudo dataset similar by schema to the CorpWatch API dataset df.head()

index	relation_id source_cw_id	target_cw_id	parent subsidiary 1 90 22569 37 AMAZON WHOLE FOODS MARKET
873 1467 22569 781 AMAZON TWITCH
899 1505 22569 821 AMAZON ZAPPOS
900 1506 22569 821 AMAZON ONE MEDICAL
901 1507 22569 821 AMAZON WOOT!

Le LangChain fournit une couche d'abstraction pour les pandas via create_pandas_dataframe_agent. Il y a deux avantages clés à utiliser LangChain/LLM pour cette tâche :

Une fois lancé, il permet à un consommateur en aval d'interagir avec l'ensemble de données en langage naturel plutôt qu'en code.
Il est plus résistant aux fautes d’orthographe et aux différentes manières de nommer les comptes.

Nous faisons tourner le point de terminaison comme ci-dessus et créons l'agent :

# Create pandas dataframe agent agent = create_pandas_dataframe_agent(llm, df, varbose=True)

Dans le code suivant, nous recherchons la relation parent/filiale et l'agent traduit la requête en langage pandas :

# Example 1
query = "Who is the parent of WHOLE FOODS MARKET?"
agent.run(query) #### output
> Entering new AgentExecutor chain...
Thought: I need to find the row with WHOLE FOODS MARKET in the subsidiary column
Action: python_repl_ast
Action Input: df[df['subsidiary'] == 'WHOLE FOODS MARKET']
Observation:
source_cw_id	target_cw_id	parent subsidiary
22569 37 AMAZON WHOLE FOODS MARKET
Thought: I now know the final answer
Final Answer: AMAZON
> Finished chain.

# Example 2
query = "Who are the subsidiaries of Amazon?"
agent.run(query)
#### output
> Entering new AgentExecutor chain...
Thought: I need to find the row with source_cw_id of 22569
Action: python_repl_ast
Action Input: df[df['source_cw_id'] == 22569]
...
Thought: I now know the final answer
Final Answer: The subsidiaries of Amazon are Whole Foods Market, Twitch, Zappos, One Medical, Woot!...> Finished chain. 'The subsidiaries of Amazon are Whole Foods Market, Twitch, Zappos, One Medical, Woot!.'

Conclusion

Dans cet article, nous avons détaillé comment nous avons utilisé les éléments de base de LangChain pour compléter un LLM avec des capacités de recherche, afin de découvrir les relations entre les comptes clients de Schneider Electric. Nous avons étendu le pipeline initial à un processus en deux étapes avec identification de domaine avant d'utiliser une invite spécifique au domaine pour une plus grande précision.

En plus de la requête de recherche Google, des ensembles de données détaillant les structures d'entreprise telles que les dépôts SEC 10K peuvent être utilisés pour enrichir davantage le LLM avec des informations fiables. L'équipe de Schneider Electric sera également en mesure d'étendre et de concevoir ses propres invites imitant la façon dont elle classe certains comptes du secteur public, améliorant ainsi encore la précision du pipeline. Ces capacités permettront à Schneider Electric de maintenir à jour et précises les structures organisationnelles de ses clients, et de débloquer la possibilité d'effectuer des analyses sur ces données.

À propos des auteurs

Antoine Medeiros est responsable de l'ingénierie et de l'architecture de solutions chez Schneider Electric. Il se spécialise dans la mise en œuvre d'initiatives d'IA/ML de grande valeur pour de nombreuses fonctions commerciales en Amérique du Nord. Avec 17 ans d'expérience chez Schneider Electric, il apporte à l'équipe une richesse de connaissances industrielles et d'expertise technique.

Blake Sanstchi est Business Intelligence Manager chez Schneider Electric, à la tête d'une équipe d'analyse axée sur le soutien de l'organisation commerciale grâce à des informations basées sur les données.

Josué Lévy est directeur principal des sciences appliquées au sein du laboratoire Amazon Machine Learning Solutions, où il aide les clients à concevoir et à créer des solutions d'IA/ML pour résoudre des problèmes commerciaux clés.

Kosta Belz est un scientifique appliqué senior chez AWS MLSL, spécialisé dans l'IA générative et le traitement de documents. Il est passionné par la création d'applications à l'aide des Knowledge Graphs et du NLP. Il possède environ 10 ans d'expérience dans la création de solutions de données et d'IA pour créer de la valeur pour les clients et les entreprises.

Aude Genèvey est scientifique appliquée au sein de l'incubateur Amazon GenAI, où elle aide les clients à résoudre des problèmes commerciaux clés grâce au ML et à l'IA. Elle était auparavant chercheuse en ML théorique et aime appliquer ses connaissances pour proposer des solutions de pointe aux clients.

Md Sirajus Salekin est un scientifique appliqué chez AWS Machine Learning Solution Lab. Il aide les clients AWS à accélérer leur activité en créant des solutions IA/ML. Ses intérêts de recherche portent sur l'apprentissage automatique multimodal, l'IA générative et les applications de ML dans le domaine de la santé.

Zichen Wang, PhD, est un scientifique appliqué senior chez AWS. Fort de plusieurs années d'expérience en recherche dans le développement de méthodes de ML et de statistiques utilisant des données biologiques et médicales, il travaille avec des clients de divers secteurs verticaux pour résoudre leurs problèmes de ML.

Anton Gridin est un architecte de solutions principal soutenant les comptes industriels mondiaux, basé à New York. Il possède plus de 15 ans d’expérience dans la création d’applications sécurisées et dans la direction d’équipes d’ingénierie.

Contenu propulsé par le référencement et distribution de relations publiques. Soyez amplifié aujourd'hui.
PlatoData.Network Ai générative verticale. Autonomisez-vous. Accéder ici.
PlatoAiStream. Intelligence Web3. Connaissance Amplifiée. Accéder ici.
PlatonESG. Carbone, Technologie propre, Énergie, Environnement, Solaire, La gestion des déchets. Accéder ici.
PlatoHealth. Veille biotechnologique et essais cliniques. Accéder ici.
La source: https://aws.amazon.com/blogs/machine-learning/schneider-electric-leverages-retrieval-augmented-llms-on-sagemaker-to-ensure-real-time-updates-in-their-erp-systems/

Horodatage: 31 octobre 2023

Horodatage: 6 mai 2022

Comment JPMorgan Chase & Co. utilise les événements AWS DeepRacer pour favoriser l'adoption mondiale du cloud

Cluster source:

Apprentissage automatique AWS

Nœud source: 1761091

Horodatage: Le 23 novembre 2022

Améliorez l'IA conversationnelle grâce à des techniques de routage avancées avec Amazon Bedrock | Services Web Amazon

Cluster source:

Apprentissage automatique AWS

Nœud source: 1968035

Horodatage: 24 avril 2024

Republié par Platon

Comment xarvio Digital Farming Solutions accélère son développement avec les capacités géospatiales d'Amazon SageMaker

Connectez facilement Amazon Athena à Amazon Lookout for Metrics pour détecter les anomalies

Comment JPMorgan Chase & Co. utilise les événements AWS DeepRacer pour favoriser l'adoption mondiale du cloud

À propos de nous

Recherche verticale et Ai

Plateforme

Restez à l'affût

Compte