Schneider Electric nutzt Retrieval Augmented LLMs auf SageMaker, um Echtzeitaktualisierungen in seinen ERP-Systemen sicherzustellen

Neuauflage von Plato

Verfolger: 0

Dieser Beitrag wurde gemeinsam mit Anthony Medeiros, Manager of Solutions Engineering and Architecture für North America Artificial Intelligence, und Blake Santschi, Business Intelligence Manager, von Schneider Electric verfasst. Weitere Experten von Schneider Electric sind Jesse Miller, Somik Chowdhury, Shaswat Babhulgaonkar, David Watkins, Mark Carlson und Barbara Sleczkowski.

Enterprise-Resource-Planning-Systeme (ERP) werden von Unternehmen genutzt, um mehrere Geschäftsfunktionen wie Buchhaltung, Vertrieb oder Auftragsverwaltung in einem System zu verwalten. Insbesondere werden sie routinemäßig zur Speicherung von Informationen im Zusammenhang mit Kundenkonten verwendet. Verschiedene Organisationen innerhalb eines Unternehmens verwenden möglicherweise unterschiedliche ERP-Systeme und deren Zusammenführung ist eine komplexe technische Herausforderung im großen Maßstab, die domänenspezifisches Wissen erfordert.

Schneider Electric ist führend in der digitalen Transformation des Energiemanagements und der industriellen Automatisierung. Um die Bedürfnisse seiner Kunden bestmöglich zu erfüllen, muss Schneider Electric die Verknüpfungen zwischen den Konten verknüpfter Kunden in seinen ERP-Systemen im Auge behalten. Während ihr Kundenstamm wächst, kommen täglich neue Kunden hinzu, und ihre Account-Teams müssen diese neuen Kunden manuell sortieren und sie mit der richtigen übergeordneten Einheit verknüpfen.

Die Verknüpfungsentscheidung basiert auf den neuesten Informationen, die öffentlich im Internet oder in den Medien verfügbar sind, und kann durch kürzliche Akquisitionen, Marktnachrichten oder Geschäftsbereichsumstrukturierungen beeinflusst werden. Ein Beispiel für die Kontoverknüpfung wäre die Identifizierung der Beziehung zwischen Amazon und seiner Tochtergesellschaft Whole Foods Market [Quelle].

Schneider Electric setzt große Sprachmodelle ein, um Fragen in verschiedenen wissensspezifischen Bereichen zu beantworten. Das Datum, an dem das Modell trainiert wurde, schränkt sein Wissen ein. Sie haben sich dieser Herausforderung gestellt, indem sie ein großes Open-Source-Sprachmodell der Retriever-Augmented Generation verwendet haben, das auf verfügbar ist Amazon SageMaker-JumpStart um große Mengen an externem Wissen zu verarbeiten und Unternehmens- oder öffentliche Beziehungen zwischen ERP-Datensätzen aufzuzeigen.

Als Schneider Electric Anfang 2023 beschloss, einen Teil seines Kontoverknüpfungsprozesses mithilfe künstlicher Intelligenz (KI) zu automatisieren, ging das Unternehmen eine Partnerschaft mit dem AWS Machine Learning Solutions Lab (MLSL) ein. Mit der Expertise von MLSL in der ML-Beratung und -Ausführung war Schneider Electric in der Lage, eine KI-Architektur zu entwickeln, die den manuellen Aufwand in ihren Verknüpfungsworkflows reduziert und ihren nachgelagerten Analyseteams einen schnelleren Datenzugriff ermöglicht.

Generative KI

Generative KI und große Sprachmodelle (LLMs) verändern die Art und Weise, wie Unternehmensorganisationen traditionell komplexe Herausforderungen im Zusammenhang mit der Verarbeitung und dem Verständnis natürlicher Sprache lösen können. Zu den Vorteilen, die LLMs bieten, gehört die Fähigkeit, große Textteile zu verstehen und verwandte Fragen durch menschenähnliche Antworten zu beantworten. AWS macht es Kunden einfach, mit LLM-Workloads zu experimentieren und diese zu produzieren, indem viele Optionen über Amazon SageMaker JumpStart verfügbar gemacht werden. Amazonas Grundgestein und Amazonas-Titan.

Externer Wissenserwerb

LLMs sind für ihre Fähigkeit bekannt, menschliches Wissen zu komprimieren und haben bemerkenswerte Fähigkeiten bei der Beantwortung von Fragen in verschiedenen wissensspezifischen Bereichen bewiesen, ihr Wissen ist jedoch durch das Datum begrenzt, an dem das Modell trainiert wurde. Wir begegnen dieser Informationslücke, indem wir das LLM mit einer Google-Such-API koppeln, um ein leistungsstarkes Retrieval Augmented LLM (RAG) bereitzustellen, das die Herausforderungen von Schneider Electric bewältigt. Das RAG ist in der Lage, große Mengen an externem Wissen aus der Google-Suche zu verarbeiten und Unternehmens- oder öffentliche Beziehungen zwischen ERP-Datensätzen aufzuzeigen.

Siehe folgendes Beispiel:

Frage: Wer ist die Muttergesellschaft von One Medical?
Google-Anfrage: „One Medical Muttergesellschaft“ → Informationen → LLM
Antworten: One Medical, eine Tochtergesellschaft von Amazon…

Das vorangehende Beispiel (entnommen aus der Kundendatenbank von Schneider Electric) betrifft eine Akquisition, die im Februar 2023 stattfand und daher aufgrund von Wissenskürzungen nicht allein vom LLM erfasst würde. Die Ergänzung des LLM mit der Google-Suche garantiert die aktuellsten Informationen.

Flan-T5-Modell

In diesem Projekt haben wir das Flan-T5-XXL-Modell von verwendet Flan-T5 Modellfamilie.

Die Flan-T5-Modelle sind auf Anweisungen abgestimmt und daher in der Lage, verschiedene Zero-Shot-NLP-Aufgaben auszuführen. In unserer nachgelagerten Aufgabe war es nicht erforderlich, eine große Menge an Weltwissen unterzubringen, sondern vielmehr eine gute Leistung bei der Beantwortung von Fragen in einem Kontext von Texten zu erbringen, die durch Suchergebnisse bereitgestellt wurden, und daher schnitt das 11B-Parameter-T5-Modell gut ab.

JumpStart bietet eine komfortable Bereitstellung dieser Modellfamilie durch Amazon SageMaker-Studio und das SageMaker SDK. Dazu gehören Flan-T5 Small, Flan-T5 Base, Flan-T5 Large, Flan-T5 XL und Flan-T5 XXL. Darüber hinaus bietet JumpStart einige Versionen von Flan-T5 XXL mit unterschiedlichen Quantisierungsstufen an. Wir haben Flan-T5-XXL zur Inferenzverwendung an einem Endpunkt bereitgestellt Amazon SageMaker Studio-Jumpstart.

Pfad zu Flan-T5 SageMaker JumpStart

Retrieval Augmented LLM mit LangChain

LangChain ist ein beliebtes und schnell wachsendes Framework, das die Entwicklung von Anwendungen auf Basis von LLMs ermöglicht. Es basiert auf dem Konzept von KettenHierbei handelt es sich um Kombinationen verschiedener Komponenten, die die Funktionalität von LLMs für eine bestimmte Aufgabe verbessern sollen. Es ermöglicht uns zum Beispiel, Anpassungen vorzunehmen Eingabeaufforderungen und LLMs mit verschiedenen Tools wie externen Suchmaschinen oder Datenquellen integrieren. In unserem Anwendungsfall haben wir Google verwendet Serper Komponente zum Durchsuchen des Webs und stellte das verfügbare Flan-T5-XXL-Modell bereit Amazon SageMaker Studio-Jumpstart. LangChain übernimmt die Gesamtorchestrierung und ermöglicht die Einspeisung der Suchergebnisseiten in die Flan-T5-XXL-Instanz.

Die Retrieval-Augmented Generation (RAG) besteht aus zwei Schritten:

Abruf relevanter Textteile aus externen Quellen
Augmentation der Chunks mit Kontext in der Eingabeaufforderung an den LLM.

Für den Anwendungsfall von Schneider Electric geht das RAG wie folgt vor:

Der angegebene Firmenname wird mit einer Frage wie „Wer ist die Muttergesellschaft von
Die extrahierten Informationen werden mit der Eingabeaufforderung und der Originalfrage kombiniert und zur Beantwortung an das LLM weitergeleitet.

Das folgende Diagramm veranschaulicht diesen Vorgang.

RAG-Workflow

Verwenden Sie den folgenden Code, um einen Endpunkt zu erstellen:

# Spin FLAN-T5-XXL Sagemaker Endpoint
llm = SagemakerEndpoint(...)

Suchtool instanziieren:

search = GoogleSerperAPIWrapper()
search_tool = Tool( name="Search", func=search.run, description="useful for when you need to ask with search", verbose=False)

Im folgenden Code verketten wir die Abruf- und Erweiterungskomponenten:

my_template = """
Answer the following question using the information. n
Question : {question}? n
Information : {search_result} n
Answer: """
prompt_template = PromptTemplate( input_variables=["question", 'search_result'], template=my_template)
question_chain = LLMChain( llm=llm, prompt=prompt_template, output_key="answer") def search_and_reply_company(company): # Retrieval search_result = search_tool.run(f"{company} parent company") # Augmentation output = question_chain({ "question":f"Who is the parent company of {company}?", "search_result": search_result}) return output["answer"] search_and_reply_company("Whole Foods Market") "Amazon"

Das prompte Engineering

Die Kombination aus Kontext und Frage wird als Eingabeaufforderung bezeichnet. Wir haben festgestellt, dass die von uns verwendete pauschale Eingabeaufforderung (Variationen rund um die Frage nach der Muttergesellschaft) für die meisten öffentlichen Sektoren (Domänen) gut funktionierte, sich jedoch nicht gut auf Bildung oder Gesundheitswesen übertragen ließ, da der Begriff der Muttergesellschaft dort keine Bedeutung hat. Für Bildung haben wir „X“ verwendet, während wir für das Gesundheitswesen „Y“ verwendet haben.

Um diese domänenspezifische Eingabeaufforderungsauswahl zu ermöglichen, mussten wir auch die Domäne identifizieren, zu der ein bestimmtes Konto gehört. Hierzu verwendeten wir auch eine RAG, bei der eine Multiple-Choice-Frage „Was ist die Domain von {account}?“ lautete. Als ersten Schritt erkundigten wir uns und auf der Grundlage der Antwort erkundigten wir uns im zweiten Schritt über die entsprechende Eingabeaufforderung beim übergeordneten Konto. Siehe den folgenden Code:

my_template_options = """
Answer the following question using the information. n
Question :  {question}? n
Information : {search_result} n
Options :n {options} n
Answer: """ prompt_template_options = PromptTemplate(
input_variables=["question", 'search_result', 'options'],
template=my_template_options)
question_chain = LLMChain( llm=llm, prompt=prompt_template_options, output_key="answer") my_options = """
- healthcare
- education
- oil and gas
- banking
- pharma
- other domain """ def search_and_reply_domain(company):
search_result = search_tool.run(f"{company} ")
output = question_chain({ "question":f"What is the domain of {company}?", "search_result": search_result, "options":my_options})
return output["answer"] search_and_reply_domain("Exxon Mobil") "oil and gas"

Die branchenspezifischen Eingabeaufforderungen haben die Gesamtleistung von 55 % auf 71 % der Genauigkeit gesteigert. Insgesamt ist der Aufwand und die Zeit, die in die Entwicklung investiert werden, effektiv Eingabeaufforderungen scheinen die Qualität der LLM-Antwort deutlich zu verbessern.

RAG mit tabellarischen Daten (SEC-10k)

Die SEC 10K-Einreichungen sind eine weitere zuverlässige Informationsquelle für Tochtergesellschaften und Unterabteilungen, die jährlich von börsennotierten Unternehmen eingereicht werden. Diese Einreichungen sind direkt bei der SEC verfügbar EDGAR Oder durch BodyWatch API.

Wir gehen davon aus, dass die Informationen tabellarisch vorliegen. Unten ist ein Pseudo csv Datensatz, der das Originalformat des SEC-10K-Datensatzes nachahmt. Es ist möglich, mehrere zusammenzuführen csv Datenquellen in einen kombinierten Pandas-Datenrahmen:

# A pseudo dataset similar by schema to the CorpWatch API dataset df.head()

index	relation_id source_cw_id	target_cw_id	parent subsidiary 1 90 22569 37 AMAZON WHOLE FOODS MARKET
873 1467 22569 781 AMAZON TWITCH
899 1505 22569 821 AMAZON ZAPPOS
900 1506 22569 821 AMAZON ONE MEDICAL
901 1507 22569 821 AMAZON WOOT!

Die LangChain bietet eine Abstraktionsschicht für Pandas create_pandas_dataframe_agent. Die Verwendung von LangChain/LLMs für diese Aufgabe bietet zwei wesentliche Vorteile:

Sobald es hochgefahren ist, ermöglicht es einem nachgeschalteten Verbraucher, mit dem Datensatz in natürlicher Sprache statt in Code zu interagieren
Es ist robuster gegenüber Rechtschreibfehlern und unterschiedlichen Benennungsmethoden für Konten.

Wir drehen den Endpunkt wie oben beschrieben und erstellen den Agenten:

# Create pandas dataframe agent agent = create_pandas_dataframe_agent(llm, df, varbose=True)

Im folgenden Code fragen wir nach der Mutter-/Tochterbeziehung und der Agent übersetzt die Abfrage in die Pandas-Sprache:

# Example 1
query = "Who is the parent of WHOLE FOODS MARKET?"
agent.run(query) #### output
> Entering new AgentExecutor chain...
Thought: I need to find the row with WHOLE FOODS MARKET in the subsidiary column
Action: python_repl_ast
Action Input: df[df['subsidiary'] == 'WHOLE FOODS MARKET']
Observation:
source_cw_id	target_cw_id	parent subsidiary
22569 37 AMAZON WHOLE FOODS MARKET
Thought: I now know the final answer
Final Answer: AMAZON
> Finished chain.

# Example 2
query = "Who are the subsidiaries of Amazon?"
agent.run(query)
#### output
> Entering new AgentExecutor chain...
Thought: I need to find the row with source_cw_id of 22569
Action: python_repl_ast
Action Input: df[df['source_cw_id'] == 22569]
...
Thought: I now know the final answer
Final Answer: The subsidiaries of Amazon are Whole Foods Market, Twitch, Zappos, One Medical, Woot!...> Finished chain. 'The subsidiaries of Amazon are Whole Foods Market, Twitch, Zappos, One Medical, Woot!.'

Zusammenfassung

In diesem Beitrag haben wir detailliert beschrieben, wie wir mithilfe von Bausteinen von LangChain ein LLM mit Suchfunktionen erweitert haben, um Beziehungen zwischen den Kundenkonten von Schneider Electric aufzudecken. Wir haben die anfängliche Pipeline auf einen zweistufigen Prozess mit Domänenidentifizierung erweitert, bevor wir für eine höhere Genauigkeit eine domänenspezifische Eingabeaufforderung verwendet haben.

Zusätzlich zur Google-Suchanfrage können Datensätze, die Unternehmensstrukturen detailliert beschreiben, wie etwa die SEC-10K-Einreichungen, verwendet werden, um das LLM mit vertrauenswürdigen Informationen weiter zu ergänzen. Das Team von Schneider Electric wird außerdem in der Lage sein, eigene Eingabeaufforderungen zu erweitern und zu entwerfen, die die Art und Weise nachahmen, wie sie einige Konten des öffentlichen Sektors klassifizieren, wodurch die Genauigkeit der Pipeline weiter verbessert wird. Diese Fähigkeiten werden es Schneider Electric ermöglichen, aktuelle und genaue Organisationsstrukturen seiner Kunden aufrechtzuerhalten und die Möglichkeit zu schaffen, Analysen auf der Grundlage dieser Daten durchzuführen.

Über die Autoren

Antonius Medeiros ist Manager für Solutions Engineering und Architektur bei Schneider Electric. Er ist auf die Bereitstellung hochwertiger KI/ML-Initiativen für viele Geschäftsfunktionen in Nordamerika spezialisiert. Mit 17 Jahren Erfahrung bei Schneider Electric bringt er umfangreiche Branchenkenntnisse und technisches Fachwissen in das Team ein.

Blake Sanstchi ist Business Intelligence Manager bei Schneider Electric und leitet ein Analyseteam, das sich auf die Unterstützung der Vertriebsorganisation durch datengesteuerte Erkenntnisse konzentriert.

Joshua Levy ist Senior Applied Science Manager im Amazon Machine Learning Solutions-Labor, wo er Kunden beim Entwerfen und Erstellen von KI/ML-Lösungen zur Lösung wichtiger Geschäftsprobleme unterstützt.

Kosta Belz ist Senior Applied Scientist bei AWS MLSL mit Schwerpunkt auf generativer KI und Dokumentenverarbeitung. Seine Leidenschaft gilt der Entwicklung von Anwendungen mithilfe von Knowledge Graphs und NLP. Er verfügt über rund 10 Jahre Erfahrung im Aufbau von Daten- und KI-Lösungen, um Mehrwert für Kunden und Unternehmen zu schaffen.

Aude Genevay ist Angewandte Wissenschaftlerin im Amazon GenAI Incubator, wo sie Kunden bei der Lösung wichtiger Geschäftsprobleme durch ML und KI unterstützt. Zuvor war sie als Forscherin im Bereich theoretisches ML tätig und genießt es, ihr Wissen anzuwenden, um Kunden hochmoderne Lösungen zu liefern.

MD Sirajus Salekin ist angewandter Wissenschaftler am AWS Machine Learning Solution Lab. Er hilft AWS-Kunden, ihr Geschäft durch die Entwicklung von KI/ML-Lösungen zu beschleunigen. Seine Forschungsinteressen sind multimodales maschinelles Lernen, generative KI und ML-Anwendungen im Gesundheitswesen.

Zichen Wang, PhD, ist Senior Applied Scientist bei AWS. Mit mehrjähriger Forschungserfahrung in der Entwicklung von ML und statistischen Methoden unter Verwendung biologischer und medizinischer Daten arbeitet er mit Kunden aus verschiedenen Branchen zusammen, um ihre ML-Probleme zu lösen.

Anton Gridin ist ein Principal Solutions Architect mit Sitz in New York City, der globale Industriekunden unterstützt. Er verfügt über mehr als 15 Jahre Erfahrung in der Entwicklung sicherer Anwendungen und in der Leitung von Engineering-Teams.

SEO-gestützte Content- und PR-Distribution. Holen Sie sich noch heute Verstärkung.
PlatoData.Network Vertikale generative KI. Motiviere dich selbst. Hier zugreifen.
PlatoAiStream. Web3-Intelligenz. Wissen verstärkt. Hier zugreifen.
PlatoESG. Kohlenstoff, CleanTech, Energie, Umwelt, Solar, Abfallwirtschaft. Hier zugreifen.
PlatoHealth. Informationen zu Biotechnologie und klinischen Studien. Hier zugreifen.
Quelle: https://aws.amazon.com/blogs/machine-learning/schneider-electric-leverages-retrieval-augmented-llms-on-sagemaker-to-ensure-real-time-updates-in-their-erp-systems/

Zeitstempel: 31. Oktober 2023

Zeitstempel: 1. Juni 2023

Neuauflage von Plato

Effizienz steigern: Die Leistungsfähigkeit der selektiven Ausführung in Amazon SageMaker Pipelines nutzen | Amazon Web Services

Automatisieren Sie die Dokumentenvalidierung und Betrugserkennung im Hypothekenzeichnungsprozess mit AWS AI Services: Teil 1 | Amazon Web Services

KI/ML-gesteuerte umsetzbare Erkenntnisse und Themen für Amazon-Drittanbieter, die AWS verwenden

Wie OCX Cognition mithilfe von AWS Step Functions und Amazon SageMaker | die Zeit für die Entwicklung von ML-Modellen von Wochen auf Tage und die Zeit für die Aktualisierung von Modellen von Tagen auf Echtzeit reduzierte Amazon Web Services

Transformation der qualitativen Forschung durch die Automatisierung von Sprache in Text-zu-Text-Analysen

Identifizieren Sie potenzielle Ursachen in geschäftskritischen Anomalien mit Amazon Lookout for Metrics

Amazon SageMaker-Experimente der nächsten Generation – Organisieren, verfolgen und vergleichen Sie Ihre Schulungen zum maschinellen Lernen im großen Maßstab

Über uns

Vertikale Suche & Ai

Plattform

Bleiben Sie in Verbindung

Konto