Schneider Electric sfrutta il Retrieval Augmented LLM su SageMaker per garantire aggiornamenti in tempo reale nei propri sistemi ERP

Ripubblicato da Platone

Seguaci: 0

Questo post è stato scritto in collaborazione con Anthony Medeiros, Manager of Solutions Engineering and Architecture for North America Artificial Intelligence, e Blake Santschi, Business Intelligence Manager, di Schneider Electric. Altri esperti di Schneider Electric includono Jesse Miller, Somik Chowdhury, Shaswat Babhulgaonkar, David Watkins, Mark Carlson e Barbara Sleczkowski.

I sistemi ERP (Enterprise Resource Planning) vengono utilizzati dalle aziende per gestire diverse funzioni aziendali come la contabilità, le vendite o la gestione degli ordini in un unico sistema. In particolare, vengono abitualmente utilizzati per archiviare informazioni relative ai conti dei clienti. Diverse organizzazioni all'interno di un'azienda potrebbero utilizzare diversi sistemi ERP e fonderli è una sfida tecnica complessa su larga scala che richiede conoscenze specifiche del settore.

Schneider Electric è leader nella trasformazione digitale della gestione energetica e dell'automazione industriale. Per soddisfare al meglio le esigenze dei propri clienti, Schneider Electric deve tenere traccia dei collegamenti tra gli account dei clienti correlati nei propri sistemi ERP. Man mano che la loro base clienti cresce, nuovi clienti vengono aggiunti ogni giorno e i loro team account devono ordinare manualmente questi nuovi clienti e collegarli all'entità madre corretta.

La decisione di collegamento si basa sulle informazioni più recenti disponibili pubblicamente su Internet o nei media e potrebbe essere influenzata da recenti acquisizioni, notizie di mercato o ristrutturazioni divisionali. Un esempio di collegamento dell'account potrebbe essere quello di identificare la relazione tra Amazon e la sua controllata Whole Foods Market [source].

Schneider Electric sta implementando modelli linguistici di grandi dimensioni per le loro capacità di rispondere a domande in vari domini specifici della conoscenza, la data in cui il modello è stato addestrato ne limita la conoscenza. Hanno affrontato questa sfida utilizzando un modello linguistico di grandi dimensioni open source Retriever-Augmented Generation disponibile su JumpStart di Amazon SageMaker per elaborare grandi quantità di conoscenza esterna estratta ed esporre relazioni aziendali o pubbliche tra i record ERP.

All'inizio del 2023, quando Schneider Electric ha deciso di automatizzare parte del processo di collegamento degli account utilizzando l'intelligenza artificiale (AI), l'azienda ha collaborato con AWS Machine Learning Solutions Lab (MLSL). Grazie all'esperienza di MLSL nella consulenza ed esecuzione di ML, Schneider Electric è stata in grado di sviluppare un'architettura AI in grado di ridurre lo sforzo manuale nei flussi di lavoro di collegamento e fornire un accesso più rapido ai dati ai team di analisi a valle.

AI generativa

L’intelligenza artificiale generativa e i modelli linguistici di grandi dimensioni (LLM) stanno trasformando il modo in cui le organizzazioni aziendali sono in grado di risolvere sfide tradizionalmente complesse legate all’elaborazione e alla comprensione del linguaggio naturale. Alcuni dei vantaggi offerti dai LLM includono la capacità di comprendere ampie porzioni di testo e di rispondere a domande correlate producendo risposte simili a quelle umane. AWS consente ai clienti di sperimentare e produrre facilmente carichi di lavoro LLM rendendo disponibili molte opzioni tramite Amazon SageMaker JumpStart, Roccia Amazzonicae Titano Amazzonico.

Acquisizione di conoscenze esterne

Gli LLM sono noti per la loro capacità di comprimere la conoscenza umana e hanno dimostrato notevoli capacità nel rispondere a domande in vari domini specifici della conoscenza, ma la loro conoscenza è limitata dalla data in cui il modello è stato addestrato. Affrontiamo questo limite di informazioni accoppiando LLM con un'API di ricerca di Google per fornire un potente Retrieval Augmented LLM (RAG) che affronta le sfide di Schneider Electric. Il RAG è in grado di elaborare grandi quantità di dati esterni estratti dalla ricerca di Google e di mostrare relazioni aziendali o pubbliche tra i record ERP.

Vedi il seguente esempio:

Domanda: Chi è la società madre di One Medical?
Domanda di Google: “Una società madre medica” → informazioni → LLM
Risposta: One Medical, una filiale di Amazon...

L'esempio precedente (tratto dal database dei clienti di Schneider Electric) riguarda un'acquisizione avvenuta nel febbraio 2023 e quindi non verrebbe rilevata solo da LLM a causa delle interruzioni delle conoscenze. Aumentare il LLM con la ricerca di Google garantisce le informazioni più aggiornate.

Modello Flan-T5

In quel progetto abbiamo utilizzato il modello Flan-T5-XXL della Flan-T5 famiglia di modelli.

I modelli Flan-T5 sono ottimizzati per le istruzioni e quindi sono in grado di eseguire varie attività di PNL zero-shot. Nel nostro compito a valle non c'era bisogno di accogliere una grande quantità di conoscenza del mondo, ma piuttosto di ottenere buoni risultati nella risposta alle domande dato un contesto di testi forniti attraverso i risultati di ricerca e, pertanto, il modello T11 con parametri 5B ha funzionato bene.

JumpStart fornisce una comoda distribuzione di questa famiglia di modelli tramite Amazon Sage Maker Studio e l'SDK SageMaker. Ciò include Flan-T5 Small, Flan-T5 Base, Flan-T5 Large, Flan-T5 XL e Flan-T5 XXL. Inoltre, JumpStart fornisce alcune versioni di Flan-T5 XXL a diversi livelli di quantizzazione. Abbiamo distribuito Flan-T5-XXL su un endpoint per l'utilizzo dell'inferenza Avvia Amazon SageMaker Studio.

Percorso per Flan-T5 SageMaker JumpStart

Recupero LLM aumentato con LangChain

LangChain è un framework popolare e in rapida crescita che consente lo sviluppo di applicazioni basate su LLM. Si basa sul concetto di Catene, che sono combinazioni di diversi componenti progettati per migliorare la funzionalità dei LLM per una determinata attività. Ad esempio, ci consente di personalizzare istruzioni e integrare LLM con diversi strumenti come motori di ricerca esterni o fonti di dati. Nel nostro caso d'uso, abbiamo utilizzato Google Serper componente per effettuare ricerche sul Web e ha distribuito il modello Flan-T5-XXL disponibile su Avvia Amazon SageMaker Studio. LangChain esegue l'orchestrazione complessiva e consente di inserire le pagine dei risultati della ricerca nell'istanza Flan-T5-XXL.

La Retrieval-Augmented Generation (RAG) si compone di due fasi:

Recupero di porzioni di testo rilevanti provenienti da fonti esterne
aumentare dei blocchi con contesto nel prompt fornito al LLM.

Per il caso d'uso di Schneider Electric, il RAG procede come segue:

Il nome della società specificato viene combinato con una domanda come "Chi è la società madre di X", dove X è la società specificata) e passato a una query di Google utilizzando l'intelligenza artificiale Serper
Le informazioni estratte vengono combinate con la domanda rapida e originale e passate al LLM per una risposta.

Il diagramma seguente illustra questo processo.

Flusso di lavoro RAG

Utilizza il codice seguente per creare un endpoint:

# Spin FLAN-T5-XXL Sagemaker Endpoint
llm = SagemakerEndpoint(...)

Strumento di ricerca istanziata:

search = GoogleSerperAPIWrapper()
search_tool = Tool( name="Search", func=search.run, description="useful for when you need to ask with search", verbose=False)

Nel codice seguente concatenamo i componenti di recupero e aumento:

my_template = """
Answer the following question using the information. n
Question : {question}? n
Information : {search_result} n
Answer: """
prompt_template = PromptTemplate( input_variables=["question", 'search_result'], template=my_template)
question_chain = LLMChain( llm=llm, prompt=prompt_template, output_key="answer") def search_and_reply_company(company): # Retrieval search_result = search_tool.run(f"{company} parent company") # Augmentation output = question_chain({ "question":f"Who is the parent company of {company}?", "search_result": search_result}) return output["answer"] search_and_reply_company("Whole Foods Market") "Amazon"

L'ingegneria rapida

La combinazione del contesto e della domanda viene chiamata prompt. Abbiamo notato che il prompt generale che abbiamo utilizzato (variazioni relative alla richiesta della società madre) ha funzionato bene per la maggior parte dei settori pubblici (domini) ma non si è generalizzato bene all'istruzione o alla sanità poiché la nozione di società madre non ha significato in tali settori. Per l’istruzione abbiamo usato “X” mentre per l’assistenza sanitaria abbiamo usato “Y”.

Per abilitare la selezione del prompt specifico del dominio, dovevamo anche identificare il dominio a cui appartiene un determinato account. Per questo, abbiamo utilizzato anche un RAG in cui una domanda a scelta multipla “Qual è il dominio di {account}?” come primo passo e in base alla risposta abbiamo chiesto informazioni al genitore dell'account utilizzando il relativo prompt come secondo passo. Vedere il seguente codice:

my_template_options = """
Answer the following question using the information. n
Question :  {question}? n
Information : {search_result} n
Options :n {options} n
Answer: """ prompt_template_options = PromptTemplate(
input_variables=["question", 'search_result', 'options'],
template=my_template_options)
question_chain = LLMChain( llm=llm, prompt=prompt_template_options, output_key="answer") my_options = """
- healthcare
- education
- oil and gas
- banking
- pharma
- other domain """ def search_and_reply_domain(company):
search_result = search_tool.run(f"{company} ")
output = question_chain({ "question":f"What is the domain of {company}?", "search_result": search_result, "options":my_options})
return output["answer"] search_and_reply_domain("Exxon Mobil") "oil and gas"

I suggerimenti specifici del settore hanno aumentato la prestazione complessiva dal 55% al 71% di precisione. Nel complesso, lo sforzo e il tempo investiti per uno sviluppo efficace istruzioni sembrano migliorare significativamente la qualità della risposta LLM.

RAG con dati tabulari (SEC-10k)

La documentazione SEC 10K è un'altra fonte affidabile di informazioni per le filiali e le suddivisioni depositate ogni anno da una società quotata in borsa. Questi documenti sono disponibili direttamente sulla SEC EDGAR o attraverso Corp Watch API.

Supponiamo che le informazioni siano fornite in formato tabellare. Di seguito è riportato uno pseudo csv set di dati che imita il formato originale del set di dati SEC-10K. È possibile unirne più di uno csv origini dati in un dataframe panda combinato:

# A pseudo dataset similar by schema to the CorpWatch API dataset df.head()

index	relation_id source_cw_id	target_cw_id	parent subsidiary 1 90 22569 37 AMAZON WHOLE FOODS MARKET
873 1467 22569 781 AMAZON TWITCH
899 1505 22569 821 AMAZON ZAPPOS
900 1506 22569 821 AMAZON ONE MEDICAL
901 1507 22569 821 AMAZON WOOT!

LangChain fornisce un livello di astrazione per i panda create_pandas_dataframe_agent. Ci sono due vantaggi chiave nell’utilizzare LangChain/LLM per questa attività:

Una volta avviato, consente al consumatore a valle di interagire con il set di dati in linguaggio naturale anziché in codice
È più resistente agli errori di ortografia e ai diversi modi di denominare gli account.

Giriamo l'endpoint come sopra e creiamo l'agente:

# Create pandas dataframe agent agent = create_pandas_dataframe_agent(llm, df, varbose=True)

Nel codice seguente, chiediamo la relazione madre/filiale e l'agente traduce la query nel linguaggio dei panda:

# Example 1
query = "Who is the parent of WHOLE FOODS MARKET?"
agent.run(query) #### output
> Entering new AgentExecutor chain...
Thought: I need to find the row with WHOLE FOODS MARKET in the subsidiary column
Action: python_repl_ast
Action Input: df[df['subsidiary'] == 'WHOLE FOODS MARKET']
Observation:
source_cw_id	target_cw_id	parent subsidiary
22569 37 AMAZON WHOLE FOODS MARKET
Thought: I now know the final answer
Final Answer: AMAZON
> Finished chain.

# Example 2
query = "Who are the subsidiaries of Amazon?"
agent.run(query)
#### output
> Entering new AgentExecutor chain...
Thought: I need to find the row with source_cw_id of 22569
Action: python_repl_ast
Action Input: df[df['source_cw_id'] == 22569]
...
Thought: I now know the final answer
Final Answer: The subsidiaries of Amazon are Whole Foods Market, Twitch, Zappos, One Medical, Woot!...> Finished chain. 'The subsidiaries of Amazon are Whole Foods Market, Twitch, Zappos, One Medical, Woot!.'

Conclusione

In questo post, abbiamo spiegato in dettaglio come abbiamo utilizzato gli elementi costitutivi di LangChain per potenziare un LLM con funzionalità di ricerca, al fine di scoprire le relazioni tra gli account dei clienti di Schneider Electric. Abbiamo esteso la pipeline iniziale a un processo in due fasi con l'identificazione del dominio prima di utilizzare un prompt specifico del dominio per una maggiore precisione.

Oltre alla query di Ricerca Google, i set di dati che descrivono in dettaglio le strutture aziendali come i documenti depositati alla SEC 10K possono essere utilizzati per aumentare ulteriormente il LLM con informazioni affidabili. Il team di Schneider Electric sarà inoltre in grado di estendere e progettare i propri suggerimenti imitando il modo in cui classificano alcuni conti del settore pubblico, migliorando ulteriormente la precisione del processo. Queste funzionalità consentiranno a Schneider Electric di mantenere le strutture organizzative aggiornate e precise dei propri clienti e di sbloccare la possibilità di eseguire analisi su questi dati.

Informazioni sugli autori

Antonio Medeiros è Manager of Solutions Engineering and Architecture presso Schneider Electric. È specializzato nella fornitura di iniziative AI/ML di alto valore a molte funzioni aziendali nel Nord America. Con 17 anni di esperienza presso Schneider Electric, apporta al team una vasta conoscenza del settore e competenze tecniche.

Blake Sanschi è un Business Intelligence Manager presso Schneider Electric, a capo di un team di analisi focalizzato sul supporto dell'organizzazione di vendita attraverso approfondimenti basati sui dati.

Giosuè Levy è Senior Applied Science Manager nel laboratorio Amazon Machine Learning Solutions, dove aiuta i clienti a progettare e realizzare soluzioni AI/ML per risolvere problemi aziendali chiave.

Kosta Belz è uno scienziato applicato senior presso AWS MLSL con particolare attenzione all'intelligenza artificiale generativa e all'elaborazione dei documenti. È appassionato di creazione di applicazioni utilizzando Knowledge Graph e PNL. Ha circa 10 anni di esperienza nella creazione di soluzioni di dati e intelligenza artificiale per creare valore per clienti e imprese.

Audé Genèvey è una scienziata applicata presso l'incubatore Amazon GenAI, dove aiuta i clienti a risolvere problemi aziendali chiave tramite ML e AI. In precedenza è stata ricercatrice in ML teorico e le piace applicare le sue conoscenze per fornire soluzioni all'avanguardia ai clienti.

Il signor Sirajus Salekin è uno scienziato applicato presso AWS Machine Learning Solution Lab. Aiuta i clienti AWS ad accelerare il proprio business creando soluzioni AI/ML. I suoi interessi di ricerca riguardano l'apprendimento automatico multimodale, l'intelligenza artificiale generativa e le applicazioni ML nel settore sanitario.

Zichen Wang, PhD, è uno scienziato applicato senior in AWS. Con diversi anni di esperienza di ricerca nello sviluppo di metodi statistici e di machine learning utilizzando dati biologici e medici, lavora con clienti di vari settori verticali per risolvere i loro problemi di machine learning.

Anton Gridin è un Principal Solutions Architect che supporta clienti industriali globali, con sede a New York City. Ha più di 15 anni di esperienza nella creazione di applicazioni sicure e nella guida di team di ingegneri.