Questo post è stato scritto in collaborazione con Anthony Medeiros, Manager of Solutions Engineering and Architecture for North America Artificial Intelligence, e Blake Santschi, Business Intelligence Manager, di Schneider Electric. Altri esperti di Schneider Electric includono Jesse Miller, Somik Chowdhury, Shaswat Babhulgaonkar, David Watkins, Mark Carlson e Barbara Sleczkowski.
I sistemi ERP (Enterprise Resource Planning) vengono utilizzati dalle aziende per gestire diverse funzioni aziendali come la contabilità, le vendite o la gestione degli ordini in un unico sistema. In particolare, vengono abitualmente utilizzati per archiviare informazioni relative ai conti dei clienti. Diverse organizzazioni all'interno di un'azienda potrebbero utilizzare diversi sistemi ERP e fonderli è una sfida tecnica complessa su larga scala che richiede conoscenze specifiche del settore.
Schneider Electric è leader nella trasformazione digitale della gestione energetica e dell'automazione industriale. Per soddisfare al meglio le esigenze dei propri clienti, Schneider Electric deve tenere traccia dei collegamenti tra gli account dei clienti correlati nei propri sistemi ERP. Man mano che la loro base clienti cresce, nuovi clienti vengono aggiunti ogni giorno e i loro team account devono ordinare manualmente questi nuovi clienti e collegarli all'entità madre corretta.
La decisione di collegamento si basa sulle informazioni più recenti disponibili pubblicamente su Internet o nei media e potrebbe essere influenzata da recenti acquisizioni, notizie di mercato o ristrutturazioni divisionali. Un esempio di collegamento dell'account potrebbe essere quello di identificare la relazione tra Amazon e la sua controllata Whole Foods Market [source].
Schneider Electric sta implementando modelli linguistici di grandi dimensioni per le loro capacità di rispondere a domande in vari domini specifici della conoscenza, la data in cui il modello è stato addestrato ne limita la conoscenza. Hanno affrontato questa sfida utilizzando un modello linguistico di grandi dimensioni open source Retriever-Augmented Generation disponibile su JumpStart di Amazon SageMaker per elaborare grandi quantità di conoscenza esterna estratta ed esporre relazioni aziendali o pubbliche tra i record ERP.
All'inizio del 2023, quando Schneider Electric ha deciso di automatizzare parte del processo di collegamento degli account utilizzando l'intelligenza artificiale (AI), l'azienda ha collaborato con AWS Machine Learning Solutions Lab (MLSL). Grazie all'esperienza di MLSL nella consulenza ed esecuzione di ML, Schneider Electric è stata in grado di sviluppare un'architettura AI in grado di ridurre lo sforzo manuale nei flussi di lavoro di collegamento e fornire un accesso più rapido ai dati ai team di analisi a valle.
AI generativa
L’intelligenza artificiale generativa e i modelli linguistici di grandi dimensioni (LLM) stanno trasformando il modo in cui le organizzazioni aziendali sono in grado di risolvere sfide tradizionalmente complesse legate all’elaborazione e alla comprensione del linguaggio naturale. Alcuni dei vantaggi offerti dai LLM includono la capacità di comprendere ampie porzioni di testo e di rispondere a domande correlate producendo risposte simili a quelle umane. AWS consente ai clienti di sperimentare e produrre facilmente carichi di lavoro LLM rendendo disponibili molte opzioni tramite Amazon SageMaker JumpStart, Roccia Amazzonicae Titano Amazzonico.
Acquisizione di conoscenze esterne
Gli LLM sono noti per la loro capacità di comprimere la conoscenza umana e hanno dimostrato notevoli capacità nel rispondere a domande in vari domini specifici della conoscenza, ma la loro conoscenza è limitata dalla data in cui il modello è stato addestrato. Affrontiamo questo limite di informazioni accoppiando LLM con un'API di ricerca di Google per fornire un potente Retrieval Augmented LLM (RAG) che affronta le sfide di Schneider Electric. Il RAG è in grado di elaborare grandi quantità di dati esterni estratti dalla ricerca di Google e di mostrare relazioni aziendali o pubbliche tra i record ERP.
Vedi il seguente esempio:
Domanda: Chi è la società madre di One Medical?
Domanda di Google: “Una società madre medica” → informazioni → LLM
Risposta: One Medical, una filiale di Amazon...
L'esempio precedente (tratto dal database dei clienti di Schneider Electric) riguarda un'acquisizione avvenuta nel febbraio 2023 e quindi non verrebbe rilevata solo da LLM a causa delle interruzioni delle conoscenze. Aumentare il LLM con la ricerca di Google garantisce le informazioni più aggiornate.
Modello Flan-T5
In quel progetto abbiamo utilizzato il modello Flan-T5-XXL della Flan-T5 famiglia di modelli.
I modelli Flan-T5 sono ottimizzati per le istruzioni e quindi sono in grado di eseguire varie attività di PNL zero-shot. Nel nostro compito a valle non c'era bisogno di accogliere una grande quantità di conoscenza del mondo, ma piuttosto di ottenere buoni risultati nella risposta alle domande dato un contesto di testi forniti attraverso i risultati di ricerca e, pertanto, il modello T11 con parametri 5B ha funzionato bene.
JumpStart fornisce una comoda distribuzione di questa famiglia di modelli tramite Amazon Sage Maker Studio e l'SDK SageMaker. Ciò include Flan-T5 Small, Flan-T5 Base, Flan-T5 Large, Flan-T5 XL e Flan-T5 XXL. Inoltre, JumpStart fornisce alcune versioni di Flan-T5 XXL a diversi livelli di quantizzazione. Abbiamo distribuito Flan-T5-XXL su un endpoint per l'utilizzo dell'inferenza Avvia Amazon SageMaker Studio.
Recupero LLM aumentato con LangChain
LangChain è un framework popolare e in rapida crescita che consente lo sviluppo di applicazioni basate su LLM. Si basa sul concetto di Catene, che sono combinazioni di diversi componenti progettati per migliorare la funzionalità dei LLM per una determinata attività. Ad esempio, ci consente di personalizzare istruzioni e integrare LLM con diversi strumenti come motori di ricerca esterni o fonti di dati. Nel nostro caso d'uso, abbiamo utilizzato Google Serper componente per effettuare ricerche sul Web e ha distribuito il modello Flan-T5-XXL disponibile su Avvia Amazon SageMaker Studio. LangChain esegue l'orchestrazione complessiva e consente di inserire le pagine dei risultati della ricerca nell'istanza Flan-T5-XXL.
La Retrieval-Augmented Generation (RAG) si compone di due fasi:
- Recupero di porzioni di testo rilevanti provenienti da fonti esterne
- aumentare dei blocchi con contesto nel prompt fornito al LLM.
Per il caso d'uso di Schneider Electric, il RAG procede come segue:
- Il nome della società specificato viene combinato con una domanda come "Chi è la società madre di X", dove X è la società specificata) e passato a una query di Google utilizzando l'intelligenza artificiale Serper
- Le informazioni estratte vengono combinate con la domanda rapida e originale e passate al LLM per una risposta.
Il diagramma seguente illustra questo processo.
Utilizza il codice seguente per creare un endpoint:
Strumento di ricerca istanziata:
Nel codice seguente concatenamo i componenti di recupero e aumento:
L'ingegneria rapida
La combinazione del contesto e della domanda viene chiamata prompt. Abbiamo notato che il prompt generale che abbiamo utilizzato (variazioni relative alla richiesta della società madre) ha funzionato bene per la maggior parte dei settori pubblici (domini) ma non si è generalizzato bene all'istruzione o alla sanità poiché la nozione di società madre non ha significato in tali settori. Per l’istruzione abbiamo usato “X” mentre per l’assistenza sanitaria abbiamo usato “Y”.
Per abilitare la selezione del prompt specifico del dominio, dovevamo anche identificare il dominio a cui appartiene un determinato account. Per questo, abbiamo utilizzato anche un RAG in cui una domanda a scelta multipla “Qual è il dominio di {account}?” come primo passo e in base alla risposta abbiamo chiesto informazioni al genitore dell'account utilizzando il relativo prompt come secondo passo. Vedere il seguente codice:
I suggerimenti specifici del settore hanno aumentato la prestazione complessiva dal 55% al 71% di precisione. Nel complesso, lo sforzo e il tempo investiti per uno sviluppo efficace istruzioni sembrano migliorare significativamente la qualità della risposta LLM.
RAG con dati tabulari (SEC-10k)
La documentazione SEC 10K è un'altra fonte affidabile di informazioni per le filiali e le suddivisioni depositate ogni anno da una società quotata in borsa. Questi documenti sono disponibili direttamente sulla SEC EDGAR o attraverso Corp Watch API.
Supponiamo che le informazioni siano fornite in formato tabellare. Di seguito è riportato uno pseudo csv set di dati che imita il formato originale del set di dati SEC-10K. È possibile unirne più di uno csv origini dati in un dataframe panda combinato:
# A pseudo dataset similar by schema to the CorpWatch API dataset
df.head()
- Distribuzione di contenuti basati su SEO e PR. Ricevi amplificazione oggi.
- PlatoData.Network Generativo verticale Ai. Potenzia te stesso. Accedi qui.
- PlatoAiStream. Intelligenza Web3. Conoscenza amplificata. Accedi qui.
- PlatoneESG. Carbonio, Tecnologia pulita, Energia, Ambiente, Solare, Gestione dei rifiuti. Accedi qui.
- Platone Salute. Intelligence sulle biotecnologie e sulle sperimentazioni cliniche. Accedi qui.
- Fonte: https://aws.amazon.com/blogs/machine-learning/schneider-electric-leverages-retrieval-augmented-llms-on-sagemaker-to-ensure-real-time-updates-in-their-erp-systems/
- :ha
- :È
- :non
- :Dove
- $ SU
- 1
- 10
- 100
- 10K
- 11
- 15 anni
- 15%
- 160
- 17
- 2023
- 7
- 710
- a
- capacità
- capace
- WRI
- sopra
- astrazione
- accelerare
- accesso
- ospitare
- Il mio account
- Contabilità
- conti
- precisione
- preciso
- acquisizione
- acquisizioni
- operanti in
- Action
- aggiunto
- aggiunta
- aggiuntivo
- indirizzo
- indirizzata
- indirizzi
- vantaggi
- influenzato
- Agente
- AI
- AI / ML
- Consentire
- consente
- da solo
- anche
- Amazon
- Apprendimento automatico di Amazon
- Amazon Sage Maker
- JumpStart di Amazon SageMaker
- Amazon Web Services
- America
- tra
- quantità
- importi
- an
- analitica
- ed
- Annualmente
- Un altro
- rispondere
- Anthony
- api
- apparire
- applicazioni
- applicato
- AMMISSIONE
- architettura
- SONO
- in giro
- artificiale
- intelligenza artificiale
- Intelligenza artificiale (AI)
- AS
- chiedere
- chiedendo
- assumere
- At
- aumentare
- aumentata
- automatizzare
- Automazione
- disponibile
- disponibile direttamente
- AWS
- Apprendimento automatico di AWS
- Settore bancario
- base
- basato
- BE
- stato
- prima
- appartiene
- sotto
- vantaggi
- MIGLIORE
- fra
- Blocchi
- Amplificato
- Porta
- costruire
- Costruzione
- affari
- funzioni aziendali
- business intelligence
- ma
- by
- detto
- Materiale
- funzionalità
- capace
- Carlson
- catturati
- catena
- Challenge
- sfide
- scegliere
- Città
- classificare
- CNBC
- codice
- Colonna
- combinazione
- combinazioni
- combinato
- Aziende
- azienda
- complesso
- componente
- componenti
- comprendere
- concetto
- preoccupazioni
- consiste
- consulting
- Consumer
- contesto
- Comodo
- Aziende
- creare
- Creare valore
- cliente
- Clienti
- alle lezioni
- dati
- l'accesso ai dati
- data-driven
- Banca Dati
- dataset
- Data
- David
- deciso
- decisione
- consegnare
- consegna
- dimostrato
- schierato
- distribuzione
- deployment
- Design
- progettato
- dettaglio
- dettagliati
- sviluppare
- in via di sviluppo
- Mercato
- diverso
- digitale
- DIGITAL TRANSFORMATION
- direttamente
- do
- documento
- dominio
- domini
- dovuto
- Presto
- facile
- Istruzione
- sforzo
- Elettrico
- enable
- endpoint
- energia
- Ingegneria
- Motori
- garantire
- entrare
- aziende
- entità
- ERP
- esempio
- esecuzione
- mostra
- esperienza
- esperimento
- competenza
- esperti
- estendere
- esterno
- Exxon Mobil
- famiglia
- FAST
- più veloce
- Febbraio
- Federale
- pochi
- depositata
- limatura
- finale
- Trovate
- Nome
- Focus
- concentrato
- i seguenti
- segue
- alimenti
- Nel
- formato
- Contesto
- da
- funzionalità
- funzioni
- ulteriormente
- Inoltre
- GAS
- ELETTRICA
- generativo
- AI generativa
- dato
- globali
- Google Search
- grafici
- Crescita
- cresce
- garanzie
- ha avuto
- successo
- Avere
- he
- assistenza sanitaria
- aiuta
- suo
- superiore
- il suo
- Come
- HTML
- http
- HTTPS
- umano
- i
- Identificazione
- identificare
- illustra
- competenze
- miglioramento
- in
- includere
- inclusi
- incubatrice
- industriale
- industria
- informazioni
- inizialmente
- iniziative
- ingresso
- intuizioni
- esempio
- integrare
- Intelligence
- interagire
- interessi
- Internet
- ai miglioramenti
- investito
- IT
- SUO
- joshua
- jpg
- mantenere
- Le
- Sapere
- conoscenze
- conosciuto
- laboratorio
- Lingua
- grandi
- strato
- leader
- principale
- apprendimento
- livelli
- leveraggi
- tributo
- piace
- Limitato
- limitativo
- LINK
- collegamento
- Collegamento
- LLM
- macchina
- machine learning
- mantenere
- FA
- Fare
- gestire
- gestione
- direttore
- Manuale
- manualmente
- molti
- marchio
- Rappresentanza
- Notizie di mercato
- significativo
- Media
- medicale
- dati medici
- Unire
- fusione
- metodi
- forza
- mugnaio
- ML
- modello
- modelli
- Scopri di più
- maggior parte
- multiplo
- Nome
- di denominazione
- Naturale
- Elaborazione del linguaggio naturale
- Bisogno
- esigenze
- New
- New York
- New York City
- notizie
- nlp
- no
- Nord
- America del Nord
- Nozione
- adesso
- osservazione
- of
- offerto
- Olio
- Olio e Gas
- on
- ONE
- Un medico
- aprire
- open source
- Opzioni
- or
- orchestrazione
- minimo
- organizzazione
- organizzativa
- organizzazioni
- i
- Altro
- nostro
- su
- produzione
- complessivo
- proprio
- pagine
- panda
- parametri
- società madre
- parte
- particolare
- collaborato
- Passato
- appassionato
- sentiero
- Eseguire
- performance
- eseguita
- esecuzione
- esegue
- Pharma
- phd
- conduttura
- pianificazione
- Platone
- Platone Data Intelligence
- PlatoneDati
- Popolare
- possibile
- Post
- alimentato
- potente
- in precedenza
- Direttore
- problemi
- ricavo
- processi
- lavorazione
- produzione
- progetto
- corretto
- purché
- fornisce
- la percezione
- pubblicamente
- qualità
- domanda
- Domande
- piuttosto
- tempo reale
- recente
- record
- ridurre
- relazionato
- rapporto
- Relazioni
- pertinente
- affidabile
- notevole
- richiede
- riparazioni
- ricercatore
- risorsa
- risposta
- risposte
- colpevole
- Risultati
- ritorno
- robusto
- di routine
- RIGA
- Correre
- sagemaker
- vendite
- Scala
- Schneider Electric
- Scienze
- Scienziato
- sdk
- Cerca
- Motori di ricerca
- SEC
- Secondo
- settore
- Settori
- sicuro
- vedere
- prodotti
- anziano
- servire
- Servizi
- alcuni
- lei
- significativamente
- simile
- da
- piccole
- soluzione
- Soluzioni
- RISOLVERE
- alcuni
- Fonte
- fonti
- specializzata
- specifico
- Spin
- spun
- state-of-the-art
- statistiche
- step
- Passi
- Tornare al suo account
- strutture
- studio
- suddivisioni
- filiale
- tale
- Supporto
- sistema
- SISTEMI DI TRATTAMENTO
- preso
- Task
- task
- team
- le squadre
- Consulenza
- testo
- di
- che
- Il
- le informazioni
- loro
- Li
- teorico
- Là.
- perciò
- Strumenti Bowman per analizzare le seguenti finiture:
- di
- questo
- pensiero
- Attraverso
- così
- tempo
- a
- insieme
- strumenti
- top
- pista
- negoziate
- tradizionalmente
- allenato
- Trasformazione
- trasformazione
- affidabili sul mercato
- Twitch
- seconda
- scoprire
- e una comprensione reciproca
- sbloccare
- up-to-date
- Aggiornamenti
- us
- uso
- utilizzato
- utilizzando
- APPREZZIAMO
- vario
- Fisso
- versioni
- verticali
- via
- Prima
- Modo..
- modi
- we
- Ricchezza
- sito web
- servizi web
- WELL
- Che
- Che cosa è l'
- quando
- quale
- while
- OMS
- tutto
- volere
- con
- entro
- flusso di lavoro
- flussi di lavoro
- lavori
- mondo
- sarebbe
- X
- anni
- York
- Tu
- zefiro