Schneider Electric utnytter utvidede LLM-er på SageMaker for å sikre sanntidsoppdateringer i ERP-systemene deres

Publisert av Platon

Følgere: 0

Dette innlegget ble skrevet sammen med Anthony Medeiros, leder for løsningsteknikk og arkitektur for Nord-Amerika kunstig intelligens, og Blake Santschi, Business Intelligence Manager, fra Schneider Electric. Ytterligere Schneider Electric-eksperter inkluderer Jesse Miller, Somik Chowdhury, Shaswat Babhulgaonkar, David Watkins, Mark Carlson og Barbara Sleczkowski.

Enterprise Resource Planning (ERP)-systemer brukes av bedrifter til å administrere flere forretningsfunksjoner som regnskap, salg eller ordreadministrasjon i ett system. Spesielt brukes de rutinemessig til å lagre informasjon knyttet til kundekontoer. Ulike organisasjoner i et selskap kan bruke forskjellige ERP-systemer og sammenslåing av dem er en kompleks teknisk utfordring i stor skala som krever domenespesifikk kunnskap.

Schneider Electric er ledende innen digital transformasjon av energiledelse og industriell automasjon. For å kunne betjene kundenes behov best mulig, må Schneider Electric holde styr på koblingene mellom relaterte kunders kontoer i deres ERP-systemer. Etter hvert som kundebasen deres vokser, legges nye kunder til daglig, og kontoteamene deres må manuelt sortere gjennom disse nye kundene og koble dem til den riktige overordnede enheten.

Koblingsbeslutningen er basert på den nyeste informasjonen som er offentlig tilgjengelig på Internett eller i media, og kan bli påvirket av nylige oppkjøp, markedsnyheter eller divisjonsrestrukturering. Et eksempel på kontokobling vil være å identifisere forholdet mellom Amazon og datterselskapet Whole Foods Market [kilde].

Schneider Electric distribuerer store språkmodeller for deres evner til å svare på spørsmål i ulike kunnskapsspesifikke domener, datoen modellen har blitt trent opp begrenser kunnskapen. De taklet denne utfordringen ved å bruke en Retriever-Augmented Generation åpen kildekode, stor språkmodell tilgjengelig på Amazon SageMaker JumpStart å behandle store mengder ekstern kunnskap hentet og vise bedrifts- eller offentlige relasjoner blant ERP-poster.

Tidlig i 2023, da Schneider Electric bestemte seg for å automatisere deler av kontokoblingsprosessen ved hjelp av kunstig intelligens (AI), inngikk selskapet et samarbeid med AWS Machine Learning Solutions Lab (MLSL). Med MLSLs ekspertise innen ML-rådgivning og utførelse, var Schneider Electric i stand til å utvikle en AI-arkitektur som ville redusere den manuelle innsatsen i koblingsarbeidsflytene deres, og levere raskere datatilgang til deres nedstrøms analyseteam.

Generativ AI

Generativ kunstig intelligens og store språkmodeller (LLMs) transformerer måten forretningsorganisasjoner er i stand til å løse tradisjonelt komplekse utfordringer knyttet til naturlig språkbehandling og -forståelse. Noen av fordelene som tilbys av LLM-er inkluderer muligheten til å forstå store deler av teksten og svare på relaterte spørsmål ved å produsere menneskelignende svar. AWS gjør det enkelt for kunder å eksperimentere med og produsere LLM-arbeidsmengder ved å gjøre mange alternativer tilgjengelige via Amazon SageMaker JumpStart, Amazonas grunnfjellog Amazon Titan.

Ekstern kunnskapsinnhenting

LLM-er er kjent for sin evne til å komprimere menneskelig kunnskap og har vist bemerkelsesverdige evner til å svare på spørsmål innen ulike kunnskapsspesifikke domener, men kunnskapen deres er begrenset av datoen modellen har blitt trent. Vi adresserer denne informasjonsgrensen ved å koble LLM med et Google Search API for å levere en kraftig Retrieval Augmented LLM (RAG) som adresserer Schneider Electrics utfordringer. RAG er i stand til å behandle store mengder ekstern kunnskap hentet fra Google-søk og vise bedrifts- eller offentlige relasjoner blant ERP-poster.

Se følgende eksempel:

Spørsmål: Hvem er morselskapet til One Medical?
Google-søk: "Ett medisinsk morselskap" → informasjon → LLM
Svar: One Medical, et datterselskap av Amazon...

Det foregående eksemplet (hentet fra Schneider Electrics kundedatabase) gjelder et oppkjøp som skjedde i februar 2023 og som dermed ikke ville bli fanget opp av LLM alene på grunn av kunnskapsavbrudd. Å utvide LLM med Google-søk garanterer den mest oppdaterte informasjonen.

Flan-T5 modell

I det prosjektet brukte vi Flan-T5-XXL-modellen fra Flan-T5 familie av modeller.

Flan-T5-modellene er instruksjonstilpasset og er derfor i stand til å utføre ulike nullskudd NLP-oppgaver. I nedstrømsoppgaven vår var det ikke nødvendig å imøtekomme en enorm mengde verdenskunnskap, men snarere å prestere godt på spørsmålssvar gitt en kontekst av tekster gitt gjennom søkeresultater, og derfor presterte 11B-parameter T5-modellen godt.

JumpStart gir praktisk distribusjon av denne modellfamilien gjennom Amazon SageMaker Studio og SageMaker SDK. Dette inkluderer Flan-T5 Small, Flan-T5 Base, Flan-T5 Large, Flan-T5 XL og Flan-T5 XXL. Videre tilbyr JumpStart noen få versjoner av Flan-T5 XXL på forskjellige kvantiseringsnivåer. Vi distribuerte Flan-T5-XXL til et endepunkt for slutningsbruk Amazon SageMaker Studio Jumpstart.

Vei til Flan-T5 SageMaker JumpStart

Retrieval Augmented LLM med LangChain

Langkjede er populært og raskt voksende rammeverk som tillater utvikling av applikasjoner drevet av LLM-er. Det er basert på konseptet kjeder, som er kombinasjoner av forskjellige komponenter designet for å forbedre funksjonaliteten til LLM-er for en gitt oppgave. For eksempel lar det oss tilpasse ledetekster og integrere LLM med forskjellige verktøy som eksterne søkemotorer eller datakilder. I vårt brukstilfelle brukte vi Google Serper komponent for å søke på nettet, og implementerte Flan-T5-XXL-modellen tilgjengelig på Amazon SageMaker Studio Jumpstart. LangChain utfører den overordnede orkestreringen og lar søkeresultatsidene mates inn i Flan-T5-XXL-forekomsten.

The Retrieval-Augmented Generation (RAG) består av to trinn:

Henting av relevante tekstbiter fra eksterne kilder
Forstørrelse av delene med kontekst i ledeteksten gitt til LLM.

For Schneider Electrics brukssak går RAG frem som følger:

Det gitte firmanavnet kombineres med et spørsmål som "Hvem er morselskapet til X", hvor X er det gitte selskapet) og sendes til en google-spørring ved hjelp av Serper AI
Den utpakkede informasjonen kombineres med det direkte og originale spørsmålet og sendes til LLM for svar.

Følgende diagram illustrerer denne prosessen.

RAG arbeidsflyt

Bruk følgende kode for å opprette et endepunkt:

# Spin FLAN-T5-XXL Sagemaker Endpoint
llm = SagemakerEndpoint(...)

Øyeblikkelig søkeverktøy:

search = GoogleSerperAPIWrapper()
search_tool = Tool( name="Search", func=search.run, description="useful for when you need to ask with search", verbose=False)

I følgende kode lenker vi sammen gjenfinnings- og utvidelseskomponentene:

my_template = """
Answer the following question using the information. n
Question : {question}? n
Information : {search_result} n
Answer: """
prompt_template = PromptTemplate( input_variables=["question", 'search_result'], template=my_template)
question_chain = LLMChain( llm=llm, prompt=prompt_template, output_key="answer") def search_and_reply_company(company): # Retrieval search_result = search_tool.run(f"{company} parent company") # Augmentation output = question_chain({ "question":f"Who is the parent company of {company}?", "search_result": search_result}) return output["answer"] search_and_reply_company("Whole Foods Market") "Amazon"

The Prompt Engineering

Kombinasjonen av konteksten og spørsmålet kalles ledeteksten. Vi la merke til at den generelle forespørselen vi brukte (variasjoner rundt å spørre etter morselskapet) presterte bra for de fleste offentlige sektorer (domener), men generaliserte ikke godt til utdanning eller helsetjenester siden begrepet morselskap ikke er meningsfullt der. For utdanning brukte vi "X" mens vi brukte "Y" for helsetjenester.

For å aktivere dette domenespesifikke spørsmålsvalget, måtte vi også identifisere domenet en gitt konto tilhører. Til dette brukte vi også en RAG der et flervalgsspørsmål "Hva er domenet til {konto}?" som et første trinn, og basert på svaret spurte vi forelderen til kontoen ved å bruke den relevante ledeteksten som et andre trinn. Se følgende kode:

my_template_options = """
Answer the following question using the information. n
Question :  {question}? n
Information : {search_result} n
Options :n {options} n
Answer: """ prompt_template_options = PromptTemplate(
input_variables=["question", 'search_result', 'options'],
template=my_template_options)
question_chain = LLMChain( llm=llm, prompt=prompt_template_options, output_key="answer") my_options = """
- healthcare
- education
- oil and gas
- banking
- pharma
- other domain """ def search_and_reply_domain(company):
search_result = search_tool.run(f"{company} ")
output = question_chain({ "question":f"What is the domain of {company}?", "search_result": search_result, "options":my_options})
return output["answer"] search_and_reply_domain("Exxon Mobil") "oil and gas"

De sektorspesifikke spørsmålene har økt den generelle ytelsen fra 55 % til 71 % av nøyaktigheten. Samlet sett er innsatsen og tiden investert for å utvikle effektiv ledetekster ser ut til å forbedre kvaliteten på LLM-responsen betydelig.

RAG med tabelldata (SEC-10k)

SEC 10K-registreringene er en annen pålitelig informasjonskilde for datterselskaper og underavdelinger som innleveres årlig av et børsnotert selskap. Disse registreringene er tilgjengelig direkte på SEC EDGAR eller gjennom CorpWatch API.

Vi antar at informasjonen er gitt i tabellformat. Nedenfor er en pseudo csv datasett som etterligner det opprinnelige formatet til SEC-10K-datasettet. Det er mulig å slå sammen flere csv datakilder til en kombinert pandas-dataramme:

# A pseudo dataset similar by schema to the CorpWatch API dataset df.head()

index	relation_id source_cw_id	target_cw_id	parent subsidiary 1 90 22569 37 AMAZON WHOLE FOODS MARKET
873 1467 22569 781 AMAZON TWITCH
899 1505 22569 821 AMAZON ZAPPOS
900 1506 22569 821 AMAZON ONE MEDICAL
901 1507 22569 821 AMAZON WOOT!

Langkjeden gir et abstraksjonslag for pandaer gjennom create_pandas_dataframe_agent. Det er to viktige fordeler ved å bruke LangChain/LLM-er for denne oppgaven:

Når den er spunnet opp, lar den en nedstrømsforbruker samhandle med datasettet på naturlig språk i stedet for kode
Den er mer robust overfor feilstavinger og ulike måter å navngi kontoer på.

Vi snurrer endepunktet som ovenfor og lager agenten:

# Create pandas dataframe agent agent = create_pandas_dataframe_agent(llm, df, varbose=True)

I følgende kode spør vi etter foreldre/datterselskap-forholdet, og agenten oversetter spørringen til panda-språket:

# Example 1
query = "Who is the parent of WHOLE FOODS MARKET?"
agent.run(query) #### output
> Entering new AgentExecutor chain...
Thought: I need to find the row with WHOLE FOODS MARKET in the subsidiary column
Action: python_repl_ast
Action Input: df[df['subsidiary'] == 'WHOLE FOODS MARKET']
Observation:
source_cw_id	target_cw_id	parent subsidiary
22569 37 AMAZON WHOLE FOODS MARKET
Thought: I now know the final answer
Final Answer: AMAZON
> Finished chain.

# Example 2
query = "Who are the subsidiaries of Amazon?"
agent.run(query)
#### output
> Entering new AgentExecutor chain...
Thought: I need to find the row with source_cw_id of 22569
Action: python_repl_ast
Action Input: df[df['source_cw_id'] == 22569]
...
Thought: I now know the final answer
Final Answer: The subsidiaries of Amazon are Whole Foods Market, Twitch, Zappos, One Medical, Woot!...> Finished chain. 'The subsidiaries of Amazon are Whole Foods Market, Twitch, Zappos, One Medical, Woot!.'

konklusjonen

I dette innlegget beskrev vi hvordan vi brukte byggeklosser fra LangChain for å utvide en LLM med søkefunksjoner, for å avdekke forhold mellom Schneider Electrics kundekontoer. Vi utvidet den første pipelinen til en to-trinns prosess med domeneidentifikasjon før vi brukte en domenespesifikk melding for høyere nøyaktighet.

I tillegg til Google-søkespørsmålet, kan datasett som beskriver bedriftsstrukturer som SEC 10K-filene brukes til å utvide LLM ytterligere med pålitelig informasjon. Schneider Electric-teamet vil også være i stand til å utvide og designe sine egne meldinger som etterligner måten de klassifiserer enkelte offentlige sektorkontoer, noe som ytterligere forbedrer nøyaktigheten til rørledningen. Disse egenskapene vil gjøre det mulig for Schneider Electric å opprettholde oppdaterte og nøyaktige organisasjonsstrukturer til sine kunder, og låse opp muligheten til å gjøre analyser på toppen av disse dataene.

Om forfatterne

Anthony Medeiros er leder for løsningsteknikk og arkitektur hos Schneider Electric. Han spesialiserer seg på å levere AI/ML-initiativer av høy verdi til mange forretningsfunksjoner i Nord-Amerika. Med 17 års erfaring hos Schneider Electric, bringer han et vell av bransjekunnskap og teknisk ekspertise til teamet.

Blake Sanstchi er Business Intelligence Manager hos Schneider Electric, og leder et analyseteam fokusert på å støtte salgsorganisasjonen gjennom datadrevet innsikt.

Joshua Levy er Senior Applied Science Manager i Amazon Machine Learning Solutions-lab, hvor han hjelper kunder med å designe og bygge AI/ML-løsninger for å løse viktige forretningsproblemer.

Kosta Belz er en Senior Applied Scientist med AWS MLSL med fokus på Generativ AI og dokumentbehandling. Han brenner for å bygge applikasjoner ved hjelp av Kunnskapsgrafer og NLP. Han har rundt 10 års erfaring med å bygge data- og AI-løsninger for å skape verdier for kunder og bedrifter.

Aude Genevey er en Applied Scientist i Amazon GenAI Incubator, hvor hun hjelper kunder med å løse viktige forretningsproblemer gjennom ML og AI. Hun har tidligere vært forsker i teoretisk ML og liker å bruke kunnskapen sin til å levere toppmoderne løsninger til kunder.

Md Sirajus Salekin er en Applied Scientist ved AWS Machine Learning Solution Lab. Han hjelper AWS-kunder med å akselerere virksomheten sin ved å bygge AI/ML-løsninger. Hans forskningsinteresser er multimodal maskinlæring, generativ AI og ML-applikasjoner i helsevesenet.

Zichen Wang, PhD, er en senior anvendt vitenskapsmann i AWS. Med flere års forskningserfaring i utvikling av ML og statistiske metoder ved bruk av biologiske og medisinske data, jobber han med kunder på tvers av ulike vertikaler for å løse deres ML-problemer.

Anton Gridin er en hovedløsningsarkitekt som støtter Global Industrial Accounts, basert i New York City. Han har mer enn 15 års erfaring med å bygge sikre applikasjoner og lede ingeniørteam.

SEO-drevet innhold og PR-distribusjon. Bli forsterket i dag.
PlatoData.Network Vertical Generative Ai. Styrk deg selv. Tilgang her.
PlatoAiStream. Web3 Intelligence. Kunnskap forsterket. Tilgang her.
PlatoESG. Karbon, CleanTech, Energi, Miljø, Solenergi, Avfallshåndtering. Tilgang her.
PlatoHelse. Bioteknologisk og klinisk etterretning. Tilgang her.
kilde: https://aws.amazon.com/blogs/machine-learning/schneider-electric-leverages-retrieval-augmented-llms-on-sagemaker-to-ensure-real-time-updates-in-their-erp-systems/

Tidstempel: Oktober 31, 2023

Tidstempel: Juni 1, 2023

Publisert av Platon

Låser opp effektivitet: Utnytt kraften til selektiv utførelse i Amazon SageMaker Pipelines | Amazon Web Services

Automatiser dokumentvalidering og svindeldeteksjon i pantegarantiprosessen ved å bruke AWS AI-tjenester: Del 1 | Amazon Web Services

AI/ML-drevet handlingsinnsikt og temaer for Amazon-tredjepartselgere som bruker AWS

Hvordan OCX Cognition reduserte ML-modellutviklingstiden fra uker til dager og modelloppdateringstiden fra dager til sanntid ved hjelp av AWS Step Functions og Amazon SageMaker | Amazon Web Services

Transformere kvalitativ forskning ved å automatisere tale til tekst-til-tekst-analyse

Identifiser potensiell rotårsak til forretningskritiske anomalier ved å bruke Amazon Lookout for Metrics

Neste generasjon Amazon SageMaker-eksperimenter – Organiser, spor og sammenlign maskinlæringstreningene dine i stor skala

Om Oss

Vertikal søk og Ai

Plattform

Hold kontakten

Logg inn