See postitus kirjutati koos Anthony Medeirosega, Põhja-Ameerika tehisintellekti lahenduste inseneri ja arhitektuuri juhi ning Blake Santschiga, Schneider Electricu äriintellekti juhiga. Täiendavad Schneider Electricu eksperdid on Jesse Miller, Somik Chowdhury, Shaswat Babhulgaonkar, David Watkins, Mark Carlson ja Barbara Sleczkowski.
Ettevõtte ressursside planeerimise (ERP) süsteeme kasutavad ettevõtted mitme ärifunktsiooni (nt raamatupidamine, müük või tellimuste haldamine) haldamiseks ühes süsteemis. Eelkõige kasutatakse neid regulaarselt kliendikontodega seotud teabe salvestamiseks. Ettevõtte erinevad organisatsioonid võivad kasutada erinevaid ERP-süsteeme ja nende ühendamine on mastaabis keeruline tehniline väljakutse, mis nõuab valdkonnaspetsiifilisi teadmisi.
Schneider Electric on energiahalduse ja tööstusautomaatika digitaalse ümberkujundamise liider. Oma klientide vajaduste parimaks rahuldamiseks peab Schneider Electric jälgima seotud klientide kontode vahelisi seoseid oma ERP-süsteemides. Kui nende kliendibaas kasvab, lisandub iga päev uusi kliente ja nende kontomeeskonnad peavad need uued kliendid käsitsi sorteerima ja linkima õige emaüksusega.
Linkimisotsus põhineb kõige värskemal Internetis või meedias avalikult kättesaadaval teabel ning seda võivad mõjutada hiljutised omandamised, turuuudised või osakonna ümberstruktureerimine. Kontode linkimise näide oleks Amazoni ja selle tütarettevõtte Whole Foods Marketi vahelise suhte tuvastamine [allikas].
Schneider Electric juurutab suuri keelemudeleid, et vastata küsimustele erinevates teadmistepõhistes valdkondades, mudeli väljaõppe kuupäev piirab selle teadmisi. Nad lahendasid selle väljakutse, kasutades retriiverite laiendatud põlvkonna avatud lähtekoodiga suure keele mudelit, mis on saadaval aadressil Amazon SageMaker JumpStart töödelda suurtes kogustes kogutud välisteadmisi ja näidata ettevõtte või avalikke suhteid ERP-kirjete vahel.
2023. aasta alguses, kui Schneider Electric otsustas osa oma kontode sidumisprotsessist tehisintellekti (AI) abil automatiseerida, tegi ettevõte koostööd AWS Machine Learning Solutions Labiga (MLSL). Tänu MLSLi teadmistele ML-i nõustamise ja teostamise vallas suutis Schneider Electric välja töötada tehisintellekti arhitektuuri, mis vähendaks nende töövoogude ühendamisel käsitsi tehtavat pingutust ja tagaks kiirema juurdepääsu andmetele nende allavoolu analüütikameeskondadele.
Generatiivne AI
Generatiivsed tehisintellektid ja suured keelemudelid (LLM) muudavad viisi, kuidas äriorganisatsioonid suudavad lahendada traditsiooniliselt keerulisi loomuliku keele töötlemise ja mõistmisega seotud väljakutseid. Mõned LLM-ide pakutavad eelised hõlmavad võimet mõista suuri tekstiosasid ja vastata seotud küsimustele, luues inimsarnaseid vastuseid. AWS teeb klientidele lihtsaks LLM-i töökoormustega katsetamise ja tootmise, tehes Amazon SageMaker JumpStarti kaudu kättesaadavaks palju valikuid, Amazonase aluspõhija Amazoni titaan.
Väliste teadmiste omandamine
LLM-id on tuntud oma võime poolest inimteadmisi kokku suruda ja on näidanud märkimisväärseid võimeid küsimustele vastamisel erinevates teadmistepõhistes valdkondades, kuid nende teadmised on piiratud mudeli koolitamise kuupäevaga. Me tegeleme selle teabepiiranguga, ühendades LLM-i Google'i otsingu API-ga, et pakkuda võimsat Retrieval Augmented LLM-i (RAG), mis lahendab Schneider Electricu väljakutsed. RAG suudab töödelda suurel hulgal Google'i otsingust ammutatud välisteadmisi ja näidata ettevõtte või avalikke suhteid ERP-kirjete vahel.
Vaadake järgmist näidet:
Küsimus: Kes on One Medicali emaettevõte?
Google'i päring: “One Medical emaettevõte” → teave → LLM
Vastus: One Medical, Amazoni tütarettevõte…
Eelnev näide (võetud Schneider Electricu kliendiandmebaasist) puudutab omandamist, mis toimus 2023. aasta veebruaris ja seega ei jääks LLM ainuüksi teadmiste katkemise tõttu vahele. LLM-i täiendamine Google'i otsinguga tagab kõige värskema teabe.
Flan-T5 mudel
Selles projektis kasutasime mudelit Flan-T5-XXL Flan-T5 mudelite perekond.
Flan-T5 mudelid on juhistega häälestatud ja seetõttu on need võimelised täitma erinevaid null-shot NLP-ülesandeid. Meie allavoolu ülesandes ei olnud vaja mahutada tohutul hulgal maailmateadmisi, vaid pigem tuli hästi vastata küsimustele, võttes arvesse otsingutulemuste kaudu esitatud tekstide konteksti, ja seetõttu toimis 11B parameetrite T5 mudel hästi.
JumpStart pakub selle mudeliperekonna mugavat juurutamist Amazon SageMaker Studio ja SageMaker SDK. See hõlmab Flan-T5 Small, Flan-T5 Base, Flan-T5 Large, Flan-T5 XL ja Flan-T5 XXL. Lisaks pakub JumpStart mõningaid Flan-T5 XXL-i versioone erinevatel kvantimistasemetel. Kasutasime järelduste tegemiseks Flan-T5-XXL lõpp-punkti Amazon SageMaker Studio Kiirstart.
Otsitav laiendatud LLM koos LangChainiga
LangChain on populaarne ja kiiresti kasvav raamistik, mis võimaldab arendada rakendusi, mida toidavad LLM-id. See põhineb kontseptsioonil ketid, mis on erinevate komponentide kombinatsioonid, mis on loodud LLM-ide funktsionaalsuse parandamiseks antud ülesande jaoks. Näiteks võimaldab see meil kohandada küsib ja integreerida LLM-id erinevate tööriistadega, nagu välised otsingumootorid või andmeallikad. Meie kasutasime Google'it Serper veebist otsimiseks mõeldud komponenti ja võttis kasutusele mudeli Flan-T5-XXL, mis on saadaval aadressil Amazon SageMaker Studio Kiirstart. LangChain teostab üldise orkestreerimise ja võimaldab otsingutulemuste lehtedel sisestada Flan-T5-XXL eksemplari.
Retrieval-Augmented Generation (RAG) koosneb kahest etapist:
- Väljatoomine asjakohastest tekstilõikudest välistest allikatest
- Augmentatsioon LLM-ile antud viipa kontekstiga tükkidest.
Schneider Electricu kasutusjuhtumi puhul toimib RAG järgmiselt:
- Etteantud ettevõtte nimi kombineeritakse küsimusega "Kes on X emaettevõte", kus X on antud ettevõte) ja edastatakse Serper AI abil Google'i päringule
- Väljavõetud teave kombineeritakse kiire ja algse küsimusega ning edastatakse vastuse saamiseks LLM-ile.
Järgmine diagramm illustreerib seda protsessi.
Kasutage lõpp-punkti loomiseks järgmist koodi:
Automaatne otsingutööriist:
Järgmises koodis aheldame otsingu- ja suurendamiskomponendid kokku:
Kiire tehnika
Konteksti ja küsimuse kombinatsiooni nimetatakse viipeks. Märkasime, et meie kasutatud koondviip (erinevused emaettevõtte küsimise ümber) toimis enamikus avalikes sektorites (domeenides) hästi, kuid ei üldistanud hästi haridusele ega tervishoiule, kuna emaettevõtte mõistel pole seal tähendust. Hariduse jaoks kasutasime "X", samas kui tervishoiu jaoks kasutasime "Y".
Selle domeenipõhise viipavaliku lubamiseks pidime tuvastama ka domeeni, kuhu antud konto kuulub. Selleks kasutasime ka RAG-i, kus oli valikvastustega küsimus „Mis on konto {account} domeen?” esimese sammuna ja vastuse põhjal küsisime konto vanemalt, kasutades teise sammuna vastavat viipa. Vaadake järgmist koodi:
Sektoripõhised juhised on suurendanud üldist jõudlust 55%-lt 71%-le. Üldiselt on tõhusaks arendamiseks investeeritud jõupingutused ja aeg küsib näivad oluliselt parandavat LLM-i vastuse kvaliteeti.
RAG tabeliandmetega (SEC-10k)
SEC 10K taotlused on veel üks usaldusväärne teabeallikas tütarettevõtete ja allüksuste kohta, mille börsil noteeritud ettevõtted esitavad igal aastal. Need dokumendid on saadaval otse SEC-is EDGAR või läbi CorpWatch API.
Eeldame, et teave on esitatud tabeli kujul. Allpool on pseudo csv andmestik, mis jäljendab SEC-10K andmestiku algset vormingut. Võimalik liita mitu csv andmeallikad kombineeritud pandade andmeraami:
# A pseudo dataset similar by schema to the CorpWatch API dataset
df.head()
- SEO-põhise sisu ja PR-levi. Võimenduge juba täna.
- PlatoData.Network Vertikaalne generatiivne Ai. Jõustage ennast. Juurdepääs siia.
- PlatoAiStream. Web3 luure. Täiustatud teadmised. Juurdepääs siia.
- PlatoESG. Süsinik, CleanTech, Energia, Keskkond päikeseenergia, Jäätmekäitluse. Juurdepääs siia.
- PlatoTervis. Biotehnoloogia ja kliiniliste uuringute luureandmed. Juurdepääs siia.
- Allikas: https://aws.amazon.com/blogs/machine-learning/schneider-electric-leverages-retrieval-augmented-llms-on-sagemaker-to-ensure-real-time-updates-in-their-erp-systems/
- :on
- :on
- :mitte
- : kus
- $ UP
- 1
- 10
- 100
- 10K
- 11
- 15 aastat
- 15%
- 160
- 17
- 2023
- 7
- 710
- a
- võime
- Võimalik
- MEIST
- üle
- abstraktsioon
- kiirendama
- juurdepääs
- majutada
- konto
- raamatupidamine
- Kontod
- täpsus
- täpne
- omandamine
- ülevõtmised
- üle
- tegevus
- lisatud
- lisamine
- Täiendavad lisad
- aadress
- adresseeritud
- aadressid
- eelised
- mõjutatud
- Agent
- AI
- AI / ML
- Lubades
- võimaldab
- üksi
- Ka
- Amazon
- Amazoni masinõpe
- Amazon SageMaker
- Amazon SageMaker JumpStart
- Amazon Web Services
- Ameerika
- vahel
- summa
- summad
- an
- analytics
- ja
- Aastas
- Teine
- vastus
- Anthony
- API
- ilmuma
- rakendused
- rakendatud
- Rakendades
- arhitektuur
- OLEME
- ümber
- kunstlik
- tehisintellekti
- Tehisintellekt (AI)
- AS
- küsima
- küsib
- eeldab
- At
- suurendama
- suurendatud
- automatiseerima
- Automaatika
- saadaval
- otse saadaval
- AWS
- AWS-i masinõpe
- Pangandus
- baas
- põhineb
- BE
- olnud
- enne
- kuulub
- alla
- Kasu
- BEST
- vahel
- Plokid
- Kiirendatud
- Toob
- ehitama
- Ehitus
- äri
- äritegevuse funktsioonid
- ärianalüüsi
- kuid
- by
- kutsutud
- CAN
- võimeid
- võimeline
- Carlson
- püütud
- kett
- väljakutse
- väljakutseid
- valik
- Linn
- Klassifitseerige
- CNBC
- kood
- Veerg
- kombinatsioon
- kombinatsioonid
- kombineeritud
- Ettevõtted
- ettevõte
- keeruline
- komponent
- komponendid
- mõista
- mõiste
- Murettekitav
- koosneb
- nõustamine
- tarbija
- kontekst
- Mugav
- Korporatiivne
- looma
- Loo väärtust
- klient
- Kliendid
- iga päev
- andmed
- juurdepääs andmetele
- andmepõhistele
- andmebaas
- andmekogumid
- kuupäev
- David
- otsustatud
- otsus
- tarnima
- edastamine
- Näidatud
- lähetatud
- juurutamine
- kasutuselevõtu
- Disain
- kavandatud
- detail
- üksikasjalik
- arendama
- arenev
- & Tarkvaraarendus
- erinev
- digitaalne
- Digitaalne Transformation
- otse
- do
- dokument
- domeen
- Domeenid
- kaks
- Varajane
- lihtne
- Käsitöö
- jõupingutusi
- Starter
- võimaldama
- Lõpp-punkt
- energia
- Inseneriteadus
- Mootorid
- tagama
- Sisse
- ettevõtete
- üksus
- ERP
- näide
- täitmine
- näitama
- kogemus
- eksperiment
- teadmised
- ekspertide
- laiendama
- väline
- Exxon Mobil
- pere
- KIIRE
- kiiremini
- Veebruar
- Toidetud
- vähe
- esitatud
- viilmed
- lõplik
- leidma
- esimene
- Keskenduma
- keskendunud
- Järel
- järgneb
- toiduained
- eest
- formaat
- Raamistik
- Alates
- funktsionaalsus
- funktsioonid
- edasi
- Pealegi
- GAS
- põlvkond
- generatiivne
- Generatiivne AI
- antud
- Globaalne
- Google Search
- graafikud
- Kasvavad
- Kasvab
- garantiid
- olnud
- juhtus
- Olema
- he
- tervishoid
- aitab
- siin
- rohkem
- tema
- Kuidas
- HTML
- http
- HTTPS
- inim-
- i
- Identifitseerimine
- identifitseerima
- illustreerib
- parandama
- Paranemist
- in
- sisaldama
- hõlmab
- inkubaator
- tööstus-
- tööstus
- info
- esialgne
- algatused
- sisend
- teadmisi
- Näiteks
- integreerima
- Intelligentsus
- suhelda
- el
- Internet
- sisse
- investeerinud
- IT
- ITS
- Joosua
- jpg
- hoidma
- Võti
- Teadma
- teadmised
- teatud
- labor
- keel
- suur
- kiht
- juht
- juhtivate
- õppimine
- taset
- võimendab
- maks
- nagu
- piiratud
- piirav
- LINK
- sidumine
- lingid
- LLM
- masin
- masinõpe
- säilitada
- TEEB
- Tegemine
- juhtima
- juhtimine
- juht
- käsiraamat
- käsitsi
- palju
- märk
- Turg
- Market News
- tähendusrikas
- Meedia
- meditsiini-
- meditsiinilised andmed
- Merge
- ühinevad
- meetodid
- võib
- Mölder
- ML
- mudel
- mudelid
- rohkem
- kõige
- mitmekordne
- nimi
- nimetamine
- Natural
- Natural Language Processing
- Vajadus
- vajadustele
- Uus
- New York
- New York City
- uudised
- nlp
- ei
- põhja-
- Põhja-Ameerika
- Mõiste
- nüüd
- tähelepanek
- of
- pakutud
- Õli
- Nafta ja gaas
- on
- ONE
- Üks meditsiiniline
- avatud
- avatud lähtekoodiga
- Valikud
- or
- Korraldus
- et
- organisatsioon
- organisatsiooniline
- organisatsioonid
- originaal
- Muu
- meie
- välja
- väljund
- üldine
- enda
- lehekülge
- pandas
- parameetrid
- emafirma
- osa
- eriline
- partnerlusega
- Vastu võetud
- kirglik
- tee
- täitma
- jõudlus
- teostatud
- esitades
- täidab
- Pharma
- phd
- torujuhe
- planeerimine
- Platon
- Platoni andmete intelligentsus
- PlatoData
- populaarne
- võimalik
- post
- sisse
- võimas
- varem
- Peamine
- probleeme
- tulu
- protsess
- töötlemine
- tootmine
- projekt
- korralik
- tingimusel
- annab
- avalik
- avalikult
- kvaliteet
- küsimus
- Küsimused
- pigem
- reaalajas
- hiljuti
- andmed
- vähendama
- seotud
- suhe
- Suhted
- asjakohane
- usaldusväärne
- tähelepanuväärne
- Vajab
- teadustöö
- uurija
- ressurss
- vastus
- vastuste
- kaasa
- Tulemused
- tagasipöördumine
- jõuline
- regulaarselt
- ROW
- jooks
- salveitegija
- müük
- Skaala
- Schneider Electric
- teadus
- teadlane
- SDK
- Otsing
- Otsingumootorid
- SEC
- Teine
- sektor
- Sektorid
- kindlustama
- vaata
- valik
- vanem
- teenima
- Teenused
- mitu
- ta
- märgatavalt
- sarnane
- alates
- väike
- lahendus
- Lahendused
- LAHENDAGE
- mõned
- allikas
- Allikad
- spetsialiseerunud
- konkreetse
- Spin
- kedratud
- modernne
- statistiline
- Samm
- Sammud
- salvestada
- struktuuride
- stuudio
- allüksused
- tütarettevõtja
- selline
- Toetamine
- süsteem
- süsteemid
- võtnud
- Ülesanne
- ülesanded
- meeskond
- meeskonnad
- Tehniline
- tekst
- kui
- et
- .
- teave
- oma
- Neile
- teoreetiline
- Seal.
- seetõttu
- Need
- nad
- see
- arvasin
- Läbi
- Seega
- aeg
- et
- kokku
- tööriist
- töövahendid
- ülemine
- jälgida
- kaubeldakse
- traditsiooniliselt
- koolitatud
- Transformation
- transformeerivate
- usaldusväärne
- Tõmblema
- kaks
- paljastama
- mõistmine
- avamine
- ajakohane
- Uudised
- us
- kasutama
- Kasutatud
- kasutamine
- väärtus
- eri
- suur
- versioonid
- vertikaalid
- kaudu
- oli
- Tee..
- kuidas
- we
- Jõukus
- web
- veebiteenused
- Hästi
- M
- Mis on
- millal
- mis
- kuigi
- WHO
- kogu
- will
- koos
- jooksul
- töövoog
- Töövoogud
- töötab
- maailm
- oleks
- X
- aastat
- york
- sa
- sephyrnet