Această postare a fost scrisă împreună cu Anthony Medeiros, Manager de Inginerie și Arhitectură de Soluții pentru Inteligența Artificială din America de Nord, și Blake Santschi, Manager de Business Intelligence, de la Schneider Electric. Alți experți Schneider Electric includ Jesse Miller, Somik Chowdhury, Shaswat Babhulgaonkar, David Watkins, Mark Carlson și Barbara Sleczkowski.
Sistemele Enterprise Resource Planning (ERP) sunt folosite de companii pentru a gestiona mai multe funcții de afaceri, cum ar fi contabilitatea, vânzările sau gestionarea comenzilor într-un singur sistem. În special, acestea sunt utilizate în mod obișnuit pentru a stoca informații legate de conturile clienților. Diferite organizații din cadrul unei companii pot folosi sisteme ERP diferite, iar fuzionarea acestora este o provocare tehnică complexă la scară, care necesită cunoștințe specifice domeniului.
Schneider Electric este lider în transformarea digitală a managementului energiei și automatizării industriale. Pentru a răspunde cât mai bine nevoilor clienților lor, Schneider Electric trebuie să țină evidența legăturilor dintre conturile clienților afiliați în sistemele lor ERP. Pe măsură ce baza lor de clienți crește, clienții noi sunt adăugați zilnic, iar echipele lor de cont trebuie să sorteze manual acești noi clienți și să-i conecteze la entitatea-mamă potrivită.
Decizia de conectare se bazează pe cele mai recente informații disponibile public pe internet sau în mass-media și ar putea fi afectată de achiziții recente, știri de pe piață sau restructurare divizială. Un exemplu de conectare a conturilor ar fi identificarea relației dintre Amazon și filiala sa, Whole Foods Market [sursă].
Schneider Electric implementează modele de limbaj mari pentru capacitățile lor de a răspunde la întrebări în diferite domenii specifice de cunoaștere, data la care modelul a fost instruit îi limitează cunoștințele. Ei au abordat această provocare folosind un model de limbă mare open source generație Retriever-Augmented disponibil pe Amazon SageMaker JumpStart pentru a procesa cantități mari de cunoștințe externe extrase și a prezenta relații corporative sau publice între înregistrările ERP.
La începutul anului 2023, când Schneider Electric a decis să-și automatizeze o parte din procesul de conectare a conturilor folosind inteligența artificială (AI), compania a încheiat un parteneriat cu AWS Machine Learning Solutions Lab (MLSL). Cu expertiza MLSL în consultanța și execuția ML, Schneider Electric a reușit să dezvolte o arhitectură AI care să reducă efortul manual în conectarea fluxurilor de lucru și să ofere acces mai rapid la date echipelor lor de analiză din aval.
AI generativă
Inteligența artificială generativă și modelele de limbaj mari (LLM) transformă modul în care organizațiile de afaceri sunt capabile să rezolve provocările complexe în mod tradițional legate de procesarea și înțelegerea limbajului natural. Unele dintre beneficiile oferite de LLM includ capacitatea de a înțelege porțiuni mari de text și de a răspunde la întrebările conexe, producând răspunsuri asemănătoare oamenilor. AWS facilitează pentru clienți să experimenteze și să producă sarcinile de lucru LLM, punând la dispoziție multe opțiuni prin Amazon SageMaker JumpStart, Amazon Bedrock, și Amazon Titan.
Achiziția de cunoștințe externe
LLM-urile sunt cunoscute pentru capacitatea lor de a comprima cunoștințele umane și au demonstrat capacități remarcabile de a răspunde la întrebări în diferite domenii specifice de cunoaștere, dar cunoștințele lor sunt limitate de data la care modelul a fost instruit. Abordăm această întrerupere a informațiilor prin cuplarea LLM cu un API de căutare Google pentru a oferi un LLM (RAG) puternic pentru recuperare, care abordează provocările Schneider Electric. RAG este capabil să proceseze cantități mari de cunoștințe externe extrase din căutarea Google și să prezinte relații corporative sau publice între înregistrările ERP.
Vezi următorul exemplu:
Întrebare: Cine este compania-mamă a One Medical?
Interogare Google: „One Medical company company” → informații → LLM
Răspuns: One Medical, o subsidiară a Amazon...
Exemplul precedent (preluat din baza de date a clienților Schneider Electric) se referă la o achiziție care a avut loc în februarie 2023 și, prin urmare, nu ar fi prins doar de LLM din cauza limitelor de cunoștințe. Creșterea LLM cu căutarea Google garantează cele mai actualizate informații.
Model Flan-T5
În acel proiect am folosit modelul Flan-T5-XXL de la Flan-T5 familie de modele.
Modelele Flan-T5 sunt reglate în funcție de instrucțiuni și, prin urmare, sunt capabile să efectueze diverse sarcini NLP zero-shot. În sarcina noastră din aval nu a fost nevoie să găzduim o cantitate mare de cunoștințe despre lume, ci mai degrabă să performam bine la răspunsul la întrebări având în vedere un context de texte furnizate prin rezultatele căutării și, prin urmare, modelul T11 cu parametrii 5B a funcționat bine.
JumpStart oferă implementarea convenabilă a acestei familii de modele prin Amazon SageMaker Studio și SDK-ul SageMaker. Acesta include Flan-T5 Small, Flan-T5 Base, Flan-T5 Large, Flan-T5 XL și Flan-T5 XXL. Mai mult, JumpStart oferă câteva versiuni ale Flan-T5 XXL la diferite niveluri de cuantizare. Am implementat Flan-T5-XXL la un punct final pentru utilizarea inferenței Amazon SageMaker Studio Jumpstart.
Recuperare LLM sporit cu LangChain
LangChain este un cadru popular și în creștere rapidă, care permite dezvoltarea de aplicații alimentate de LLM-uri. Se bazează pe conceptul de lanţuri, care sunt combinații de diferite componente concepute pentru a îmbunătăți funcționalitatea LLM-urilor pentru o anumită sarcină. De exemplu, ne permite să personalizăm solicitări și integrați LLM-urile cu diferite instrumente, cum ar fi motoare de căutare externe sau surse de date. În cazul nostru de utilizare, am folosit Google Serper componentă pentru a căuta pe web și a implementat modelul Flan-T5-XXL disponibil pe Amazon SageMaker Studio Jumpstart. LangChain realizează orchestrarea generală și permite ca paginile cu rezultatele căutării să fie introduse în instanța Flan-T5-XXL.
Generația Retrieval-Augmented (RAG) constă din doi pași:
- Recuperare de fragmente de text relevante din surse externe
- Augmentare a bucăților cu context în promptul dat LLM.
Pentru cazul de utilizare al Schneider Electric, RAG procedează după cum urmează:
- Numele companiei dat este combinat cu o întrebare precum „Cine este compania-mamă a lui X”, unde X este compania dată) și transmis la o interogare Google folosind Serper AI
- Informațiile extrase sunt combinate cu întrebarea promptă și originală și transmise LLM pentru un răspuns.
Următoarea diagramă ilustrează acest proces.
Utilizați următorul cod pentru a crea un punct final:
Instrumentul de căutare instanțiat:
În următorul cod, înlănțuim componentele de recuperare și de augmentare:
Ingineria promptă
Combinația dintre context și întrebare se numește prompt. Am observat că promptul general pe care l-am folosit (variații în ceea ce privește solicitarea companiei-mamă) a funcționat bine pentru majoritatea sectoarelor publice (domenii), dar nu s-a generalizat bine în educație sau asistență medicală, deoarece noțiunea de companie-mamă nu are sens acolo. Pentru educație, am folosit „X”, în timp ce pentru asistență medicală am folosit „Y”.
Pentru a activa această selecție promptă specifică domeniului, a trebuit să identificăm și domeniul căruia îi aparține un anumit cont. Pentru aceasta, am folosit și un RAG în care o întrebare cu răspunsuri multiple „Care este domeniul {account}?” ca prim pas și, pe baza răspunsului, am întrebat părintele contului folosind promptul relevant ca al doilea pas. Vezi următorul cod:
Indicațiile specifice sectorului au sporit performanța generală de la 55% la 71% din precizie. În general, efortul și timpul investit pentru a se dezvolta eficient solicitări par să îmbunătățească semnificativ calitatea răspunsului LLM.
RAG cu date tabelare (SEC-10k)
Documentele SEC 10K reprezintă o altă sursă de încredere de informații pentru filiale și subdiviziuni depuse anual de către companiile cotate la bursă. Aceste dosare sunt disponibile direct pe SEC EDGAR sau prin CorpWatch API-ul.
Presupunem că informațiile sunt date în format tabelar. Mai jos este un pseudo csv setul de date care imită formatul original al setului de date SEC-10K. Este posibil să îmbinați mai multe csv surse de date într-un cadru de date Pandas combinat:
# A pseudo dataset similar by schema to the CorpWatch API dataset
df.head()
- Distribuție de conținut bazat pe SEO și PR. Amplifică-te astăzi.
- PlatoData.Network Vertical Generative Ai. Împuterniciți-vă. Accesați Aici.
- PlatoAiStream. Web3 Intelligence. Cunoștințe amplificate. Accesați Aici.
- PlatoESG. carbon, CleanTech, Energie, Mediu inconjurator, Solar, Managementul deșeurilor. Accesați Aici.
- PlatoHealth. Biotehnologie și Inteligență pentru studii clinice. Accesați Aici.
- Sursa: https://aws.amazon.com/blogs/machine-learning/schneider-electric-leverages-retrieval-augmented-llms-on-sagemaker-to-ensure-real-time-updates-in-their-erp-systems/
- :are
- :este
- :nu
- :Unde
- $UP
- 1
- 10
- 100
- 10 K
- 11
- ani 15
- 15%
- 160
- 17
- 2023
- 7
- 710
- a
- capacitate
- Capabil
- Despre Noi
- mai sus
- abstracție
- accelera
- acces
- găzdui
- Cont
- Contabilitate
- Conturi
- precizie
- precis
- achiziție
- achiziții
- peste
- Acțiune
- adăugat
- plus
- Suplimentar
- adresa
- adresat
- adrese
- Avantajele
- afectat
- Agent
- AI
- AI / ML
- Permiterea
- permite
- singur
- de asemenea
- Amazon
- Învățare automată Amazon
- Amazon SageMaker
- Amazon SageMaker JumpStart
- Amazon Web Services
- America
- printre
- sumă
- Sume
- an
- Google Analytics
- și
- Anual
- O alta
- răspunde
- Anthony
- api
- apărea
- aplicatii
- aplicat
- Aplicarea
- arhitectură
- SUNT
- în jurul
- artificial
- inteligență artificială
- Inteligența artificială (AI)
- AS
- cere
- solicitând
- asuma
- At
- spori
- augmented
- automatizarea
- Automatizare
- disponibil
- disponibil direct
- AWS
- Învățare automată AWS
- Bancar
- de bază
- bazat
- BE
- fost
- înainte
- aparține
- de mai jos
- Beneficiile
- CEL MAI BUN
- între
- Blocuri
- amplificat
- Aduce
- construi
- Clădire
- afaceri
- funcții de afaceri
- business intelligence
- dar
- by
- denumit
- CAN
- capacități
- capabil
- Carlson
- prins
- lanţ
- contesta
- provocări
- alegere
- Oraș
- Clasifica
- CNBC
- cod
- Coloană
- combinaţie
- combinaţii
- combinate
- Companii
- companie
- complex
- component
- componente
- înţelege
- concept
- preocupările
- constă
- consultant
- consumator
- context
- Convenabil
- Istoria
- crea
- A crea valoare
- client
- clienţii care
- zilnic
- de date
- accesul la date
- Pe bază de date
- Baza de date
- seturi de date
- Data
- David
- hotărât
- decizie
- livra
- livrarea
- demonstrat
- dislocate
- Implementarea
- desfășurarea
- Amenajări
- proiectat
- detaliu
- detaliat
- dezvolta
- în curs de dezvoltare
- Dezvoltare
- diferit
- digital
- Transformarea digitală
- direct
- do
- document
- domeniu
- domenii
- două
- Devreme
- uşor
- Educaţie
- efort
- electric
- permite
- Punct final
- energie
- Inginerie
- Motoare
- asigura
- intrarea
- Companii
- entitate
- ERP
- exemplu
- execuție
- expune
- experienţă
- experiment
- expertiză
- experți
- extinde
- extern
- Exxon Mobil
- familie
- FAST
- mai repede
- februarie
- fed-
- puțini
- depusă
- pilitură
- final
- Găsi
- First
- Concentra
- concentrat
- următor
- urmează
- alimente
- Pentru
- format
- Cadru
- din
- funcționalitate
- funcții
- mai mult
- În plus
- GAS
- generaţie
- generativ
- AI generativă
- dat
- Caritate
- Cautare Google
- grafice
- În creştere
- creste
- garanții
- HAD
- sa întâmplat
- Avea
- he
- de asistență medicală
- ajută
- ei
- superior
- lui
- Cum
- HTML
- http
- HTTPS
- uman
- i
- Identificare
- identifica
- ilustrează
- îmbunătăţi
- îmbunătățirea
- in
- include
- include
- incubator
- industrial
- industrie
- informații
- inițială
- inițiative
- intrare
- perspective
- instanță
- integra
- Inteligență
- interacţiona
- interese
- Internet
- în
- investit
- IT
- ESTE
- Joshua
- jpg
- A pastra
- Cheie
- Cunoaște
- cunoştinţe
- cunoscut
- de laborator
- limbă
- mare
- strat
- lider
- conducere
- învăţare
- nivelurile de
- pîrghii
- percepe
- ca
- Limitat
- limitativ
- LINK
- legarea
- Link-uri
- LLM
- maşină
- masina de învățare
- menține
- FACE
- Efectuarea
- administra
- administrare
- manager
- manual
- manual
- multe
- marca
- Piață
- Stiri de piata
- semnificativ
- Mass-media
- medical
- date medicale
- Îmbina
- care fuzionează
- Metode
- ar putea
- Morar
- ML
- model
- Modele
- mai mult
- cele mai multe
- multiplu
- nume
- denumire
- Natural
- Procesarea limbajului natural
- Nevoie
- nevoilor
- Nou
- New York
- New York City
- ştiri
- nlp
- Nu.
- North
- America de Nord
- noțiune
- acum
- observaţie
- of
- oferit
- Ulei
- Petrol și gaze
- on
- ONE
- Unul medical
- deschide
- open-source
- Opţiuni
- or
- orchestrație
- comandă
- organizație
- de organizare
- organizații
- original
- Altele
- al nostru
- afară
- producție
- global
- propriu
- pagini
- panda
- parametrii
- companie mamă
- parte
- special
- parteneriat
- Trecut
- pasionat
- cale
- Efectua
- performanță
- efectuată
- efectuarea
- efectuează
- Pharma
- PhD
- conducte
- planificare
- Plato
- Informații despre date Platon
- PlatoData
- Popular
- posibil
- Post
- alimentat
- puternic
- în prealabil
- Principal
- probleme
- venituri
- proces
- prelucrare
- producând
- proiect
- adecvat
- prevăzut
- furnizează
- public
- public
- calitate
- întrebare
- Întrebări
- mai degraba
- în timp real
- recent
- înregistrări
- reduce
- legate de
- relaţie
- Relaţii
- de încredere
- remarcabil
- Necesită
- cercetare
- cercetător
- resursă
- răspuns
- răspunsuri
- rezultat
- REZULTATE
- reveni
- robust
- în mod obișnuit
- RÂND
- Alerga
- sagemaker
- de vânzări
- Scară
- Schneider Electric
- Ştiinţă
- Om de stiinta
- sdk
- Caută
- Motoare de cautare
- SEC
- Al doilea
- sector
- sectoare
- sigur
- vedea
- selecţie
- senior
- servi
- Servicii
- câteva
- ea
- semnificativ
- asemănător
- întrucât
- mic
- soluţie
- soluţii
- REZOLVAREA
- unele
- Sursă
- Surse
- specializată
- specific
- Rotire
- tors
- de ultimă oră
- statistic
- Pas
- paşi
- stoca
- structurile
- studio
- subdiviziuni
- filială
- astfel de
- De sprijin
- sistem
- sisteme
- luate
- Sarcină
- sarcini
- echipă
- echipe
- Tehnic
- a) Sport and Nutrition Awareness Day in Manasia Around XNUMX people from the rural commune Manasia have participated in a sports and healthy nutrition oriented activity in one of the community’s sports ready yards. This activity was meant to gather, mainly, middle-aged people from a Romanian rural community and teach them about the benefits that sports have on both their mental and physical health and on how sporting activities can be used to bring people from a community closer together. Three trainers were made available for this event, so that the participants would get the best possible experience physically and so that they could have the best access possible to correct information and good sports/nutrition practices. b) Sports Awareness Day in Poiana Țapului A group of young participants have taken part in sporting activities meant to teach them about sporting conduct, fairplay, and safe physical activities. The day culminated with a football match.
- decât
- acea
- informațiile
- lor
- Lor
- teoretic
- Acolo.
- prin urmare
- Acestea
- ei
- acest
- gândit
- Prin
- Prin urmare
- timp
- la
- împreună
- instrument
- Unelte
- top
- urmări
- firmei
- tradiţional
- dresat
- Transformare
- transformare
- demn de încredere
- TIC nervos
- Două
- descoperi
- înţelegere
- deschide
- up-to-data
- actualizări
- us
- utilizare
- utilizat
- folosind
- valoare
- diverse
- Fixă
- Versiunile
- verticalele
- de
- a fost
- Cale..
- modalități de
- we
- Bogatie
- web
- servicii web
- BINE
- Ce
- Ce este
- cand
- care
- în timp ce
- OMS
- întreg
- voi
- cu
- în
- flux de lucru
- fluxuri de lucru
- fabrică
- lume
- ar
- X
- ani
- York
- Tu
- zephyrnet