Tämä viesti on kirjoitettu yhteistyössä Pohjois-Amerikan tekoälyn ratkaisusuunnittelusta ja arkkitehtuurista vastaavan Anthony Medeirosin ja Schneider Electricin Business Intelligence Managerin Blake Santschin kanssa. Muita Schneider Electricin asiantuntijoita ovat Jesse Miller, Somik Chowdhury, Shaswat Babhulgaonkar, David Watkins, Mark Carlson ja Barbara Sleczkowski.
Yritykset käyttävät Enterprise Resource Planning (ERP) -järjestelmiä useiden liiketoimintatoimintojen, kuten kirjanpidon, myynnin tai tilausten hallinnan, hallintaan yhdessä järjestelmässä. Niitä käytetään rutiininomaisesti erityisesti asiakastileihin liittyvien tietojen tallentamiseen. Yrityksen eri organisaatiot saattavat käyttää erilaisia ERP-järjestelmiä, ja niiden yhdistäminen on mittakaavassa monimutkainen tekninen haaste, joka vaatii toimialuekohtaista osaamista.
Schneider Electric on energiahallinnan ja teollisuusautomaation digitaalisen muuntamisen johtava yritys. Voidakseen parhaiten palvella asiakkaidensa tarpeita Schneider Electricin on seurattava toiminnanohjausjärjestelmissään liittyvien asiakkaiden tilien välisiä linkkejä. Kun heidän asiakaskuntansa kasvaa, uusia asiakkaita lisätään päivittäin, ja heidän tilitiimiensä on lajiteltava nämä uudet asiakkaat manuaalisesti ja linkitettävä ne oikeaan emokokonaisuuteen.
Linkityspäätös perustuu viimeisimpään Internetissä tai tiedotusvälineissä julkisesti saatavilla olevaan tietoon, ja siihen voivat vaikuttaa viimeaikaiset yritysostot, markkinauutiset tai divisioonan uudelleenjärjestelyt. Esimerkki tilien yhdistämisestä olisi Amazonin ja sen tytäryhtiön Whole Foods Marketin välisen suhteen tunnistaminen [lähde].
Schneider Electric ottaa käyttöön suuria kielimalleja, jotta ne pystyvät vastaamaan kysymyksiin useilla tietokohtaisilla aloilla, ja mallin koulutuspäivä rajoittaa sen tietämystä. He ratkaisivat tämän haasteen käyttämällä Retriever-Augmented Generation avoimen lähdekoodin laajaa kielimallia, joka on saatavilla osoitteessa Amazon SageMaker JumpStart käsitellä suuria määriä hankittua ulkopuolista tietoa ja näyttää yritys- tai julkisia suhteita ERP-tietueiden välillä.
Vuoden 2023 alussa, kun Schneider Electric päätti automatisoida osan tilien linkitysprosessistaan tekoälyn (AI) avulla, yhtiö teki yhteistyötä AWS Machine Learning Solutions Labin (MLSL) kanssa. MLSL:n asiantuntemuksella ML-konsultoinnissa ja -toteutuksessa Schneider Electric pystyi kehittämään tekoälyarkkitehtuurin, joka vähentäisi manuaalista työtä linkittäessäsi työnkulkujaan ja mahdollistaisi nopeamman tiedonsaannin loppupään analytiikkatiimeilleen.
Generatiivinen AI
Generatiiviset tekoälyt ja suuret kielimallit (LLM) muuttavat tapaa, jolla yritysorganisaatiot pystyvät ratkaisemaan perinteisesti monimutkaisia luonnollisen kielen käsittelyyn ja ymmärtämiseen liittyviä haasteita. Joitakin LLM:n tarjoamia etuja ovat kyky ymmärtää suuria osia tekstiä ja vastata aiheeseen liittyviin kysymyksiin tuottamalla ihmisen kaltaisia vastauksia. AWS:n avulla asiakkaat voivat helposti kokeilla ja tuottaa LLM-työkuormia tarjoamalla monia vaihtoehtoja saataville Amazon SageMaker JumpStartin kautta, Amazonin kallioperäja Amazon Titan.
Ulkoisen tiedon hankinta
LLM:t tunnetaan kyvystään tiivistää ihmistietoa, ja he ovat osoittaneet merkittäviä kykyjä vastata kysymyksiin useilla tietokohtaisilla aloilla, mutta heidän tietämystään rajoittaa mallin koulutuspäivämäärä. Korjaamme tämän tiedon katkaisun yhdistämällä LLM:n Google Search API:n kanssa tarjotaksemme tehokkaan Retrieval Augmented LLM:n (RAG), joka vastaa Schneider Electricin haasteisiin. RAG pystyy käsittelemään suuria määriä Google-hausta saatua ulkoista tietoa ja osoittamaan yritys- tai julkisia suhteita ERP-tietueiden välillä.
Katso seuraava esimerkki:
Kysymys: Kuka on One Medicalin emoyhtiö?
Google-kysely: "One Medical-emoyhtiö" → tiedot → LLM
Vastaus: One Medical, Amazonin tytäryhtiö…
Edellinen esimerkki (otettu Schneider Electric -asiakastietokannasta) koskee yrityskauppaa, joka tapahtui helmikuussa 2023, ja näin ollen se ei jää yksin LLM:n kiinni tietokatkojen vuoksi. LLM:n lisääminen Google-haulla takaa ajantasaisimmat tiedot.
Flan-T5 malli
Tässä projektissa käytimme mallia Flan-T5-XXL Flan-T5 malliperheeseen.
Flan-T5-mallit ovat ohjeviritettyjä, joten ne pystyvät suorittamaan erilaisia nolla-shot NLP -tehtäviä. Loppuvaiheen tehtävässämme ei tarvinnut ottaa käyttöön valtavaa määrää maailmantietoa, vaan pikemminkin pärjätä hyvin kysymyksiin vastaamisessa hakutulosten kautta tarjottujen tekstien kontekstissa, ja siksi 11B-parametrien T5-malli toimi hyvin.
JumpStart tarjoaa tämän malliperheen kätevän käyttöönoton Amazon SageMaker Studio ja SageMaker SDK. Tämä sisältää Flan-T5 Small, Flan-T5 Base, Flan-T5 Large, Flan-T5 XL ja Flan-T5 XXL. Lisäksi JumpStart tarjoaa muutamia versioita Flan-T5 XXL:stä eri kvantisointitasoilla. Otimme Flan-T5-XXL:n käyttöön päätepisteeseen päätelmiä varten Amazon SageMaker Studio Jumpstart.
Haku laajennettu LLM LangChainilla
LangChain on suosittu ja nopeasti kasvava kehys, joka mahdollistaa LLM-sovellusten kehittämisen. Se perustuu käsitteeseen kahleet, jotka ovat eri komponenttien yhdistelmiä, jotka on suunniteltu parantamaan LLM:n toimivuutta tietyssä tehtävässä. Sen avulla voimme esimerkiksi mukauttaa ohjeita ja integroida LLM:t erilaisiin työkaluihin, kuten ulkoisiin hakukoneisiin tai tietolähteisiin. Käyttötapauksessamme käytimme Googlea Serper komponenttia verkosta hakemiseen ja otettiin käyttöön Flan-T5-XXL-malli, joka on saatavilla osoitteessa Amazon SageMaker Studio Jumpstart. LangChain suorittaa yleisen orkestroinnin ja sallii hakutulossivujen syöttämisen Flan-T5-XXL-instanssiin.
Retrieval-Augmented Generation (RAG) koostuu kahdesta vaiheesta:
- haku asiaankuuluvia tekstikappaleita ulkoisista lähteistä
- lisääminen LLM:lle annetussa kehotteessa olevista osista kontekstineen.
Schneider Electricin käyttötapauksessa RAG etenee seuraavasti:
- Annettu yrityksen nimi yhdistetään kysymykseen, kuten "Kuka on X:n emoyhtiö", missä X on annettu yritys) ja välitetään google-kyselyyn Serper AI:llä
- Poimitut tiedot yhdistetään nopeaan ja alkuperäiseen kysymykseen ja välitetään LLM:lle vastausta varten.
Seuraava kaavio havainnollistaa tätä prosessia.
Luo päätepiste käyttämällä seuraavaa koodia:
Välitön hakutyökalu:
Seuraavassa koodissa ketjutamme haku- ja lisäyskomponentit yhteen:
Nopea suunnittelu
Kontekstin ja kysymyksen yhdistelmää kutsutaan kehotteeksi. Huomasimme, että käyttämämme yleiskehote (emoyhtiön kysymisen vaihtelut) toimi hyvin useimmilla julkisilla sektoreilla (verkkotunnuksilla), mutta se ei yleistynyt hyvin koulutukseen tai terveydenhuoltoon, koska emoyhtiön käsitteellä ei ole siellä merkitystä. Koulutuksessa käytimme kirjainta X, kun taas terveydenhuollossa käytimme kirjainta Y.
Tämän verkkotunnuskohtaisen kehotteen valinnan mahdollistamiseksi meidän oli myös tunnistettava verkkotunnus, johon tietty tili kuuluu. Tätä varten käytimme myös RAG:ta, jossa monivalintakysymys "Mikä on {tilin} verkkotunnus?" ensimmäisenä vaiheena, ja vastauksen perusteella tiedustelimme tilin emoyhtiöltä käyttämällä asianmukaista kehotetta toisena vaiheena. Katso seuraava koodi:
Alakohtaiset kehotteet ovat parantaneet yleistä suorituskykyä 55 prosentista 71 prosenttiin tarkkuudesta. Kaiken kaikkiaan vaivaa ja aikaa kehitetään tehokkaaksi ohjeita näyttävät parantavan merkittävästi LLM-vastauksen laatua.
RAG taulukkotiedoilla (SEC-10k)
SEC 10K -ilmoitukset ovat toinen luotettava tietolähde tytäryhtiöille ja alayksiköille, jotka julkisesti noteeratut yhtiöt jättävät vuosittain. Nämä hakemukset ovat saatavilla suoraan SEC:stä Edgar tai läpi CorpWatch API.
Oletamme, että tiedot annetaan taulukkomuodossa. Alla on pseudo csv tietojoukko, joka jäljittelee SEC-10K-tietojoukon alkuperäistä muotoa. On mahdollista yhdistää useita csv tietolähteet yhdistettyyn pandatietokehykseen:
# A pseudo dataset similar by schema to the CorpWatch API dataset
df.head()
- SEO-pohjainen sisällön ja PR-jakelu. Vahvista jo tänään.
- PlatoData.Network Vertical Generatiivinen Ai. Vahvista itseäsi. Pääsy tästä.
- PlatoAiStream. Web3 Intelligence. Tietoa laajennettu. Pääsy tästä.
- PlatoESG. hiili, CleanTech, energia, ympäristö, Aurinko, Jätehuolto. Pääsy tästä.
- PlatonHealth. Biotekniikan ja kliinisten kokeiden älykkyys. Pääsy tästä.
- Lähde: https://aws.amazon.com/blogs/machine-learning/schneider-electric-leverages-retrieval-augmented-llms-on-sagemaker-to-ensure-real-time-updates-in-their-erp-systems/
- :on
- :On
- :ei
- :missä
- $ YLÖS
- 1
- 10
- 100
- 10K
- 11
- 15 vuotta
- 15%
- 160
- 17
- 2023
- 7
- 710
- a
- kyky
- pystyy
- Meistä
- edellä
- abstraktio
- kiihdyttää
- pääsy
- majoittaa
- Tili
- kirjanpito
- Tilit
- tarkkuus
- tarkka
- hankinta
- yritysostot
- poikki
- Toiminta
- lisä-
- Lisäksi
- lisä-
- osoite
- osoitettu
- osoitteet
- etuja
- vaikuttaa
- Agentti
- AI
- AI / ML
- Salliminen
- mahdollistaa
- yksin
- Myös
- Amazon
- Amazonin koneoppiminen
- Amazon Sage Maker
- Amazon SageMaker JumpStart
- Amazon Web Services
- Amerikka
- keskuudessa
- määrä
- määrät
- an
- Analytics
- ja
- Vuosittain
- Toinen
- vastaus
- Anthony
- api
- näyttää
- sovellukset
- sovellettu
- Hakeminen
- arkkitehtuuri
- OVAT
- noin
- keinotekoinen
- tekoäly
- Tekoäly (AI)
- AS
- kysyä
- pyytäminen
- olettaa
- At
- lisätä
- täydennetty
- automatisoida
- Automaatio
- saatavissa
- saatavilla suoraan
- AWS
- AWS-koneoppiminen
- Pankkitoiminta
- pohja
- perustua
- BE
- ollut
- ennen
- kuuluu
- alle
- Hyödyt
- PARAS
- välillä
- Blocks
- Boostatut
- Tuo
- rakentaa
- Rakentaminen
- liiketoiminta
- liiketoiminnot
- bisnesvaisto
- mutta
- by
- nimeltään
- CAN
- kyvyt
- kykenee
- Carlson
- kiinni
- ketju
- haaste
- haasteet
- valinta
- Kaupunki
- luokitella
- CNBC
- koodi
- Sarake
- yhdistelmä
- yhdistelmät
- yhdistetty
- Yritykset
- yritys
- monimutkainen
- komponentti
- osat
- ymmärtää
- käsite
- huolenaiheet
- muodostuu
- konsultointi
- kuluttaja
- tausta
- Mukava
- Yrityksen
- luoda
- Luo arvoa
- asiakas
- Asiakkaat
- päivittäin
- tiedot
- tietojen käyttö
- data-driven
- tietokanta
- aineistot
- Päivämäärä
- David
- päätti
- päätös
- toimittaa
- tuottaa
- osoittivat
- käyttöön
- levityspinnalta
- käyttöönotto
- Malli
- suunniteltu
- yksityiskohta
- yksityiskohtainen
- kehittää
- kehittämällä
- Kehitys
- eri
- digitaalinen
- Digital Transformation
- suoraan
- do
- asiakirja
- verkkotunnuksen
- verkkotunnuksia
- kaksi
- Varhainen
- helppo
- koulutus
- vaivaa
- sähköinen
- mahdollistaa
- päätepiste
- energia
- Tekniikka
- Moottorit
- varmistaa
- kirjoittamalla
- yrityksille
- kokonaisuus
- ERP
- esimerkki
- teloitus
- näyttely
- experience
- kokeilu
- asiantuntemus
- asiantuntijat
- laajentaa
- ulkoinen
- Exxon Mobil
- perhe
- FAST
- nopeampi
- helmikuu
- Fed
- harvat
- jätetty
- viilaus
- lopullinen
- Löytää
- Etunimi
- Keskittää
- keskityttiin
- jälkeen
- seuraa
- elintarvikkeet
- varten
- muoto
- Puitteet
- alkaen
- toiminnallisuus
- tehtävät
- edelleen
- Lisäksi
- GAS
- sukupolvi
- generatiivinen
- Generatiivinen AI
- tietty
- Global
- Google Search
- kaaviot
- Kasvava
- kasvaa
- takeita
- HAD
- tapahtui
- Olla
- he
- terveydenhuollon
- auttaa
- hänen
- korkeampi
- hänen
- Miten
- HTML
- http
- HTTPS
- ihmisen
- i
- Tunnistaminen
- tunnistaa
- havainnollistaa
- parantaa
- parantaminen
- in
- sisältää
- sisältää
- hautomo
- teollinen
- teollisuus
- tiedot
- ensimmäinen
- aloitteita
- panos
- oivalluksia
- esimerkki
- yhdistää
- Älykkyys
- olla vuorovaikutuksessa
- etu
- Internet
- tulee
- investoineet
- IT
- SEN
- Joshua
- jpg
- Pitää
- avain
- Tietää
- tuntemus
- tunnettu
- laboratorio
- Kieli
- suuri
- kerros
- johtaja
- johtava
- oppiminen
- tasot
- vipusuhteita
- vero
- pitää
- rajallinen
- rajoittamalla
- LINK
- yhdistää
- linkit
- OTK
- kone
- koneoppiminen
- ylläpitää
- TEE
- Tekeminen
- hoitaa
- johto
- johtaja
- manuaalinen
- käsin
- monet
- Merkitse
- markkinat
- Market News
- mielekäs
- Media
- lääketieteellinen
- lääketieteelliset tiedot
- mennä
- sulautuvan
- menetelmät
- ehkä
- Mylläri
- ML
- malli
- mallit
- lisää
- eniten
- moninkertainen
- nimi
- nimeäminen
- Luonnollinen
- Luonnollinen kielen käsittely
- Tarve
- tarpeet
- Uusi
- New York
- new york city
- uutiset
- NLP
- Nro
- Pohjoiseen
- Pohjois-Amerikka
- Käsite
- nyt
- havainto
- of
- tarjotaan
- Öljy
- Öljy ja kaasu
- on
- ONE
- Yksi lääketieteellinen
- avata
- avoimen lähdekoodin
- Vaihtoehdot
- or
- orkestrointi
- tilata
- organisaatio
- organisatorinen
- organisaatioiden
- alkuperäinen
- Muut
- meidän
- ulos
- ulostulo
- yleinen
- oma
- sivut
- pandas
- parametrit
- emoyhtiö
- osa
- erityinen
- kumppanuuteen
- Hyväksytty
- intohimoinen
- polku
- Suorittaa
- suorituskyky
- suoritettu
- esittävä
- suorittaa
- Pharma
- phd
- putki
- suunnittelu
- Platon
- Platonin tietotieto
- PlatonData
- Suosittu
- mahdollinen
- Kirje
- powered
- voimakas
- aiemmin
- Pääasiallinen
- ongelmia
- tuotto
- prosessi
- käsittely
- tuottavat
- projekti
- asianmukainen
- mikäli
- tarjoaa
- julkinen
- julkisesti
- laatu
- kysymys
- kysymykset
- pikemminkin
- reaaliaikainen
- äskettäinen
- asiakirjat
- vähentää
- liittyvä
- yhteys
- Ihmissuhteet
- merkityksellinen
- luotettava
- huomattava
- Vaatii
- tutkimus
- tutkija
- resurssi
- vastaus
- vasteet
- johtua
- tulokset
- palata
- luja
- rutiininomaisesti
- RIVI
- ajaa
- sagemaker
- myynti
- Asteikko
- Schneider Electric
- tiede
- Tiedemies
- sdk
- Haku
- Hakukoneet
- SEK
- Toinen
- sektori
- sektorit
- turvallinen
- nähdä
- valinta
- vanhempi
- palvella
- Palvelut
- useat
- hän
- merkittävästi
- samankaltainen
- koska
- pieni
- ratkaisu
- Ratkaisumme
- SOLVE
- jonkin verran
- lähde
- Lähteet
- erikoistunut
- erityinen
- Kierre
- kehrätty
- huippu-
- tilastollinen
- Vaihe
- Askeleet
- verkkokaupasta
- rakenteet
- studio
- alaosastoa
- tytäryhtiö
- niin
- Tukea
- järjestelmä
- järjestelmät
- otettava
- Tehtävä
- tehtävät
- joukkue-
- tiimit
- Tekninen
- teksti
- kuin
- että
- -
- tiedot
- heidän
- Niitä
- teoreettinen
- Siellä.
- siksi
- Nämä
- ne
- tätä
- ajatus
- Kautta
- Näin
- aika
- että
- yhdessä
- työkalu
- työkalut
- ylin
- raita
- vaihdettiin
- perinteisesti
- koulutettu
- Muutos
- muuttamassa
- luotettava
- Nykiä
- kaksi
- paljastaa
- ymmärtäminen
- avata
- ajanmukainen
- Päivitykset
- us
- käyttää
- käytetty
- käyttämällä
- arvo
- eri
- valtava
- versiot
- pystysuunnassa
- kautta
- oli
- Tapa..
- tavalla
- we
- Rikkaus
- verkko
- verkkopalvelut
- HYVIN
- Mitä
- Mikä on
- kun
- joka
- vaikka
- KUKA
- koko
- tulee
- with
- sisällä
- työnkulku
- työnkulkuja
- toimii
- maailman-
- olisi
- X
- vuotta
- york
- Voit
- zephyrnet