Ten post został napisany wspólnie z Anthonym Medeirosem, menedżerem ds. inżynierii rozwiązań i architektury w Ameryce Północnej w zakresie sztucznej inteligencji, oraz Blake'iem Santschi, menedżerem ds. analityki biznesowej w firmie Schneider Electric. Do dodatkowych ekspertów Schneider Electric należą Jesse Miller, Somik Chowdhury, Shaswat Babhulgaonkar, David Watkins, Mark Carlson i Barbara Sleczkowski.
Systemy planowania zasobów przedsiębiorstwa (ERP) są wykorzystywane przez przedsiębiorstwa do zarządzania kilkoma funkcjami biznesowymi, takimi jak księgowość, sprzedaż czy zarządzanie zamówieniami w jednym systemie. W szczególności są one rutynowo wykorzystywane do przechowywania informacji związanych z kontami klientów. Różne organizacje w firmie mogą korzystać z różnych systemów ERP, a łączenie ich jest złożonym wyzwaniem technicznym na dużą skalę, które wymaga wiedzy specyficznej dla danej dziedziny.
Schneider Electric jest liderem cyfrowej transformacji zarządzania energią i automatyki przemysłowej. Aby jak najlepiej służyć potrzebom swoich klientów, Schneider Electric musi śledzić powiązania pomiędzy powiązanymi kontami klientów w swoich systemach ERP. W miarę powiększania się bazy klientów, codziennie dodawani są nowi klienci, a zespoły obsługujące konta muszą ręcznie sortować tych nowych klientów i łączyć ich z odpowiednim podmiotem nadrzędnym.
Decyzja o połączeniu opiera się na najnowszych informacjach dostępnych publicznie w Internecie lub mediach i może mieć na nią wpływ niedawne przejęcia, wiadomości rynkowe lub restrukturyzacja oddziałów. Przykładem łączenia kont może być identyfikacja powiązania między Amazonem a jego spółką zależną, Whole Foods Market [źródło].
Schneider Electric wdraża duże modele językowe ze względu na ich możliwości w zakresie odpowiadania na pytania z różnych dziedzin wiedzy, a data przeszkolenia modelu ogranicza jego wiedzę. Poradzili sobie z tym wyzwaniem, korzystając z modelu dużego języka open source generacji Retriever-Augmented Generation dostępnego w witrynie Amazon SageMaker JumpStart do przetwarzania dużych ilości pobranej wiedzy zewnętrznej i wykazywania powiązań korporacyjnych lub publicznych między rekordami ERP.
Kiedy na początku 2023 r. Schneider Electric zdecydował się zautomatyzować część procesu łączenia kont przy użyciu sztucznej inteligencji (AI), firma nawiązała współpracę z laboratorium AWS Machine Learning Solutions Lab (MLSL). Dzięki specjalistycznej wiedzy MLSL w zakresie doradztwa i realizacji ML firma Schneider Electric była w stanie opracować architekturę sztucznej inteligencji, która ograniczyłaby wysiłek ręczny związany z łączeniem przepływów pracy i zapewniła szybszy dostęp do danych zespołom analitycznym na niższym szczeblu.
generatywna sztuczna inteligencja
Generatywna sztuczna inteligencja i duże modele językowe (LLM) zmieniają sposób, w jaki organizacje biznesowe są w stanie rozwiązywać tradycyjnie złożone wyzwania związane z przetwarzaniem i rozumieniem języka naturalnego. Niektóre z korzyści oferowanych przez LLM obejmują możliwość rozumienia dużych fragmentów tekstu i odpowiadania na powiązane pytania poprzez tworzenie odpowiedzi przypominających ludzkie. AWS ułatwia klientom eksperymentowanie i produkcję obciążeń LLM, udostępniając wiele opcji za pośrednictwem Amazon SageMaker JumpStart, Amazońska skała macierzysta, Amazon Tytan.
Zewnętrzne pozyskiwanie wiedzy
LLM są znane ze swojej zdolności do kompresji ludzkiej wiedzy i wykazały niezwykłe umiejętności w odpowiadaniu na pytania z różnych dziedzin wiedzy, ale ich wiedza jest ograniczona datą wytrenowania modelu. Rozwiązujemy problem braku informacji, łącząc LLM z interfejsem API wyszukiwarki Google, aby zapewnić potężne narzędzie LLM ze wspomaganiem wyszukiwania (RAG), które pozwala sprostać wyzwaniom stojącym przed firmą Schneider Electric. RAG jest w stanie przetwarzać duże ilości wiedzy zewnętrznej wyciągniętej z wyszukiwarki Google i wykazywać powiązania korporacyjne lub publiczne pomiędzy rekordami ERP.
Zobacz poniższy przykład:
Pytanie: Kto jest spółką-matką One Medical?
Zapytanie Google: „Spółka-matka One Medical” → informacje → LLM
Odpowiedź: One Medical, spółka zależna Amazona…
Powyższy przykład (pobrany z bazy danych klientów Schneider Electric) dotyczy przejęcia, które miało miejsce w lutym 2023 r. i w związku z tym nie zostałoby ujęte przez samą LLM ze względu na ograniczenia wiedzy. Rozszerzenie LLM o wyszukiwarkę Google gwarantuje najbardziej aktualne informacje.
Model Flan-T5
W tym projekcie wykorzystaliśmy model Flan-T5-XXL z firmy Flan-T5 rodzina modeli.
Modele Flan-T5 są dostosowane do instrukcji i dlatego są w stanie wykonywać różne zadania NLP typu zero-shot. W naszym dalszym zadaniu nie było potrzeby uwzględniania ogromnej ilości wiedzy światowej, ale raczej dobre wyniki w udzielaniu odpowiedzi na pytania, biorąc pod uwagę kontekst tekstów dostarczonych w wynikach wyszukiwania, w związku z czym model T11 z parametrami 5B spisał się dobrze.
JumpStart zapewnia wygodne wdrażanie tej rodziny modeli poprzez Studio Amazon SageMaker oraz pakiet SDK SageMaker. Obejmuje to Flan-T5 Small, Flan-T5 Base, Flan-T5 Large, Flan-T5 XL i Flan-T5 XXL. Ponadto JumpStart udostępnia kilka wersji Flan-T5 XXL na różnych poziomach kwantyzacji. Wdrożyliśmy Flan-T5-XXL w punkcie końcowym w celu wykorzystania wnioskowania Uruchomienie Amazon SageMaker Studio.
Pobieranie rozszerzone LLM z LangChain
LangChain to popularny i szybko rozwijający się framework umożliwiający tworzenie aplikacji opartych na LLM. Opiera się na koncepcji więzy, które są kombinacjami różnych komponentów zaprojektowanych w celu poprawy funkcjonalności LLM dla danego zadania. Na przykład pozwala nam dostosować monity i integruj LLM z różnymi narzędziami, takimi jak zewnętrzne wyszukiwarki lub źródła danych. W naszym przypadku użyliśmy Google Serper komponent do wyszukiwania w Internecie i wdrożył dostępny model Flan-T5-XXL Uruchomienie Amazon SageMaker Studio. LangChain wykonuje ogólną orkiestrację i umożliwia wprowadzanie stron wyników wyszukiwania do instancji Flan-T5-XXL.
Generacja wspomagana odzyskiwaniem (RAG) składa się z dwóch etapów:
- Wyszukiwanie odpowiednich fragmentów tekstu ze źródeł zewnętrznych
- zwiększenie fragmentów z kontekstem w monicie przekazanym LLM.
W przypadku zastosowania Schneider Electric wytyczne RAG postępują w następujący sposób:
- Podana nazwa firmy jest łączona z pytaniem typu „Kto jest firmą-matką X”, gdzie X to dana firma) i przekazywana do zapytania Google za pomocą Serper AI
- Wyodrębnione informacje są łączone z szybkim i oryginalnym pytaniem i przekazywane do LLM w celu uzyskania odpowiedzi.
Poniższy diagram ilustruje ten proces.
Użyj poniższego kodu, aby utworzyć punkt końcowy:
Narzędzie wyszukiwania instancji:
W poniższym kodzie łączymy komponenty pobierania i powiększania:
Szybka inżynieria
Połączenie kontekstu i pytania nazywa się podpowiedzią. Zauważyliśmy, że ogólna zachęta, której użyliśmy (warianty dotyczące pytania o firmę-matkę) działała dobrze w przypadku większości sektorów publicznych (domen), ale nie dawała się dobrze uogólnić na edukację lub opiekę zdrowotną, ponieważ pojęcie firmy-matki nie ma tam znaczenia. W przypadku edukacji używaliśmy „X”, natomiast w przypadku opieki zdrowotnej używaliśmy „Y”.
Aby umożliwić wybór monitu specyficzny dla domeny, musieliśmy także zidentyfikować domenę, do której należy dane konto. W tym celu użyliśmy również RAG, w którym zadano pytanie wielokrotnego wyboru „Jaka jest domena {konta}?” jako pierwszy krok, a na podstawie odpowiedzi zadaliśmy pytanie podmiotowi nadrzędnemu konta, korzystając z odpowiedniego monitu w drugim kroku. Zobacz następujący kod:
Podpowiedzi specyficzne dla sektora zwiększyły ogólną wydajność z 55% do 71% dokładności. Ogólnie rzecz biorąc, wysiłek i czas zainwestowane w rozwój były skuteczne monity wydają się znacząco poprawiać jakość odpowiedzi LLM.
RAG z danymi tabelarycznymi (SEC-10k)
Dokumenty SEC 10K to kolejne wiarygodne źródło informacji dla spółek zależnych i oddziałów składanych corocznie przez spółki notowane na giełdzie. Dokumenty te są dostępne bezpośrednio w SEC EDGAR lub przez CorpWatch API.
Zakładamy, że informacje podano w formie tabelarycznej. Poniżej pseudo CSV zbiór danych naśladujący oryginalny format zbioru danych SEC-10K. Istnieje możliwość łączenia wielu CSV źródła danych w połączoną ramkę danych pand:
# A pseudo dataset similar by schema to the CorpWatch API dataset
df.head()
- Dystrybucja treści i PR oparta na SEO. Uzyskaj wzmocnienie już dziś.
- PlatoData.Network Pionowe generatywne AI. Wzmocnij się. Dostęp tutaj.
- PlatoAiStream. Inteligencja Web3. Wiedza wzmocniona. Dostęp tutaj.
- PlatonESG. Węgiel Czysta technologia, Energia, Środowisko, Słoneczny, Gospodarowanie odpadami. Dostęp tutaj.
- Platon Zdrowie. Inteligencja w zakresie biotechnologii i badań klinicznych. Dostęp tutaj.
- Źródło: https://aws.amazon.com/blogs/machine-learning/schneider-electric-leverages-retrieval-augmented-llms-on-sagemaker-to-ensure-real-time-updates-in-their-erp-systems/
- :ma
- :Jest
- :nie
- :Gdzie
- $W GÓRĘ
- 1
- 10
- 100
- 10 tysięcy
- 11
- 15 roku
- 15%
- 160
- 17
- 2023
- 7
- 710
- a
- zdolność
- Zdolny
- O nas
- powyżej
- abstrakcja
- przyśpieszyć
- dostęp
- pomieścić
- Konto
- Księgowość
- Konta
- precyzja
- dokładny
- nabycie
- przejęcia
- w poprzek
- Działania
- w dodatku
- dodatek
- Dodatkowy
- adres
- zaadresowany
- Adresy
- Zalety
- afektowany
- Agent
- AI
- AI / ML
- Pozwalać
- pozwala
- sam
- również
- Amazonka
- Uczenie maszynowe Amazon
- Amazon Sage Maker
- Amazon SageMaker JumpStart
- Amazon Web Services
- Ameryka
- wśród
- ilość
- kwoty
- an
- analityka
- i
- Rocznie
- Inne
- odpowiedź
- Anthony
- api
- zjawić się
- aplikacje
- stosowany
- Stosowanie
- architektura
- SĄ
- na około
- sztuczny
- sztuczna inteligencja
- Sztuczna inteligencja (AI)
- AS
- zapytać
- pytanie
- założyć
- At
- zwiększać
- zwiększona
- zautomatyzować
- Automatyzacja
- dostępny
- dostępne bezpośrednio
- AWS
- Uczenie maszynowe AWS
- Bankowość
- baza
- na podstawie
- BE
- być
- zanim
- należy
- poniżej
- Korzyści
- BEST
- pomiędzy
- Bloki
- Wzmocnione
- Przynosi
- budować
- Budowanie
- biznes
- Funkcje biznesowe
- business intelligence
- ale
- by
- nazywa
- CAN
- możliwości
- zdolny
- Carlson
- złapany
- łańcuch
- wyzwanie
- wyzwania
- wybór
- Miasto
- Klasyfikuj
- CNBC
- kod
- Kolumna
- połączenie
- kombinacje
- połączony
- Firmy
- sukcesy firma
- kompleks
- składnik
- składniki
- zrozumieć
- pojęcie
- Obawy
- składa się
- consulting
- konsument
- kontekst
- Wygodny
- Korporacyjny
- Stwórz
- Utwórz wartość
- klient
- Klientów
- codziennie
- dane
- dostęp do danych
- sterowane danymi
- Baza danych
- zbiory danych
- Data
- David
- postanowiła
- decyzja
- dostarczyć
- dostarczanie
- wykazać
- wdrażane
- wdrażanie
- Wdrożenie
- Wnętrze
- zaprojektowany
- detal
- szczegółowe
- rozwijać
- rozwijanie
- oprogramowania
- różne
- cyfrowy
- cyfrowy Transformacja
- bezpośrednio
- do
- dokument
- domena
- domeny
- z powodu
- Wcześnie
- łatwo
- Edukacja
- wysiłek
- elektryczny
- umożliwiać
- Punkt końcowy
- energia
- Inżynieria
- silniki
- zapewnić
- wprowadzenie
- przedsiębiorstwa
- jednostka
- ERP
- przykład
- egzekucja
- pokazać
- doświadczenie
- eksperyment
- ekspertyza
- eksperci
- rozciągać się
- zewnętrzny
- Exxon Mobil
- członków Twojej rodziny
- FAST
- szybciej
- luty
- nakarmiony
- kilka
- wniesiony
- opiłki
- finał
- Znajdź
- i terminów, a
- Skupiać
- koncentruje
- następujący
- następujący sposób
- żywność
- W razie zamówieenia projektu
- format
- Framework
- od
- Funkcjonalność
- Funkcje
- dalej
- Ponadto
- GAS
- generacja
- generatywny
- generatywna sztuczna inteligencja
- dany
- Globalne
- Szukaj w Google
- wykresy
- Rozwój
- Rośnie
- gwarancji
- miał
- się
- Have
- he
- opieki zdrowotnej
- pomaga
- jej
- wyższy
- jego
- W jaki sposób
- HTML
- http
- HTTPS
- człowiek
- i
- Identyfikacja
- zidentyfikować
- ilustruje
- podnieść
- poprawy
- in
- zawierać
- obejmuje
- inkubator
- przemysłowy
- przemysł
- Informacja
- początkowy
- inicjatywy
- wkład
- spostrzeżenia
- przykład
- integrować
- Inteligencja
- interakcji
- zainteresowania
- Internet
- najnowszych
- zainwestowany
- IT
- JEGO
- joshua
- jpg
- Trzymać
- Klawisz
- Wiedzieć
- wiedza
- znany
- laboratorium
- język
- duży
- warstwa
- lider
- prowadzący
- nauka
- poziomy
- wykorzystuje
- pobór
- lubić
- Ograniczony
- ograniczenie
- LINK
- Powiązanie
- linki
- LLM
- maszyna
- uczenie maszynowe
- utrzymać
- WYKONUJE
- Dokonywanie
- zarządzanie
- i konserwacjami
- kierownik
- podręcznik
- ręcznie
- wiele
- znak
- rynek
- Aktualności z rynku
- wymowny
- Media
- medyczny
- dane medyczne
- Łączyć
- połączenie
- metody
- może
- Miller
- ML
- model
- modele
- jeszcze
- większość
- wielokrotność
- Nazwa
- nazywania
- Naturalny
- Przetwarzanie języka naturalnego
- Potrzebować
- wymagania
- Nowości
- I Love New York
- nowy jork
- aktualności
- nlp
- Nie
- Północ
- Ameryka Północna
- Pojęcie
- już dziś
- obserwacja
- of
- oferowany
- Olej
- Olej i gaz
- on
- ONE
- One Medical
- koncepcja
- open source
- Opcje
- or
- orkiestracja
- zamówienie
- organizacja
- organizacyjny
- organizacji
- oryginalny
- Inne
- ludzkiej,
- na zewnątrz
- wydajność
- ogólny
- własny
- stron
- pandy
- parametry
- Przedsiębiorstwo macierzyste
- część
- szczególny
- partner
- minęło
- namiętny
- ścieżka
- wykonać
- jest gwarancją najlepszej jakości, które mogą dostarczyć Ci Twoje monitory,
- wykonywane
- wykonywania
- wykonuje
- Pharma
- PhD
- rurociąg
- planowanie
- plato
- Analiza danych Platona
- PlatoDane
- Popularny
- możliwy
- Post
- powered
- mocny
- poprzednio
- Główny
- problemy
- dochód
- wygląda tak
- przetwarzanie
- produkcji
- projekt
- właściwy
- pod warunkiem,
- zapewnia
- publiczny
- publicznie
- jakość
- pytanie
- pytania
- raczej
- w czasie rzeczywistym
- niedawny
- dokumentacja
- zmniejszyć
- związane z
- związek
- Relacje
- rzetelny
- znakomity
- Wymaga
- Badania naukowe
- badacz
- Zasób
- odpowiedź
- Odpowiedzi
- dalsze
- Efekt
- powrót
- krzepki
- rutynowo
- RZĄD
- run
- sagemaker
- sole
- Skala
- Schneider Electric
- nauka
- Naukowiec
- Sdk
- Szukaj
- Wyszukiwarki
- SEK
- druga
- sektor
- Sektory
- bezpieczne
- widzieć
- wybór
- senior
- służyć
- Usługi
- kilka
- ona
- znacznie
- podobny
- ponieważ
- mały
- rozwiązanie
- Rozwiązania
- ROZWIĄZANIA
- kilka
- Źródło
- Źródła
- specjalizuje się
- specyficzny
- Spin
- uprzedzony
- state-of-the-art
- statystyczny
- Ewolucja krok po kroku
- Cel
- sklep
- Struktury
- studio
- podrejony
- subsydiarny
- taki
- Wspierający
- system
- systemy
- Zadania
- Zadanie
- zadania
- zespół
- Zespoły
- Techniczny
- XNUMX
- niż
- że
- Połączenia
- Informacje
- ich
- Im
- teoretyczny
- Tam.
- w związku z tym
- Te
- one
- to
- myśl
- Przez
- A zatem
- czas
- do
- razem
- narzędzie
- narzędzia
- Top
- śledzić
- w obrocie
- tradycyjnie
- przeszkolony
- Transformacja
- transformatorowy
- godny zaufania
- Twitch
- drugiej
- odkryć
- zrozumienie
- odblokować
- nowomodny
- Nowości
- us
- posługiwać się
- używany
- za pomocą
- wartość
- różnorodny
- Naprawiono
- Wersje
- pionowe
- przez
- była
- Droga..
- sposoby
- we
- Bogactwo
- sieć
- usługi internetowe
- DOBRZE
- Co
- Co to jest
- jeśli chodzi o komunikację i motywację
- który
- Podczas
- KIM
- cały
- będzie
- w
- w ciągu
- workflow
- przepływów pracy
- działa
- świat
- by
- X
- lat
- york
- You
- zefirnet