Ma örömmel jelentjük be, hogy a Together Computer GPT-NeoXT-Chat-Base-20B nyelvi alapmodellje elérhető az ügyfelek számára Amazon SageMaker JumpStart. A GPT-NeoXT-Chat-Base-20B egy nyílt forráskódú modell társalgási botok készítésére. Könnyedén kipróbálhatja ezt a modellt és használhatja a JumpStart segítségével. A JumpStart a gépi tanulási (ML) központja Amazon SageMaker amely hozzáférést biztosít az alapmodellekhez a beépített algoritmusok és a végpontok közötti megoldássablonok mellett, hogy segítsen gyorsan elkezdeni az ML-t.
Ebben a bejegyzésben bemutatjuk, hogyan kell telepíteni a GPT-NeoXT-Chat-Base-20B modellt, és meghívja a modellt egy OpenChatKit interaktív héj. Ez a bemutató egy nyílt forráskódú alapozó modell chatbotot kínál az alkalmazáson belüli használatra.
A JumpStart modellek Deep Java Serving-t használnak, amely a Deep Java Library-t (DJL) használja mély sebességű könyvtárakkal a modellek optimalizálása és a következtetések késésének minimalizálása érdekében. A JumpStart mögöttes megvalósítás a következőhöz hasonló megvalósítást követ jegyzetfüzet. JumpStart modellközpont-ügyfélként jobb teljesítményt érhet el anélkül, hogy a SageMaker SDK-n kívül kellene karbantartania a modellszkriptet. A JumpStart modellek a hálózat elkülönítését lehetővé tevő végpontokkal is javított biztonsági helyzetet érnek el.
Alapozó modellek a SageMakerben
A JumpStart hozzáférést biztosít a népszerű modellközpontok számos modelljéhez, beleértve a Hugging Face-t, a PyTorch Hub-ot és a TensorFlow Hub-ot, amelyeket a SageMaker ML-fejlesztési munkafolyamataiban használhat fel. Az ML közelmúltbeli fejlődése a modellek új osztályát eredményezte alapozó modellek, amelyek jellemzően több milliárd paraméterre vannak kiképezve, és a felhasználási esetek széles kategóriájához adaptálhatók, mint például a szövegösszegzés, a digitális művészet generálása és a nyelvi fordítás. Mivel ezeknek a modelleknek a betanítása költséges, az ügyfelek a meglévő, előre betanított alapozómodelleket szeretnék használni, és szükség szerint finomhangolni őket, ahelyett, hogy maguk képeznék ki ezeket a modelleket. A SageMaker a modellek válogatott listáját kínálja, amelyek közül választhat a SageMaker konzolon.
Mostantól különböző modellszolgáltatók alapozómodelljeit találhatja meg a JumpStartban, így gyorsan elkezdheti az alapozó modelleket. Különböző feladatokon vagy modellszolgáltatókon alapuló alapmodelleket találhat, és könnyen áttekintheti a modell jellemzőit és használati feltételeit. Ezeket a modelleket egy teszt UI widget segítségével is kipróbálhatja. Ha nagyszabású alapmodellt szeretne használni, ezt egyszerűen megteheti anélkül, hogy elhagyná a SageMakert a modellszolgáltatók előre elkészített notebookjainak használatával. Mivel a modelleket az AWS-en tárolják és telepítik, biztos lehet benne, hogy adatait – akár a modell kiértékeléséhez, akár nagyszabású használatához használják – soha nem osztják meg harmadik felekkel.
GPT-NeoXT-Chat-Base-20B alapozó modell
Együtt számítógép kifejlesztette a GPT-NeoXT-Chat-Base-20B-t, egy 20 milliárd paraméteres nyelvi modellt, amelyet az ElutherAI GPT-NeoX modelljére finomítottak, több mint 40 millió utasítással, a párbeszéd-stílusú interakciókra összpontosítva. Ezenkívül a modell számos feladatra hangolódik, mint például a kérdés megválaszolása, osztályozása, kinyerése és összegzése. A modell az OIG-43M adatkészleten alapul, amelyet a LAION és az Ontocord együttműködésével hoztak létre.
A fent említett finomhangoláson kívül a GPT-NeoXT-Chat-Base-20B-v0.16 további finomhangoláson is átesett, kis mennyiségű visszacsatolási adat révén. Ez lehetővé teszi, hogy a modell jobban alkalmazkodjon az emberi preferenciákhoz a beszélgetésekben. A GPT-NeoXT-Chat-Base-20B chatbot-alkalmazásokban való használatra készült, és előfordulhat, hogy a tervezett hatókörön kívül más felhasználási esetekben nem teljesít jól. Az Ontocord és a LAION közösen kiadták az OpenChatKit, a ChatGPT nyílt forráskódú alternatíváját, hasonló képességekkel. Az OpenChatKit Apache-2.0 licenc alatt indult, teljes hozzáférést biztosítva a forráskódhoz, a modellsúlyokhoz és a képzési adatkészletekhez. Számos olyan feladat van, amelyekben az OpenChatKit már eleve kiválóan teljesít. Ide tartoznak az összegzési feladatok, a kivonatolási feladatok, amelyek lehetővé teszik a strukturált információk strukturálatlan dokumentumokból való kinyerését, valamint az osztályozási feladatok egy mondat vagy bekezdés különböző kategóriákba sorolásához.
Fedezzük fel, hogyan használhatjuk a GPT-NeoXT-Chat-Base-20B modellt a JumpStartban.
Megoldás áttekintése
A következőben megtalálhatja a GPT-NeoXT-Chat-Base-20B telepítését bemutató kódot a SageMaker-en, valamint egy példát a telepített modell párbeszédes használatára a parancshéj használatával. GitHub notebook.
A következő szakaszokban részletesen kibővítjük az egyes lépéseket a modell üzembe helyezéséhez, majd a különböző feladatok megoldásához:
- Állítsa be az előfeltételeket.
- Válasszon egy előre betanított modellt.
- Lekérheti a műtermékeket, és telepíthet egy végpontot.
- Kérdezze le a végpontot, és elemezze a választ.
- Használjon OpenChatKit rendszerhéjat a telepített végponttal való interakcióhoz.
Állítsa be az előfeltételeket
Ezt a notebookot egy ml.t3.medium példányon tesztelték Amazon SageMaker Studio a Python 3 (Data Science) kernellel és egy SageMaker notebook példányban a conda_python3 kernellel.
A notebook futtatása előtt használja a következő parancsot a beállításhoz szükséges kezdeti lépések végrehajtásához:
Válasszon egy előre betanított modellt
A szokásos módon beállítunk egy SageMaker munkamenetet a Boto3 használatával, majd kiválasztjuk a telepíteni kívánt modellazonosítót:
Lekérheti a műtermékeket, és telepíthet egy végpontot
A SageMaker segítségével az előre betanított modellen következtetést tudunk levonni anélkül, hogy először finomhangolnánk egy új adatkészleten. Kezdjük azzal, hogy lekérjük a instance_type
, image_uri
és model_uri
az előre betanított modell számára. Az előre betanított modell hosztolásához létrehozunk egy példányt sagemaker.model.Model és telepítse azt. A következő kód az ml.g5.24xlarge kódot használja a következtetési végponthoz. A telepítési módszer eltarthat néhány percig.
Kérdezze le a végpontot, és elemezze a választ
Ezután egy példát mutatunk be, hogyan hívhatunk meg egy végpontot a hiperparaméterek részhalmazával:
A következő választ kapjuk:
Itt megadtuk a hasznos terhelés argumentumot "stopping_criteria": ["<human>"]
, ami azt eredményezte, hogy a modellválasz a szósorozat generálásával végződik <human>
. A JumpStart modellszkript bármilyen karakterlánc-listát elfogad kívánt stopszóként, konvertálja ezt a listát érvényessé stopping_criteria kulcsszó argumentum A transzformátorok API-t generálnak, és leállítják a szöveggenerálást, ha a kimeneti szekvencia bármely megadott stopszót tartalmaz. Ez két okból hasznos: egyrészt csökken a következtetési idő, mivel a végpont nem generál tovább nem kívánt szöveget a stopszavakon túl, másrészt ez megakadályozza, hogy az OpenChatKit modell további emberi és bot válaszokat hallucináljon, amíg a többi leállítási kritérium teljesül. .
Használjon OpenChatKit rendszerhéjat a telepített végponttal való interakcióhoz
Az OpenChatKit parancssori shellt biztosít a chatbottal való interakcióhoz. Ebben a lépésben létrehozza a shell egy olyan verzióját, amely kölcsönhatásba léphet a telepített végponttal. Az OpenChatKit adattárban található következtetési szkriptek egyszerű egyszerűsítését biztosítjuk, amelyek kölcsönhatásba léphetnek a telepített SageMaker-végpontunkkal.
Ennek két fő összetevője van:
- Egy shell interpreter (
JumpStartOpenChatKitShell
), amely lehetővé teszi a modell végpontjának iteratív következtetési meghívását - Egy beszélgetési objektum (
Conversation
), amely a korábbi emberi/chatbot interakciókat helyben tárolja az interaktív shellben, és megfelelően formázza a múltbeli beszélgetéseket a jövőbeli következtetési kontextushoz
A Conversation
Az objektum úgy importálódik, ahogy van az OpenChatKit lerakatból. A következő kód egyéni shell-értelmezést hoz létre, amely kölcsönhatásba léphet a végponttal. Ez az OpenChatKit megvalósítás egyszerűsített változata. Javasoljuk, hogy fedezze fel az OpenChatKit adattárat, hogy megtudja, hogyan használhat mélyebb szolgáltatásokat, mint például a token streaming, a moderálási modellek és a visszakeresés kiterjesztett generálása ebben az összefüggésben. A jegyzetfüzet kontextusa egy minimális életképes chatbot bemutatására összpontosít egy JumpStart végponttal; innen szükség szerint bonyolultabbá teheti.
Egy rövid bemutató a JumpStartOpenChatKitShell
a következő videóban látható.
A következő részlet bemutatja a kód működését:
Most elindíthatja ezt a shellt parancshurokként. Ez ismételten felszólítást ad ki, elfogadja a bevitelt, elemzi a beviteli parancsot, és elküldi a műveleteket. Mivel az eredményül kapott shell egy végtelen ciklusban használható, ez a notebook alapértelmezett parancssort biztosít (cmdqueue
) a bemeneti sorok sorban álló listájaként. Mert az utolsó bemenet a parancs /quit
, a parancsértelmező kilép a sor kimerülése után. A csevegőbottal való dinamikus interakcióhoz távolítsa el a cmdqueue
.
1. példa: A beszélgetés kontextusa megmarad
A következő prompt azt mutatja, hogy a chatbot képes megőrizni a beszélgetés kontextusát, hogy válaszoljon a további kérdésekre:
2. példa: Az érzelmek osztályozása
A következő példában a chatbot osztályozási feladatot hajtott végre a mondat érzéseinek azonosításával. Mint látható, a chatbot sikeresen osztályozta a pozitív és negatív érzelmeket.
3. példa: Összegzési feladatok
Ezután a chatbot shell-jével próbáltuk ki az összegzési feladatokat. A következő példa bemutatja, hogy a hosszú szöveg kb Amazon Comprehend egy mondatban volt összefoglalva, és a chatbot képes volt válaszolni a szöveggel kapcsolatos további kérdésekre:
4. példa: Strukturált információk kinyerése strukturálatlan szövegből
A következő példában a chatbot segítségével létrehoztunk egy fejléceket, sorokat és oszlopokat tartalmazó leértékelési táblázatot, hogy a szabad formátumú információk felhasználásával projekttervet hozzunk létre:
5. példa: Parancsok a chatbot bemeneteként
Bemenetet is biztosíthatunk parancsként, mint pl /hyperparameters
a hiperparaméterek értékeinek megtekintéséhez és /quit
a parancshéjból való kilépéshez:
Ezek a példák csak néhány olyan feladatot mutattak be, amelyekben az OpenChatKit kiváló. Javasoljuk, hogy próbáljon ki különféle utasításokat, és nézze meg, melyik a legmegfelelőbb az Ön használati esetéhez.
Tisztítsuk meg
A végpont tesztelése után mindenképpen törölje a SageMaker következtetési végpontot és a modellt, hogy elkerülje a költségeket.
Következtetés
Ebben a bejegyzésben megmutattuk, hogyan tesztelheti és használhatja a GPT-NeoXT-Chat-Base-20B modellt a SageMaker segítségével, és hogyan készíthet érdekes chatbot alkalmazásokat. Próbálja ki a SageMaker alapozó modelljét még ma, és ossza meg velünk visszajelzését!
Ez az útmutató csak tájékoztató jellegű. Ennek ellenére el kell végeznie a saját független értékelését, és meg kell tennie az intézkedéseket annak biztosítására, hogy megfeleljen saját minőség-ellenőrzési gyakorlatának és szabványainak, valamint az Önre, a tartalmaira és a tartalmaira vonatkozó helyi szabályoknak, törvényeknek, rendeleteknek, licenceknek és használati feltételeknek. az ebben az útmutatóban hivatkozott harmadik fél modellje. Az AWS-nek nincs ellenőrzése vagy felhatalmazása az ebben az útmutatóban hivatkozott harmadik féltől származó modellre, és nem vállal semmilyen kijelentést vagy garanciát arra vonatkozóan, hogy a harmadik féltől származó modell biztonságos, vírusmentes, működőképes vagy kompatibilis az Ön éles környezetével és szabványaival. Az AWS nem vállal semmilyen kijelentést, garanciát vagy garanciát arra vonatkozóan, hogy az ebben az útmutatóban szereplő információk egy adott eredményt vagy eredményt eredményeznek.
A szerzőkről
Rachna Chadha az AWS stratégiai számláinak fő megoldási építésze AI/ML. Rachna optimista, aki hisz abban, hogy az AI etikus és felelős használata javíthatja a társadalmat a jövőben, és gazdasági és társadalmi jólétet hozhat. Szabadidejében Rachna szereti a családjával tölteni az idejét, kirándulni és zenét hallgatni.
Dr. Kyle Ulrich egy alkalmazott tudós a Amazon SageMaker beépített algoritmusok csapat. Kutatási területei közé tartoznak a skálázható gépi tanulási algoritmusok, a számítógépes látás, az idősorok, a Bayes-féle nem-paraméterek és a Gauss-folyamatok. Doktori fokozatát a Duke Egyetemen szerezte, és publikációkat publikált a NeurIPS-ben, a Cell-ben és a Neuron-ban.
Dr. Ashish Khetan vezető alkalmazott tudós az Amazon SageMaker beépített algoritmusaival, és segít gépi tanulási algoritmusok fejlesztésében. PhD fokozatát az Illinois Urbana-Champaign Egyetemen szerezte. A gépi tanulás és a statisztikai következtetések aktív kutatója, és számos közleményt publikált NeurIPS, ICML, ICLR, JMLR, ACL és EMNLP konferenciákon.
- SEO által támogatott tartalom és PR terjesztés. Erősödjön még ma.
- PlatoAiStream. Web3 adatintelligencia. Felerősített tudás. Hozzáférés itt.
- A jövő pénzverése – Adryenn Ashley. Hozzáférés itt.
- Részvények vásárlása és eladása PRE-IPO társaságokban a PREIPO® segítségével. Hozzáférés itt.
- Forrás: https://aws.amazon.com/blogs/machine-learning/gpt-neoxt-chat-base-20b-foundation-model-for-chatbot-applications-is-now-available-on-amazon-sagemaker/
- :van
- :is
- :nem
- $ UP
- 1
- 100
- 12
- 13
- 15%
- 20
- 23
- 30
- 40
- 50
- 500
- 7
- 9
- a
- Képes
- Rólunk
- Elfogad!
- hozzáférés
- Szerint
- Fiókok
- Elérése
- cselekvések
- aktív
- alkalmazkodni
- hozzá
- mellett
- További
- Ezen kívül
- fejlett
- előlegek
- AI
- AI / ML
- algoritmusok
- lehetővé
- lehetővé teszi, hogy
- Is
- alternatív
- am
- amazon
- Amazon Comprehend
- Amazon SageMaker
- Az Amazon Web Services
- összeg
- an
- elemzés
- elemez
- és a
- bejelent
- válasz
- bármilyen
- api
- API-k
- app
- Alkalmazás
- alkalmazások
- alkalmazott
- alkalmaz
- megfelelő
- körülbelül
- VANNAK
- érv
- Művészet
- AS
- értékelés
- biztosított
- At
- bővített
- hatóság
- elérhető
- elkerülése érdekében
- AWS
- alapján
- bayesi
- BE
- mert
- előtt
- úgy gondolja,
- BEST
- Jobb
- Túl
- milliárd
- Bot
- botok
- Doboz
- hoz
- épít
- beépített
- by
- TUD
- képességek
- tőke
- eset
- esetek
- kategóriák
- Kategória
- jellemzők
- díjak
- chatbot
- ChatGPT
- A pop-art design, négy időzóna kijelzése egyszerre és méretének arányai azok az érvek, amelyek a NeXtime Time Zones-t kiváló választássá teszik. Válassza a
- Város
- osztály
- besorolás
- osztályoz
- kód
- együtt
- együttműködés
- Oszlopok
- Közös
- hasonló
- összeegyeztethető
- teljes
- bonyolultság
- alkatrészek
- megért
- számítógép
- Számítógépes látás
- aggodalmak
- konferenciák
- Konzol
- Konténer
- tartalmaz
- tartalom
- kontextus
- folytatódik
- ellenőrzés
- Beszélgetés
- társalgó
- beszélgetések
- megtérít
- Hűvös
- teremt
- készítette
- teremt
- létrehozása
- kritériumok
- a válogatott
- szokás
- vevő
- Ügyfelek
- DC
- dátum
- adat-tudomány
- adatkészletek
- mély
- mély tanulás
- alapértelmezett
- bemutatását,
- attól
- telepíteni
- telepített
- bevetés
- leírás
- tervezett
- kívánatos
- részlet
- Határozzuk meg
- Fejleszt
- fejlett
- fejlesztők
- Fejlesztés
- fejleszt
- különböző
- digitális
- digitális művészet
- do
- Dokkmunkás
- dokumentum
- dokumentumok
- nem
- Nem
- uralkodó
- Herceg
- herceg egyetem
- időtartama
- dinamikusan
- minden
- könnyen
- Gazdasági
- elemek
- más
- lehetővé
- lehetővé téve
- ösztönzése
- végtől végig
- Endpoint
- biztosítására
- Egész
- Szervezetek
- egység
- Környezet
- etikai
- értékelő
- Még
- megvizsgálni
- példa
- példák
- izgatott
- létező
- Kilépés
- Bontsa
- drága
- feltárása
- kivonat
- Arc
- család
- messze
- Kedvenc
- félelem
- Funkció
- Jellemzők
- Visszacsatolás
- kevés
- Fájlok
- Találjon
- vezetéknév
- koncentrál
- összpontosítás
- következő
- következik
- A
- Alapítvány
- ból ből
- további
- jövő
- generál
- generáló
- generáció
- kap
- adott
- megy
- jó
- nyújtó
- garanciák
- útmutatást
- Legyen
- tekintettel
- he
- fejlécek
- segít
- segít
- neki
- itt
- övé
- vendéglátó
- házigazdája
- Hogyan
- How To
- HTML
- HTTPS
- Kerékagy
- emberi
- i
- ID
- azonosító
- if
- Illinois
- kép
- végrehajtás
- javul
- javított
- in
- mélyreható
- tartalmaz
- magában foglalja a
- Beleértve
- független
- Végtelen
- információ
- Tájékoztató
- kezdetben
- bemenet
- bemenet
- meglátások
- telepíteni
- példa
- utasítás
- szándékolt
- kölcsönhatásba
- kölcsönhatások
- interaktív
- érdekes
- érdekek
- bele
- szigetelés
- kérdés
- IT
- ITS
- Jáva
- Állások
- jpg
- éppen
- Kulcs
- Kedves
- Ismer
- ismert
- nyelv
- Nyelvek
- nagy
- keresztnév
- Késleltetés
- indít
- indított
- törvények
- tanulás
- kilépő
- hadd
- könyvtárak
- könyvtár
- Engedély
- engedélyek
- mint
- Kedvencek
- vonal
- vonalak
- Lista
- Kihallgatás
- helyi
- helyileg
- Hosszú
- Sok
- gép
- gépi tanulás
- Fő
- fenntartása
- csinál
- mód
- sok
- Lehet..
- intézkedések
- közepes
- megemlíti
- módszer
- millió
- minimális
- Perc
- ML
- modell
- modellek
- mérséklet
- módosított
- több
- Reggel
- zene
- Természetes
- Természetes nyelvi feldolgozás
- Szükség
- szükséges
- negatív
- hálózat
- hálózatba
- soha
- Új
- új termékek
- hír
- NLP
- nem
- jegyzetfüzet
- Most
- tárgy
- of
- olívabogyó
- on
- ONE
- csak
- nyílt forráskódú
- operatív
- Optimalizálja
- Opciók
- or
- Más
- mi
- ki
- Eredmény
- vázolt
- teljesítmény
- kívül
- felett
- saját
- papírok
- paraméterek
- különös
- fél
- múlt
- Teljesít
- teljesítmény
- kifejezés
- Pizza
- terv
- Plató
- Platón adatintelligencia
- PlatoData
- játszani
- Népszerű
- pozitív
- állás
- gyakorlat
- Predictor
- preferenciák
- előfeltételek
- megakadályozza
- előző
- Fő
- prioritás
- Folyamatok
- feldolgozás
- Termelés
- Termékek
- program
- jólét
- ad
- feltéve,
- szolgáltatók
- biztosít
- közzétett
- célokra
- Piton
- pytorch
- világítás
- kérdés
- Kérdések
- gyorsan
- hatótávolság
- Inkább
- real-time
- miatt
- új
- recept
- elismerés
- felismerés
- Csökkent
- Refaktor
- előírások
- engedje
- eltávolítása
- TÖBBSZÖR
- raktár
- kötelező
- kutatás
- kutató
- válasz
- válaszok
- felelős
- REST
- eredményez
- kapott
- megtartása
- visszatérés
- Kritika
- Emelkedik
- szabályok
- futás
- s
- sagemaker
- SageMaker következtetés
- azt mondják
- skálázható
- Skála
- beolvasás
- Tudomány
- Tudós
- hatálya
- szkriptek
- sdk
- Keresés
- Második
- szakaszok
- biztonság
- biztonság
- lát
- kiválasztás
- MAGA
- idősebb
- mondat
- érzés
- Sorozat
- Series of
- szolgáltatás
- Szolgáltatások
- szolgáló
- ülés
- készlet
- Szettek
- felépítés
- számos
- megosztott
- Héj
- rövid
- kellene
- előadás
- kirakat
- bemutatásra
- kimutatta,
- mutatott
- Műsorok
- hasonló
- egyszerűsített
- SIX
- kicsi
- So
- Közösség
- A közösségi hálón való kommunikáció
- Társadalom
- megoldások
- Megoldások
- SOLVE
- néhány
- forrás
- forráskód
- különleges
- meghatározott
- sebesség
- Költési
- terjedése
- szabványok
- kezdet
- kezdődött
- statisztikai
- Lépés
- Lépései
- Még mindig
- megáll
- árnyékolók
- Stratégiai
- folyó
- struktúra
- szerkesztett
- sikeresen
- ilyen
- ÖSSZEFOGLALÓ
- Támogatott
- táblázat
- Vesz
- Feladat
- feladatok
- csapat
- technikák
- mondd
- sablonok
- tensorflow
- feltételek
- teszt
- tesztelők
- mint
- hogy
- A
- Főváros
- A jövő
- az információ
- The Source
- Őket
- maguk
- akkor
- Ott.
- Ezek
- Harmadik
- harmadik felek
- harmadik fél
- ezt
- Keresztül
- idő
- Idősorok
- nak nek
- Ma
- együtt
- jelképes
- Vonat
- kiképzett
- Képzések
- transzformerek
- Fordítás
- kipróbált
- igaz
- megpróbál
- kettő
- típus
- jellemzően
- ui
- alatt
- mögöttes
- megértés
- egyetemi
- -ig
- upon
- us
- Használat
- használ
- használati eset
- használt
- segítségével
- hasznosított
- Értékek
- fajta
- különféle
- változat
- keresztül
- életképes
- videó
- látomás
- akar
- meleg
- volt
- washington
- we
- időjárás
- háló
- webes szolgáltatások
- Hetek
- fogadtatás
- JÓL
- Mit
- Mi
- amikor
- vajon
- ami
- WHO
- széles
- szélesebb
- lesz
- val vel
- belül
- nélkül
- szó
- szavak
- művek
- ír
- te
- A te
- zephyrnet