Danes z veseljem sporočamo, da je temeljni model Falcon 180B, ki ga je razvil Inštitut za tehnološke inovacije (TII) in je bil usposobljen na Amazon SageMaker, na voljo strankam prek Amazon SageMaker JumpStart za uvedbo z enim klikom za izvajanje sklepanja. Falcon 180B je največji in eden najzmogljivejših modelov z javno dostopnimi utežmi z velikostjo 3.5 milijard parametrov in usposobljenim na ogromnem naboru podatkov s 180 bilijona žetonov. Ta model lahko preizkusite s SageMaker JumpStart, središčem za strojno učenje (ML), ki omogoča dostop do algoritmov, modelov in rešitev ML, tako da lahko hitro začnete uporabljati ML. V tem prispevku bomo predstavili, kako odkriti in namestiti model Falcon 180B prek SageMaker JumpStart.
Kaj je Falcon 180B
Falcon 180B je model, ki ga je izdal IIT ki sledi prejšnjim izdajam v družini Falcon. Je povečana različica Falcona 40B in uporablja več poizvedb za boljšo razširljivost. To je avtoregresivni jezikovni model, ki uporablja optimizirano transformatorsko arhitekturo. Usposobljen je bil na 3.5 bilijona žetonov podatkov, ki so bili v glavnem sestavljeni iz spletnih podatkov iz RefinedWeb (približno 85%). Model ima dve različici: 180B in 180B-Chat. 180B je neobdelan, vnaprej usposobljen model, ki ga je treba dodatno prilagoditi za večino primerov uporabe. 180B-Chat je bolj primeren za sprejemanje splošnih navodil. Model klepeta je bil natančno nastavljen na naborih podatkov o klepetu in navodilih skupaj z več obsežnimi nabori podatkov o pogovorih.
Model je na voljo pod Licenca Falcon-180B TII in Politika sprejemljive uporabe.
TII je letalo Falcon 180B usposobil Amazon SageMaker, v gruči približno 4K A100 GPE. Uporabil je kodno bazo za distribuirano usposabljanje po meri, imenovano Gigatron, ki uporablja 3D paralelizem z ZeRO, in prilagojena, visoko zmogljiva jedra Triton. Uporabljena arhitektura porazdeljenega usposabljanja Preprosta storitev shranjevanja Amazon (Amazon S3) kot edina poenotena storitev za nalaganje podatkov ter pisanje in branje kontrolnih točk, kar je še posebej pripomoglo k zanesljivosti obremenitev in preprostosti delovanja.
Kaj je SageMaker JumpStart
S SageMaker JumpStart lahko praktiki ML izbirajo med rastočim seznamom najuspešnejših modelov temeljev. Strokovnjaki ML lahko uvedejo temeljne modele v namenske instance SageMaker znotraj omrežno izoliranega okolja in prilagodijo modele z uporabo Amazon SageMaker za usposabljanje in uvajanje modelov.
Zdaj lahko odkrijete in uvedete Falcon 180B z nekaj kliki Amazon SageMaker Studio ali programsko prek SDK-ja SageMaker Python, kar vam omogoča, da izpeljete zmogljivost modela in kontrole MLOps s funkcijami SageMaker, kot je Amazonski cevovodi SageMaker, Napaka Amazon SageMaker, ali kontejnerski dnevniki. Model je nameščen v varnem okolju AWS in pod vašimi kontrolami VPC, kar pomaga zagotoviti varnost podatkov. Falcon 180B je mogoče odkriti in ga je mogoče namestiti v regijah, kjer so na voljo zahtevani primerki. Trenutno so primerki ml.p4de na voljo na vzhodu ZDA (N. Virginija) in zahodu ZDA (Oregon).
Odkrijte modele
Do temeljnih modelov lahko dostopate prek SageMaker JumpStart v uporabniškem vmesniku SageMaker Studio in SDK SageMaker Python. V tem razdelku bomo opisali, kako odkriti modele v SageMaker Studio.
SageMaker Studio je integrirano razvojno okolje (IDE), ki ponuja enoten spletni vizualni vmesnik, kjer lahko dostopate do namensko izdelanih orodij za izvajanje vseh razvojnih korakov ML, od priprave podatkov do gradnje, usposabljanja in uvajanja vaših modelov ML. Za več podrobnosti o tem, kako začeti in nastaviti SageMaker Studio, glejte Amazon SageMaker Studio.
V SageMaker Studio lahko dostopate do SageMaker JumpStart, ki vsebuje vnaprej pripravljene modele, prenosnike in vnaprej pripravljene rešitve, pod Predizdelane in avtomatizirane rešitve.
Na ciljni strani SageMaker JumpStart lahko brskate po rešitvah, modelih, prenosnikih in drugih virih. Falcon 180B najdete v Temeljni modeli: generiranje besedila vrtiljak.
Z izbiro najdete tudi druge modelske variante Raziščite vse modele generiranja besedila ali iskanje Falcon
.
Izberete lahko kartico modela, da si ogledate podrobnosti o modelu, kot so licenca, podatki, uporabljeni za usposabljanje, in način uporabe. Našli boste tudi dva gumba, uvajanje in Odprite Beležnico, ki vam bo pomagal pri uporabi modela (naslednji posnetek zaslona prikazuje uvajanje možnost).
Namestite modele
Ko izberete uvajanje, se bo začela uvedba modela. Druga možnost je, da uvedete prek vzorčnega zvezka, ki se prikaže z izbiro Odprite Beležnico. Primer zvezka nudi navodila od konca do konca o tem, kako razmestiti model za sklepanje in čiščenje virov.
Za uvajanje z uporabo prenosnega računalnika začnemo z izbiro ustreznega modela, ki ga določi model_id
. Kateri koli od izbranih modelov lahko namestite na SageMaker z naslednjo kodo:
To razmesti model v SageMaker s privzetimi konfiguracijami, vključno s privzeto vrsto primerka in privzetimi konfiguracijami VPC. Te konfiguracije lahko spremenite tako, da podate neprivzete vrednosti v JumpStartModel
. Če želite izvedeti več, glejte Dokumentacija API. Ko je uveden, lahko izvajate sklepanje glede na uvedeno končno točko prek napovedovalca SageMaker. Oglejte si naslednjo kodo:
Parametri sklepanja nadzirajo proces generiranja besedila na končni točki. Največji nadzor novih žetonov se nanaša na velikost izhoda, ki ga ustvari model. Upoštevajte, da to ni enako številu besed, ker besedišče modela ni enako besedišču angleškega jezika in vsak žeton morda ni beseda angleškega jezika. Temperatura nadzoruje naključnost v izhodu. Višja temperatura povzroči bolj ustvarjalne in halucinirane rezultate. Vsi parametri sklepanja so neobvezni.
Ta model parametrov 180B ima 335 GB in zahteva še več pomnilnika GPE za zadostno izvedbo sklepanja s 16-bitno natančnostjo. Trenutno JumpStart podpira ta model samo na primerkih ml.p4de.24xlarge. Možno je razmestiti 8-bitni kvantizirani model na primerek ml.p4d.24xlarge z zagotavljanjem env={"HF_MODEL_QUANTIZE": "bitsandbytes"}
argument ključne besede za JumpStartModel
konstruktor in določanje instance_type="ml.p4d.24xlarge"
na način namestitve. Vendar upoštevajte, da je zakasnitev na žeton približno 5x počasnejša za to kvantizirano konfiguracijo.
Naslednja tabela navaja vse modele Falcon, ki so na voljo v SageMaker JumpStart, skupaj z ID-ji modela, privzetimi vrstami primerkov, največjim številom podprtih skupnih žetonov (vsota števila vhodnih žetonov in števila ustvarjenih žetonov) in tipično zakasnitvijo odziva na žeton za vsakega od teh modelov.
Ime modela | ID modela | Privzeta vrsta primerka | Največje skupno število žetonov | Zakasnitev na žeton* |
Falcon 7B | huggingface-llm- falcon-7b-bf16 |
ml.g5.2xvelik | 2048 | 34 ms |
Falcon 7B Instruct | huggingface-llm- falcon-7b-instruct-bf16 |
ml.g5.2xvelik | 2048 | 34 ms |
Falcon 40B | huggingface-llm- falcon-40b-bf16 |
ml.g5.12xvelik | 2048 | 57 ms |
Falcon 40B Instruct | huggingface-llm- falcon-40b-instruct-bf16 |
ml.g5.12xvelik | 2048 | 57 ms |
Falcon 180B | huggingface-llm- falcon-180b-bf16 |
ml.p4de.24xvelik | 2048 | 45 ms |
Falcon 180B Chat | huggingface-llm- falcon-180b-chat-bf16 |
ml.p4de.24xvelik | 2048 | 45 ms |
*zakasnitev na žeton je podana za mediani odzivni čas primerov pozivov, navedenih v tem blogu; ta vrednost se bo spreminjala glede na dolžino vhodnih in izhodnih zaporedij.
Pozivi za sklepanje in primere za Falcon 180B
Modele Falcon lahko uporabite za dopolnjevanje katerega koli dela besedila. Z generiranjem besedila lahko izvajate različne naloge, kot so odgovarjanje na vprašanja, jezikovni prevod, analiza čustev in še veliko več. Končna točka sprejme naslednjo shemo vhodne obremenitve:
Lahko raziščete definicijo teh parametri odjemalca in njihove privzete vrednosti v repozitoriju sklepanja o ustvarjanju besedila.
Sledi nekaj vzorčnih primerov pozivov in besedila, ki ga ustvari model. Vsi izhodi tukaj so ustvarjeni s parametri sklepanja {"max_new_tokens": 768, "stop": ["<|endoftext|>", "###"]}
.
Izdelava spletnega mesta je možna v 10 preprostih korakih:
Morda boste opazili, da ta vnaprej usposobljeni model ustvarja dolga besedilna zaporedja, ki niso nujno idealna za primere uporabe pogovornih oken. Preden pokažemo, kako deluje natančno nastavljeni model klepeta za večji nabor pozivov, ki temeljijo na pogovornem oknu, naslednja dva primera ponazarjata, kako uporabljati modele Falcon z učenjem v kontekstu z nekaj posnetki, kjer nudimo vzorce usposabljanja, ki so na voljo modelu. Upoštevajte, da »nekajkratno učenje« ne prilagaja uteži modela — med tem postopkom izvedemo samo sklepanje o razporejenem modelu, medtem ko v vhodnem kontekstu zagotovimo nekaj primerov za pomoč pri izhodu cehovskega modela.
Pozivi za sklepanje in primere za Falcon 180B-Chat
Z modeli Falcon 180B-Chat, optimiziranimi za primere uporabe dialoga, lahko vnos v končne točke modela klepeta vsebuje prejšnjo zgodovino med pomočnikom za klepet in uporabnikom. Vprašanja lahko postavljate v kontekstu pogovora, ki se je zgodil do zdaj. Določite lahko tudi sistemsko konfiguracijo, kot so osebe, ki določajo vedenje pomočnika za klepet. Vhodni tovor do končne točke je enak modelu Falcon 180B, razen inputs
vrednost niza mora uporabljati naslednjo obliko:
Sledi nekaj vzorčnih primerov pozivov in besedila, ki ga ustvari model. Vsi izhodi so ustvarjeni s parametri sklepanja {"max_new_tokens":256, "stop": ["nUser:", "<|endoftext|>", " User:", "###"]}.
V naslednjem primeru se je uporabnik z asistentom pogovarjal o turističnih krajih v Parizu. Nato uporabnik sprašuje o prvi možnosti, ki jo priporoča pomočnik za klepet.
Čiščenje
Ko končate z zagonom zvezka, izbrišite vse vire, ki ste jih ustvarili med postopkom, da bo vaše zaračunavanje ustavljeno. Uporabite naslednjo kodo:
zaključek
V tej objavi smo vam pokazali, kako začeti uporabljati Falcon 180B v studiu SageMaker in razmestiti model za sklepanje. Ker so osnovni modeli vnaprej usposobljeni, lahko pomagajo znižati stroške usposabljanja in infrastrukture ter omogočijo prilagoditev za vaš primer uporabe. Za začetek obiščite SageMaker JumpStart v SageMaker Studio.
viri
O avtorjih
Dr. Kyle Ulrich je uporabni znanstvenik pri ekipi Amazon SageMaker JumpStart. Njegovi raziskovalni interesi vključujejo skalabilne algoritme strojnega učenja, računalniški vid, časovne vrste, Bayesove neparametrične in Gaussove procese. Njegov doktorat je pridobil na Univerzi Duke in je objavil članke v NeurIPS, Cell in Neuron.
Dr. Ashish Khetan je višji aplikativni znanstvenik pri Amazon SageMaker JumpStart in pomaga pri razvoju algoritmov strojnega učenja. Doktoriral je na Univerzi Illinois Urbana-Champaign. Je aktiven raziskovalec strojnega učenja in statističnega sklepanja ter je objavil številne članke na konferencah NeurIPS, ICML, ICLR, JMLR, ACL in EMNLP.
Olivier Cruchant je glavni arhitekt za rešitve strokovnjaka za strojno učenje pri AWS s sedežem v Franciji. Olivier pomaga strankam AWS – od majhnih novoustanovljenih podjetij do velikih podjetij – pri razvoju in uvajanju aplikacij za strojno učenje proizvodnega razreda. V prostem času rad bere raziskovalne naloge in s prijatelji in družino raziskuje divjino.
Karl Albertsen vodi središče temeljnega modela Amazon SageMaker, skupine za algoritme in partnerstva.
- Distribucija vsebine in PR s pomočjo SEO. Okrepite se še danes.
- PlatoData.Network Vertical Generative Ai. Opolnomočite se. Dostopite tukaj.
- PlatoAiStream. Web3 Intelligence. Razširjeno znanje. Dostopite tukaj.
- PlatoESG. Avtomobili/EV, Ogljik, CleanTech, Energija, Okolje, sončna energija, Ravnanje z odpadki. Dostopite tukaj.
- PlatoHealth. Obveščanje o biotehnologiji in kliničnih preskušanjih. Dostopite tukaj.
- ChartPrime. Izboljšajte svojo igro trgovanja s ChartPrime. Dostopite tukaj.
- BlockOffsets. Posodobitev okoljskega offset lastništva. Dostopite tukaj.
- vir: https://aws.amazon.com/blogs/machine-learning/falcon-180b-foundation-model-from-tii-is-now-available-via-amazon-sagemaker-jumpstart/
- :ima
- : je
- :ne
- :kje
- $GOR
- 1
- 10
- 100
- 11
- 12
- 13
- 14
- 150
- 20
- 25
- 26%
- 3d
- 4k
- 7
- 8
- 9
- a
- O meni
- Sprejema
- dostop
- dostopen
- Doseči
- aktivna
- dodajte
- Poleg tega
- Naslov
- po
- proti
- algoritmi
- vsi
- omogoča
- skupaj
- Prav tako
- vedno
- am
- Amazon
- Amazon SageMaker
- Amazon SageMaker JumpStart
- Amazon Web Services
- an
- Analiza
- in
- in infrastrukturo
- Objavi
- Še ena
- odgovor
- kaj
- kdo
- privlačna
- aplikacije
- uporabna
- primerno
- približno
- Arhitektura
- SE
- Argument
- Umetnost
- članek
- AS
- vprašati
- Pomočnik
- At
- pozornosti
- pritegnili
- atrakcija
- Avtomatizirano
- Na voljo
- poti
- AWS
- temeljijo
- baterija
- Bajezijski
- BE
- lepa
- ker
- bilo
- pred
- vedenje
- Boljše
- med
- zaračunavanje
- Blog
- se ponaša
- brskalnik
- builder
- gradbeniki
- Building
- poslovni
- vendar
- by
- kavarne
- CAN
- zmožnost
- kartice
- Vrtiljak
- primeru
- primeri
- spremenite
- preveriti
- Izberite
- izbiri
- izbran
- mesto
- Razvrsti
- Grozd
- Cms
- Koda
- Koda
- zbirka
- Stolpci
- COM
- kombinirani
- Skupno
- podjetje
- dokončanje
- dokončanje
- računalnik
- Računalniška vizija
- konference
- konfiguracija
- Sestavljeno
- kontakt
- vsebujejo
- Posoda
- Vsebuje
- vsebina
- ozadje
- kontekstualno
- stalno
- prispevali
- nadzor
- Nadzor
- Pogovor
- pogovorni
- stroški
- ustvarjajo
- ustvaril
- Ustvarjanje
- Creative
- Pokal
- Trenutna
- Trenutno
- po meri
- stranka
- Pomoč strankam
- Stranke, ki so
- customization
- prilagodite
- datum
- Varovanje podatkov
- nabor podatkov
- dan
- Odločitev
- namenjen
- privzeto
- opredeliti
- opredelitev
- izkazati
- Odvisno
- razporedi
- razporejeni
- uvajanja
- uvajanje
- razpolaga
- Oblikovanje
- destinacija
- Podrobnosti
- Ugotovite,
- Razvoj
- razvili
- Razvoj
- Dialog
- Dialog
- drugačen
- odkriti
- porazdeljena
- razdeljeno usposabljanje
- do
- ne
- domena
- Ime domene
- IMENA DOMEN
- opravljeno
- sanje
- Duke
- vojvodska univerza
- med
- vsak
- enostavnost
- enostavno
- East
- lahka
- E-naslov
- omogočajo
- omogočanje
- konec koncev
- Končna točka
- energija
- Inženiring
- Angleščina
- zagotovitev
- podjetja
- okolje
- zlasti
- Tudi
- Primer
- Primeri
- Razen
- razburjen
- strokovno znanje
- raziskuje
- Raziskovati
- izražena
- razširitev
- razširitve
- obsežen
- družina
- slavni
- daleč
- zanimivo
- Lastnosti
- Nekaj
- Najdi
- prva
- Plavaj
- po
- sledi
- za
- format
- Nekdanji
- Fundacija
- štiri
- FRAME
- Francija
- francosko
- prijatelji
- iz
- delovanje
- nadalje
- Gardens
- Gem
- ustvarjajo
- ustvarila
- ustvarja
- generacija
- dobili
- steklo
- Go
- Cilj
- Cilji
- dogaja
- dobro
- prisodil
- GPU
- Grafične kartice
- veliko
- Pridelovanje
- Navodila
- ceh
- imel
- se je zgodilo
- sovražijo
- Imajo
- ob
- he
- Srce
- pomoč
- pomoč
- pomoč
- Pomaga
- tukaj
- skrita
- skriti dragulj
- visokozmogljivo
- več
- njegov
- zgodovina
- Domov
- gostitelj
- gostovanje
- Kako
- Kako
- Vendar
- HTML
- HTTPS
- Hub
- i
- ikona
- ID
- idealen
- ID-ji
- if
- Illinois
- slika
- slike
- uvoz
- Impresivno
- in
- vključujejo
- Vključno
- Neverjetno
- Podatki
- Infrastruktura
- Inovacije
- vhod
- vhodi
- primer
- Inštitut
- Navodila
- integrirana
- zainteresirani
- interesi
- vmesnik
- v
- izolirani
- IT
- ITS
- jpg
- znano
- Kyle
- pristanek
- jezik
- velika
- Velika podjetja
- obsežne
- večja
- Največji
- Latenca
- Zadnji
- kosilo
- Zakoni
- postavitev
- Interesenti
- UČITE
- učenje
- dolžina
- Licenca
- light
- obložene
- LINK
- Povezave
- Seznam
- seznami
- nalaganje
- Long
- nižje
- Luxembourg
- stroj
- strojno učenje
- je
- Znamka
- Izdelava
- upravljanje
- upravlja
- več
- čudite
- Masa
- ogromen
- max
- največja
- Maj ..
- kar pomeni,
- pomeni
- mediji
- Srednjeveško
- Spomin
- Sporočilo
- Metoda
- morda
- Mešanje
- mešanico
- ML
- MLOps
- Model
- modeli
- več
- Najbolj
- motion
- muzej
- Glasba
- my
- Ime
- Imenovan
- Imena
- Krmarjenje
- ostalo
- nujno
- Nimate
- negativna
- net
- mreža
- Nevtralna
- Novo
- Naslednja
- noč
- št
- prenosnik
- Opaziti..
- zdaj
- Številka
- opazovalci
- of
- Ponudbe
- Olje
- Olive
- on
- enkrat
- ONE
- samo
- odkrito
- operativno
- optimizirana
- Možnost
- možnosti
- or
- Oregon
- Ostalo
- ven
- opisano
- izhod
- več
- Stran
- strani
- Palace
- članki
- parameter
- parametri
- paris
- parkirati
- zlasti
- partnerstev
- Plačilo
- način plačila
- ljudje
- za
- popolna
- Izvedite
- performance
- opravlja
- Dr.
- telefon
- Fizika
- kos
- Načrt
- platon
- Platonova podatkovna inteligenca
- PlatoData
- prosim
- pozitiven
- mogoče
- Prispevek
- Prispevkov
- Precision
- Predictor
- priprava
- predstaviti
- prejšnja
- v prvi vrsti
- , ravnateljica
- Težave
- Postopek
- Procesi
- Izdelek
- spodbujanje
- pravilno
- zagotavljajo
- če
- Ponudnik
- zagotavlja
- zagotavljanje
- objavljeno
- Namen
- dal
- Python
- vprašanja
- hitro
- naključnost
- Surovi
- reading
- Recept
- priporočeno
- glejte
- nanaša
- Ne glede na to
- regije
- Registracija
- registracijo
- registrar
- registracija
- relativna
- relativnost
- sprosti
- Izpusti
- pomembno
- zanesljivost
- zanesljiv
- ne pozabite
- Skladišče
- predstavlja
- zahteva
- potreben
- Raziskave
- raziskovalec
- viri
- Odgovor
- Rezultati
- Rich
- Ride
- licenčnine
- Run
- tek
- s
- sagemaker
- sol
- Enako
- Prilagodljivost
- razširljive
- Lestvica
- Znanstvenik
- SDK
- MORJE
- Iskalnik
- iskanje
- Sezona
- drugi
- Oddelek
- zavarovanje
- varnost
- glej
- seme
- izbran
- izbiranje
- višji
- sentiment
- Serija
- Storitev
- Storitve
- nastavite
- nastavitve
- več
- Delite s prijatelji, znanci, družino in partnerji :-)
- trgovin
- Kratke Hlače
- shouldnt
- Prikaži
- je pokazala,
- Razstave
- podpisati
- Enostavno
- preprostost
- preprosto
- sam
- Spletna mesta
- Velikosti
- Počasi
- majhna
- So
- doslej
- socialna
- družbeni mediji
- Objave v družabnih medijih
- rešitve
- nekaj
- Nekaj
- vir
- Vesolje
- specialist
- določeno
- hitrost
- Začetek
- začel
- Ustanavljanjem
- Države
- postaja
- Statistično
- Koraki
- stop
- ustavil
- shranjevanje
- trgovina
- ulica
- String
- studio
- Osupljiva
- taka
- podpora
- Podprti
- Podpira
- Preverite
- Simbol
- sistem
- miza
- Bodite
- ob
- Naloge
- ključi
- skupina
- Skupine
- Tehnologija
- Tehnološka inovacija
- Predloga
- Test
- besedilo
- da
- O
- svet
- njihove
- Njih
- tema
- POTEM
- Teorija
- Tukaj.
- te
- jih
- tretja
- ta
- skozi
- čas
- Časovne serije
- do
- skupaj
- žeton
- Boni
- orodje
- orodja
- Skupaj za plačilo
- Stolp
- Vlak
- usposobljeni
- usposabljanje
- transformator
- prevesti
- prevod
- Bilijona
- Izlet
- Triton
- poskusite
- tweet
- dva
- tip
- Vrste
- tipičen
- ui
- pod
- poenoteno
- edinstven
- univerza
- dokler
- Prenos
- us
- uporaba
- primeru uporabe
- Rabljeni
- uporabnik
- Uporabniki
- uporablja
- uporabo
- Vakuumska
- vrednost
- Vrednote
- raznolikost
- različnih
- različica
- različice
- preko
- Vibe
- Video
- Video posnetki
- Poglej
- ogledov
- Virginia
- Vizija
- obisk
- Obiskovalci
- vizualno
- sprehod
- želeli
- je
- vodni žig
- we
- web
- spletne storitve
- Web-Based
- Spletna stran
- teden
- Weeks
- Dobro
- West
- Kaj
- Kaj je
- kdaj
- ki
- medtem
- bo
- okna
- z
- v
- brez
- beseda
- besede
- svet
- pisanje
- ja
- Vi
- Vaša rutina za
- zefirnet
- nič