Täna on meil hea meel teatada, et Meta Llama 3 vundamendimudelid on saadaval Amazon SageMaker JumpStart juurutamiseks ja järelduste tegemiseks. Llama 3 mudelid on eelkoolitatud ja peenhäälestatud generatiivse teksti mudelite kogu.
Selles postituses kirjeldame, kuidas SageMaker JumpStarti kaudu Llama 3 mudeleid avastada ja juurutada.
Mis on Meta Llama 3
Llama 3 on saadaval kahes parameetri suuruses – 8B ja 70B 8k kontekstipikkusega –, mis toetavad mitmesuguseid kasutusjuhtumeid, täiustades arutluskäiku, koodi genereerimist ja juhiste järgimist. Llama 3 kasutab ainult dekoodri trafo arhitektuuri ja uut tokenisaatorit, mis tagab 128 3 suuruse mudeli parema jõudluse. Lisaks täiustas Meta koolitusjärgseid protseduure, mis vähendasid oluliselt valede keeldumiste määra, parandasid joondamist ja suurendasid mudeli vastuste mitmekesisust. Nüüd saate Llama XNUMX jõudluse ja MLOps-i juhtelementide kombineeritud eeliseid kasutada Amazon SageMakeri funktsioonidega, nagu SageMaker Pipelines, SageMaker Siluja või konteineri logid. Lisaks juurutatakse mudelit AWS-i turvalises keskkonnas teie VPC juhtimise all, mis aitab tagada andmete turvalisuse.
Mis on SageMaker JumpStart
SageMaker JumpStartiga saate valida laia valiku avalikult kättesaadavate vundamendimudelite hulgast. ML-i praktikud saavad juurutada sihtmudeleid spetsiaalsetele SageMakeri eksemplaridele võrgust eraldatud keskkonnast ja kohandada mudeleid SageMakeri abil mudeli koolituseks ja juurutamiseks. Nüüd saate mõne klõpsuga avastada ja juurutada Llama 3 mudeleid Amazon SageMaker Studio või programmiliselt SageMaker Python SDK kaudu, mis võimaldab teil tuletada mudeli jõudlust ja MLOps-i juhtelemente SageMakeri funktsioonidega, nagu SageMakeri torujuhtmed, SageMakeri silurvõi konteineri palke. Mudel on juurutatud AWS-i turvalises keskkonnas ja teie VPC kontrolli all, aidates tagada andmete turvalisust. Llama 3 mudelid on täna saadaval Amazon SageMaker Studios juurutamiseks ja järelduste tegemiseks us-east-1
(N. Virginia), us-east-2
(Ohio), us-west-2
(Oregon), eu-west-1
(Iirimaa) ja ap-northeast-1
(Tokyo) AWS-i piirkonnad.
Avastage mudeleid
Vundamendimudelitele pääsete juurde SageMakeri JumpStarti kaudu SageMaker Studio kasutajaliideses ja SageMaker Python SDK-s. Selles jaotises käsitleme SageMaker Studio mudelite leidmist.
SageMaker Studio on integreeritud arenduskeskkond (IDE), mis pakub ühtset veebipõhist visuaalset liidest, kus pääsete juurde sihipäraselt loodud tööriistadele, et sooritada kõiki ML-i arendusetappe alates andmete ettevalmistamisest kuni ML-mudelite loomise, koolitamise ja juurutamiseni. Lisateavet SageMaker Studio alustamise ja seadistamise kohta leiate aadressilt Amazon SageMaker Studio.
SageMaker Studios pääsete juurde SageMaker JumpStartile, mis sisaldab eelkoolitatud mudeleid, märkmikke ja eelehitatud lahendusi. Eelehitatud ja automatiseeritud lahendused.
Sihtlehel SageMaker JumpStart saate hõlpsasti avastada erinevaid mudeleid, sirvides erinevaid jaotureid, mis on nimetatud mudelipakkujate järgi. Llama 3 mudelid leiate Meta hubist. Kui te Llama 3 mudeleid ei näe, värskendage oma SageMaker Studio versiooni, lülitades välja ja taaskäivitades. Lisateabe saamiseks vaadake Lülitage Studio klassikalised rakendused välja ja värskendage neid.
Leiate Llama 3 mudelid, otsides vasakus ülanurgas olevast otsingukastist "Meta-lama-3".
Kõiki SageMaker JumpStartis saadaolevaid Meta mudeleid saate avastada, klõpsates Meta jaoturil.
Mudelikaardil klõpsates avaneb vastava mudeli üksikasjade leht, kust saate mudeli hõlpsalt juurutada.
Mudeli juurutamine
Kui valite juurutada ja tunnistage EULA tingimusi, algab juurutamine.
Saate jälgida juurutamise edenemist lehel, mis kuvatakse pärast nupu Juuruta klõpsamist.
Teise võimalusena saate valida Ava märkmik kasutusele võtta näidismärkmiku kaudu. Näidismärkmik pakub täielikke juhiseid selle kohta, kuidas mudelit järelduste tegemiseks ja ressursside puhastamiseks kasutada.
Sülearvuti abil juurutamiseks alustage sobiva mudeli valimisega, mille määrab model_id
. Saate SageMakeris juurutada mis tahes valitud mudelitest järgmise koodiga.
Vaikimisi accept_eula
on seatud väärtusele False
. Lõpp-punkti edukaks juurutamiseks peate käsitsi nõustuma EULA-ga. Seda tehes nõustute kasutaja litsentsilepingu ja aktsepteeritava kasutuse poliitikaga. Samuti leiate litsentsilepingu Laama veebisait. See juurutab mudeli SageMakeris vaikekonfiguratsioonidega, sealhulgas eksemplari vaiketüübi ja VPC vaikekonfiguratsioonidega. Saate neid konfiguratsioone muuta, määrates sisse mittevaikeväärtused JumpStartModel
. Lisateabe saamiseks vaadake järgmist dokumentatsioon.
Järgmises tabelis on loetletud kõik SageMaker JumpStartis saadaolevad Llama 3 mudelid koos model_ids
, vaikeeksemplari tüübid ja kõigi nende mudelite puhul toetatud maksimaalne žetoonide koguarv (sisendmärkide ja loodud märkide arvu summa).
Mudeli nimi | Mudeli ID | Maksimaalne žetoonide kogusumma | Eksemplari vaiketüüp |
Meta-laama-3-8B | meta-tekstipõlvkond-laama-3-8B | 8192 | ml.g5.12xsuur |
Meta-laama-3-8B-juhend | meta-tekstigenereerimine-laama-3-8B-juhend | 8192 | ml.g5.12xsuur |
Meta-laama-3-70B | meta-tekstipõlvkond-laama-3-70b | 8192 | ml.p4d.24xlarge |
Meta-laama-3-70B-juhend | meta-tekstigeneratsioon-laama-3-70b-juhend | 8192 | ml.p4d.24xlarge |
Käivitage järeldus
Pärast mudeli juurutamist saate SageMakeri ennustaja kaudu käivitada juurutatud lõpp-punkti põhjal järeldusi. Peenhäälestatud juhiste mudelid (Laama 3: 8B Instruct ja 70B Instruct) aktsepteerivad kasutaja ja vestlusabilise vaheliste vestluste ajalugu ning loovad järgneva vestluse. Eelkoolitatud mudelid (Laama 3: 8B ja 70B) nõuavad stringiviipa ja täidavad teksti lõpetamise kaasasolevale viipale.
Järeldusparameetrid juhivad teksti genereerimise protsessi lõpp-punktis. Max uued märgid juhivad mudeli genereeritud väljundi suurust. See ei ole sama, mis sõnade arv, sest mudeli sõnavara ei kattu inglise keele sõnavaraga ja iga märk ei pruugi olla ingliskeelne sõna. Temperatuuriparameeter kontrollib väljundi juhuslikkust. Kõrgem temperatuur toob kaasa loomingulisemad ja hallutsineeritumad tulemused. Kõik järeldusparameetrid on valikulised.
Näidisviibad mudelile 70B
Saate kasutada Llama 3 mudeleid mis tahes tekstilõigu teksti lõpetamiseks. Teksti genereerimise abil saate täita mitmesuguseid ülesandeid, nagu küsimustele vastamine, keele tõlkimine ja sentimentide analüüs jne. Lõpp-punkti sisendkoormus näeb välja järgmine kood:
Järgnevalt on toodud mõned näidisviibad ja mudeli loodud tekst. Kõik väljundid genereeritakse järeldusparameetritega {"max_new_tokens":64, "top_p":0.9, "temperature":0.6}
.
Järgmises näites näitame, kuidas kasutada Llama 3 mudeleid vähese kontekstisisese õppimisega, kus pakume mudelile saadaolevaid koolitusnäidiseid. Teeme järeldusi ainult juurutatud mudeli kohta ja selle protsessi ajal ning mudelite kaalud ei muutu.
Näidisviibad mudelile 70B-Instruct
Llama 3 käsumudelite puhul, mis on optimeeritud dialoogikasutusjuhtude jaoks, on juhiste mudeli lõpp-punktide sisendiks vestlusabilise ja kasutaja vaheline eelnev ajalugu. Saate esitada küsimusi, mis on seotud seni toimunud vestlusega. Saate esitada ka süsteemi konfiguratsiooni, näiteks isikud, mis määravad vestlusassistendi käitumise. Kuigi kasuliku koormuse sisendvorming on sama, mis eelkoolitatud baasmudelil, tuleks sisendtekst vormindada järgmiselt.
Selles juhismallis saate valikuliselt alustada tähega a system
rolli ja kaasata pöördepõhisesse ajalugu nii palju vahelduvaid rolle, kui soovitakse. Lõplik roll peaks alati olema assistant
ja lõpetage kahe uue reavahetusega.
Järgmisena kaaluge mõnda mudeli viipade ja vastuste näidet. Järgmises näites esitab kasutaja assistendile lihtsa küsimuse.
Järgmises näites vestleb kasutaja assistendiga Pariisi turismiobjektide teemal. Seejärel küsib kasutaja vestlusassistendi soovitatud esimese võimaluse kohta.
Järgmistes näidetes määrame süsteemi konfiguratsiooni.
Koristage
Kui olete märkmiku käitamise lõpetanud, kustutage kindlasti kõik protsessi käigus loodud ressursid, et teie arveldamine peataks. Kasutage järgmist koodi:
Järeldus
Selles postituses näitasime teile, kuidas SageMaker Studios Llama 3 mudelitega alustada. Nüüd on teil juurdepääs neljale Llama 3 alusmudelile, mis sisaldavad miljardeid parameetreid. Kuna vundamendimudelid on eelkoolitatud, võivad need aidata vähendada koolitus- ja infrastruktuurikulusid ning võimaldada kohandamist teie kasutusjuhtumitele. Kontrollige SageMaker KiirStart SageMaker Studios, et alustada.
Autorite kohta
Kyle Ulrich on AWS-i rakendusteadlane II
Xin Huang on AWSi vanemrakendusteadlane
Qing Lan on AWS-i tarkvaraarendaja vaneminsener
Haotian An on AWS-i tarkvaraarendaja II insener
Christopher Whitten on AWS-i tarkvaraarenduse insener II
Tyler Osterberg on AWS-i tarkvaraarenduse insener I
Manan Shah on AWS-i tarkvaraarenduse juht
Jonathan Guinegagne on AWS-i tarkvaraarendaja vaneminsener
Adriana Simmons on AWS-i vanemtoodete turundusjuht
Juuni võitis on AWS-i vanemtootejuht
Ashish Khetan on AWSi vanemrakendusteadlane
Rachna Chadha on AWS-i peamine lahendusarhitekt – AI/ML
Deepak Rupakula on AWS-i GTM-i peamine spetsialist
- SEO-põhise sisu ja PR-levi. Võimenduge juba täna.
- PlatoData.Network Vertikaalne generatiivne Ai. Jõustage ennast. Juurdepääs siia.
- PlatoAiStream. Web3 luure. Täiustatud teadmised. Juurdepääs siia.
- PlatoESG. Süsinik, CleanTech, Energia, Keskkond päikeseenergia, Jäätmekäitluse. Juurdepääs siia.
- PlatoTervis. Biotehnoloogia ja kliiniliste uuringute luureandmed. Juurdepääs siia.
- Allikas: https://aws.amazon.com/blogs/machine-learning/meta-llama-3-models-are-now-available-in-amazon-sagemaker-jumpstart/
- :on
- :on
- :mitte
- : kus
- $ UP
- 1
- 10
- 11
- 120
- 19
- 360-kraad
- 43
- 7
- 8
- 8k
- 9
- a
- MEIST
- aktsepteerima
- vastuvõetav
- juurdepääs
- juurdepääsetav
- kinnitada
- lisama
- lisatud
- lisamine
- eelised
- pärast
- jälle
- vastu
- Kokkulepe
- AI / ML
- joondumine
- Materjal: BPA ja flataatide vaba plastik
- mööda
- Ka
- alati
- am
- Amazon
- Amazon SageMaker
- Amazon SageMaker JumpStart
- Amazon SageMaker Studio
- Amazon Web Services
- õhkkond
- an
- analüüs
- ja
- infrastruktuuri
- Teatama
- vastus
- vastamine
- mistahes
- õun
- rakendatud
- asjakohane
- arhitektuur
- OLEME
- kunst
- AS
- küsima
- küsib
- assistent
- seotud
- At
- Atmosfäär
- atraktsioon
- vaatamisväärsused
- Automatiseeritud
- saadaval
- vältima
- AWS
- baas
- BE
- Pidage
- ilus
- sest
- olnud
- käitumine
- Pekingis
- Uskuma
- vahel
- arvete
- miljardeid
- Kast
- puruneb
- hingemattev
- lai
- Katki
- Sirvimine
- Ehitus
- ehitatud
- kuid
- nupp
- by
- Kutsub
- CAN
- kapital
- kaart
- juhul
- juhtudel
- muutma
- vestlus
- kassid
- kontrollima
- Vali
- Linn
- klassika
- puhastama
- kood
- kogumine
- kombinatsioon
- kombineeritud
- tuleb
- KOMMUNIKATSIOON
- lõpetamist
- konfiguratsioon
- Arvestama
- pidev
- sisaldama
- Konteiner
- sisaldab
- kontekst
- kontekstuaalne
- pidevalt
- kontrollida
- kontrolli
- Mugav
- Vestlus
- Vastav
- kulud
- looma
- loodud
- Loominguline
- otsustav
- kultuur
- Tass
- Kliendid
- kohandamine
- kohandada
- andmed
- andmekaitse
- de
- pühendunud
- vaikimisi
- määratlema
- juurutada
- lähetatud
- juurutamine
- kasutuselevõtu
- juurutab
- kõrvalekalle
- soovitud
- sihtkohtadesse
- detail
- detailid
- arendaja
- & Tarkvaraarendus
- Dialoog
- erinevus
- erinev
- õhtusöögid
- avastama
- mitmekesisus
- do
- ei
- teeme
- don
- tehtud
- kahekordistunud
- alla
- ajal
- Videvik
- e
- iga
- kergesti
- jõupingutusi
- võimaldama
- võimaldades
- lõpp
- Lõpuks-lõpuni
- Lõpp-punkt
- insener
- Inseneriteadus
- Inglise
- piisavalt
- tagades
- keskkond
- Isegi
- Iga
- igaüks
- näide
- näited
- erutatud
- kogemus
- õiglane
- vale
- kuulus
- kaugele
- vägitegu
- Objekte
- FUNKTSIOONID
- jalad
- vähe
- filmid
- lõplik
- leidma
- esimene
- maitse
- Float
- voog
- Järel
- jalg
- eest
- formaat
- Sihtasutus
- neli
- Prantsusmaa
- prantsuse
- värske
- Alates
- Üldine
- Üldrelatiivsusteooria
- tekitama
- loodud
- põlvkond
- generatiivne
- õrn
- saksa
- saama
- klaas
- Go
- läheb
- järk-järgult
- suur
- murranguline
- juhised
- juhitud
- juhtuda
- juhtus
- Raske
- raske töö
- Olema
- tervislikumaks
- aitama
- aidates
- siin
- rohkem
- ajalooline
- ajalugu
- hoidma
- Avaleht
- tund
- elamispind
- Kuidas
- Kuidas
- HTML
- HTTPS
- Keskus
- jaoturid
- i
- ikooniks
- if
- ii
- import
- muljetavaldav
- paranenud
- parandusi
- in
- sisaldama
- Kaasa arvatud
- Suurendama
- kasvanud
- kasvav
- info
- Infrastruktuur
- sisend
- Näiteks
- otsekohe
- integreeritud
- Interface
- sisse
- Iirimaa
- isoleeritud
- IT
- ITS
- jpg
- lihtsalt
- hoidma
- Teadma
- teatud
- maandumine
- vaatamisväärsused
- keel
- suurim
- algatama
- Seadused
- Õppida
- õppimine
- lahkus
- Pikkus
- litsents
- elu
- Tõsta
- valgus
- heledam
- nagu
- joon
- Nimekirjad
- kirjandus
- vähe
- elama
- Elab
- Laama
- asub
- välimus
- Partii
- vähendada
- tehtud
- tegema
- Tegemine
- juht
- viis
- käsitsi
- palju
- Turundus
- max
- maksimaalne
- mai..
- tähendus
- sõnum
- Meta
- kesköö
- protokoll
- mikser
- segu
- ML
- MLOps
- mudel
- mudelid
- Jälgida
- rohkem
- kõige
- Populaarseim
- palju
- muuseum
- Muuseumid
- Nimega
- Vajadus
- vaja
- võrk
- Uus
- järgmine
- öö
- ei
- märkmik
- nüüd
- number
- NY
- tähelepanek
- vaatlejad
- esineda
- of
- pakkuma
- pakkumine
- Pakkumised
- sageli
- Ohio
- Õli
- on
- ONE
- ainult
- Avaneb
- optimaalselt
- optimeeritud
- valik
- or
- et
- Oregon
- teised
- meie
- kandma
- välja
- väljund
- väljundid
- üle
- lehekülg
- parameeter
- parameetrid
- Paris
- osa
- täitma
- jõudlus
- Füüsika
- tükk
- Koht
- Platon
- Platoni andmete intelligentsus
- PlatoData
- mängis
- palun
- poliitika
- populaarne
- post
- Predictor
- ettevalmistamisel
- eelmine
- Peamine
- menetlused
- protsess
- Toode
- tootejuht
- profiilid
- Edu
- küsib
- Ettepanekud
- anda
- tingimusel
- pakkujad
- annab
- avalik
- ühistransport
- avalikult
- eesmärk
- panema
- Python
- küsimus
- Küsimused
- juhuslikkus
- valik
- Rates
- RE
- jõudis
- põhjustel
- retsept
- soovitatav
- Lühendatud
- viitama
- keeldumine
- osas
- piirkondades
- suhtelisus
- nõudma
- ressurss
- Vahendid
- vastuste
- Tulemused
- Jõgi
- Roll
- rollid
- romantika
- ruum
- jooks
- jooksmine
- s
- salveitegija
- SageMakeri torujuhtmed
- sool
- sama
- proov
- ütlema
- teadlane
- SDK
- Otsing
- otsimine
- Teine
- Osa
- kindlustama
- turvalisus
- vaata
- väljavalitud
- valides
- valik
- vanem
- tunne
- Teenused
- teenindavad
- komplekt
- mitu
- kuju
- lask
- peaks
- näitama
- näitas
- Näitused
- seiskamist
- märkimisväärne
- lihtne
- lihtsalt
- ühekordne
- Saidid
- SUURUS
- suurused
- aeglane
- Aeglaselt
- siluda
- So
- nii kaugel
- tarkvara
- tarkvaraarenduse
- lahendus
- Lahendused
- mõned
- Sädemeke
- eriline
- spetsialist
- määratletud
- täpsustades
- kiirus
- Kaubandus-
- seisma
- alaline
- algus
- alustatud
- Ühendriigid
- stabiilne
- Sammud
- Peatus
- peatatud
- oja
- nöör
- struktuur
- stuudio
- Uimastamine
- järgnev
- oluliselt
- Edukalt
- selline
- toetama
- Toetatud
- kindel
- sümbol
- süsteem
- tabel
- sobivalt
- Võtma
- võtab
- võtmine
- ülesanded
- maitse
- meeskond
- šabloon
- tingimused
- tekst
- tänama
- et
- .
- Pealinn
- maailm
- SIIS
- teooria
- Seal.
- Need
- nad
- õhuke
- see
- tuhandeid
- Läbi
- aeg
- et
- täna
- kokku
- sümboolne
- märgid
- Tokyo
- liiga
- töövahendid
- ülemine
- Summa
- ekskursioon
- Torn
- koolitus
- trafo
- tõlkima
- Tõlge
- transportimine
- kaks
- tüüp
- liigid
- ui
- all
- ainulaadne
- kuni
- Värskendused
- kasutama
- kasutage juhtumit
- Kasutaja
- kasutusalad
- kasutamine
- väärtuslik
- Väärtused
- variatsioonid
- sort
- eri
- versioon
- väga
- kaudu
- vaated
- virginia
- visuaalne
- maht
- vs
- kõndima
- tagaotsitav
- sõda
- oli
- Vesi
- kuidas
- we
- web
- veebiteenused
- Veebipõhine
- pulmad
- Hästi
- läks
- M
- millal
- mis
- kuigi
- valge
- miks
- will
- aknad
- Vein
- koos
- ime
- sõna
- sõnad
- Töö
- maailm
- sa
- Sinu
- sephyrnet