Astăzi, suntem încântați să anunțăm că modelul de fundație Falcon 180B dezvoltat de Technology Innovation Institute (TII) și instruit pe Amazon SageMaker este disponibil pentru clienți prin Amazon SageMaker JumpStart pentru a implementa cu un singur clic pentru a rula inferența. Cu o dimensiune de 180 de miliarde de parametri și antrenat pe un set de date masiv de 3.5 trilioane de jetoane, Falcon 180B este cel mai mare și unul dintre cele mai performante modele cu greutăți accesibile în mod deschis. Puteți încerca acest model cu SageMaker JumpStart, un hub de învățare automată (ML) care oferă acces la algoritmi, modele și soluții ML, astfel încât să puteți începe rapid cu ML. În această postare, vom explica cum să descoperim și să implementăm modelul Falcon 180B prin SageMaker JumpStart.
Ce este Falcon 180B
Falcon 180B este un model lansat de IIT care urmează lansărilor anterioare din familia Falcon. Este o versiune extinsă a Falcon 40B și folosește atenția cu mai multe interogări pentru o scalabilitate mai bună. Este un model de limbaj auto-regresiv care utilizează o arhitectură transformatoare optimizată. A fost antrenat pe 3.5 trilioane de jetoane de date, constând în principal din date web de la RefinedWeb (aproximativ 85%). Modelul are două versiuni: 180B și 180B-Chat. 180B este un model brut, pre-antrenat, care ar trebui să fie reglat în continuare pentru majoritatea cazurilor de utilizare. 180B-Chat este mai potrivit pentru a primi instrucțiuni generice. Modelul Chat a fost reglat fin pe seturile de date de chat și instrucțiuni, împreună cu mai multe seturi de date conversaționale la scară largă.
Modelul este disponibil sub Licență Falcon-180B TII și Politica de utilizare acceptabilă.
Falcon 180B a fost antrenat de TII pe Amazon SageMaker, pe un cluster de GPU-uri A4 de aproximativ 100K. A folosit o bază de cod de antrenament distribuită personalizat numită Gigatron, care utilizează paralelismul 3D cu ZeRO și nuclee Triton personalizate, de înaltă performanță. Arhitectura de instruire distribuită utilizată Serviciul Amazon de stocare simplă (Amazon S3) ca unic serviciu unificat pentru încărcarea datelor și scrierea și citirea punctelor de control, care a contribuit în special la fiabilitatea sarcinii de lucru și la simplitatea operațională.
Ce este SageMaker JumpStart
Cu SageMaker JumpStart, practicienii ML pot alege dintr-o listă tot mai mare de modele de fond de ten cu cele mai bune performanțe. Practicanții ML pot implementa modele de bază în instanțe SageMaker dedicate într-un mediu izolat de rețea și pot personaliza modele folosind Amazon SageMaker pentru instruirea și implementarea modelelor.
Acum puteți descoperi și implementa Falcon 180B cu câteva clicuri Amazon SageMaker Studio sau programatic prin intermediul SDK-ului SageMaker Python, permițându-vă să obțineți performanța modelului și controalele MLOps cu funcții SageMaker, cum ar fi Pipelines Amazon SageMaker, Debugger Amazon SageMaker, sau jurnalele containerului. Modelul este implementat într-un mediu securizat AWS și sub controalele dvs. VPC, contribuind la asigurarea securității datelor. Falcon 180B poate fi descoperit și poate fi implementat în regiunile în care sunt disponibile instanțele necesare. În prezent, instanțe ml.p4de sunt disponibile în estul SUA (N. Virginia) și în vestul SUA (Oregon).
Descoperă modele
Puteți accesa modelele de fundație prin SageMaker JumpStart în SageMaker Studio UI și SageMaker Python SDK. În această secțiune, vom analiza cum să descoperiți modelele în SageMaker Studio.
SageMaker Studio este un mediu de dezvoltare integrat (IDE) care oferă o interfață vizuală unică bazată pe web, unde puteți accesa instrumente special create pentru a efectua toți pașii de dezvoltare ML, de la pregătirea datelor până la construirea, antrenamentul și implementarea modelelor dvs. ML. Pentru mai multe detalii despre cum să începeți și să configurați SageMaker Studio, consultați Amazon SageMaker Studio.
În SageMaker Studio, puteți accesa SageMaker JumpStart, care conține modele pre-antrenate, notebook-uri și soluții prefabricate, sub Soluții preconstruite și automatizate.
Din pagina de destinație SageMaker JumpStart, puteți căuta soluții, modele, notebook-uri și alte resurse. Puteți găsi Falcon 180B în Modele de fundație: generare text carusel.
Poti gasi si alte variante de model alegand Explorați toate modelele de generare de text sau căutarea Falcon
.
Puteți alege cardul model pentru a vedea detalii despre model, cum ar fi licența, datele utilizate pentru antrenament și modul de utilizare. Veți găsi și două butoane, Lansa și Deschide Notebook, care vă va ajuta să utilizați modelul (captura de ecran următoare arată Lansa opțiune).
Implementați modele
Când alegi Lansa, va începe implementarea modelului. Alternativ, puteți implementa prin exemplul de blocnotes care apare prin alegere Deschide Notebook. Exemplul de blocnotes oferă îndrumări de la capăt la capăt cu privire la modul de implementare a modelului pentru inferență și curățarea resurselor.
Pentru a implementa folosind un notebook, începem prin a selecta un model adecvat, specificat de model_id
. Puteți implementa oricare dintre modelele selectate pe SageMaker cu următorul cod:
Aceasta implementează modelul pe SageMaker cu configurații implicite, inclusiv tipul de instanță implicit și configurațiile VPC implicite. Puteți modifica aceste configurații specificând valori care nu sunt implicite în JumpStartModel
. Pentru a afla mai multe, consultați Documentație API. După ce este implementat, puteți rula inferențe împotriva punctului final implementat printr-un predictor SageMaker. Vezi următorul cod:
Parametrii de inferență controlează procesul de generare a textului la punctul final. Controlul maxim de jetoane noi se referă la dimensiunea rezultatului generat de model. Rețineți că acesta nu este același cu numărul de cuvinte, deoarece vocabularul modelului nu este același cu vocabularul în limba engleză și este posibil ca fiecare simbol să nu fie un cuvânt în limba engleză. Temperatura controlează aleatoritatea în ieșire. O temperatură mai ridicată are ca rezultat rezultate mai creative și halucinate. Toți parametrii de inferență sunt opționali.
Acest model de parametri 180B are 335 GB și necesită și mai multă memorie GPU pentru a efectua suficient deduceri cu precizie de 16 biți. În prezent, JumpStart acceptă acest model numai pe instanțe ml.p4de.24xlarge. Este posibil să se implementeze un model cuantizat pe 8 biți pe o instanță ml.p4d.24xlarge prin furnizarea env={"HF_MODEL_QUANTIZE": "bitsandbytes"}
argument al cuvântului cheie la JumpStartModel
constructor şi specificarea instance_type="ml.p4d.24xlarge"
la metoda de implementare. Cu toate acestea, rețineți că latența pe token este de aproximativ 5 ori mai lentă pentru această configurație cuantificată.
Următorul tabel listează toate modelele Falcon disponibile în SageMaker JumpStart împreună cu ID-urile modelului, tipurile de instanțe implicite, numărul maxim de jetoane totale (suma numărului de jetoane de intrare și numărul de jetoane generate) acceptate și latența de răspuns tipică pe token pentru fiecare dintre aceste modele.
Nume model | ID model | Tip de instanță implicit | Totalul maxim de jetoane | Latență pe token* |
Soimul 7B | huggingface-llm- falcon-7b-bf16 |
ml.g5.2xmare | 2048 | 34 ms |
Falcon 7B Instruct | huggingface-llm- falcon-7b-instruct-bf16 |
ml.g5.2xmare | 2048 | 34 ms |
Soimul 40B | huggingface-llm- falcon-40b-bf16 |
ml.g5.12xmare | 2048 | 57 ms |
Falcon 40B Instruct | huggingface-llm- falcon-40b-instruct-bf16 |
ml.g5.12xmare | 2048 | 57 ms |
Soimul 180B | huggingface-llm- falcon-180b-bf16 |
ml.p4de.24xlarge | 2048 | 45 ms |
Falcon 180B Chat | huggingface-llm- falcon-180b-chat-bf16 |
ml.p4de.24xlarge | 2048 | 45 ms |
*latența pe token este furnizată pentru timpul mediu de răspuns al exemplelor de solicitări furnizate în acest blog; această valoare va varia în funcție de lungimea secvențelor de intrare și de ieșire.
Inferențe și exemple de solicitări pentru Falcon 180B
Modelele Falcon pot fi folosite pentru completarea textului pentru orice bucată de text. Prin generarea de text, puteți efectua o varietate de sarcini, cum ar fi răspunsul la întrebări, traducerea limbii, analiza sentimentelor și multe altele. Punctul final acceptă următoarea schemă de încărcare utilă de intrare:
Puteți explora definiția acestora parametrii clientului și valorile lor implicite în depozitul de generare de text-inferență.
Următoarele sunt câteva exemple de prompturi și textul generat de model. Toate ieșirile de aici sunt generate cu parametri de inferență {"max_new_tokens": 768, "stop": ["<|endoftext|>", "###"]}
.
Construirea unui site web se poate face în 10 pași simpli:
Este posibil să observați că acest model preantrenat generează secvențe de text lungi care nu sunt neapărat ideale pentru cazurile de utilizare a dialogurilor. Înainte de a arăta cum funcționează modelul de chat ajustat pentru un set mai mare de solicitări bazate pe dialoguri, următoarele două exemple ilustrează cum să folosiți modelele Falcon cu învățare în context cu câteva fotografii, unde oferim mostre de antrenament disponibile modelului. Rețineți că „învățare cu puține lovituri” nu ajustează ponderile modelului - efectuăm doar inferențe asupra modelului implementat în timpul acestui proces, oferind în același timp câteva exemple în contextul de intrare pentru a ajuta la ieșirea modelului de breaslă.
Inferență și exemple de solicitări pentru Falcon 180B-Chat
Cu modelele Falcon 180B-Chat, optimizate pentru cazuri de utilizare a dialogului, intrarea în punctele finale ale modelului de chat poate conține istoricul anterior între asistentul de chat și utilizator. Puteți pune întrebări în contextul conversației care a avut loc până acum. De asemenea, puteți furniza configurația sistemului, cum ar fi personaje, care definesc comportamentul asistentului de chat. Sarcina utilă de intrare la punctul final este aceeași cu modelul Falcon 180B, cu excepția inputs
valoarea șir ar trebui să utilizeze următorul format:
Următoarele sunt câteva exemple de prompturi și textul generat de model. Toate ieșirile sunt generate cu parametri de inferență {"max_new_tokens":256, "stop": ["nUser:", "<|endoftext|>", " User:", "###"]}.
În exemplul următor, utilizatorul a avut o conversație cu asistentul despre locurile turistice din Paris. În continuare, utilizatorul întreabă despre prima opțiune recomandată de asistentul de chat.
A curăța
După ce ați terminat de rulat blocnotesul, asigurați-vă că ștergeți toate resursele pe care le-ați creat în acest proces, astfel încât facturarea să fie oprită. Utilizați următorul cod:
Concluzie
În această postare, v-am arătat cum să începeți cu Falcon 180B în SageMaker Studio și să implementați modelul pentru inferență. Deoarece modelele de fundație sunt pregătite în prealabil, ele pot ajuta la reducerea costurilor de instruire și infrastructură și pot permite personalizarea pentru cazul dvs. de utilizare. Vizitați SageMaker JumpStart în SageMaker Studio acum pentru a începe.
Resurse
Despre Autori
Dr. Kyle Ulrich este un om de știință aplicat în echipa Amazon SageMaker JumpStart. Interesele sale de cercetare includ algoritmi scalabili de învățare automată, viziunea computerizată, serii temporale, non-parametrice bayesiene și procese gaussiene. Doctoratul său este de la Universitatea Duke și a publicat lucrări în NeurIPS, Cell, and Neuron.
Dr. Ashish Khetan este cercetător senior aplicat cu Amazon SageMaker JumpStart și ajută la dezvoltarea algoritmilor de învățare automată. Și-a luat doctoratul la Universitatea din Illinois Urbana-Champaign. Este un cercetător activ în învățarea automată și inferența statistică și a publicat multe lucrări în conferințele NeurIPS, ICML, ICLR, JMLR, ACL și EMNLP.
Olivier Cruchaneste arhitect principal de soluții de specialitate în învățare automată la AWS, cu sediul în Franța. Olivier îi ajută pe clienții AWS – de la startup-uri mici până la întreprinderi mari – să dezvolte și să implementeze aplicații de învățare automată la nivel de producție. În timpul liber, îi place să citească lucrări de cercetare și să exploreze sălbăticia cu prietenii și familia.
Karl Albertsen conduce echipele de modele, algoritmi și parteneriate ale Amazon SageMaker.
- Distribuție de conținut bazat pe SEO și PR. Amplifică-te astăzi.
- PlatoData.Network Vertical Generative Ai. Împuterniciți-vă. Accesați Aici.
- PlatoAiStream. Web3 Intelligence. Cunoștințe amplificate. Accesați Aici.
- PlatoESG. Automobile/VE-uri, carbon, CleanTech, Energie, Mediu inconjurator, Solar, Managementul deșeurilor. Accesați Aici.
- PlatoHealth. Biotehnologie și Inteligență pentru studii clinice. Accesați Aici.
- ChartPrime. Crește-ți jocul de tranzacționare cu ChartPrime. Accesați Aici.
- BlockOffsets. Modernizarea proprietății de compensare a mediului. Accesați Aici.
- Sursa: https://aws.amazon.com/blogs/machine-learning/falcon-180b-foundation-model-from-tii-is-now-available-via-amazon-sagemaker-jumpstart/
- :are
- :este
- :nu
- :Unde
- $UP
- 1
- 10
- 100
- 11
- 12
- 13
- 14
- 150
- 20
- 25
- 26%
- 3d
- 4k
- 7
- 8
- 9
- a
- Despre Noi
- acceptă
- acces
- accesibil
- Obține
- activ
- adăuga
- În plus,
- adresa
- După
- împotriva
- algoritmi
- TOATE
- permite
- de-a lungul
- de asemenea
- mereu
- am
- Amazon
- Amazon SageMaker
- Amazon SageMaker JumpStart
- Amazon Web Services
- an
- analiză
- și
- și infrastructură
- anunța
- O alta
- răspunde
- Orice
- oricine
- interesant
- aplicatii
- aplicat
- adecvat
- aproximativ
- arhitectură
- SUNT
- argument
- Artă
- articol
- AS
- cere
- Asistent
- At
- atenţie
- atrage
- atracţie
- Automata
- disponibil
- căi
- AWS
- bazat
- acumulator
- Bayesian
- BE
- frumos
- deoarece
- fost
- înainte
- comportament
- Mai bine
- între
- facturare
- Blog
- se mândreşte cu
- browser-ul
- constructor
- constructori
- Clădire
- afaceri
- dar
- by
- cafenele
- CAN
- capacitate
- card
- carusel
- caz
- cazuri
- Schimbare
- verifica
- Alege
- alegere
- ales
- Oraș
- Clasifica
- Grup
- CMS
- cod
- codeBase
- colectare
- Coloane
- COM
- combinate
- Comun
- companie
- Completă
- completare
- calculator
- Computer Vision
- conferințe
- Configuraţie
- Constând
- contactați-ne
- conţine
- Recipient
- conține
- conţinut
- context
- contextual
- continuu
- Contribuit
- Control
- controale
- Conversație
- de conversaţie
- Cheltuieli
- crea
- a creat
- Crearea
- Creator
- Ceaşcă
- Curent
- În prezent
- personalizat
- client
- Relații Clienți
- clienţii care
- personalizare
- personaliza
- de date
- securitatea datelor
- seturi de date
- zi
- decizie
- dedicat
- Mod implicit
- defini
- definiție
- demonstra
- În funcție
- implementa
- dislocate
- Implementarea
- desfășurarea
- implementează
- Amenajări
- destinație
- detalii
- Determina
- dezvolta
- dezvoltat
- Dezvoltare
- Dialog
- Dialog
- diferit
- descoperi
- distribuite
- instruire distribuită
- do
- face
- domeniu
- Domain Name
- NUMELE DE DOMENIU
- făcut
- vise
- Duce
- duke universitate
- în timpul
- fiecare
- uşura
- cu ușurință
- Est
- uşor
- permite
- permițând
- un capăt la altul
- Punct final
- energie
- Inginerie
- Engleză
- asigura
- Companii
- Mediu inconjurator
- mai ales
- Chiar
- exemplu
- exemple
- Cu excepția
- excitat
- expertiză
- explora
- Explorarea
- și-a exprimat
- extensie
- extensii
- extensiv
- familie
- celebru
- departe
- fascinant
- DESCRIERE
- puțini
- Găsi
- First
- pluti
- următor
- urmează
- Pentru
- format
- Fost
- Fundație
- patru
- FRAME
- Franţa
- Franceză
- Prietenii lui
- din
- funcționare
- mai mult
- Gardens
- Gem
- genera
- generată
- generează
- generaţie
- obține
- de sticlă
- Go
- scop
- Goluri
- merge
- bine
- am
- GPU
- unități de procesare grafică
- mare
- În creştere
- îndrumare
- breaslă
- HAD
- sa întâmplat
- ură
- Avea
- având în
- he
- inimă
- ajutor
- util
- ajutor
- ajută
- aici
- Ascuns
- bijuterie ascunsă
- performanta ridicata
- superior
- lui
- istorie
- Acasă
- gazdă
- găzduire
- Cum
- Cum Pentru a
- Totuși
- HTML
- HTTPS
- Butuc
- i
- iconic
- ID
- ideal
- ID-uri
- if
- Illinois
- imagine
- imagini
- import
- impresionant
- in
- include
- Inclusiv
- incredibil
- informații
- Infrastructură
- Inovaţie
- intrare
- intrări
- instanță
- Institut
- instrucțiuni
- integrate
- interesat
- interese
- interfaţă
- în
- izolat
- IT
- ESTE
- jpg
- cunoscut
- Kyle
- aterizare
- limbă
- mare
- Întreprinderi mari
- pe scară largă
- mai mare
- cea mai mare
- Latență
- Ultimele
- lansa
- legii
- Aspect
- Conduce
- AFLAȚI
- învăţare
- Lungime
- Licență
- ușoară
- căptușită
- LINK
- Link-uri
- Listă
- liste
- încărcare
- Lung
- LOWER
- Luxemburg
- maşină
- masina de învățare
- făcut
- face
- Efectuarea
- administrare
- gestionează
- multe
- minune
- Masa
- masiv
- max
- maxim
- Mai..
- sens
- mijloace
- Mass-media
- medieval
- Memorie
- mesaj
- metodă
- ar putea
- Amestecarea
- amestec
- ML
- MLOps
- model
- Modele
- mai mult
- cele mai multe
- mişcare
- muzeu
- Muzică
- my
- nume
- Numit
- nume
- Navigaţi
- Navigare
- în mod necesar
- Nevoie
- negativ
- net
- reţea
- Neutru
- Nou
- următor
- noapte
- Nu.
- caiet
- Înștiințare..
- acum
- număr
- observatori
- of
- promoții
- Ulei
- Măslin
- on
- dată
- ONE
- afară
- deschis
- operațional
- optimizate
- Opțiune
- Opţiuni
- or
- Oregon
- Altele
- afară
- a subliniat
- producție
- peste
- pagină
- pagini
- Palat
- lucrări
- parametru
- parametrii
- Paris
- Parc
- în special
- parteneriate
- plată
- Modalitate de plată
- oameni
- pentru
- Perfect
- Efectua
- performanță
- efectuează
- PhD
- telefon
- Fizică
- bucată
- plan
- Plato
- Informații despre date Platon
- PlatoData
- "vă rog"
- pozitiv
- posibil
- Post
- postări
- Precizie
- Predictor
- pregătirea
- prezenta
- precedent
- în primul rând
- Principal
- probleme
- proces
- procese
- Produs
- promova
- cum se cuvine
- furniza
- prevăzut
- furnizorul
- furnizează
- furnizarea
- publicat
- scop
- pune
- Piton
- Întrebări
- repede
- dezordine
- Crud
- Citind
- reţetă
- recomandat
- trimite
- se referă
- Fără deosebire
- regiuni
- Inregistreaza-te
- înregistrare
- grefier
- Înscriere
- relativ
- relativitatea
- eliberat
- Lansări
- încredere
- de încredere
- minte
- depozit
- reprezintă
- Necesită
- necesar
- cercetare
- cercetător
- Resurse
- răspuns
- REZULTATE
- Bogat
- Călări
- drepturi de autor
- Alerga
- funcţionare
- s
- sagemaker
- sare
- acelaşi
- scalabilitate
- scalabil
- Scară
- Om de stiinta
- sdk
- SEA
- Caută
- căutare
- Sezon
- Al doilea
- Secțiune
- sigur
- securitate
- vedea
- sămânţă
- selectate
- selectarea
- senior
- sentiment
- serie
- serviciu
- Servicii
- set
- setări
- câteva
- Distribuie
- magazine
- Pantaloni scurți
- să
- Arăta
- a arătat
- Emisiuni
- semna
- simplu
- simplitate
- pur şi simplu
- singur
- Centre de cercetare
- Mărimea
- Încet
- mic
- So
- până acum
- Social
- social media
- Postări în rețelele sociale
- soluţii
- unele
- ceva
- Sursă
- Spaţiu
- specialist
- specificată
- viteză
- Începe
- început
- Startup-urile
- Statele
- staţie
- statistic
- paşi
- Stop
- oprit
- depozitare
- stoca
- stradă
- Şir
- studio
- Uluitor
- astfel de
- a sustine
- Suportat
- Sprijină
- sigur
- simbol
- sistem
- tabel
- Lua
- luare
- sarcini
- gust
- echipă
- echipe
- Tehnologia
- Inovația tehnologică
- șablon
- test
- a) Sport and Nutrition Awareness Day in Manasia Around XNUMX people from the rural commune Manasia have participated in a sports and healthy nutrition oriented activity in one of the community’s sports ready yards. This activity was meant to gather, mainly, middle-aged people from a Romanian rural community and teach them about the benefits that sports have on both their mental and physical health and on how sporting activities can be used to bring people from a community closer together. Three trainers were made available for this event, so that the participants would get the best possible experience physically and so that they could have the best access possible to correct information and good sports/nutrition practices. b) Sports Awareness Day in Poiana Țapului A group of young participants have taken part in sporting activities meant to teach them about sporting conduct, fairplay, and safe physical activities. The day culminated with a football match.
- acea
- lumea
- lor
- Lor
- temă
- apoi
- teorie
- Acolo.
- Acestea
- ei
- Al treilea
- acest
- Prin
- timp
- Seria de timp
- la
- împreună
- semn
- indicativele
- instrument
- Unelte
- Total
- Turn
- Tren
- dresat
- Pregătire
- transformator
- Traduceți
- Traducere
- Trilion
- excursie
- Triton
- încerca
- tweet
- Două
- tip
- Tipuri
- tipic
- ui
- în
- unificat
- unic
- universitate
- până la
- Se încarcă
- us
- utilizare
- carcasa de utilizare
- utilizat
- Utilizator
- utilizatorii
- utilizări
- folosind
- Vid
- valoare
- Valori
- varietate
- diverse
- versiune
- Versiunile
- de
- Vibe
- Video
- Video
- Vizualizare
- vizualizari
- Virginia
- viziune
- Vizita
- vizitatori
- vizual
- umbla
- vrea
- a fost
- filigran
- we
- web
- servicii web
- bazat pe web
- website
- săptămână
- săptămâni
- BINE
- Vest
- Ce
- Ce este
- cand
- care
- în timp ce
- voi
- ferestre
- cu
- în
- fără
- Cuvânt
- cuvinte
- lume
- scris
- da
- Tu
- Ta
- zephyrnet
- zero