Täna on meil hea meel teatada, et Lehepung mudel on nüüd klientidele saadaval Amazon SageMaker JumpStart. Gemma on perekond keelemudelid põhineb Google'i Gemini mudelitel, treenitud kuni 6 triljoni tekstimärgiga. Gemma perekond koosneb kahest suurusest: 7 miljardi parameetriga mudel ja 2 miljardi parameetri mudel. Nüüd saate kasutada Gemma 2B ja Gemma 7B eelkoolitatud ja juhiste järgi häälestatud mudeleid. SageMaker KiirStart. JumpStart on SageMakeri masinõppe (ML) jaotur, mis pakub juurdepääsu alusmudelitele lisaks sisseehitatud algoritmidele ja täielikele lahendusmallidele, mis aitavad teil ML-iga kiiresti alustada.
Selles postituses kirjeldame, kuidas Gemma mudelit juurutada ja SageMaker JumpStartis oma kasutusjuhtumite jaoks peenhäälestada. Täielik märkmik on saadaval aadressil GitHub.
Gemma mudel
Lehepung on kergete ja tipptasemel seadmete perekond mudelid ehitatud samade teadusuuringute ja tehnoloogia põhjal, mida kasutati loomiseks Kaksikud mudelid. Gemma, mille on välja töötanud Google DeepMind ja teised Google'i meeskonnad, on inspireeritud Geminist. Gemmal on tugevad üldised võimed tekstivaldkonnas ning tipptasemel mõistmis- ja arutlusoskused. See saavutab parema jõudluse võrreldes teiste avalikult kättesaadavate sarnase või suurema ulatusega mudelitega erinevates valdkondades, sealhulgas küsimustele vastamine, tervemõistuslik arutluskäik, matemaatika ja loodusteadused ning kodeerimine. Gemma avaldas mudeli kaalud, et toetada arendajate uuendusi Gemma mudelite abil. Gemma lasti turule uuega Vastutustundlik generatiivne AI tööriistakomplekt mis pakub juhiseid ja olulisi tööriistu turvalisemate tehisintellekti rakenduste loomiseks Gemma abil.
Vundamendi mudelid SageMakeris
JumpStart pakub juurdepääsu paljudele mudelitele populaarsetest mudelikeskustest, sealhulgas Hugging Face, PyTorch Hub ja TensorFlow Hub, mida saate kasutada SageMakeri ML-i arendamise töövoo raames. Hiljutised edusammud ML-is on toonud kaasa uue mudelite klassi, mida tuntakse kui vundamendi mudelid, mis on tavaliselt koolitatud miljarditele parameetritele ja on kohandatavad laia kategooria kasutusjuhtudega, nagu teksti kokkuvõte, digitaalse kunsti loomine ja keele tõlge. Kuna nende mudelite koolitamine on kallis, soovivad kliendid kasutada olemasolevaid eelkoolitatud vundamendimudeleid ja neid vastavalt vajadusele peenhäälestada, mitte neid mudeleid ise koolitada. SageMaker pakub kureeritud mudelite loendit, mille hulgast saate SageMakeri konsoolil valida.
Nüüd leiate JumpStartist erinevate mudelipakkujate vundamendimudeleid, mis võimaldavad teil vundamendimudelitega kiiresti alustada. Saate leida vundamendimudeleid, mis põhinevad erinevatel ülesannetel või mudelipakkujatel, ning vaadata üle mudeli omadused ja kasutustingimused. Saate neid mudeleid proovida ka kasutajaliidese testvidina abil. Kui soovite kasutada vundamendimudelit mastaapselt, saate seda teha SageMakerist lahkumata, kasutades mudelipakkujate eelehitatud märkmikke. Kuna mudeleid hostitakse ja juurutatakse AWS-is, ei jagata teie andmeid, olenemata sellest, kas neid kasutatakse mudeli hindamiseks või mastaabis kasutamiseks, kunagi kolmandate osapooltega.
Uurime, kuidas saate KiirStartis mudelit Llama Guard kasutada.
Tutvuge Gemma mudeliga Kiirstardis
Gemma alusmudelitele pääsete juurde SageMakeri JumpStarti kaudu SageMaker Studio kasutajaliideses ja SageMaker Python SDK-s. Selles jaotises käsitleme SageMaker Studio mudelite leidmist.
SageMaker Studio on integreeritud arenduskeskkond (IDE), mis pakub ühtset veebipõhist visuaalset liidest, kus pääsete juurde sihipäraselt loodud tööriistadele, et sooritada kõiki ML-i arendusetappe alates andmete ettevalmistamisest kuni ML-mudelite loomise, koolitamise ja juurutamiseni. Lisateavet selle kohta, kuidas alustada ja SageMaker Studio seadistada, vt Amazon SageMaker Studio.
Avage SageMaker Studio AWS-i halduskonsoolis jaotises SageMaker JumpStart Eelehitatud ja automatiseeritud lahendused. Kiirstart sisaldab eelkoolitatud mudeleid, märkmikke ja eelehitatud lahendusi.
SageMaker JumpStarti sihtlehel leiate Gemma mudeli, otsides Gemma.
Seejärel saate valida erinevate Gemma mudelite variantide hulgast, sealhulgas Gemma 2B, Gemma 7B, Gemma 2B instruct ja Gemma 7B instruct.
Valige mudelikaart, et vaadata mudeli üksikasju, nagu litsents, koolituseks kasutatud andmed ja mudeli kasutamine. Samuti leiate a juurutada nuppu, mis viib teid sihtlehele, kus saate testida järeldusi kasuliku koormuse näite abil.
Juurutage Gemma koos SageMaker Python SDK-ga
Koodi, mis näitab Gemma juurutamist JumpStartis, ja näite juurutatud mudeli kasutamise kohta leiate see GitHubi märkmik.
Alustuseks valige SageMaker Model Hubi mudeli ID ja mudeli versioon, mida Gemma juurutamisel kasutada.
Valige järgmisest tabelist mudeli ID, mis kirjeldab JumpStarti juurutamise vaikekonfiguratsioonisuvandeid. 256 tuhande märgiga sõnavara tõttu mahub Gemma 7B ainult ühele A10G GPU-le, kui toetab 1 pikkust konteksti. Sel põhjusel kasutab JumpStart Gemma 7B jaoks suuremat vaikeeksemplari.
Mudeli ID | Vaikimisi järelduse eksemplar | Tensori paralleelaste | Toetatud konteksti pikkus |
kallistav nägu-llm-gemma-2b | ml.g5.xlarge | 1 | 8k |
huggingface-llm-gemma-2b-juhend | ml.g5.xlarge | 1 | 8k |
kallistav nägu-llm-gemma-7b | ml.g5.12xsuur | 4 | 8k |
huggingface-llm-gemma-7b-juhend | ml.g5.12xsuur | 4 | 8k |
Nüüd saate mudeli juurutada, kasutades SageMaker JumpStart. Järgmine kood kasutab vaikeeksemplari ml.g5.12xlarge
järeldamise lõpp-punkti jaoks Saate mudeli juurutada muudele eksemplaritüüpidele läbimise teel instance_type
aasta JumpStartModel
klass. Juurutamine võib võtta 5–10 minutit.
Edukaks juurutamiseks peate käsitsi muutma accept_eula
argument mudeli juurutusmeetodis True
. See mudel on juurutatud teksti genereerimise järelduse (TGI) süvaõppe konteineri abil.
Kutsu lõpp-punkt
Saate programmiliselt laadida näidiskoormusi rakendusest JumpStartModel
objektiks. See aitab teil alustada, järgides eelvormindatud juhiseid, mida Gemma saab alla neelata.
Enne konkreetsete viipade vaatamist kaalume Gemma Instruct mudelite vestlusmalli.
Siin asetate oma viipa lahtrisse [USER_PROMPT]
asukoht. Süsteemijuhiseid ei toetata; selle asemel saate lisada soovitud juhise kasutajaviipa ette. Lisaks, kui teil on mitme pöördega vestlus, võib mudeliviip vajaduse korral vaheldumisi kasutaja ja assistendi vahel.
Nüüd kaaluge mõnda juhiste näidet. Siin palute Gemmal kirjutada Hello World programm.
Oodatav väljund on järgmine:
Järgmisena kutsuge Gemma luuletuse kirjutamise loominguliseks ülesandeks.
Järgmine on väljund:
See näeb päris hea välja!
Vaatame nüüd latentsusaega ja läbilaskevõime võrdlusuuringuid mudelite esitamisel JumpStarti juurutuse vaikekonfiguratsiooniga. Siin näitame, kuidas mudeli jõudlus võib teie tüüpilise lõpp-punkti töökoormuse korral erineda. Järgmistes tabelites näete, et väikese suurusega päringud (256 sisendsõna ja 256 väljundmärki) on suure hulga samaaegsete kasutajate korral üsna tõhusad, saavutades lubade läbilaskevõime suurusjärgus tuhat kuni kaks tuhat luba sekundis. Kuna aga sisendsõnade arv läheneb Gemma maksimaalsele toetatud konteksti pikkusele kaheksa tuhande märgini, täidab lõpp-punkt eksemplari mäluga seotud piirangute tõttu selle partiimise mahtu – samaaegsete päringute arvu, mida on lubatud samaaegselt töödelda.
Lisateavet selle teabe arvestamise ja juurutamise konfiguratsioonide kohandamise kohta teie konkreetse kasutusjuhtumi jaoks leiate teemast Võrrelge ja optimeerige lõpp-punkti juurutamist rakenduses Amazon SageMaker JumpStart.
. | Läbilaskevõime (märke/s) | ||||||||||
Samaaegsed kasutajad | 1 | 2 | 4 | 8 | 16 | 32 | 64 | 128 | |||
mudel | Eksemplari tüüp | Sisestage sõnad | Väljundmärgid | . | . | . | . | . | . | . | . |
gemma-2b-juhend | ml.g5.xlarge | 256 | 256 | 73 | 137 | 262 | 486 | 829 | 1330 | 1849 | 1834 |
2048 | 256 | 69 | 126 | 227 | 373 | 537 | 704 | 764 | - | ||
7936 | 256 | 60 | 100 | 147 | 195 | 226 | 230 | - | - | ||
gemma-7b-juhend | ml.g5.12xsuur | 256 | 256 | 62 | 119 | 227 | 413 | 601 | 811 | 937 | 962 |
2048 | 256 | 56 | 100 | 172 | 245 | 267 | 273 | - | - | ||
7936 | 256 | 44 | 67 | 77 | 77 | 78 | - | - | - |
. | P50 latentsus (ms/märk) | ||||||||||
Samaaegsed kasutajad | 1 | 2 | 4 | 8 | 16 | 32 | 64 | 128 | |||
mudel | Eksemplari tüüp | Sisestage sõnad | Väljundmärgid | . | . | . | . | . | . | . | . |
gemma-2b-juhend | ml.g5.xlarge | 256 | 256 | 13 | 14 | 15 | 16 | 19 | 23 | 33 | 49 |
2048 | 256 | 14 | 15 | 17 | 20 | 28 | 43 | 79 | - | ||
7936 | 256 | 16 | 19 | 26 | 39 | 68 | 136 | - | - | ||
Gemma-7b-juhend | ml.g5.12xsuur | 256 | 256 | 16 | 16 | 17 | 19 | 26 | 38 | 57 | 110 |
2048 | 256 | 17 | 19 | 23 | 32 | 52 | 119 | - | - | ||
7936 | 256 | 22 | 29 | 45 | 105 | 197 | - | - | - |
Peenhäälestage Gemma SageMaker Python SDK abil
Järgmisena näitame teile, kuidas peenhäälestada Gemma 7B käsumudelit vestlusvormingus andmestikul, kasutades QLoRA tehnikat. Nagu eelnevalt mainitud, pakub JumpStart 256 tuhande suure sõnavara ja 8 tuhande pikkuse konteksti pikkuse tõttu järgmisi QLoRA peenhäälestuse vaikekonfiguratsioone.
Mudeli ID | Treeningu vaikejuhtum | Sisendjada maksimaalne pikkus | Seadme treeningpartii suuruse kohta | Gradiendi akumulatsiooni sammud |
kallistav nägu-llm-gemma-2b | ml.g5.2xsuur | 1024 | 1 | 4 |
huggingface-llm-gemma-2b-juhend | ml.g5.2xsuur | 1024 | 1 | 4 |
kallistav nägu-llm-gemma-7b | ml.g5.12xsuur | 2048 | 1 | 4 |
huggingface-llm-gemma-7b-juhend | ml.g5.12xsuur | 2048 | 1 | 4 |
Laadime ja töötleme andmestiku vestlusvormingus. Selle demonstratsiooni näidisandmekogum on OpenAssistanti TOP-1 vestluslõimed.
Treeningu andmed tuleks formuleerida JSON-ridades (.jsonl
) vormingus, kus iga rida on sõnastik, mis esindab vestluste kogumit. Allpool on näidatud üks näide JSON-i ridade failis. Andmestiku töötlemise üksikasjad leiate sülearvutist GitHub.
Treeningskriptide aluseks on JumpStart HuggingFace SFTTtreener koos QLoRA ja FlashTähelepanu. Flash Attention võimaldab skaleerimise tõhusust, mis viib kiirema treenimiseni ja järelduste tegemiseni. Lisaks vestluspõhisele peenhäälestamisele toetab JumpStart ka juhiste ja domeeni kohandamise peenhäälestust QLoRA abil. Üksikasjalikumat teavet leiate sülearvutist GitHub.
Pärast peenhäälestamist saate peenhäälestatud mudeli juurutada SageMakeri lõpp-punkti.
Saate juurutada SageMakeri lõpp-punktis vestlusandmetele peenhäälestatud mudeli HuggingFace sõnumite API funktsioon alternatiivse lähenemisviisina. Sõnumi API funktsiooni kasutamise eeliseks on see, et see võimaldab kasutajatel edastada päringunäiteid töötlemata kujul, nagu on näidatud järgmises tabelis, ja lõpp-punktis olev chat_template teisendab päringunäited enne mudelisse saatmist õigesse vormingusse. Üksikasju vaadake juurutamise jaotisest pärast peenhäälestamist märkmik.
Pärast peenhäälestatud mudeli juurutamist lõpp-punktis saate võrrelda eelkoolitatud ja peenhäälestatud Gemma mudelite väljundvastuseid. Näited on kogutud katseandmetest, mis on treeningandmetest kinnipidamise kogum. Järeldusparameetrid on max_tokens
kui 512, top_p
kui 0.9, temperature
nagu 0.4 ja top_k
kui 50.
Nagu peenhäälestustulemustest näha, on agendi vastused täpsemad.
Oma peenhäälestatud mudelite edasiseks hindamiseks võite uurida FM-i hindamine rakendusega Amazon SageMaker Clarify et näha, kuidas teie peenhäälestatud mudel töötab võrreldes baasmudeliga.
Sisendid | Põhjendatud tõde | Vastus kasutajalt baas mudel | Vastus peenhäälestatud mudelilt | |
1 |
Kasutaja: Ma tahan oma sõnavara kallal töötada. Kas saate anda mõned lihtsad viisid, kuidas leida uusi sõnu, mida kasutada oma lausete mitmekesisuse suurendamiseks? Assistent: Kindlasti! Sõnavara täiendamine on pidev protsess, kuid siin on mõned lihtsad viisid uute sõnade leidmiseks ja lausete mitmekesisuse suurendamiseks. 1. Lugege laialdaselt. Erinevate žanrite ja teemade raamatute, artiklite ja ajaveebide lugemine avab teile uued sõnad ja fraasid. Märkige üles kõik võõrad sõnad, mida kohtate, ja otsige nende tähendusi. 2. Kasutage tesaurust: kirjutades või lugedes kasutage sageli kasutatavate sõnade sünonüümide leidmiseks tesaurust. See mitte ainult ei aita teil uusi sõnu õppida, vaid parandab ka arusaamist nende tähenduse väikestest erinevustest. 3. Sõna-päevakalendrid või rakendused: tellige sõna-päevas e-kiri või laadige alla sõnavara koguv rakendus. Need tööriistad tutvustavad teile iga päev uut sõna koos selle tähenduse, häälduse ja kasutusnäidetega. 4. Liituge raamatuklubi või vestlusrühmaga: raamatute, artiklite või mõne muu teema teemalistes vestlustes ja aruteludes osalemine avab teile erinevad vaatenurgad ja uue sõnavara. Kuulake tähelepanelikult teisi ja proovige kontekstis uusi sõnu kasutada. 5. Mängige sõnamänge: mängud nagu Scrabble, Boggle ja ristsõnad panevad proovile teie sõnavaraoskused ja aitavad teil uusi sõnu nauditavalt õppida. 6. Vaadake filme, telesaateid või dokumentaalfilme: visuaalne meedia kasutab sageli mitmekesist keelt, slängi ja kõnepruuki. Subtiitritega filmide, telesaadete või dokumentaalfilmide vaatamine aitab teil uusi sõnu paremini mõista ja meelde jätta. 7. Harjutage kirjutamist. Lugude, esseede või päevikukirjete regulaarne kirjutamine julgustab teid kasutama uusi sõnu ja väljendeid. Sõnavara laiendamiseks katsetage erinevate kirjutamisstiilide ja žanritega. 8. Õppige uue sõna etümoloogiat: sõna päritolu ja ajaloo mõistmine võib hõlbustada selle meeldejätmist ja õiget kasutamist. Etümoloogia uurimine paljastab teile ka seotud sõnad ja mõisted. 9. Kasutage mälukaarte või vahedega kordamise tarkvara: looge mälukaarte uute sõnade, nende tähenduste ja näitelausetega. Vaadake need regulaarselt üle või kasutage õppimise optimeerimiseks intervalliga kordustarkvara, nagu Anki. 10. Seadke isiklikud eesmärgid: seadke saavutatavad eesmärgid, näiteks viie uue sõna õppimine nädalas. Jälgige oma edusamme ja premeerige ennast eesmärkide saavutamise eest. Neid strateegiaid järjepidevalt oma igapäevarutiini kaasates kogute järk-järgult mitmekesise ja jõulise sõnavara. Kasutaja: Hm, mulle väga meeldib mõte lugeda. Kas oskate mulle soovitada lahedat ulmepõnevikku, mida võiksin lugeda? |
Assistent: Kindlasti! Siin on mõned soovitused ulmepõnevike jaoks, mis teile võiksid meeldida. 1. Liu Cixini "Kolme keha probleem" – see auhinnatud romaan uurib esimest kontakti inimkonna ja võõra tsivilisatsiooni vahel ning sellest tulenevaid poliitilisi ja isiklikke tagajärgi. See on kaasahaarav ja mõtlemapanev lugemine, mis süveneb sügavatesse küsimustesse eksistentsi ja universumi olemuse kohta. 2. Jeff Vandermeeri "Hävitamine" – see romaan jälgib teadlaste rühma, kes seiklevad salapärasesse piirkonda, mida tuntakse kui "piirkonda X", kus nad puutuvad kokku kummaliste ja rahutukstegevate nähtustega. Piirkonda süvenedes hakkavad nad paljastama tumedaid saladusi reaalsuse olemuse ja neid ümbritseva maailma kohta. 3. Blake Crouchi "Tume aine" – see romaan järgib säravat füüsikut nimega Jason Dessen, kes röövitakse ja transporditakse paralleeluniversumisse. Kui ta püüab leida teed tagasi oma reaalsusesse, peab ta silmitsi seisma oma valikute ja oma tegude tagajärgedega. 4. Michael Crichtoni "Andromeeda tüvi" – see klassikaline romaan jälgib teadlaste meeskonda, kes püüavad ohjeldada ja uurida Maale maandunud surmavat maavälist mikroobi. Kui nad võistlevad ajaga, et leida viis mikroobi neutraliseerimiseks, peavad nad võitlema ka poliitiliste intriigide ja isiklike konfliktidega. 5. Ernest Cline'i "Ready Player One" – see romaan toimub düstoopilises tulevikus, kus enamik elanikkonnast veedab oma aega virtuaalreaalsuse maailmas, mida tuntakse OASIS-ena. Kui OASISe looja sureb ja jätab maha väljakutse leida peidetud lihavõttemuna, asub noor peategelane põnevale otsingule, mis muudab tema elu igaveseks. Loodan, et mõni neist soovitustest äratab teie huvi! |
Assistent: tekst ei sisalda teavet teie lugemiseelistuste või -huvide kohta, seetõttu ei saa ma raamatusoovitust anda. |
Assistent: Muidugi, siin on mõned ulmepõnevike soovitused, mis teile võiksid meeldida: – Frank Herberti “Düün”: see eepiline ulmeromaani tegevus toimub Arrakise kõrbeplaneedil, kus noor prints nimega Paul Atreides peab seisma silmitsi vaenuliku keskkonna ja reetliku poliitilise maastiku väljakutsetega. – Andy Weiri "Marslane": see haarav ulmepõnevik järgib lugu Mark Watneyst, astronaudist, kes on pärast tolmutormi Marsile jäänud, kui ta kasutab oma leidlikkust ja leidlikkust, et ellu jääda ja lõpuks Maale tagasi jõuda. – HG Wellsi "Ajamasin": see klassikaline ulmeromaan läheneb ajas rändamise kontseptsioonile filosoofiliselt, uurides mineviku ja tuleviku muutmise tagajärgi. – „The Blade Runner”, autor Philip K. Dick: see neo-noir-ulmeromaan, mille tegevus toimub futuristlikus Los Angeleses, uurib inimese ja tehisintellekti ristumiskohta ning selle mõju ühiskonnale ja reaalsuse olemusele. – Isaac Asimovi "Androidid": see ulmeromaan uurib tehisintellekti kontseptsiooni ja selle võimalikke tagajärgi, eriti kui inimestel arenevad arenenud androidid, mis seavad proovile traditsioonilised inimväärtused ja tõekspidamised. Need on vaid mõned soovitused ja lõpuks sõltub teie jaoks parim raamat teie isiklikest eelistustest ja sellest, millist kogemust ulmepõnevikust otsite. Kuid ma loodan, et need soovitused annavad teile hea lähtepunkti žanri uurimiseks. Palun andke mulle teada, kui teil on lisaküsimusi või kui saan teid millegagi aidata. |
2 |
Kasutaja: kirjutage VB.NET-is programm Hello World Assistent: Siit saate: "Vbnet Kasutaja: pane see sisestama $ ja öelge siis "Tere, $" asemel "Tere, maailm!" |
Assistent: avalik moodul HelloWorld Avalik alampeamine() System.Console.WriteLine("Mis su nimi on?") Hämar nimi As String = System.Console.ReadLine() System.Console.WriteLine("Tere, " & nimi & "!") End Sub Lõpeta moodul |
Assistent: "`vbnet Avalik moodul HelloWorld Avalik alampeamine() Dim name As String = Console.ReadLine() Console.WriteLine("Tere, " & nimi) End Sub Lõpeta moodul |
Assistent: Muidugi! Siin on näide: "Vbnet |
3 |
Kasutaja: andke mulle ülesannete loend, kui alustate projekti, et koolitada välja suur keelemudel, mis suudab mõista ja vastata inimeste küsimustele. Assistent: järgmised sammud on lühendatud loend sammudest, mida tuleb teha projekti alustamisel, et koolitada välja suur keelemudel, mis on võimeline mõistma inimeste päringuid ja neile vastama. 1. Määrake projekti ulatus ja eesmärgid, sihtrühm. See peaks andma teile põhilise ettekujutuse nõutavatest sammudest. Kas ma peaksin mõnda punkti üksikasjalikumalt käsitlema? Kasutaja: neid ülesandeid tuleb täpsemalt jaotada. Kas saaksite esitada ajakohastatud ülesannete loendi koos eelseisvate ülesannete üksikasjalikuma jaotusega |
Assistent: siin on iga sammu üksikasjalikum jaotus: 1. Määrake projekti ulatus ja eesmärgid: oluline on selgelt määratleda projekti eesmärgid ja sihtrühm. See aitab teil teha otsuseid selle kohta, millist tüüpi andmeid koguda ja milline mudeli arhitektuur on sobiv. 2. Andmete kogumine ja eeltöötlemine: see on oluline samm, kuna andmete kvaliteet ja mitmekesisus mõjutavad otseselt mudeli toimivust. Eeltöötlus võib hõlmata andmete puhastamist, teksti märgistamist ja sõnade teisendamist numbriteks. 3. Valige mudeli arhitektuur: valida on palju erinevat tüüpi mudeleid, sealhulgas korduvad närvivõrgud (RNN), trafomudelid ja konvolutsioonilised närvivõrgud (CNN). Valik sõltub projekti erinõuetest ja saadaolevate andmete hulgast. 4. Andmestiku jagamine ja andmete suurendamise rakendamine. Andmete jagamine koolituse, valideerimise ja testimise alamhulkadeks on oluline mudeli toimivuse jälgimiseks koolituse ajal. Andmete suurendamist saab kasutada andmestiku suuruse kunstlikuks suurendamiseks ja mudeli töökindluse parandamiseks. 5. Treenige mudelit ja jälgige edenemist. See samm hõlmab mudeli väljaõpet treeningandmete põhjal, kasutades valideerimiskomplekti, et jälgida edenemist ja kohandada vastavalt vajadusele hüperparameetreid. Seda protsessi võib osutuda vajalikuks korrata mitu korda, kuni mudel töötab valideerimiskomplektis hästi. 6. Mudeli hindamine testikomplektis: kui mudel on koolitatud, on oluline hinnata selle toimivust eraldi testikomplektis, et saada ülevaade selle üldistusvõimest. Seda saab teha, võrreldes mudeli ennustusi tegelike tulemustega ja analüüsides vigu. 7. Konkreetsete ülesannete või domeenide peenhäälestus: see samm hõlmab mudeli edasiõppimist ülesandepõhiste andmetega, et parandada selle toimivust konkreetses domeenis. Seda saab teha ülekandeõppe kaudu, kus eelkoolitatud mudelit peenhäälestatakse uute andmete põhjal, või peenhäälestuse abil, kus mudelit õpetatakse uute andmete põhjal nullist. 8. Kasutajaliidese loomine: see hõlmab liidese kujundamist, mis võimaldab kasutajatel sisestada küsimusi või taotlusi ja saada mudelilt vastuseid. 9. Kontrollitud keskkonnas testimine: enne mudeli juurutamist reaalses keskkonnas on oluline seda kontrollitud keskkonnas testida ja kasutajatelt tagasisidet koguda. See aitab tuvastada mudelis esinevaid vigu või kõrvalekaldeid ning pakub võimalusi täiustamiseks. 10. Pidevalt jälgida ja parandada jõudlust: Lõpuks on oluline pidevalt jälgida mudeli toimivust ning teha vajadusel uuendusi ja parandusi. See võib hõlmata mudeli ümberõpet uute andmete põhjal, hüperparameetrite peenhäälestamist või arhitektuuri värskendamist. |
Assistent: ## ülesannete nimekiri suure keelemudeli koolitamiseks küsimustele vastamiseks **1. Projekti ulatus ja eesmärgid:** * Määratlege projekti eesmärgid ja soovitud funktsioonid. **2. Andmete hankimine ja eeltöötlus:** * Tuvastage koolitusandmete allikad ja koguge mitmekesine tekstiandmekogum. **3. Mudeli valik ja konfigureerimine:** * Valige sobiv mudeliarhitektuur ülesande keerukuse ja soovitud jõudluse põhjal. **4. Koolitus ja hindamine:** * Jagage treeningu andmed koolituse, valideerimise ja testimise alamhulkadeks. **5. Peenhäälestus ja liidese arendus:** * Viimistlege mudelit konkreetsete ülesannete või domeenide jaoks ülekandeõppe abil. **6. Testimine ja täiustamine:** * Testige mudelit erinevate sisendstsenaariumitega kontrollitud keskkonnas. ** Täiendavad kaalutlused:** * Määrake projekti ajakava ja eelarve. **Märkus.** See loend ei ole ammendav ja seda võib olla vaja kohandada vastavalt projekti konkreetsetele nõuetele. |
Assistent: Muidugi, siin on üksikasjalikum jaotus ülesannetest, mis on seotud suure keelemudeli koolitamisega inimeste küsimuste mõistmiseks ja neile vastamiseks: **1. Määrake projekti ulatus ja eesmärgid** **2. Koguge ja eeltöötlege kõikehõlmav/mitmekesine tekstiandmekogu** **3. Valige sobiv mudeliarhitektuur, kohandage hüperparameetreid täpsuse/kiiruse jaoks** **4. Andmestiku jagamine koolituse, valideerimise, testimise alamhulkadeks, andmete lisamise rakendamiseks** **5. Rongimudel, jälgige valideerimiskomplekti edenemist, kohandage vastavalt vajadusele** **6. Hinnake testikomplekti mudelit, võrrelge võrdlusnäitajatega, analüüsige vigu ja eelarvamusi** **7. Konkreetsete ülesannete või domeenide peenhäälestus ülekandeõppe või peenhäälestuse abil** **8. Loo liides kasutaja sisendi ja mudeli vastuse jaoks** **9. Testige kontrollitud keskkonnas, koguge täiustamiseks tagasisidet** **10. Jälgige ja parandage jõudlust pidevalt ümberõppe ja peenhäälestuse abil** Need on sammud, mis on seotud suure keelemudeli väljaõppega inimeste küsimuste mõistmiseks ja neile vastamiseks. Palun andke mulle teada, kui teil on küsimusi. |
Koristage
Pärast lõpp-punktide testimist kustutage tasude vältimiseks SageMakeri järelduse lõpp-punktid ja mudel.
Järeldus
Selles postituses näitasime teile, kuidas Gemmaga SageMaker Studios alustada ja mudelit järelduste tegemiseks juurutada. Samuti näitasime teile, kuidas saate SageMaker Kiirstardis Gemma mudeleid peenhäälestada.
Kuna vundamendimudelid on eelkoolitatud, võivad need aidata vähendada koolitus- ja infrastruktuurikulusid ning võimaldada kohandamist teie kasutusjuhtumitele. Alustamiseks külastage SageMaker Studios SageMaker JumpStart.
See juhend on mõeldud ainult informatiivsel eesmärgil. Peaksite siiski läbi viima oma sõltumatu hindamise ja võtma meetmeid tagamaks, et järgite oma konkreetseid kvaliteedikontrolli tavasid ja standardeid ning kohalikke eeskirju, seadusi, määrusi, litsentse ja kasutustingimusi, mis kehtivad teie, teie sisu ja käesolevas juhendis viidatud kolmanda osapoole mudel. AWS-il ei ole käesolevas juhendis viidatud kolmanda osapoole mudeli üle kontrolli ega volitusi ning ta ei kinnita ega garanteeri, et kolmanda osapoole mudel on turvaline, viirusevaba, töökorras või teie tootmiskeskkonna ja standarditega ühilduv. AWS ei anna mingeid kinnitusi, garantiisid ega garantiisid, et mis tahes selles juhendis sisalduv teave toob kaasa konkreetse tulemuse või tulemuse.
Autoritest
Dr Kyle Ulrich on rakendusteadlane Amazon SageMakeri sisseehitatud algoritmid meeskond. Tema uurimishuvide hulka kuuluvad skaleeritavad masinõppe algoritmid, arvutinägemine, aegridad, Bayesi mitteparameetrid ja Gaussi protsessid. Tema doktorikraad on pärit Duke'i ülikoolist ja ta on avaldanud töid NeurIPSis, Cell ja Neuron.
Dr Xin Huang on Amazon SageMaker JumpStart ja Amazon SageMaker sisseehitatud algoritmide vanemrakendusteadlane. Ta keskendub skaleeritavate masinõppe algoritmide arendamisele. Tema uurimishuvid on seotud loomuliku keele töötlemise, tabeliandmete seletatava süvaõppe ja mitteparameetrilise aegruumi klastrite tugeva analüüsiga. Ta on avaldanud palju artikleid ACL-is, ICDM-is, KDD konverentsidel ja Kuninglikus Statistikaühingus: A-seeria.
Rachna Chadha on AWS-i strateegiliste kontode pealahendusarhitekt AI/ML. Rachna on optimist, kes usub, et tehisintellekti eetiline ja vastutustundlik kasutamine võib tulevikus ühiskonda parandada ning tuua majanduslikku ja sotsiaalset õitsengut. Vabal ajal meeldib Rachnale perega aega veeta, matkata ja muusikat kuulata.
Evan Kravitz on Amazon Web Servicesi tarkvarainsener, kes töötab SageMaker JumpStart. Talle meeldib süüa teha ja New Yorgis jooksmas käia.
Dr Ashish Khetan on vanemrakendusteadlane, kellel on Amazon SageMaker sisseehitatud algoritmid ja aitab välja töötada masinõppe algoritme. Ta sai doktorikraadi Illinoisi Urbana-Champaigni ülikoolist. Ta on aktiivne masinõppe ja statistiliste järelduste uurija ning avaldanud palju artikleid NeurIPS, ICML, ICLR, JMLR, ACL ja EMNLP konverentsidel.
- SEO-põhise sisu ja PR-levi. Võimenduge juba täna.
- PlatoData.Network Vertikaalne generatiivne Ai. Jõustage ennast. Juurdepääs siia.
- PlatoAiStream. Web3 luure. Täiustatud teadmised. Juurdepääs siia.
- PlatoESG. Süsinik, CleanTech, Energia, Keskkond päikeseenergia, Jäätmekäitluse. Juurdepääs siia.
- PlatoTervis. Biotehnoloogia ja kliiniliste uuringute luureandmed. Juurdepääs siia.
- Allikas: https://aws.amazon.com/blogs/machine-learning/gemma-is-now-available-in-amazon-sagemaker-jumpstart/
- :on
- :on
- :mitte
- : kus
- $ UP
- 1
- 10
- 100
- 11
- 13
- 135
- 17
- 19
- 1900
- 250
- 28
- 29
- 31
- 39
- 41
- 50
- 7
- 8
- 9
- a
- võime
- MEIST
- üle
- aktsepteerima
- juurdepääs
- kättesaadavus
- konto
- Kontod
- kogunemine
- täpsus
- täpne
- saavutatav
- Saavutab
- omandamine
- üle
- meetmete
- aktiivne
- tegelik
- kohandamine
- lisamine
- Lisaks
- kohandama
- edasijõudnud
- ettemaksed
- pärast
- vastu
- Agent
- AI
- AI / ML
- õhusõiduki
- algoritme
- välismaalane
- Materjal: BPA ja flataatide vaba plastik
- võimaldama
- lubatud
- võimaldab
- mööda
- Ka
- alternatiiv
- Amazon
- Amazon SageMaker
- Amazon SageMaker JumpStart
- Amazon Web Services
- summa
- an
- analüüs
- analüüsima
- analüüse
- analüüsides
- ja
- infrastruktuuri
- Andromeda
- Angeles
- Teatama
- vastus
- vastamine
- vastuseid
- mistahes
- midagi
- API
- app
- rakendused
- rakendatud
- kehtima
- lähenemine
- lähenemisviisid
- asjakohane
- apps
- arhitektuur
- OLEME
- PIIRKOND
- valdkondades
- argument
- ümber
- kunst
- kaubad
- kunstlik
- tehisintellekti
- AS
- küsima
- hindamine
- assistent
- astronaut
- At
- publik
- asutus
- Automatiseeritud
- saadaval
- vältima
- auhinnatud
- AWS
- AWS-i juhtimiskonsool
- tagasi
- tasakaalustatud
- baas
- põhineb
- põhiline
- partii
- Bayesi
- BE
- sest
- enne
- alustama
- taga
- on
- uskumused
- usub,
- alla
- võrdlusuuringud
- kriteeriumid
- kasu
- Pealegi
- BEST
- Parem
- vahel
- erapoolikus
- kalduvusi
- Miljard
- miljardeid
- BLADE
- Blokeerima
- Blogi
- blogid
- Õitsema
- keha
- raamat
- Raamatud
- Lagunema
- hiilgav
- tooma
- Toomine
- Toob
- Katki
- eelarve
- ehitama
- Ehitus
- ehitatud
- sisseehitatud
- kuid
- nupp
- by
- kalendrid
- helistama
- kutsutud
- CAN
- ei saa
- lõuend
- võimeid
- võimeline
- kaart
- juhul
- juhtudel
- Kategooria
- ettevaatust
- rakk
- väljakutse
- väljakutseid
- muutma
- omadused
- koormuste
- vestlus
- Kontroll
- valik
- valikuid
- Vali
- Linn
- Tsivilisatsioon
- klass
- klassika
- puhastama
- puhastamine
- selgelt
- klõps
- klubi
- Klastrite loomine
- kood
- Kodeerimine
- koostöö
- tuleb
- tavaliselt
- võrdlema
- võrreldes
- võrrelda
- võrdlus
- kokkusobiv
- täitma
- keerukust
- keerukus
- täitma
- arvuti
- Arvuti visioon
- mõiste
- mõisted
- konkurent
- konverentsid
- konfiguratsioon
- Konfliktid
- Tagajärjed
- Arvestama
- kaalutlused
- arvestades
- järjepidevalt
- koosneb
- konsool
- pidev
- piiranguid
- kontakt
- sisaldama
- Konteiner
- sisaldab
- väidavad
- sisu
- kontekst
- pidevalt
- kontrollida
- kontrollitud
- Vestlus
- jutukas
- vestlused
- muutma
- konverteeriva
- jahe
- õigesti
- kulud
- võiks
- looma
- loomine
- Loominguline
- looja
- ristsõna
- kureeritud
- uudishimulik
- Praegune
- Kliendid
- kohandamine
- iga päev
- tants
- tume
- andmed
- andmekogumid
- päev
- otsused
- sügav
- sügav õpe
- sügavam
- Deepmind
- vaikimisi
- määratlema
- Määratleb
- süvenema
- süveneb
- demonstratsioon
- sõltuvad
- juurutada
- lähetatud
- juurutamine
- kasutuselevõtu
- DESERT
- Disain
- projekteerimine
- soovitud
- detail
- üksikasjalik
- detailid
- Määrama
- arendama
- arenenud
- arendaja
- arenev
- & Tarkvaraarendus
- seade
- diagnoosimine
- Dialoog
- erinevad
- erinevused
- erinev
- digitaalne
- digital Art
- otse
- kataloog
- avastama
- arutelu
- arutelud
- haigused
- sukelduma
- mitu
- mitmekesisus
- jagama
- do
- dokument
- dokumentaalfilme
- ei
- domeen
- Domeenid
- tehtud
- alla
- lae alla
- kaks
- Hertsog
- hertsogi ülikool
- ajal
- Tolm
- düstoopia
- iga
- maa
- lihtsam
- efektiivsus
- kaheksa
- Impeerium
- võimaldama
- võimaldab
- võimaldades
- kohtumine
- julgustab
- Lõpuks-lõpuni
- Lõpp-punkt
- kaasamine
- insener
- Parandab
- nautima
- mõnus
- tagama
- keskkond
- EPIC
- vead
- oluline
- looma
- eetiline
- hindama
- hindamine
- hindamine
- lõpuks
- Iga
- näide
- näited
- erutatud
- ulatuslik
- eksponaadid
- olemasolu
- olemasolevate
- Laiendama
- oodatav
- kallis
- kogemus
- eksperiment
- ekspertide
- uurima
- uurib
- Avastades
- nägu
- õiglus
- vale
- pere
- kiiremini
- tunnusjoon
- tagasiside
- jalad
- vähe
- väli
- võitlema
- fail
- Lõpuks
- leidma
- järeldused
- lõpp
- esimene
- esimene kontakt
- sobima
- viis
- välklamp
- lend
- keskendub
- Järel
- järgneb
- eest
- igavesti
- formaat
- Sihtasutus
- Raamistik
- avameelne
- Alates
- funktsioon
- funktsionaalsused
- funktsionaalsus
- toimimine
- edasi
- tulevik
- futuristliku
- Mängud
- koguma
- Kaksikud
- teeniva
- generatiivne
- Generatiivne AI
- žanr
- žanrid
- saama
- GitHub
- Andma
- antud
- Go
- Eesmärgid
- läheb
- hea
- sain
- GPU
- arm
- järk-järgult
- suur
- suur jõud
- Grupp
- garantiid
- valvur
- juhised
- suunata
- suunav
- käsi
- rakmed
- Olema
- he
- kõrgus
- tere
- aitama
- aitab
- siin
- siin
- varjatud
- tema
- ajalugu
- lootus
- võõrustas
- Kuidas
- Kuidas
- aga
- HTML
- HTTPS
- Keskus
- jaoturid
- Kallistav Nägu
- inim-
- Inimkond
- Inimestel
- i
- ID
- idee
- identifitseerima
- if
- Illinois
- pildid
- mõju
- rakendada
- täitmine
- import
- oluline
- parandama
- paranemine
- parandusi
- Paranemist
- in
- sisaldama
- Kaasa arvatud
- kaasates
- Suurendama
- sõltumatud
- tööstus
- tööstuse standardid
- mõju
- info
- Informatsiooniline
- Infrastruktuur
- leidlikkus
- Innovatsioon
- sisend
- sisendite
- Päringud
- teadmisi
- inspireeritud
- Näiteks
- selle asemel
- integreerima
- integreeritud
- Intelligentsus
- tahtlus
- suhtlemist
- el
- Interface
- ristmik
- sisse
- kehtestama
- intuitiivne
- kaasama
- seotud
- hõlmab
- IT
- kirjed
- ITS
- erikeel
- liituma
- ajakiri
- teekond
- jpg
- Json
- lihtsalt
- hoidma
- Laps
- Teadma
- teadmised
- teatud
- Kyle
- maandumine
- maastik
- keel
- suur
- suurem
- Hilinemine
- käivitatud
- Seadused
- juhtivate
- Õppida
- õppimine
- õpib
- jätmine
- Pikkus
- laskma
- Tase
- Finantsvõimendus
- litsents
- Litsentsid
- elu
- välk
- Välgukiirus
- kerge
- nagu
- meeldib
- joon
- liinid
- nimekiri
- kuulama
- Kuulamine
- kuulab
- Laama
- koormus
- kohalik
- liising
- Vaata
- otsin
- välimus
- a
- Los Angeles
- vähendada
- masin
- masinõpe
- Enamus
- tegema
- pahatahtlik
- juhtimine
- käsitsi
- palju
- märk
- Marss
- matemaatika
- maksimaalne
- mai..
- me
- tähendus
- tähendused
- meetmed
- Meedia
- meditsiin
- koosolekul
- mainitud
- sõnum
- kirjad
- meetod
- Michael
- võib
- meeles
- protokoll
- ML
- mudel
- mudelid
- moodulid
- Jälgida
- järelevalve
- rohkem
- kõige
- Filmid
- muusika
- peab
- my
- salapärane
- nimi
- Nimega
- Natural
- Natural Language Processing
- loodus
- vajalik
- Vajadus
- vaja
- vajadustele
- võrgustikud
- närvi-
- närvivõrgud
- mitte kunagi
- Uus
- New York
- New York City
- öö
- ei
- meeles
- märkmik
- romaan
- nüüd
- number
- Oaas
- objekt
- eesmärgid
- jälgima
- of
- Pakkumised
- sageli
- on
- kunagi
- ONE
- jätkuv
- ainult
- töökorras
- Võimalused
- optimeerimine
- optimeerima
- Valikud
- or
- et
- päritolu
- OS
- Muu
- teised
- välja
- Tulemus
- tulemusi
- väljund
- üle
- enda
- lehekülg
- dokumendid
- Parallel
- parameeter
- parameetrid
- eriline
- eriti
- isikutele
- sooritama
- Mööduv
- minevik
- tee
- mustrid
- Paul
- Inimesed
- kohta
- täitma
- jõudlus
- esitades
- täidab
- isiklik
- perspektiivid
- phd
- fraasid
- füüsik
- piloot
- Koht
- planeet
- plaanid
- Platon
- Platoni andmete intelligentsus
- PlatoData
- mängima
- mängija
- palun
- Punkt
- võrra
- poliitiline
- populaarne
- rahvastik
- post
- potentsiaal
- võim
- tava
- tavad
- Ennustused
- Predictor
- eelistusi
- ettevalmistamisel
- ilus
- varem
- Prints
- Peamine
- pildid
- protsess
- Töödeldud
- Protsessid
- töötlemine
- Produktsioon
- Programm
- Edu
- projekt
- küsib
- korralik
- heaolu
- anda
- pakkujad
- annab
- avalik
- avalikult
- avaldatud
- eesmärkidel
- Pusled
- Python
- pütorch
- kvaliteet
- päringud
- päringu
- otsimine
- küsimus
- Küsimused
- kiiresti
- üsna
- Rass
- tagajärjed
- valik
- pigem
- Töötlemata
- jõuda
- Lugenud
- Lugemine
- päris maailm
- Reaalsus
- tõesti
- realm
- põhjus
- saama
- hiljuti
- Soovitus
- soovitused
- soovitades
- korduv
- viide
- viidatud
- peegeldab
- regulaarselt
- määrused
- seotud
- vabastatud
- asjakohane
- meeles pidama
- kordama
- esindavad
- Taotlusi
- nõutav
- Nõuded
- teadustöö
- uurija
- Reageerida
- vastates
- vastus
- vastuste
- vastutus
- vastutav
- kaasa
- Tulemused
- läbi
- Premeerima
- Tõusma
- jõuline
- tugevus
- Roll
- rutiinne
- kuninglik
- eeskirjade
- jooks
- jookseb
- s
- ohutum
- salveitegija
- SageMakeri järeldus
- sama
- Säästa
- ütlema
- skaalautuvia
- Skaala
- Kaalud
- ketendamine
- stsenaariumid
- ulmefilm
- teadus
- teadlane
- teadlased
- ulatus
- kriimustada
- käsikiri
- skripte
- SDK
- sujuv
- otsimine
- Teine
- saladusi
- Osa
- kindlustama
- vaata
- valima
- väljavalitud
- valides
- valik
- saatmine
- vanem
- eri
- Jada
- Seeria
- Seeria A
- Teenused
- teenindavad
- istung
- komplekt
- Komplektid
- kehtestamine
- mitu
- jagatud
- peaks
- näitama
- näitas
- näidates
- näidatud
- Näitused
- külg
- sarnane
- lihtne
- ühekordne
- SUURUS
- suurused
- oskused
- So
- sotsiaalmeedia
- Ühiskond
- tarkvara
- Tarkvara insener
- lahendus
- Lahendused
- mõned
- Allikad
- Sparks
- konkreetse
- kiirus
- Kulutused
- kulutab
- seisma
- standardite
- alustatud
- Käivitus
- riik
- modernne
- väljavõte
- statistiline
- Samm
- Sammud
- Veel
- Lood
- torm
- Lugu
- imelik
- Strateegiline
- strateegiad
- nöör
- tugev
- stuudio
- Uuring
- tellima
- subtiitrid
- edukas
- selline
- sobiv
- toetama
- Toetatud
- Toetamine
- Toetab
- kindel
- ellu jääma
- süsteem
- tabel
- Võtma
- võtab
- lugu
- sihtmärk
- eesmärgid
- Ülesanne
- ülesanded
- meeskond
- meeskonnad
- tehnika
- tehnikat
- Tehnoloogia
- šabloon
- malle
- tensorivool
- tingimused
- test
- katsetatud
- Testimine
- tekst
- kui
- et
- .
- Piirkond
- Tulevik
- maailm
- oma
- Neile
- ennast
- SIIS
- Seal.
- seetõttu
- Need
- nad
- Kolmas
- kolmandad isikud
- kolmanda osapoole
- see
- need
- arvasin
- mõtlemapanev
- tuhat
- haarav
- Läbi
- läbilaskevõime
- aeg
- Ajaseeria
- ajas rännata
- ajakava
- korda
- et
- sümboolne
- märgistamine
- märgid
- ütles
- tööriist
- töövahendid
- teema
- Summa
- jälgida
- traditsiooniline
- Rong
- koolitatud
- koolitus
- üle
- Ülekanne
- trafo
- Tõlge
- reisima
- triljon
- tõsi
- püüdma
- meloodia
- häälestatud
- häälestamine
- tv
- kaks
- tüüp
- liigid
- tüüpiline
- tüüpiliselt
- ui
- lõpuks
- paljastama
- all
- mõistma
- mõistmine
- Tundmatu
- Universum
- Ülikool
- võrreldamatu
- kuni
- avamine
- ajakohastatud
- Uudised
- ajakohastamine
- us
- kasutatavus
- Kasutus
- kasutama
- kasutage juhtumit
- Kasutatud
- Kasutaja
- kasutajasõbralik
- Kasutajad
- kasutusalad
- kasutamine
- kinnitamine
- Väärtused
- sort
- eri
- ettevõtmine
- versioon
- vaade
- virtuaalne
- Virtuaalne reaalsus
- nägemus
- visiit
- visuaalne
- visuaalne meedia
- maht
- kõndima
- tahan
- garantiid
- oli
- Watch
- vaadates
- Tee..
- kuidas
- we
- web
- veebiteenused
- Veebipõhine
- nädal
- Hästi
- Wells
- M
- Mis on
- millal
- millal iganes
- kas
- mis
- WHO
- lai
- laialdaselt
- vidina
- will
- tarkus
- koos
- jooksul
- ilma
- sõna
- sõnad
- Töö
- töövoog
- töö
- maailm
- kirjutama
- kirjutamine
- X
- york
- sa
- noor
- Sinu
- ise
- sephyrnet