Gemma je zdaj na voljo v Amazon SageMaker JumpStart

Ponovno objavil Platon

Spremljevalci: 0

Danes z veseljem sporočamo, da je Gemma model je zdaj na voljo strankam, ki uporabljajo Amazon SageMaker JumpStart. Gemma je družina jezikovni modeli temelji na Googlovih modelih Gemini, urjenih na do 6 bilijonih žetonov besedila. Družino Gemma sestavljata dve velikosti: model s 7 milijardami parametrov in model z 2 milijardama parametrov. Zdaj lahko v SageMaker JumpStart. JumpStart je središče strojnega učenja (ML) SageMakerja, ki poleg vgrajenih algoritmov in celovitih predlog rešitev omogoča dostop do temeljnih modelov, ki vam pomagajo hitro začeti uporabljati ML.

V tej objavi bomo predstavili, kako razmestiti model Gemma in ga natančno prilagoditi za vaše primere uporabe v SageMaker JumpStart. Celoten zvezek je na voljo na GitHub.

Model Gemma

Gemma je družina lahkih, najsodobnejših modeli zgrajen na podlagi istih raziskav in tehnologije, uporabljenih za ustvarjanje Gemini modeli. Gemma, ki so jo razvili Google DeepMind in druge ekipe v Googlu, se zgleduje po Gemini. Gemma kaže močne splošne zmožnosti na besedilnih področjih ter najsodobnejše veščine razumevanja in sklepanja v velikem obsegu. Dosega boljšo zmogljivost v primerjavi z drugimi javno dostopnimi modeli podobnega ali večjega obsega na različnih področjih, vključno z odgovarjanjem na vprašanja, zdravorazumskim razmišljanjem, matematiko in znanostjo ter kodiranjem. Gemma je izdala uteži modela za podporo inovacijam razvijalcev z uporabo modelov Gemma. Gemma je bila predstavljena z novim Responsible Generative AI Toolkit ki ponuja smernice in osnovna orodja za ustvarjanje varnejših aplikacij AI z Gemmo.

Modeli temeljev v SageMakerju

JumpStart omogoča dostop do vrste modelov iz priljubljenih vozlišč za modele, vključno s Hugging Face, PyTorch Hub in TensorFlow Hub, ki jih lahko uporabite v delovnem procesu razvoja ML v SageMakerju. Nedavni napredek v ML je povzročil nov razred modelov, znan kot modeli temeljev, ki se običajno urijo na milijardah parametrov in so prilagodljivi široki kategoriji primerov uporabe, kot je povzemanje besedila, ustvarjanje digitalne umetnosti in jezikovno prevajanje. Ker je usposabljanje teh modelov drago, stranke želijo uporabiti obstoječe vnaprej pripravljene modele temeljev in jih po potrebi natančno prilagoditi, namesto da bi te modele usposobile same. SageMaker ponuja izbran seznam modelov, med katerimi lahko izbirate na konzoli SageMaker.

Zdaj lahko najdete modele temeljev različnih ponudnikov modelov znotraj JumpStarta, kar vam omogoča, da hitro začnete z modeli temeljev. Poiščete lahko temeljne modele, ki temeljijo na različnih nalogah ali ponudnikih modelov, ter pregledate značilnosti modela in pogoje uporabe. Te modele lahko preizkusite tudi s testnim gradnikom uporabniškega vmesnika. Če želite uporabiti osnovni model v velikem obsegu, lahko to storite, ne da bi zapustili SageMaker, tako da uporabite vnaprej pripravljene prenosnike ponudnikov modelov. Ker modeli gostujejo in so nameščeni na AWS, se vaši podatki, ne glede na to, ali se uporabljajo za ocenjevanje modela ali njegovo uporabo v velikem obsegu, nikoli ne delijo s tretjimi osebami.

Raziščimo, kako lahko uporabite model Llama Guard v JumpStartu.

Raziščite model Gemma v Jumpstartu

Do modelov temeljev Gemma lahko dostopate prek SageMaker JumpStart v uporabniškem vmesniku SageMaker Studio in SDK SageMaker Python. V tem razdelku bomo opisali, kako odkriti modele v SageMaker Studio.

SageMaker Studio je integrirano razvojno okolje (IDE), ki ponuja enoten spletni vizualni vmesnik, kjer lahko dostopate do namensko izdelanih orodij za izvajanje vseh razvojnih korakov ML, od priprave podatkov do gradnje, usposabljanja in uvajanja vaših modelov ML. Za več podrobnosti o tem, kako začeti in nastaviti SageMaker Studio, glejte Amazon SageMaker Studio.

V upravljalni konzoli AWS za SageMaker Studio pojdite na SageMaker JumpStart pod Predizdelane in avtomatizirane rešitve. Jumpstart vsebuje vnaprej usposobljene modele, prenosne računalnike in vnaprej pripravljene rešitve.

Gemma je zdaj na voljo v Amazon SageMaker JumpStart | Amazon Web Services PlatoBlockchain Data Intelligence. Navpično iskanje. Ai.

Na ciljni strani SageMaker JumpStart lahko najdete model Gemma z iskanjem Gemma.

Nato lahko izbirate med številnimi različicami modela Gemma, vključno z Gemma 2B, Gemma 7B, Gemma 2B instruct in Gemma 7B instruct.

Gemma je zdaj na voljo v Amazon SageMaker JumpStart | Amazon Web Services PlatoBlockchain Data Intelligence. Navpično iskanje. Ai.

Izberite kartico modela, če si želite ogledati podrobnosti o modelu, kot so licenca, podatki, uporabljeni za usposabljanje, in način uporabe modela. Našli boste tudi a uvajanje gumb, ki vas pripelje na ciljno stran, kjer lahko preizkusite sklepanje s primerom tovora.

Gemma je zdaj na voljo v Amazon SageMaker JumpStart | Amazon Web Services PlatoBlockchain Data Intelligence. Navpično iskanje. Ai.

Namestite Gemmo s SDK za SageMaker Python

Kodo, ki prikazuje uvajanje Gemme, lahko najdete na JumpStart in primer, kako uporabiti uvedeni model v ta prenosnik GitHub.

Začnite z izbiro ID-ja modela SageMaker Model Hub in različice modela, ki ju želite uporabiti pri uvajanju Gemme.

model_id, model_version = "huggingface-llm-gemma-7b-instruct", "*"

Izberite ID modela iz naslednje tabele, ki podrobno opisuje privzete konfiguracijske možnosti za razmestitev JumpStart. Zaradi velike velikosti besedišča 256 tisoč žetonov se lahko Gemma 7B prilega samo enemu grafičnemu procesorju A10G, če podpira dolžino konteksta 1 tisoč. Zaradi tega JumpStart uporablja večji privzeti primerek za Gemma 7B.

ID modela	Privzeti primerek sklepanja	Tenzorska paralelna stopnja	Podprti kontekst Dolžina
huggingface-llm-gemma-2b	ml.g5.xlarge	1	8k
huggingface-llm-gemma-2b-instruct	ml.g5.xlarge	1	8k
huggingface-llm-gemma-7b	ml.g5.12xvelik	4	8k
huggingface-llm-gemma-7b-instruct	ml.g5.12xvelik	4	8k

Zdaj lahko razmestite model s SageMaker JumpStart. Naslednja koda uporablja privzeti primerek ml.g5.12xlarge za končno točko sklepanja Model lahko razmestite na druge vrste primerkov s podajanjem instance_type v JumpStartModel razred. Uvajanje lahko traja 5-10 minut.

from sagemaker.jumpstart.model import JumpStartModel

model = JumpStartModel(model_id=model_id, model_version=model_version)
predictor= model.deploy(accept_eula=False)  # manually accept EULA here!

Za uspešno uvajanje morate ročno spremeniti accept_eula argument v metodi razmestitve modela za True. Ta model je razporejen s pomočjo vsebnika za globoko učenje (TGI).

Prikliči končno točko

Primere uporabnih obremenitev lahko programsko pridobite iz JumpStartModel predmet. To vam bo pomagalo začeti z opazovanjem vnaprej oblikovanih navodil, ki jih Gemma lahko zaužije.

example_payloads = model.retrieve_all_examples()

for payload in example_payloads:
    response = predictor.predict(payload.body)
    print("Input:n", payload.body[payload.prompt_key])
    print("Output:n", response[0]["generated_text"].strip())
    print("n===============n")

Preden si ogledamo posebne pozive, razmislimo o predlogi za klepet za modele Gemma Instruct.

<bos><start_of_turn>usern[USER_PROMPT]<end_of_turn>n<start_of_turn>model

Tukaj postavite svoj poziv v [USER_PROMPT] lokacijo. Ni podpore za sistemska navodila; namesto tega lahko pred uporabniškim pozivom dodate želeno navodilo. Poleg tega, če imate večkratni pogovor, se lahko poziv modela po potrebi zamenja med uporabnikom in pomočnikom.

Zdaj razmislite o nekaj pozivih za primere navodil. Tukaj prosite Gemmo, naj napiše program Hello World.

payload = {
    "inputs": "<bos><start_of_turn>usernWrite a hello world module in Python<end_of_turn>n<start_of_turn>model",
    "parameters": {'max_new_tokens': 256},
}
predictor.predict(payload)

Pričakovani rezultat je naslednji:

```python
# This is a Python module called hello.py

def hello():
  """Prints a hello message."""
  print("Hello, world!")

if __name__ == "__main__":
  hello()
```

**Usage:**

To use the hello.py module, you can import it and call the hello function like this:

```python
import hello

hello.hello()
```

**Output:**

```
Hello, world!
```

**Explanation:**

* The `hello.py` module defines a function called `hello()`.
* The `if __name__ == "__main__"` block checks if the script is being run directly or imported. If it is run directly, the `hello()` function is called.
* The `print("Hello, world!")` statement prints the hello message to the console.

**Note:**

* You can save the code above in a file named `hello.py` in your current directory.
* To run the script, you can use the following command:
```
python hello.py
```
* The output will be printed in the console:
```
Hello, world!
```

Nato pokličite Gemmo za ustvarjalno nalogo pisanja pesmi.

payload = {
    "inputs": "<bos><start_of_turn>usernWrite me a poem about Machine Learning.<end_of_turn>n<start_of_turn>model",
    "parameters": {'max_new_tokens': 256},
}
predictor.predict(payload)

Izhod je naslednji:

**Machine Learning**

In the realm of data, a tale unfolds,
Where algorithms dance and stories are told.
With every click, a model takes flight,
Unveiling patterns, hidden in the night.

Data whispers secrets, a treasure to find,
Machine learning listens, with a curious mind.
It sifts through terabytes, with lightning speed,
Uncovering insights, a hidden creed.

From images to text, it learns to see,
To understand the complexities of reality.
It paints a canvas, with insights deep,
Unveiling patterns, secrets to keep.

In the field of medicine, it takes a stand,
Diagnosing diseases, guiding a hand.
It analyzes data, with unmatched grace,
Bringing hope to those in a troubled place.

But with great power comes great responsibility,
As algorithms can bias, with malicious intent.
It's a journey of learning, a constant fight,
To ensure fairness, day and night.

So let us harness the power of this tool,
To create a future, where insights bloom.
With wisdom and caution, we must guide,
The path of machine learning, side by side.

To izgleda zelo dobro!

Zdaj pa si poglejmo primerjalno analizo zakasnitve in zmogljivosti prepustnosti za strežbo modela s privzeto konfiguracijo uvedbe JumpStart. Tukaj prikazujemo, kako se lahko zmogljivost modela razlikuje za vašo običajno delovno obremenitev končne točke. V naslednjih tabelah lahko opazite, da so poizvedbe majhne velikosti (256 vhodnih besed in 256 izhodnih žetonov) precej zmogljive pri velikem številu sočasnih uporabnikov in dosegajo prepustnost žetonov reda tisoč do dva tisoč žetonov na sekundo. Ko pa se število vhodnih besed približa Gemmini največji podprti dolžini konteksta osem tisoč žetonov, končna točka nasiči svojo zmogljivost paketiranja – število sočasnih zahtev, ki jih je dovoljeno sočasno obdelati – zaradi omejitev, vezanih na pomnilnik primerka.

Za več informacij o tem, kako upoštevati te informacije in prilagoditi konfiguracije razmestitve za vaš poseben primer uporabe, glejte Primerjajte in optimizirajte uvajanje končne točke v Amazon SageMaker JumpStart.

.				Prepustnost (žetoni/s)
Sočasni uporabniki				1	2	4	8	16	32	64	128
Model	Vrsta primerka	Vnos besed	Izhodni žetoni	.	.	.	.	.	.	.	.
gemma-2b-instruct	ml.g5.xlarge	256	256	73	137	262	486	829	1330	1849	1834
		2048	256	69	126	227	373	537	704	764	-
		7936	256	60	100	147	195	226	230	-	-
gemma-7b-instruct	ml.g5.12xvelik	256	256	62	119	227	413	601	811	937	962
		2048	256	56	100	172	245	267	273	-	-
		7936	256	44	67	77	77	78	-	-	-

.				Zakasnitev P50 (ms/žeton)
Sočasni uporabniki				1	2	4	8	16	32	64	128
Model	Vrsta primerka	Vnos besed	Izhodni žetoni	.	.	.	.	.	.	.	.
gemma-2b-instruct	ml.g5.xlarge	256	256	13	14	15	16	19	23	33	49
		2048	256	14	15	17	20	28	43	79	-
		7936	256	16	19	26	39	68	136	-	-
Gemma-7b-instruct	ml.g5.12xvelik	256	256	16	16	17	19	26	38	57	110
		2048	256	17	19	23	32	52	119	-	-
		7936	256	22	29	45	105	197	-	-	-

Natančno nastavite Gemmo s SDK za SageMaker Python

Nato vam pokažemo, kako natančno prilagodite model navodil Gemma 7B na naboru podatkov, oblikovanem za pogovor, z uporabo QLoRA tehnika. Kot je bilo že omenjeno, JumpStart zaradi velike velikosti besedišča 256 tisoč in dolžine konteksta 8 tisoč ponuja naslednje privzete konfiguracije za fino nastavitev QLoRA.

ID modela	Privzeti primerek usposabljanja	Največja dolžina vhodnega zaporedja	Velikost serije za usposabljanje na napravo	Koraki kopičenja gradienta
huggingface-llm-gemma-2b	ml.g5.2xvelik	1024	1	4
huggingface-llm-gemma-2b-instruct	ml.g5.2xvelik	1024	1	4
huggingface-llm-gemma-7b	ml.g5.12xvelik	2048	1	4
huggingface-llm-gemma-7b-instruct	ml.g5.12xvelik	2048	1	4

Naložimo in obdelajmo nabor podatkov v pogovorni obliki. Primer nabora podatkov za to predstavitev je TOP-1 pogovornih niti OpenAssistant.

from datasets import load_dataset

# Load the dataset
dataset = load_dataset("OpenAssistant/oasst_top1_2023-08-25")

Podatki o usposabljanju morajo biti oblikovani v vrsticah JSON (.jsonl), kjer je vsaka vrstica slovar, ki predstavlja niz pogovorov. Spodaj je prikazan en primer znotraj datoteke vrstic JSON. Za podrobnosti o tem, kako obdelati nabor podatkov, glejte zvezek v GitHub.

{'dialog': [
  {'content': 'what is the height of the empire state building',
   'role': 'user'},
  {'content': '381 meters, or 1,250 feet, is the height of the Empire State Building. If you also account for the antenna, it brings up the total height to 443 meters, or 1,454 feet',
   'role': 'assistant'},
  {'content': 'Some people need to pilot an aircraft above it and need to know.nSo what is the answer in feet?',
   'role': 'user'},
  {'content': '1454 feet', 'role': 'assistant'}]
}
import os
import boto3
from sagemaker.session import Session
from sagemaker.jumpstart.estimator import JumpStartEstimator

model_id = "huggingface-llm-gemma-7b-instruct"

estimator = JumpStartEstimator(
    model_id=model_id, environment={"accept_eula": "false"} # manually accept EULA here!
)

# For the other hyperparameters, see the GitHub notebook attached in this blog.
estimator.set_hyperparameters(chat_dataset="True", peft_type="lora", max_input_length="2048", epoch="3")
estimator.fit({"training": <your_S3_bucket_hosting_the_train_data>})

V osnovi skriptov za usposabljanje JumpStart uporablja HuggingFace SFTTrainer z QLoRA in FlashAttention. Flash Attention omogoča učinkovitost skaliranja, kar vodi do hitrejšega usposabljanja in sklepanja. Poleg natančnega prilagajanja na podlagi klepeta JumpStart podpira tudi natančno prilagajanje navodil in domene s QLoRA. Za podrobnosti si oglejte zvezek v GitHub.

Po fini nastavitvi lahko natančno nastavljen model razmestite na končno točko SageMaker.

fine_tuned_predictor= estimator.deploy()

Izberete lahko uvedbo modela, natančno nastavljenega na podatke pogovorov v končni točki SageMaker Funkcija API za sporočila HuggingFace kot alternativni pristop. Prednost uporabe funkcije API za sporočila je, da uporabnikom omogoča posredovanje primerov poizvedb v neobdelani obliki, kot je prikazano v naslednji tabeli, chat_template znotraj končne točke pa bo primere poizvedb pretvoril v pravilno obliko, preden jih pošlje v model. Za podrobnosti glejte razdelek o uvajanju po natančni nastavitvi v prenosnik.

Po uvedbi natančno nastavljenega modela v končni točki lahko primerjate izhodne odzive vnaprej usposobljenih in natančno nastavljenih modelov Gemma. Primeri so zbrani iz testnih podatkov, ki so zadržani niz podatkov o usposabljanju. Parametri sklepanja so max_tokens kot 512, top_p kot 0.9, temperature kot 0.4, in top_k kot 50.

Kot lahko vidite pri rezultatih natančnega prilagajanja, so odgovori agenta natančnejši.

Če želite dodatno oceniti svoje natančno nastavljene modele, lahko raziščete FM vrednotenje z Amazon SageMaker Clarify da vidite, kako deluje vaš natančno nastavljen model v primerjavi z osnovnim modelom.

	Vhodi	Osnovna resnica	Odgovor od baza Model	Odziv natančno nastavljenega modela
1	Uporabnik: Želim delati na svojem besedišču. Ali mi lahko ponudite nekaj preprostih načinov, kako najti nove besede, ki jih bom uporabil za povečanje raznolikosti svojih stavkov? Pomočnik: Vsekakor! Izboljševanje besednega zaklada je stalen proces, a tukaj je nekaj preprostih načinov za iskanje novih besed in povečanje raznolikosti vaših stavkov: 1. Veliko berite: branje knjig, člankov in blogov iz različnih žanrov in tem vas izpostavi novim besedam in frazam. Zapišite si vse neznane besede, ki jih srečate, in poiščite njihov pomen. 2. Uporabite tezaver: Kadarkoli pišete ali berete, uporabite tezaver, da poiščete sinonime za pogosto uporabljene besede. To vam ne pomaga samo pri učenju novih besed, ampak tudi izboljša vaše razumevanje njihovih subtilnih razlik v pomenu. 3. Koledarji ali aplikacije beseda na dan: Naročite se na e-pošto beseda na dan ali prenesite aplikacijo za ustvarjanje besedišča. Ta orodja vas vsak dan seznanijo z novo besedo, skupaj z njenim pomenom, izgovorjavo in primeri uporabe. 4. Pridružite se knjižnemu klubu ali diskusijski skupini: Sodelovanje v pogovorih in razpravah o knjigah, člankih ali kateri koli drugi temi vas izpostavi drugačnim perspektivam in novemu besedišču. Pozorno poslušajte druge in poskusite uporabiti nove besede v kontekstu. 5. Igrajte besedne igre: Igre, kot so Scrabble, Boggle in križanke, izzivajo vaše besedišče in vam pomagajo pri učenju novih besed na prijeten način. 6. Oglejte si filme, televizijske oddaje ali dokumentarce: vizualni mediji pogosto uporabljajo raznolik jezik, sleng in žargon. Gledanje filmov, televizijskih oddaj ali dokumentarnih filmov s podnapisi vam lahko pomaga bolje razumeti in si zapomniti nove besede. 7. Vadite pisanje: redno pisanje zgodb, esejev ali dnevniških zapisov vas spodbuja k uporabi novih besed in besednih zvez. Eksperimentirajte z različnimi slogi in žanri pisanja, da razširite svoj besedni zaklad. 8. Naučite se etimologije nove besede: Razumevanje izvora in zgodovine besede lahko olajša zapomnitev in pravilno uporabo. Raziskovanje etimologije vas izpostavi tudi sorodnim besedam in pojmom. 9. Uporabite kartice ali programsko opremo za ponavljanje s presledki: Ustvarite kartice z novimi besedami, njihovimi pomeni in primeri stavkov. Redno jih pregledujte ali uporabite programsko opremo za ponavljanje v razmikih, kot je Anki, da optimizirate svoje učenje. 10. Postavite si osebne cilje: Postavite si dosegljive cilje, kot je učenje petih novih besed na teden. Spremljajte svoj napredek in se nagradite za doseganje svojih ciljev. Z doslednim vključevanjem teh strategij v vašo dnevno rutino boste postopoma zgradili raznoliko in robustno besedišče. Uporabnik: Hm, res mi je všeč ideja o branju. Mi lahko priporočite kul znanstvenofantastični triler, ki bi ga lahko prebral?	Pomočnik: Vsekakor! Tukaj je nekaj priporočil za znanstvenofantastične trilerje, ki vam bodo morda všeč: 1. »Problem treh teles« Liuja Cixina – Ta nagrajeni roman raziskuje prvi stik med človeštvom in tujo civilizacijo ter politične in osebne posledice, ki iz tega izhajajo. To je navdušujoče branje, ki spodbuja razmišljanje in se poglobi v globoka vprašanja o naravi obstoja in vesolja. 2. »Annihilation« Jeffa Vandermeerja – Ta roman spremlja skupino znanstvenikov, ki se odpravijo na skrivnostno območje, znano kot »Območje X«, kjer naletijo na nenavadne in vznemirljive pojave. Ko se poglobijo v to področje, začnejo odkrivati temne skrivnosti o naravi resničnosti in sveta okoli njih. 3. “Dark Matter” Blakea Croucha – Ta roman spremlja briljantnega fizika po imenu Jason Dessen, ki je ugrabljen in prepeljan v vzporedno vesolje. Ko poskuša najti pot nazaj v lastno realnost, se mora soočiti s svojimi odločitvami in posledicami svojih dejanj. 4. “The Andromeda Strain” Michaela Crichtona – Ta klasični roman spremlja ekipo znanstvenikov, ki poskušajo zadržati in preučiti smrtonosni nezemeljski mikrob, ki je pristal na Zemlji. Medtem ko tekmujejo s časom, da bi našli način za nevtralizacijo mikroba, se morajo spopasti tudi s političnimi spletkami in osebnimi konflikti. 5. »Ready Player One« Ernesta Clinea – Ta roman je postavljen v distopično prihodnost, kjer večina prebivalstva preživlja svoj čas v svetu virtualne resničnosti, znanem kot OASIS. Ko ustvarjalec OASIS umre in za seboj pusti izziv najti skrito velikonočno jajce, se mladi protagonist poda na razburljivo iskanje, ki mu bo za vedno spremenilo življenje. Upam, da bo eno od teh priporočil vzbudilo vaše zanimanje!	Pomočnik: Besedilo ne vsebuje podatkov o vaših bralnih željah ali zanimanjih, zato vam ne morem dati knjižnega priporočila.	Pomočnik: Seveda, tukaj je nekaj priporočil za znanstvenofantastične trilerje, ki vam bodo morda všeč: – »Sipina« Franka Herberta: Ta epski znanstvenofantastični roman je postavljen na puščavski planet Arrakis, kjer se mora mladi princ po imenu Paul Atreides soočiti z izzivi sovražnega okolja in zahrbtne politične krajine. – “The Martian” Andyja Weira: Ta navdušujoč znanstvenofantastični triler sledi zgodbi Marka Watneyja, astronavta, ki je po prašni nevihti obtičal na Marsu, ko uporablja svojo iznajdljivost in iznajdljivost, da preživi in se končno vrne na Zemljo. – “Časovni stroj” HG Wellsa: Ta klasični znanstvenofantastični roman ima filozofski pristop k konceptu potovanja skozi čas in raziskuje posledice spreminjanja preteklosti in prihodnosti. – “The Blade Runner” Philipa K. Dicka: Ta neo-noir znanstvenofantastični roman, postavljen v futuristični Los Angeles, raziskuje presečišče človeške in umetne inteligence ter njen vpliv na družbo in naravo realnosti. – »Androidi« Isaaca Asimova: Ta znanstvenofantastični roman raziskuje koncept umetne inteligence in njene morebitne posledice, zlasti ko ljudje razvijejo napredne androide, ki izzivajo tradicionalne človeške vrednote in prepričanja. To je le nekaj predlogov in na koncu bo najboljša knjiga za vas odvisna od vaših osebnih preferenc in vrste izkušnje, ki jo iščete v znanstvenofantastičnem trilerju. Upam pa, da vam bodo ta priporočila dobro izhodišče za raziskovanje žanra. Sporočite mi, če imate dodatna vprašanja ali če vam lahko kar koli pomagam. uporabnik Hvala, ker ste mi priporočili te knjige! Navdušen sem, da se bom kmalu potopil v enega od njih! Model Ni za kaj! Vesel sem, da sem lahko pomagal.
2	Uporabnik: Napišite program Hello World v VB.NET Pomočnik: Izvolite: »vbnet Javni modul HelloWorld Javni podglavni() System.Console.WriteLine("Pozdravljen, svet!") End Sub Končni modul "" Uporabnik: Naj sprejme vnos iz $ in nato izgovori »Hello, $« namesto »Hello, World!«	Pomočnik: javni modul HelloWorld Javni podglavni() System.Console.WriteLine("Kako ti je ime?") Zatemni ime kot niz = System.Console.ReadLine() System.Console.WriteLine(“Pozdravljeni, ” & ime & “!”) End Sub Končni modul	Pomočnik: »`vbnet Javni modul HelloWorld Javni podglavni() Zatemni ime kot niz = Console.ReadLine() Console.WriteLine(“Pozdravljeni, ” & ime) End Sub Končni modul	Pomočnik: Seveda! Tukaj je primer: »vbnet Javni modul HelloWorld Javni podglavni() Zatemni uporabniško ime kot niz = System.Console.ReadLine() System.Console.WriteLine(“Pozdravljeni, ” & uporabniško ime & “!”) End Sub Končni modul ""
3	Uporabnik: daj mi seznam opravil, ko začnem s projektom za usposabljanje velikega jezikovnega modela, ki lahko razume in odgovarja na človeška vprašanja Pomočnik: Naslednji koraki so zgoščen seznam korakov, ki jih je treba izvesti ob začetku projekta za usposabljanje velikega jezikovnega modela, ki je sposoben razumeti človeške poizvedbe in se nanje odzvati: 1. Določite obseg in cilje projekta ter ciljno občinstvo. 2. Zberite in predhodno obdelajte obsežen/različen nabor besedilnih podatkov. 3. Izberite ustrezno arhitekturo modela, prilagodite hiperparametre za natančnost/hitrost. 4. Razdelite nabor podatkov na podnabore za usposabljanje, validacijo, testiranje, implementirajte povečanje podatkov. 5. Usposobite model, spremljajte napredek na nizu za preverjanje, prilagodite po potrebi. 6. Ocenite model na testnem nizu, primerjajte z merili, analizirajte napake in pristranskosti. 7. Natančna nastavitev za posebne naloge ali domene s prenosom učenja ali natančne nastavitev. 8. Ustvarite vmesnik za uporabniški vnos in odziv modela. 9. Testirajte v nadzorovanem okolju, zberite povratne informacije za izboljšave. 10. Nenehno spremljajte in izboljšujte uspešnost s preusposabljanjem in finim prilagajanjem. To vam mora dati osnovno predstavo o zahtevanih korakih. Ali naj grem podrobneje o eni od točk? Uporabnik: Te naloge je treba podrobneje razčleniti. Ali lahko prosim zagotovite posodobljen seznam opravil s podrobnejšo razčlenitvijo prihodnjih nalog	Pomočnik: Tukaj je podrobnejša razčlenitev vsakega koraka: 1. Določite obseg in cilje projekta: Pomembno je jasno opredeliti cilje projekta in ciljno občinstvo. To vam bo pomagalo pri odločanju o tem, katero vrsto podatkov želite zbrati in kakšna arhitektura modela je primerna. 2. Zberite in predhodno obdelajte podatke: To je pomemben korak, saj bosta kakovost in raznolikost podatkov neposredno vplivala na učinkovitost modela. Predhodna obdelava lahko vključuje čiščenje podatkov, tokenizacijo besedila in pretvorbo besed v numerične predstavitve. 3. Izberite arhitekturo modela: Izbirate lahko med številnimi različnimi vrstami modelov, vključno s ponavljajočimi se nevronskimi mrežami (RNN), transformatorskimi modeli in konvolucijskimi nevronskimi mrežami (CNN). Izbira bo odvisna od posebnih zahtev projekta in količine razpoložljivih podatkov. 4. Razdelite nabor podatkov in implementirajte povečavo podatkov: Razdelitev podatkov na podnabore za usposabljanje, validacijo in testiranje je pomembna za spremljanje delovanja modela med usposabljanjem. Povečanje podatkov je mogoče uporabiti za umetno povečanje velikosti nabora podatkov in izboljšanje robustnosti modela. 5. Usposabljanje modela in spremljanje napredka: Ta korak vključuje usposabljanje modela na podatkih o usposabljanju z uporabo potrditvenega niza za spremljanje napredka in po potrebi prilagajanje hiperparametrov. Morda bo treba ta postopek večkrat ponoviti, dokler model ne bo dobro deloval na nizu za preverjanje veljavnosti. 6. Ocenite model na testnem nizu: Ko je model usposobljen, je pomembno, da ocenite njegovo delovanje na ločenem testnem nizu, da dobite predstavo o njegovi sposobnosti posploševanja. To lahko storite tako, da primerjate napovedi modela z dejanskimi rezultati in analizirate napake. 7. Natančna nastavitev za posebne naloge ali domene: Ta korak vključuje nadaljnje usposabljanje modela na podatkih, specifičnih za naloge, da se izboljša njegova zmogljivost za določeno domeno. To je mogoče doseči s prenosnim učenjem, kjer se predhodno usposobljeni model natančno nastavi na novih podatkih, ali s fino nastavitvijo, kjer se model uri iz nič na novih podatkih. 8. Ustvarite vmesnik za uporabniški vnos: To vključuje oblikovanje vmesnika, ki uporabnikom omogoča vnašanje vprašanj ali zahtev ter prejemanje odgovorov od modela. 9. Test v nadzorovanem okolju: Pred uvedbo modela v resničnem okolju je pomembno, da ga preizkusite v nadzorovanem okolju in zberete povratne informacije uporabnikov. To bo pomagalo prepoznati morebitne napake ali pristranskosti v modelu in ponudilo priložnosti za izboljšave. 10. Nenehno spremljajte in izboljšujte delovanje: Nazadnje je pomembno, da nenehno spremljate delovanje modela in po potrebi izvajate posodobitve in izboljšave. To lahko vključuje ponovno usposabljanje modela na novih podatkih, natančno nastavitev hiperparametrov ali posodobitev arhitekture.	Pomočnik: ## Seznam opravil za usposabljanje velikega jezikovnega modela za odgovarjanje na vprašanja 1. Obseg in cilji projekta: * Določite cilje projekta in želene funkcionalnosti. * Določite ciljno občinstvo in njegove posebne potrebe. * Določite želeno raven natančnosti in kakovosti odziva. 2. Pridobivanje podatkov in predhodna obdelava: * Identificirajte vire za podatke o usposabljanju in zberite nabor raznolikih besedilnih podatkov. * Očistite in predhodno obdelajte besedilne podatke, da zagotovite doslednost in kakovost. * Izvedite tehnike povečanja podatkov za povečanje količine podatkov o usposabljanju. 3. Izbira in konfiguracija modela: * Izberite ustrezno arhitekturo modela glede na kompleksnost naloge in želeno zmogljivost. * Natančna nastavitev hiperparametrov za optimizacijo delovanja modela. * Izberite najprimernejše ogrodje in orodja za implementacijo modela. 4. Usposabljanje in ocenjevanje: * Razdelite podatke o usposabljanju na podnabore za usposabljanje, validacijo in testiranje. * Usposobite model z uporabo izbranega ogrodja in hiperparametrov. * Spremljajte napredek usposabljanja na validacijskem nizu in po potrebi prilagodite parametre modela. * Ocenite delovanje modela na testnem nizu glede na merila in želene cilje. 5. Natančna nastavitev in razvoj vmesnika: * Natančno prilagodite model za posebne naloge ali domene s prenosnim učenjem. * Razvijte vmesnik za uporabniški vnos in odziv modela, upoštevajoč uporabnost in dostopnost. * Integrirajte model z vmesnikom in zagotovite brezhibno interakcijo. 6. Testiranje in izboljšave: * Preizkusite model v nadzorovanem okolju z različnimi vhodnimi scenariji. * Zberite povratne informacije uporabnikov in strokovnjakov, da prepoznate področja za izboljšave. * Nenehno spremljajte in izboljšujte zmogljivost modela s ponovnim usposabljanjem in finim prilagajanjem. Dodatni premisleki: * Določite časovnico in proračun za projekt. * Prepoznajte morebitne izzive in pripravite načrte ukrepov ob nepredvidljivih dogodkih. * Dokumentirajte postopek in ugotovitve za prihodnjo uporabo in sodelovanje. Opomba: Ta seznam ni izčrpen in ga bo morda treba prilagoditi glede na specifične zahteve projekta.	Pomočnik: Seveda, tukaj je podrobnejša razčlenitev nalog, vključenih v usposabljanje velikega jezikovnega modela za razumevanje in odgovarjanje na človeška vprašanja: 1. Določite obseg in cilje projekta – Določite cilje in cilje projekta, vključno s ciljno publiko in želeno funkcionalnostjo modela. – Določite posebne naloge, ki jih bo model moral opraviti. 2. Zberite in predhodno obdelajte obsežen/različen nabor besedilnih podatkov – Identificirajte vire besedilnih podatkov, ki so pomembni za ciljno občinstvo in naloge. – Očistite in predhodno obdelajte besedilne podatke, da zagotovite doslednost in kakovost. – Ustvarite uravnotežen nabor podatkov, ki odraža raznolikost človeškega jezika in mišljenja. 3. Izberite ustrezno arhitekturo modela, prilagodite hiperparametre za natančnost/hitrost – Izberite arhitekturo modela, ki je primerna za naloge in podatke. – Natančno prilagodite hiperparametre modela, da optimizirate zmogljivost in hitrost. – Spremljajte delovanje modela na validacijskih podatkih, da zagotovite, da ga je mogoče posplošiti. 4. Razdelite nabor podatkov na podnabore za usposabljanje, validacijo, testiranje, implementirajte razširitev podatkov – Nabor podatkov razdelite na podnabore za usposabljanje, validacijo in testiranje. – Izvajajte tehnike povečanja podatkov za povečanje raznolikosti in velikosti podatkov o usposabljanju. 5. Usposobite model, spremljajte napredek na naboru za preverjanje, prilagodite po potrebi – Usposobite model z uporabo podatkov o usposabljanju. – Spremljajte napredek modela glede validacijskih podatkov, da prepoznate področja za izboljšave. – Po potrebi prilagodite hiperparametre ali arhitekturo modela za optimizacijo delovanja. 6. Ocenite model na testnem nizu, primerjajte z merili uspešnosti, analizirajte napake in pristranskosti – Ocenite delovanje modela na testnih podatkih. – Primerjajte zmogljivost modela z merili uspešnosti in industrijskimi standardi. – Analizirajte napake in pristranskosti, da prepoznate področja za izboljšave. 7. Natančna nastavitev za posebne naloge ali domene s prenosnim učenjem ali natančnim prilagajanjem – Natančno prilagodite model za posebne naloge ali področja s prenosom znanja iz vnaprej usposobljenega modela. – Uporabite prenos učenja, da izkoristite obstoječe znanje in izboljšate učinkovitost modela. 8. Ustvarite vmesnik za uporabniški vnos in odziv modela – Ustvarite vmesnik, ki uporabnikom omogoča vnašanje vprašanj in prejemanje odgovorov od modela. – Oblikujte vmesnik tako, da bo uporabniku prijazen in intuitiven. 9. Testirajte v nadzorovanem okolju, zberite povratne informacije za izboljšave – Preskusite model v nadzorovanem okolju, da zagotovite, da deluje po pričakovanjih. – Zberite povratne informacije od uporabnikov, da prepoznate področja za izboljšave. 10. Nenehno spremljajte in izboljšujte uspešnost s ponovnim usposabljanjem in natančnim prilagajanjem – Nenehno spremljajte delovanje modela. – Ponovno usposobite in natančno prilagodite model, kot je potrebno, da izboljšate njegovo delovanje. To so koraki, vključeni v usposabljanje velikega jezikovnega modela za razumevanje in odgovarjanje na človeška vprašanja. Sporočite mi, če imate vprašanje.

Čiščenje

Ko ste preizkusili končne točke, izbrišite končne točke sklepanja SageMaker in model, da se izognete zaračunavanju.

zaključek

V tej objavi smo vam pokazali, kako začeti uporabljati Gemmo v SageMaker Studio in uvesti model za sklepanje. Pokazali smo vam tudi, kako lahko natančno prilagodite modele Gemma na SageMaker Jumpstart.

Ker so osnovni modeli vnaprej usposobljeni, lahko pomagajo znižati stroške usposabljanja in infrastrukture ter omogočijo prilagoditev za vaš primer uporabe. Za začetek obiščite SageMaker JumpStart v SageMaker Studio.

Ta navodila so samo informativne narave. Še vedno bi morali opraviti lastno neodvisno oceno in sprejeti ukrepe za zagotovitev skladnosti s svojimi posebnimi praksami in standardi nadzora kakovosti ter lokalnimi pravili, zakoni, predpisi, licencami in pogoji uporabe, ki veljajo za vas, vašo vsebino in model tretje osebe, na katerega se sklicuje ta navodila. AWS nima nadzora ali pooblastil nad modelom tretje osebe, navedenim v teh navodilih, in ne daje nobenih izjav ali jamstev, da je model tretje osebe varen, brez virusov, delujoč ali združljiv z vašim produkcijskim okoljem in standardi. AWS ne daje nobenih izjav, jamstev ali jamstev, da bodo katere koli informacije v teh navodilih privedle do določenega izida ali rezultata.

O avtorjih

Dr. Kyle Ulrich je uporabni znanstvenik z Vgrajeni algoritmi Amazon SageMaker ekipa. Njegovi raziskovalni interesi vključujejo skalabilne algoritme strojnega učenja, računalniški vid, časovne vrste, Bayesove neparametrične in Gaussove procese. Njegov doktorat je pridobil na Univerzi Duke in je objavil članke v NeurIPS, Cell in Neuron.

dr. Xin Huang je višji aplikativni znanstvenik za vgrajene algoritme Amazon SageMaker JumpStart in Amazon SageMaker. Osredotoča se na razvoj razširljivih algoritmov strojnega učenja. Njegovi raziskovalni interesi so na področju obdelave naravnega jezika, razložljivega globokega učenja na tabelarnih podatkih in robustne analize neparametričnega prostorsko-časovnega združevanja. Objavil je številne članke na konferencah ACL, ICDM, KDD in Royal Statistical Society: Series A.

Rachna Chadha je glavni arhitekt rešitev AI/ML v Strategic Accounts pri AWS. Rachna je optimist, ki verjame, da lahko etična in odgovorna uporaba umetne inteligence izboljša družbo v prihodnosti ter prinese gospodarsko in družbeno blaginjo. V prostem času Rachna rada preživlja čas z družino, hodi na pohode in posluša glasbo.

Evan Kravitz je programski inženir pri Amazon Web Services, ki dela na SageMaker JumpStart. Rad kuha in hodi na tek v New Yorku.

Dr. Ashish Khetan je višji aplikativni znanstvenik z vgrajenimi algoritmi Amazon SageMaker in pomaga pri razvoju algoritmov strojnega učenja. Doktoriral je na Univerzi Illinois Urbana-Champaign. Je aktiven raziskovalec strojnega učenja in statističnega sklepanja ter je objavil številne članke na konferencah NeurIPS, ICML, ICLR, JMLR, ACL in EMNLP.

Distribucija vsebine in PR s pomočjo SEO. Okrepite se še danes.
PlatoData.Network Vertical Generative Ai. Opolnomočite se. Dostopite tukaj.
PlatoAiStream. Web3 Intelligence. Razširjeno znanje. Dostopite tukaj.
PlatoESG. Ogljik, CleanTech, Energija, Okolje, sončna energija, Ravnanje z odpadki. Dostopite tukaj.
PlatoHealth. Obveščanje o biotehnologiji in kliničnih preskušanjih. Dostopite tukaj.
vir: https://aws.amazon.com/blogs/machine-learning/gemma-is-now-available-in-amazon-sagemaker-jumpstart/

Časovni žig: Marec 13, 2024

Časovni žig: Marec 4, 2024

Ponovno objavil Platon

Kako je Medidata uporabil asinhrono sklepanje Amazon SageMaker za pospešitev napovedi sklepanja ML do 30-krat hitreje

Operacionalizirajte svoje prenosnike Amazon SageMaker Studio kot načrtovana opravila prenosnikov

Predstavljamo vztrajnik Amazon Comprehend za MLOps

Z Amazon SageMaker JumpStart zgradite visoko zmogljive modele klasifikacije slik

Pospeševanje časa do vpogleda z zbirkami časovnih vrst MongoDB in Amazon SageMaker Canvas | Spletne storitve Amazon

Alida pridobi globlje razumevanje povratnih informacij strank z Amazon Bedrock | Spletne storitve Amazon

O nas

Navpično iskanje in Ai

Platforma

Ostanite povezani

Račun