Peenhäälestage Llama 2 teksti genereerimiseks rakenduses Amazon SageMaker JumpStart | Amazoni veebiteenused

Peenhäälestage Llama 2 teksti genereerimiseks rakenduses Amazon SageMaker JumpStart | Amazoni veebiteenused

Täna on meil hea meel teatada, et Meta abil on võimalik Llama 2 mudeleid peenhäälestada Amazon SageMaker JumpStart. Suurte keelemudelite (LLM) perekond Llama 2 on eelkoolitatud ja peenhäälestatud generatiivse tekstimudelite kogum, mille skaala ulatub 7 miljardist 70 miljardi parameetrini. Peenhäälestatud LLM-id, nn Llama-2-chat, on optimeeritud dialoogide kasutamiseks. Saate neid mudeleid hõlpsalt proovida ja kasutada koos SageMaker JumpStartiga, mis on masinõppe (ML) keskus, mis pakub juurdepääsu algoritmidele, mudelitele ja ML-lahendustele, et saaksite ML-iga kiiresti alustada. Nüüd saate SageMaker JumpStartis ka täpsustada 7 miljardi, 13 miljardi ja 70 miljardi parameetriga Llama 2 teksti genereerimise mudeleid. Amazon SageMaker Studio Kasutajaliides mõne klõpsuga või SageMaker Python SDK abil.

Generatiivsed AI sihtasutuse mudelid on olnud enamuse ML ja tehisintellekti uuringute ja kasutusjuhtumite keskmes juba üle aasta. Need vundamendimudelid toimivad väga hästi generatiivsete ülesannetega, nagu teksti genereerimine, kokkuvõtete tegemine, küsimustele vastamine, piltide ja videote genereerimine ja palju muud, kuna need on suured ning on koolitatud mitme suure andmestiku ja sadade ülesannete täitmiseks. Vaatamata nende mudelite suurele üldistusvõimele on sageli kasutusjuhtumeid, millel on väga spetsiifilised domeeniandmed (nt tervishoid või finantsteenused), mistõttu ei pruugi need mudelid nende kasutusjuhtude puhul häid tulemusi anda. Selle tulemuseks on vajadus neid generatiivseid tehisintellekti mudeleid täiendavalt viimistleda juhtumi- ja domeenispetsiifiliste andmete põhjal.

Selles postituses käsitleme SageMaker JumpStarti kaudu Llama 2 eelkoolitatud teksti genereerimise mudelite peenhäälestamist.

Mis on Llama 2

Llama 2 on automaatselt regressiivne keelemudel, mis kasutab optimeeritud trafo arhitektuuri. Llama 2 on mõeldud äriliseks ja teaduslikuks kasutamiseks inglise keeles. See on saadaval mitmesugustes parameetrite suurustes – 7 miljardit, 13 miljardit ja 70 miljardit – ning ka eelkoolitatud ja viimistletud variatsioone. Meta sõnul kasutavad häälestatud versioonid juhendatud peenhäälestust (SFT) ja tugevdavat õpet koos inimese tagasisidega (RLHF), et viia need vastavusse inimeste eelistustega abivalmiduse ja ohutuse osas. Llama 2 koolitati eelnevalt avalikult kättesaadavatest allikatest pärit 2 triljoni andmemärgiga. Häälestatud mudelid on mõeldud assistendilaadseks vestluseks, samas kui eelkoolitatud mudeleid saab kohandada mitmesuguste loomuliku keele genereerimise ülesannete jaoks. Sõltumata sellest, millist mudeli versiooni arendaja kasutab, Meta vastutustundliku kasutamise juhend võib aidata juhtida täiendavaid peenhäälestusi, mis võivad osutuda vajalikuks mudelite kohandamiseks ja optimeerimiseks sobivate ohutusmeetmetega.

Praegu on Llama 2 saadaval järgmistes piirkondades:

  • Saadaval on eelkoolitatud mudeli juurutamine: "us-west-2", "us-east-1", "us-east-2", "eu-west-1", "ap-southeast-1", "ap-southeast-2"
  • Viimistlege ja juurutage peenhäälestatud mudelit: “us-east-1”, “us-west-2”,“eu-west-1”

Mis on SageMaker JumpStart

SageMaker JumpStarti abil saavad ML-i praktikud valida laia valiku avalikult kättesaadavate vundamendimudelite hulgast. ML-praktikud saavad sihtotstarbeliselt kasutusele võtta sihtasutuse mudelid Amazon SageMaker eksemplare võrgust eraldatud keskkonnast ja kohandage mudeleid SageMakeri abil mudeli koolituseks ja juurutamiseks. Nüüd saate Llama 2 mõne klõpsuga SageMaker Studios või programmiliselt SageMaker Python SDK kaudu avastada ja juurutada, võimaldades teil tuletada mudeli jõudlust ja MLOps-i juhtelemente SageMakeri funktsioonidega, nagu näiteks Amazon SageMakeri torujuhtmed, Amazon SageMakeri silurvõi konteineri palke. Mudel on juurutatud AWS-i turvalises keskkonnas ja teie VPC kontrolli all, aidates tagada andmete turvalisust. Lisaks saate SageMaker JumpStarti kaudu peenhäälestada Llama2 7B, 13B ja 70B eelkoolitatud teksti genereerimise mudeleid.

Llama2 mudelite peenhäälestus

Mudeleid saate täpsustada kas SageMaker Studio kasutajaliidese või SageMaker Python SDK abil. Selles jaotises käsitleme mõlemat meetodit.

Koodivaba peenhäälestus SageMaker Studio kasutajaliidese kaudu

SageMaker Studios pääsete juurde Llama 2 mudelitele SageMakeri JumpStarti kaudu Mudelid, märkmikud ja lahendused, nagu on näidatud järgmisel ekraanipildil.

Kui te Llama 2 mudeleid ei näe, värskendage oma SageMaker Studio versiooni, lülitades välja ja taaskäivitades. Versioonivärskenduste kohta lisateabe saamiseks vaadake Lülitage Studio rakendused välja ja värskendage neid.

Peenhäälestage Llama 2 teksti genereerimiseks rakenduses Amazon SageMaker JumpStart | Amazon Web Services PlatoBlockchain Data Intelligence. Vertikaalne otsing. Ai.

Valides leiate ka neli muud mudelivarianti Tutvuge kõigi teksti genereerimise mudelitega või otsides otsingukastist laama.

Peenhäälestage Llama 2 teksti genereerimiseks rakenduses Amazon SageMaker JumpStart | Amazon Web Services PlatoBlockchain Data Intelligence. Vertikaalne otsing. Ai.

Sellel lehel saate osutada Amazoni lihtne salvestusteenus (Amazon S3) kopp, mis sisaldab peenhäälestamiseks mõeldud koolitus- ja valideerimisandmekogumeid. Lisaks saate peenhäälestamiseks konfigureerida juurutamise konfiguratsiooni, hüperparameetreid ja turbesätteid. Seejärel saate valida Rong koolitustöö alustamiseks SageMaker ML eksemplaris. Eelnev ekraanipilt näitab mudeli Llama-2 7B peenhäälestuslehte; aga saate 13B ja 70B Llama 2 tekstigeneratsiooni mudeleid täpselt häälestada, kasutades nende vastavaid mudelilehti sarnaselt. Llama 2 mudelite kasutamiseks peate nõustuma lõppkasutaja litsentsilepinguga (EULA). See kuvatakse siis, kui valite Rong, nagu on näidatud järgmisel ekraanipildil. Vali Olen lugenud läbi EULA ja AUP ning nõustun nendega peenhäälestustöö alustamiseks.

Peenhäälestage Llama 2 teksti genereerimiseks rakenduses Amazon SageMaker JumpStart | Amazon Web Services PlatoBlockchain Data Intelligence. Vertikaalne otsing. Ai.

Mudeli juurutamine

Pärast mudeli peenhäälestamist saate selle juurutada, kasutades SageMakeri JumpStarti mudelilehte. Peenhäälestatud mudeli juurutamise valik kuvatakse, kui peenhäälestus on lõppenud, nagu on näidatud järgmisel ekraanipildil.

Peenhäälestage Llama 2 teksti genereerimiseks rakenduses Amazon SageMaker JumpStart | Amazon Web Services PlatoBlockchain Data Intelligence. Vertikaalne otsing. Ai.

Täpsustage SageMaker Python SDK kaudu

Llama 2 mudeleid saate ka SageMaker Python SDK abil täpsustada. Järgmine on näidiskood teie andmestiku Llama 2 7B peenhäälestamiseks:

import os
import boto3
from sagemaker.session import Session
from sagemaker.jumpstart.estimator import JumpStartEstimator # To fine-tune the 13B/70B model, please change model_id to `meta-textgeneration-llama-2-13b`/`meta-textgeneration-llama-2-70b`.
model_id = "meta-textgeneration-llama-2-7b" estimator = JumpStartEstimator( model_id=model_id, environment={"accept_eula": "true"}
)
# By default, instruction tuning is set to false. Thus, to use instruction tuning dataset you use
estimator.set_hyperparameters(instruction_tuned="True", epoch="5")
estimator.fit({"training": train_data_location})

Täpselt häälestatud mudeli saate juurutada otse hindajast:

finetuned_predictor = estimator.deploy()

Koodi leiate ka siit LLaMA 2 mudelite peenhäälestus SageMaker JumpStartis. See hõlmab andmestiku ettevalmistamist, kohandatud andmestiku koolitust ja peenhäälestatud mudeli juurutamist. See demonstreerib Dolly andmestiku alamhulga peenhäälestamist kokkuvõteülesande näidetega. Järgmine on näidissisend koos peenhäälestatud ja peenhäälestamata vastustega koos põhitõe vastusega:

Sisend mudelile:

Below is an instruction that describes a task, paired with an input that provides further context. Write a response that appropriately completes the request.nn### Instruction:nWhen did Felix Luna die?nn### Input:nFélix César Luna (30 September 1925 – 5 November 2009) was an Argentine writer, lyricist and historian.nnnn### Response:n

Põhitõe vastus:

Felix Luna died on November 5th, 2009

Vastus peenhäälestamata mudelilt:

Félix César Luna (30 September 1925 – 5 November 2009) was an ArgentinennWhen did Luna die?nnn### Explanation:nWe answer the question with the input's date of birth and the date of death.nnn### Solution: 1102n

Vastus peenhäälestatud mudelilt:

Félix Luna died on November 5th, 2009.nn

Andmestiku Dolly ja Dialogsum erinevate mudelite jõudluse võrdlusuuringu kohta vaadake jaotist Tulemuslikkuse võrdlusuuringud jaotise lisas selle postituse lõpus.

Peenhäälestuse tehnika

Keelemudelid, nagu Llama, on suuremad kui 10 GB või isegi 100 GB. Selliste suurte mudelite peenhäälestamiseks on vaja märkimisväärselt suure CUDA-mäluga eksemplare. Lisaks võib nende mudelite treenimine mudeli suuruse tõttu olla väga aeglane. Seetõttu kasutame tõhusaks peenhäälestamiseks järgmisi optimeerimisi:

  • Madala asetusega kohandamine (LoRA) – See on teatud tüüpi parameetrite tõhus peenhäälestus (PEFT) suurte mudelite tõhusaks peenhäälestamiseks. Selle käigus külmutame kogu mudeli ja lisame mudelisse vaid väikese komplekti reguleeritavaid parameetreid või kihte. Näiteks selle asemel, et treenida kõiki 7 miljardit parameetrit Llama 2 7B jaoks, saame peenhäälestada vähem kui 1% parameetritest. See aitab oluliselt vähendada mäluvajadust, sest me peame salvestama ainult 1% parameetrite gradiente, optimeerija olekuid ja muud koolitusega seotud teavet. Lisaks aitab see vähendada koolituse aega ja kulusid. Selle meetodi kohta lisateabe saamiseks vaadake LoRA: suurte keelemudelite madalatasemeline kohandamine.
  • Int8 kvantimine – Isegi selliste optimeeringutega nagu LoRA on mudelid nagu Llama 70B ikka veel treenimiseks liiga suured. Mälu jalajälje vähendamiseks treeningu ajal saame treeningu ajal kasutada Int8 kvantiseerimist. Kvantimine vähendab tavaliselt ujukoma andmetüüpide täpsust. Kuigi see vähendab mudeli kaalude salvestamiseks vajalikku mälu, halvendab see teabe kadumise tõttu jõudlust. Int8 kvantimine kasutab ainult veerandi täpsust, kuid ei põhjusta jõudluse halvenemist, kuna see ei kaota lihtsalt bitte. See ümardab andmed ühelt tüübilt teisele. Int8 kvantimise kohta lisateabe saamiseks vaadake LLM.int8(): 8-bitine maatrikskorrutis mastaabis transformerite jaoks.
  • Täielikult jagatud andmete paralleelne (FSDP) – See on teatud tüüpi andmeparalleelne treeningalgoritm, mis killustab mudeli parameetrid andmetega paralleelsete töötajate vahel ja võib valikuliselt osa treeninguarvutustest protsessoritele maha laadida. Kuigi parameetrid on jagatud erinevate GPU-de vahel, on iga mikropartii arvutamine GPU töötaja jaoks kohalik. See killustab parameetreid ühtlasemalt ja saavutab optimeeritud jõudluse suhtluse ja arvutuste kattumise kaudu treeningu ajal.

Järgmises tabelis võrreldakse erinevaid meetodeid kolme Llama 2 mudeliga.

, Vaikimisi eksemplari tüüp Toetatud eksemplaritüübid vaikekonfiguratsiooniga Vaikeseade LORA + FSDP LORA + FSDP puudub Int8 kvantimine + LORA + FSDP puudub
Laama 2 7B ml.g5.12xsuur ml.g5.12xsuur, ml.g5.24xsuur, ml.g5.48xsuur LORA + FSDP Jah Jah Jah
Laama 2 13B ml.g5.12xsuur ml.g5.24xsuur, ml.g5.48xsuur LORA + FSDP Jah Jah Jah
Laama 2 70B ml.g5.48xsuur ml.g5.48xsuur INT8 + LORA + NO FSDP Ei Ei Jah

Pange tähele, et Llama mudelite peenhäälestus põhineb alljärgnevatel skriptidel GitHub repo.

Koolituse andmestiku vorming

SageMaker JumpStart toetab praegu andmekogumeid nii domeeni kohandamise vormingus kui ka juhiste häälestamise vormingus. Selles jaotises määrame näidisandmestiku mõlemas vormingus. Lisateabe saamiseks vaadake Andmekogumi vormindamine jaotises lisas.

Domeeni kohandamise vorming

Teksti genereerimise Llama 2 mudelit saab peenhäälestada mis tahes domeenispetsiifilises andmekogumis. Pärast domeenispetsiifilise andmestiku peenhäälestamist peaks mudel genereerima domeenispetsiifilist teksti ja lahendama selles konkreetses domeenis mitmesugused NLP-ülesanded, kasutades mõne võttega viipasid. Selle andmestiku puhul koosneb sisend CSV-, JSON- või TXT-failist. Näiteks võivad sisendandmed olla tekstifailina Amazoni SEC-failid:

This report includes estimates, projections, statements relating to our
business plans, objectives, and expected operating results that are “forward-
looking statements” within the meaning of the Private Securities Litigation
Reform Act of 1995, Section 27A of the Securities Act of 1933, and Section 21E
of the Securities Exchange Act of 1934. Forward-looking statements may appear
throughout this report, including the following sections: “Business” (Part I,
Item 1 of this Form 10-K), “Risk Factors” (Part I, Item 1A of this Form 10-K),
and “Management’s Discussion and Analysis of Financial Condition and Results
of Operations” (Part II, Item 7 of this Form 10-K). These forward-looking
statements generally are identified by the words “believe,” “project,”
“expect,” “anticipate,” “estimate,” “intend,” “strategy,” “future,”
“opportunity,” “plan,” “may,” “should,” “will,” “would,” “will be,” “will
continue,” “will likely result,” and similar expressions.

Juhendi häälestamise formaat

Käskude peenhäälestamisel on mudel peenhäälestatud loomuliku keele töötlemise (NLP) ülesannete komplekti jaoks, mida kirjeldatakse juhiste abil. See aitab nullkaadri viipade abil parandada mudeli jõudlust nähtamatute ülesannete puhul. Käskude häälestamise andmestiku vormingus määrate template.json fail, mis kirjeldab sisend- ja väljundvorminguid. Näiteks faili iga rida train.jsonl näeb välja järgmine:

{"instruction": "What is a dispersive prism?", "context": "In optics, a dispersive prism is an optical prism that is used to disperse light, that is, to separate light into its spectral components (the colors of the rainbow). Different wavelengths (colors) of light will be deflected by the prism at different angles. This is a result of the prism material's index of refraction varying with wavelength (dispersion). Generally, longer wavelengths (red) undergo a smaller deviation than shorter wavelengths (blue). The dispersion of white light into colors by a prism led Sir Isaac Newton to conclude that white light consisted of a mixture of different colors.", "response": "A dispersive prism is an optical prism that disperses the light's different wavelengths at different angles. When white light is shined through a dispersive prism it will separate into the different colors of the rainbow."}

Täiendav fail template.json näeb välja järgmine:

{ "prompt": "Below is an instruction that describes a task, paired with an input that provides further context. " "Write a response that appropriately completes the request.nn" "### Instruction:n{instruction}nn### Input:n{context}nn", "completion": " {response}",
}

Toetatud hüperparameetrid treenimiseks

Llama 2 peenhäälestus toetab mitmeid hüperparameetreid, millest igaüks võib mõjutada peenhäälestatud mudeli mälunõuet, treeningkiirust ja jõudlust:

  • epohh – Läbimiste arv, mille peenhäälestusalgoritm läbib treeningu andmestiku. Peab olema täisarv, mis on suurem kui 1. Vaikimisi on 5.
  • õppimise_määr – Mudeli kaalude värskendamise kiirus pärast iga treeningnäidete partii läbitöötamist. Peab olema positiivne ujuk, mis on suurem kui 0. Vaikimisi on 1e-4.
  • instruction_tuned – Kas modelli juhendada-koolitada või mitte. Peab olema 'True"või"False'. Vaikimisi on 'False'.
  • per_device_train_batch_size – Partii suurus GPU tuuma/protsessori kohta koolituse jaoks. Peab olema positiivne täisarv. Vaikimisi on 4.
  • per_device_eval_batch_size – Hindamiseks mõeldud partii suurus GPU tuuma/protsessori kohta. Peab olema positiivne täisarv. Vaikimisi on 1.
  • max_train_samples – Silumiseks või kiiremaks treenimiseks kärpige treeningnäidete arv selle väärtuseni. Väärtus -1 tähendab kõigi treeningnäidiste kasutamist. Peab olema positiivne täisarv või -1. Vaikimisi on -1.
  • max_val_samples – Silumiseks või kiiremaks väljaõppeks kärpige valideerimisnäidete arv selle väärtuseni. Väärtus -1 tähendab kõigi valideerimisnäidiste kasutamist. Peab olema positiivne täisarv või -1. Vaikimisi on -1.
  • max_sisendi_pikkus – Sisendjada maksimaalne kogupikkus pärast märgistamist. Sellest pikemad jadad kärbitakse. Kui -1, max_input_length on seatud minimaalseks 1024 ja maksimaalseks mudeli pikkuseks, mille määrab tokenisaator. Kui see on seatud positiivsele väärtusele, max_input_length on seatud antud väärtuse miinimumile ja model_max_length määratletud tokenisaatori poolt. Peab olema positiivne täisarv või -1. Vaikimisi on -1.
  • validation_split_ratio – Kui valideerimiskanal on none, peab rongi andmetest eraldatud rongi valideerimise suhe olema vahemikus 0–1. Vaikimisi on 0.2.
  • train_data_split_seed – Kui valideerimisandmed puuduvad, fikseerib see sisendtreeningu andmete juhusliku jagamise algoritmi kasutatavateks treening- ja valideerimisandmeteks. Peab olema täisarv. Vaikimisi on 0.
  • eeltöötlus_töötajate_arv – eeltöötluseks kasutatavate protsesside arv. Kui None, põhiprotsessi kasutatakse eeltöötluseks. Vaikimisi on None.
  • lora_r – Lora R. Peab olema positiivne täisarv. Vaikimisi on 8.
  • lora_alpha - Lora Alfa. Peab olema positiivne täisarv. Vaikimisi on 32
  • lora_dropout – Lora Dropout. peab olema positiivne ujuk vahemikus 0 kuni 1. Vaikimisi on 0.05.
  • int8_kvantimine - Kui True, mudel on treenimiseks laaditud 8-bitise täpsusega. Vaikimisi 7B ja 13B jaoks on False. Vaikimisi on 70B True.
  • enable_fsdp - Kui True, koolitusel kasutatakse FSDP-d. Vaikimisi 7B ja 13B jaoks on True. Vaikimisi on 70B False. Pange tähele, et int8_quantization FSDP ei toeta.

Eksemplaritüübid ja ühilduvad hüperparameetrid

Peenhäälestuse mälunõue võib mitme teguri tõttu erineda.

  • Mudelitüüp – 7B mudelil on kõige vähem GPU mälunõudlust ja 70B mudelil on suurim mälunõue
  • Maksimaalne sisendi pikkus - Sisendpikkuse suurem väärtus toob kaasa rohkemate žetoonide korraga töötlemise ja nõuab seetõttu rohkem CUDA mälu
  • Partii suurus – Suurem partii suurus nõuab suuremat CUDA mälu ja seetõttu on vaja suuremaid eksemplaritüüpe
  • Int8 kvantimine – Int8 kvantiseerimise kasutamisel laaditakse mudel madala täpsusega ja seetõttu vajab see vähem CUDA mälu

Alustamise hõlbustamiseks pakume erinevate eksemplaritüüpide, hüperparameetrite ja mudelitüüpide kombinatsioone, mida saab edukalt peenhäälestada. Saate valida konfiguratsiooni vastavalt oma vajadustele ja eksemplaritüüpide saadavusele. Täpsustame kõiki kolme mudelit erinevatel seadetel kolme epohhiga Dolly andmestiku alamhulga koos kokkuvõtete näidetega.

7B mudel

Järgmine tabel võtab kokku 7B mudeli peenhäälestusvalikud.

Juhtumi tüüp Maksimaalne sisend Len Seadme partii suurus Int8 kvantimine Luba FSDP Kulunud aeg (min)
ml.g4dn.12xsuur 1024 8 TRUE FALSE 166
ml.g4dn.12xsuur 2048 2 TRUE FALSE 178
ml.g4dn.12xsuur 1024 4 FALSE TRUE 120
ml.g4dn.12xsuur 2048 2 FALSE TRUE 143
ml.g5.2xsuur 1024 4 TRUE FALSE 61
ml.g5.2xsuur 2048 2 TRUE FALSE 68
ml.g5.2xsuur 1024 4 FALSE TRUE 43
ml.g5.2xsuur 2048 2 FALSE TRUE 49
ml.g5.4xsuur 1024 4 FALSE TRUE 39
ml.g5.4xsuur 2048 2 FALSE TRUE 50
ml.g5.12xsuur 1024 16 TRUE FALSE 57
ml.g5.12xsuur 2048 4 TRUE FALSE 64
ml.g5.12xsuur 1024 4 FALSE TRUE 26
ml.g5.12xsuur 2048 4 FALSE TRUE 23
ml.g5.48xsuur 1024 16 TRUE FALSE 59
ml.g5.48xsuur 2048 4 TRUE FALSE 67
ml.g5.48xsuur 1024 8 FALSE TRUE 22
ml.g5.48xsuur 2048 4 FALSE TRUE 21

13B

Järgmine tabel võtab kokku 13B mudeli peenhäälestusvalikud.

Juhtumi tüüp Maksimaalne sisend Len Seadme partii suurus Int8 kvantimine Luba FSDP Kulunud aeg (min)
ml.g4dn.12xsuur 1024 4 TRUE FALSE 283
ml.g4dn.12xsuur 2048 2 TRUE FALSE 328
ml.g5.12xsuur 1024 8 TRUE FALSE 92
ml.g5.12xsuur 2048 4 TRUE FALSE 104
ml.g5.48xsuur 1024 8 TRUE FALSE 95
ml.g5.48xsuur 2048 4 TRUE FALSE 107
ml.g5.48xsuur 1024 8 FALSE TRUE 35
ml.g5.48xsuur 2048 2 FALSE TRUE 41

70B

Järgmine tabel võtab kokku 70B mudeli peenhäälestusvalikud.

Juhtumi tüüp Maksimaalne sisend Len Seadme partii suurus Int8 kvantimine Luba FSDP Kulunud aeg (min)
ml.g5.48xsuur 1024 4 TRUE FALSE 396
ml.g5.48xsuur 2048 1 TRUE FALSE 454

Soovitused eksemplaritüüpide ja hüperparameetrite kohta

Mudeli täpsuse täpsustamisel pidage meeles järgmist.

  • Suuremad mudelid, nagu 70B, tagavad parema jõudluse kui 7B
  • Jõudlus ilma Int8 kvantimiseta on parem kui jõudlus INT8 kvantiseerimisega

Pange tähele järgmisi treeninguaegu ja CUDA mälunõudeid:

  • Kehtestamine int8_quantization=True vähendab mäluvajadust ja viib kiirema treeninguni.
  • Vähenemine per_device_train_batch_size ja max_input_length vähendab mälunõuet ja seetõttu saab seda kasutada väiksematel eksemplaridel. Väga madalate väärtuste seadmine võib aga treeninguaega pikendada.
  • Kui te ei kasuta Int8 kvantiseerimist (int8_quantization=False), kasutage FSDP-d (enable_fsdp=True) kiiremaks ja tõhusamaks treenimiseks.

Eksemplari tüübi valimisel võtke arvesse järgmist.

  • G5 eksemplarid pakuvad toetatud eksemplaritüüpide seas kõige tõhusamat koolitust. Seega, kui teil on saadaval G5 eksemplare, peaksite neid kasutama.
  • Treeningu aeg sõltub suuresti GPU-de arvust ja saadaolevast CUDA mälust. Seetõttu on sama arvu GPU-dega eksemplaride (nt ml.g5.2xlarge ja ml.g5.4xlarge) koolitus ligikaudu sama. Seetõttu saate treenimiseks kasutada odavamat eksemplari (ml.g5.2xlarge).
  • P3 eksemplaride kasutamisel toimub koolitus 32-bitise täpsusega, kuna bfloat16 nendel juhtudel ei toetata. Seetõttu kulutab treeningtöö p3 eksemplaridel treenides võrreldes g5 eksemplaridega kaks korda rohkem CUDA mälu.

Koolituse maksumuse kohta eksemplari kohta lisateabe saamiseks vaadake Amazon EC2 G5 eksemplarid.

Kui andmestik on juhiste häälestamise vormingus ja sisend+lõpetamise jadad on väikesed (nt 50–100 sõna), siis on suur väärtus max_input_length viib väga halva jõudluseni. Selle parameetri vaikeväärtus on -1, mis vastab max_input_length 2048 Llama mudelite jaoks. Seetõttu soovitame, et kui teie andmekogum sisaldab väikeseid näidiseid, kasutage jaoks väikest väärtust max_input_length (näiteks 200–400).

Lõpuks võib G5 eksemplaride suure nõudluse tõttu tekkida nende eksemplaride puudumine teie piirkonnas koos veaga “CapacityError: Unable to provision requested ML compute capacity. Please retry using a different ML instance type.” Kui teil tekib see tõrge, proovige uuesti koolitustööd või proovige teist piirkonda.

Probleemid väga suurte mudelite peenhäälestamisel

Selles jaotises käsitleme kahte probleemi väga suurte mudelite peenhäälestamisel.

Keela väljundi tihendamine

Vaikimisi on koolitustöö väljund koolitatud mudel, mis tihendatakse enne Amazon S3 üleslaadimist tar.gz-vormingus. Mudeli suurte mõõtmete tõttu võib see samm aga kaua aega võtta. Näiteks 70B mudeli tihendamiseks ja üleslaadimiseks võib kuluda rohkem kui 4 tundi. Selle probleemi vältimiseks võite kasutada SageMakeri treeningplatvormi toetatud väljundi tihendamise keelamise funktsiooni. Sel juhul laaditakse mudel üles ilma tihendamiseta, mida kasutatakse edasiseks juurutamiseks:

estimator = JumpStartEstimator(
model_id=model_id, environment={"accept_eula": "true"}, disable_output_compression=True
)

SageMaker Studio kerneli ajalõpu probleem

Llama 70B mudeli suuruse tõttu võib treeningtöö võtta mitu tundi ja SageMaker Studio tuum võib treeningfaasis välja surra. Selle aja jooksul aga käivad SageMakeris veel treeningud. Kui see juhtub, saate lõpp-punkti siiski juurutada, kasutades järgmise koodiga koolitustöö nime:

from sagemaker.jumpstart.estimator import JumpStartEstimator
training_job_name = <<<INSERT_TRAINING_JOB_NAME>>> attached_estimator = JumpStartEstimator.attach(training_job_name, model_id)
attached_estimator.logs()
attached_estimator.deploy()

Koolitustöö nime leidmiseks liikuge SageMakeri konsooli ja selle alla koolitus valige navigeerimispaanil Koolitustööd. Tuvastage koolitustöö nimi ja asendage see eelmise koodiga.

Järeldus

Selles postituses arutasime Meta Llama 2 mudelite peenhäälestamist, kasutades SageMaker JumpStart. Näitasime, et saate nende mudelite viimistlemiseks ja juurutamiseks kasutada SageMakeri JumpStart-konsooli SageMaker Studios või SageMaker Python SDK-d. Arutasime ka peenhäälestustehnikat, eksemplaritüüpe ja toetatud hüperparameetreid. Lisaks andsime välja soovitused optimeeritud koolituseks, mis põhinevad erinevatel meie poolt läbi viidud testidel. Kolme mudeli kahe andmekogumi peenhäälestamise tulemused on näidatud selle postituse lõpus olevas lisas. Nagu nendest tulemustest näeme, parandab peenhäälestus kokkuvõtet võrreldes peenhäälestamata mudelitega. Järgmise sammuna võite proovida neid mudeleid oma andmestikul peenhäälestada, kasutades GitHubi hoidlas oleva koodi, et testida ja võrrelda tulemusi vastavalt oma kasutusjuhtumitele.

Autorid soovivad tunnustada Christopher Whitteni, Xin Huangi, Kyle Ulrichi, Sifei Li, Amy You, Adam Kozdrowiczi, Evan Kravitzi, Benjamin Crabtree, Haotian Ani, Manan Shahi, Tony Cruzi, Ernev Sharma, Jonathan Guinegagne'i ja June'i tehnilist panust. Võitis.


Autoritest

Vivek MadanDr Vivek Madan on Amazon SageMaker JumpStart meeskonna rakendusteadlane. Ta sai doktorikraadi Illinoisi ülikoolist Urbana-Champaignis ja oli Georgia Techi järeldoktor. Ta on aktiivne masinõppe ja algoritmide kujundamise uurija ning avaldanud ettekandeid EMNLP, ICLR, COLT, FOCS ja SODA konverentsidel.

Peenhäälestage Llama 2 teksti genereerimiseks rakenduses Amazon SageMaker JumpStart | Amazon Web Services PlatoBlockchain Data Intelligence. Vertikaalne otsing. Ai.Dr Farooq Sabir on AWS-i tehisintellekti ja masinõppe lahenduste vanemarhitekt. Tal on doktori- ja magistrikraad elektrotehnika alal Texase ülikoolist Austinis ning magistrikraadi arvutiteaduses Georgia Tehnoloogiainstituudist. Tal on üle 15-aastane töökogemus ning talle meeldib õpetada ja juhendada ka kolledži üliõpilasi. AWS-is aitab ta klientidel sõnastada ja lahendada äriprobleeme andmeteaduse, masinõppe, arvutinägemise, tehisintellekti, numbrilise optimeerimise ja sellega seotud valdkondades. Teksases Dallases asuv talle ja ta perele meeldib reisida ja pikki teereise teha.

Peenhäälestage Llama 2 teksti genereerimiseks rakenduses Amazon SageMaker JumpStart | Amazon Web Services PlatoBlockchain Data Intelligence. Vertikaalne otsing. Ai.Dr Ashish Khetan on Amazon SageMaker JumpStarti vanemrakendusteadlane ja aitab välja töötada masinõppe algoritme. Ta sai doktorikraadi Illinoisi Urbana-Champaigni ülikoolist. Ta on aktiivne masinõppe ja statistiliste järelduste uurija ning avaldanud palju artikleid NeurIPS, ICML, ICLR, JMLR, ACL ja EMNLP konverentsidel.


Lisa

See lisa sisaldab lisateavet jõudluse võrdlusuuringute ja andmestiku vormindamise kohta.

Tulemuslikkuse võrdlusuuringud

Selles jaotises pakume tulemusi kolme Llama 2 mudeli (7B, 13B ja 70B) peenhäälestamiseks kahes erinevas andmekogumis. Dolly ja Dialogsum. Dolly andmestiku puhul on meie ülesandeks teha kokkuvõte teksti lõigust, Dialogsumi puhul aga viimistleme mudelit, et võtta kokku kahe inimese vaheline arutelu. Järgmistes tabelites näitame mudeli sisendit (viip ja juhised), põhitõde (kokkuvõte), vastust eelkoolitatud Llama 2 mudelilt ja vastust peenhäälestatud Llama 2 mudelilt iga kolme laama jaoks. 2 mudelit. Näitame viie andmepunkti järeldustulemusi. Järgmistest tabelitest näete, et mudelite peenhäälestamisel paranevad mõlema andmestiku kokkuvõtted.

  • Dolly andmestiku teksti genereerimise mudeli Llama 2 7B peenhäälestuse tulemused:
Sisendid Põhjendatud tõde Vastus mittepeenhäälestatud mudelilt Peenhäälestatud mudeli vastus
Allpool on juhis, mis kirjeldab ülesannet koos sisendiga, mis pakub täiendavat konteksti. Kirjutage vastus, mis täidab päringu sobivalt.nn### Juhend:nKus on Allauchnn### Sisend:nAllauch (prantsuse hääldus: ; oksitaani: Alaug) on ​​Prantsuse kommuun, mis asub Marseille'st idas Bouches-du-Rhône'i departemangus Prantsusmaal Provence-Alpes-Côte d'Azuri piirkonnas.nnKommuuni elanikke tuntakse prantsuse keeles Allaudiensi või Allaudiennesina.nnnn### Vastus:n Allauch on Prantsusmaa omavalitsusüksus, mis asub Marseille'st idas Bouches-du-Rhône'i departemangus Provence-Alpes-Côte d'Azuri piirkonnas Prantsusmaal. Allauch on linn, mis asub 28 km Marseille'st idas Bouches-du-Rhône'i departemangus Provence-Alpes-Côte d'Azuri piirkonnas Prantsusmaal. Seda peetakse üheks kaunimaks külaks Prantsusmaal. Linn on ümbritsetud mägede ja viinamarjaistandustega ning seal elab umbes 6,000 inimest. Seda mainiti esmakordselt 1006. aastal ja sellel on rikas Kommuun asub kaljusel platool nimega Massif du Gélas, mis asub Marseille'st ida pool. Siit avaneb kaunis vaade Marseille'le ja selle rannajoonele. Allauch on nüüd hästi arenenud kommuun, kus on oma raekoda ning hulgaliselt poode, baare ja restorane. Tänu oma asukohale Marseille ja Alpilles'i vahel on see säilitanud palju piirkonna looduslikke omadusi, sealhulgas Glandes Massif, tuntud ka kui "W".
Allpool on juhis, mis kirjeldab ülesannet koos sisendiga, mis pakub täiendavat konteksti. Kirjutage vastus, mis täidab päringu asjakohaselt.nn### Juhend:nMis on munev imetaja?nn### Sisend:nKannulind (Ornithorhynchus anatinus), mida mõnikord nimetatakse ka pardnokklinduks, on poolveeline munarakk - munevad imetajad, mis on endeemilised Ida-Austraalias, sealhulgas Tasmaanias. Lillelind on oma perekonna (Ornithorhynchidae) ja perekonna (Ornithorhynchus) ainus elusolev esindaja või monotüüpne takson, kuigi fossiilide registris leidub mitmeid sarnaseid liike.nnnn### Vastus:n Pardnokk-platypus on Ida-Austraaliast leitud muneev imetaja. See on oma perekonna Ornithorhynchus ainus elav esindaja. n Ma uurisin teie küsimust üsna palju. Lugesin kogu teie teises lõigus esitatud teabe. Lugesin natuke ka platypuse kohta, sealhulgas [seda lehte](https://phys.org/news/2019-04-australia-platypus-predator-species.html). Ma arvan, et leidsin mõned vastused teie küsimusele. Kas te küsite, kas lind on muna munev imetaja või kui Imetaja, kes muneb, nagu platypusnn
Allpool on juhis, mis kirjeldab ülesannet koos sisendiga, mis pakub täiendavat konteksti. Kirjutage vastus, mis täidab päringu sobivalt.nn### Juhend:nMillal Felix Luna suri?nn### Sisend:nFélix César Luna (30. september 1925 – 5. november 2009) oli Argentina kirjanik, laulusõnade kirjutaja ja ajaloolane.nnnn# ## Vastus:n Felix Luna suri 5. novembril 2009 Félix César Luna (30. september 1925 – 5. november 2009) oli argentiinnMillal Luna suri?nnn### Selgitus:nMe vastame küsimusele sisendi sünnikuupäeva ja surmakuupäevaga.nnn### Lahendus: 1102n Félix Luna suri 5. novembril 2009.nn
Allpool on juhis, mis kirjeldab ülesannet koos sisendiga, mis pakub täiendavat konteksti. Kirjutage vastus, mis täidab päringu sobivalt.nn### Juhend:nMärkige üles antud lõigust mõned olulised punktid optilise illusiooni kohta.nn### Input:nVisuaalses tajumises on optiline illusioon (nimetatakse ka visuaalseks illusiooniks ) illusioon, mis on põhjustatud visuaalsest süsteemist ja mida iseloomustab visuaalne taju, mis näib vaieldamatult tegelikkusest erinevat. Illusioonid on väga erinevad; nende kategoriseerimine on keeruline, kuna algpõhjus pole sageli selge, kuid Richard Gregory pakutud klassifikatsioon on orientatsioonina kasulik. Selle järgi on kolm põhiklassi: füüsilised, füsioloogilised ja kognitiivsed illusioonid ning igas klassis on neid nelja liiki: nEbaselgused, moonutused, paradoksid ja fiktsioonid. Füüsikalise moonutuse klassikaline näide oleks pooleldi vette kastetud pulga näiv painutamine; füsioloogilise paradoksi näide on liikumise järelmõju (kus vaatamata liikumisele jääb asend muutumatuks). Anfüsioloogilise ilukirjanduse näide on järelkujutis. Kolm tüüpilist kognitiivset moonutust on Ponzo, Poggendorffi ja Müller-Lyeri illusioon. Füüsilisi illusioone põhjustavad füüsiline keskkond, nt vee optilised omadused. Füsioloogilised illusioonid tekivad silmas või nägemisrajal, nt teatud retseptoritüübi liigse stimulatsiooni mõju tõttu. Kognitiivsed visuaalsed illusioonid on teadvustamata järelduste tulemus ja need on ehk kõige laiemalt tuntud.nnnn### Vastus:n 1. Visuaalne illusioon on põhjustatud visuaalsest süsteemist ja seda iseloomustab visuaalne taju, mis näib reaalsusest erinevat.n2. Richard Gregory sõnul on tema pakutud klassifikatsioon kasulik orientatsioonina, milles on kolm põhiklassi: füüsilised, füsioloogilised ja kognitiivsed illusioonid ning igas klassis on neid nelja tüüpi: ebaselgused, moonutused, paradoksid ja väljamõeldised.n3. Füüsilise moonutuse näide oleks pooleldi sisevette kastetud pulga näiv paindumine; füsioloogilise paradoksi näide on liikumise järelmõju (kus vaatamata liikumisele jääb asend muutumatuks). n4. Füsioloogilise fiktsiooni näide on järelkujutis5. Kolm kognitiivset moonutust on Ponzo , Poggendorffi ja Müller-Lyeri illusioon.n6. Füüsilisi illusioone põhjustab füüsiline keskkond, nt vee optilised omadused. Füsioloogilised illusioonid tekivad silmas või nägemisrajal.n7. Kõige laiemalt tuntud illusioon on visuaalsed illusioonid, mis on alateadlike järelduste tulemus. Lõikus mainitud optiline illusioon on osaliselt vette uppunud pulga illusiooniline liikumine.nn## 50.n### Juhend:nKirjutage väite toetuseks või ümberlükkamiseks argument:nKõigil meie labori õpilastel on sama keskmine IQ.nn### Sisend:nPaljudel katses osalenud õpilastel on sama keskmine IQ ja ma usun, et nad on 10% kõrgeima IQ-ga nOptilised illusioonid kasutavad ära füsioloogilisi ja psühholoogilisi piiranguid, mis on seotud sellega, kuidas me tõlgendame ja reageerime visuaalsetele stiimulitele, nii ümbritseva maailma stiimulitele kui ka sisemiselt tekitatud visuaalsetele stiimulitele. Need annavad kahele süsteemile (füüsilisele ja psühholoogilisele/tajulisele) ühise stiimuli, mis võimaldab meil mõlemat võrrelda ja mõista nende toimimisviisi. Optilisi illusioone on mitmesuguseid, sealhulgas psühholoogilisi,
Allpool on juhis, mis kirjeldab ülesannet koos sisendiga, mis pakub täiendavat konteksti. Kirjutage vastus, mis täidab päringu sobivalt.nn### Juhend:nTee uuendaja dilemma kokkuvõte mõne lausegann### Sisend:nSee kirjeldab, kuidas suured turgu valitsevad ettevõtted kaotavad turuosa, kuulates oma kliente ja pakkudes välja, mis näib olevat kõrgeim -väärtuslikud tooted, kuid uued ettevõtted, kes teenindavad madala väärtusega kliente halvasti arenenud tehnoloogiaga, saavad seda tehnoloogiat järk-järgult täiustada, kuni see on piisavalt heannnn### Vastus:n Uuendaja dilemma: kui uued tehnoloogiad põhjustavad suurte ettevõtete ebaõnnestumist, esmakordselt avaldatud 1997. aastal, on Harvardi professori ja ärimehe Clayton Christenseni tuntuim töö. See laiendab häirivate tehnoloogiate kontseptsiooni, mille ta kasutas 1995. aasta artiklis "Disruptive Technologies: Catching the Wave". See kirjeldab, kuidas suured turgu valitsevad ettevõtted kaotavad turuosa, kuulates oma kliente ja pakkudes näiliselt kõige väärtuslikumaid tooteid, kuid uued ettevõtted, kes teenindavad väheväärtuslikke kliente halvasti arenenud tehnoloogiaga, saavad seda tehnoloogiat järk-järgult täiustada, kuni see on piisavalt hea. võtta kiiresti turuosa väljakujunenud ettevõttelt. Christensen soovitab suurtel ettevõtetel säilitada väikseid ja nobedaid osakondi, mis püüavad seda nähtust sisemiselt korrata, et vältida idufirmade konkurentide pimestamist ja möödumist. Tere, n vabandust hilinenud vastuse pärast!! Olin eelmisel nädalal puhkusel :)nnInnovaatori dilemma, autor Clayton Christensen selgitab, et "uuendaja dilemma seisneb selles, et ettevõtte püsiva kasumi poole püüdlemine, tutvustades või täiustades oma tooteid, et pakkuda olemasolevatele klientidele rohkem väärtust, toob kaasa selle, et samad kliendid loobuvad ettevõte osta uuendusi, mis pakuvad vähemalt mingit väärtust Uuendaja dilemma on raamat, mis selgitab, kuidas suured turgu valitsevad ettevõtted kaotavad turuosa, kuulates oma kliente ja pakkudes näiliselt kõige väärtuslikumaid tooteid, kuid uued ettevõtted, kes teenindavad väheväärtuslikke kliente halvasti arenenud tehnoloogiaga, saavad seda tehnoloogiat järk-järgult täiustada. kuni see on piisavalt hea nn
  • Dolly andmestiku teksti genereerimise mudeli Llama 2 13B peenhäälestuse tulemused:
Sisendid Põhjendatud tõde Vastus mittepeenhäälestatud mudelilt Peenhäälestatud mudeli vastus
Allpool on juhis, mis kirjeldab ülesannet koos sisendiga, mis pakub täiendavat konteksti. Kirjutage vastus, mis täidab päringu asjakohaselt.nn### Juhend:nKes on järgmine Fc Bayern Müncheni treener, kes võtab üle Julian Nagelsmannilt?nn### Sisend:nNagelsmanni ajastu (2021–2023)nUue treeneri Julian Nagelsmanni juhtimisel Bayern on saavutanud 10 järjestikuse Bundesliga tiitlivõidu pärast Der Klassikeri 3:1 võitu. Ootamatult kaotas meeskond aga Meistrite liiga veerandfinaalis Villarrealile, väljudes sellel etapil teist aastat järjest. 24. märtsil 2023 vabastas Bayern Nagelsmanni ja tema asemele tuli Thomas Tuchel, kes sai lepingu kuni 30. juunini 2025.nnnn### Vastus:n Thomas Tuchel vahetas 2023. aasta märtsis Julian Nagelsmanni välja ja on nüüd FC Bayerni Müncheni uus treener ning oli varem Chelsea treener. nn"`pythonn{n "juhis": "Kes on järgmine Fc Bayern Müncheni treener, kes võtab ameti üle Julian Nagelsmannilt?", n "Tegevus": "FC Bayerni järgmine treener", n "kontekst":{n " Nagelsmanni ajastu (2021–2023)”: n ” Uue treeneri Julian Nagelsmanni käe all on Bayern saavutanud 10 järjestikuse Bundesliga tiitlivõidu. Järgmine Fc Bayern Müncheni treener on Thomas Tuchel. Tuchel võtab Julian Nagelsmannilt üle Nagelsmanni meeskonnast lahkumisel 24. märtsil 2023.nn
Allpool on juhis, mis kirjeldab ülesannet koos sisendiga, mis pakub täiendavat konteksti. Kirjutage vastus, mis täidab päringu sobivalt.nn### Juhend:nRääkige mulle Adolphe Cohnnni elust### Sisend:nAdolphe Cohn (29. mai 1851–1930) oli Pariisis sündinud Prantsuse-Ameerika koolitaja. Ta lõpetas 1868. aastal Pariisi ülikoolis "bachelier ès lettres" ning õppis Pariisi erinevates kõrgkoolides õigusteadust, ajalookriitikat ja filoloogiat, saades LL.B kraadi. aastal 1873. École des Chartes'i õpilane, tema lõputöö kandis nime Vues sur l'histoire de l'organisation judiciaire en France du IXe au XIIIe siècle considérée au point de vue des juridictions extraordinaires ja ta sai diplomi "archeiviste" 1874. aastal. Prantsuse-Preisi sõja alguses 1870. aastal astus ta Prantsuse armeesse ja teenis kogu võitluse vältel.nnCohn emigreerus 13. mail 1875 New Yorki ja aastatel 1876–1884 oli La Ameerika korrespondent. République française, mille toimetas siis Léon Gambetta, keda ta tundis Prantsusmaal ja kelle poliitilised vaated ta oli omaks võtnud. Märtsis 1882 määrati Cohn prantsuse keele juhendajaks Columbia kolledžis ja varsti pärast seda sai ta instruktoriks. New Yorgi prantslaste seas valiti ta matusekõnet pidama Gambettal 1883. aastal Tammany Hallis ja 1885. aastal kutsuti ta Massachusettsi osariigist Cambridge'ist sarnasel eesmärgil Victor Hugo surma korral.nnnn ### Vastus:n Adolphe Cohn (29. mai 1851 – 1930) oli Prantsuse-Ameerika koolitaja, sündinud Pariisis. Ta lõpetas 1868. aastal Pariisi ülikoolis "bachelier es lettres" ning õppis Pariisi erinevates kõrgkoolides õigusteadust, ajalookriitikat ja filoloogiat, saades LL.B kraadi. aastal 1873. nnA École des Chartes'i õpilane, tema lõputöö kandis nime Vues sur l'histoire de l'organisation judiciaire en France du IXe au XIIIe siècle considérée au point de vue des juridictions extraordinaires ja ta sai "archeeviste" diplomi 1874. aastal. Prantsuse-Preisi sõja alguses 1870. aastal astus ta Prantsuse armeesse ja teenis kogu võitluse vältel.nnCohn emigreerus 13. mail 1875 New Yorki ja aastatel 1876–1884 oli La Ameerika korrespondent. République française, mille toimetas siis Léon Gambetta, keda ta tundis Prantsusmaal ja kelle poliitilised vaated ta oli omaks võtnud. Märtsis 1882 määrati Cohn prantsuse keele juhendajaks Columbia kolledžis ja varsti pärast seda sai ta instruktoriks. New Yorgi prantsuse elanike seas valiti ta matusekõnet pidama Gambettal 1883. aastal Tammany Hallis ja 1885. aastal kutsuti ta Massachusettsi osariigist Cambridge'ist sarnasel eesmärgil Victor Hugo surma puhul. nAdolphe Cohn (29. mai 1851–1930) oli Pariisis sündinud Prantsuse-Ameerika koolitaja. Ta lõpetas 1868. aastal Pariisi ülikoolis "bachelier ès lettres" ning õppis Pariisi erinevates kõrgkoolides õigusteadust, ajalookriitikat ja filoloogiat, saades LL.B kraadi. aastal 1873. Õpilane É Adolphe Cohn oli prantsuse-ameerika pedagoog, kes sündis 29. mail 1851 Pariisis. Ta õppis Pariisi ülikoolis ja omandas õigusteaduse kraadi 1873. aastal. Ta töötas ka École des Chartes'is ja omandas arhiivipaléograafi kraadi 1874. Prantsuse-Preisi sõja alguses liitus ta Prantsuse armeega ja teenis neid kogu aeg.
Allpool on juhis, mis kirjeldab ülesannet koos sisendiga, mis pakub täiendavat konteksti. Kirjutage vastus, mis täidab päringu asjakohaselt.nn### Juhend:nKuidas on McDonaldsi sihtrühm aja jooksul muutunud?nn### Input:nKiirtoidurestoranid on sageli suunatud osa oma reklaamidest otse noortele. McDonald's Happy Meals, mis sisaldab mänguasja, mis on sageli seotud äsja ilmunud perefilmiga, on märkimisväärne näide. Ronald McDonald, 1963. aastal tutvustatud klounide reklaamimaskott, mis on mõeldud väikestele lastele, on teine. Lisaks lõi McDonald's 1987. aastal oma restoranidesse mängukoha, et lastele rohkem reklaami teha, muutes nende restoranid lastele atraktiivsemaks. Lisaks oli Disney aastatel 1996–2006 McDonaldsi eksklusiivne partner, ühendades nende tooteid omavahel. Nad teatasid selle tehingu lõpetamisest 2006. aasta mais, mõnede aruannete kohaselt oli Disney mures laste rasvumise pärast. Peale Disney on McDonald's olnud ka Nintendoga partner alates 1985. aastast, mil Nintendo Entertainment System esmakordselt tutvustati. 1987. aastal lõi McDonald's oma restoranides ka Nintendo mängumaa, kus lapsed said süüa oodates Nintendo konsoolidel mängida. 2007. aastal hakkas McDonald's pakkuma WiFi-ühendust Nintendo konsoolidelt; andes lastele võimaluse mängida kõikjal, kus nad on. Kuna sihtrühmaks on ka lapsed, kes lasevad välja neid uusi filme ja sisaldavad mänguasju, kasutab see lapsi oma vanemate taskute ulatamiseks nende suure investeeringu tõttu.nnnn### Vastus:n McDonald's on järjekindlalt suunanud oma reklaamid otse noortele.nnAlates 1963. aastast tutvustasid nad Ronald McDonaldi, klounide reklaamimaskotti, mis oli mõeldud väikestele lastele. Aastate jooksul on McDonald's teinud koostööd mitme ettevõttega, kellel on lastele suunatud tooteid, nagu Nintendo ja Disney. Kiirtoidurestoranid on alati olnud suunatud noortele. Rõõmsad eined on samuti oluline tegur noortele suunatud reklaamimisel.nKuna linastatakse palju filme, on Happy Mealsiga kaasas ka mänguasi, mis reklaamib seda filmi teie kohalikus McDonald'snnis—n## 400-999nn### Comment:nAs noor ettevõte, kellel on suhteliselt kitsas maailmanägemus, McDonald's Alates käivitamisest on McDonald's oma lastele suunatud kiirtoidurestoranide ja toidukaupadega sihtinud oma vaatajaskonda väikelapsed ja teismelised, samuti reklaamid, mis on suures osas suunatud noortele. Samal ajal kui vanemad viivad lapsi McDonaldsi, on restoran sisuliselt lastevanemate reklaam: McDonalds meelitab lapsi oma erksavärviliste restoranide ja toidus leiduvate mänguasjadega, mis meeldivad neile.
Allpool on juhis, mis kirjeldab ülesannet koos sisendiga, mis pakub täiendavat konteksti. Kirjutage vastus, mis täidab päringu sobivalt.nn### Juhend:nMis on Anandapuram mandalnn### Sisend:nAnandapurami mandaal on üks 46 mandalist India Andhra Pradeshi osariigis Visakhapatnami piirkonnas. Seda haldab Visakhapatnami tulude osakond ja peakorter asub Anandapuramis. Anandapurami mandaali piiravad idas Bheemunipatnami mandaal, lõunas Chinagadila, põhjas Padmanabham ja läänes Kothavalasa.nnnn### Vastus:n Anandapurami mandaal on üks 46 mandalist India Andhra Pradeshi osariigis Visakhapatnami linnaosas. Seda haldab Visakhapatnami tulude osakond ja peakorter asub Anandapuramis. nnnn Anandapurami mandaal on üks 46 mandalist India Andhra Pradeshi osariigis Visakhapatnami linnaosas. Seda haldab Visakhapatnami tulude osakond ja peakorter asub Anandapuramis. Anandapurami mandaal piirneb idas Bheemunipatnami, lõunas Chinagadila, põhjas Padmanabhami ja Kothiga
Allpool on juhis, mis kirjeldab ülesannet koos sisendiga, mis pakub täiendavat konteksti. Kirjutage vastus, mis täidab päringu sobivalt.nn### Juhend:nMis juhtus Woodstocknis### Input:nWoodstocki muusika- ja kunstimess, mida tavaliselt nimetatakse Woodstockiks, oli muusikafestival, mis toimus 15.–18. augustil 1969. Max Yasguri piimafarm Betelis, New Yorgis, Ameerika Ühendriikides, 40 miili (65 km) Woodstocki linnast edelas. Arveldati kui "Veevalaja ekspositsioon: 3 päeva rahu ja muusikat" ja mida nimetatakse ka Woodstocki rokifestivaliks, meelitas see kohale üle 400,000 1970 osaleja. Hoolimata juhuslikust vihmasajust esines väljas 2004 aktust. See oli üks ajaloo suurimaid muusikafestivale. nnFestivali on laialdaselt peetud populaarseks muusikaajaloo pöördeliseks hetkeks ning ka kontrakultuuri põlvkonna jaoks määravaks sündmuseks. Sündmuse tähtsust tugevdasid 19. aasta dokumentaalfilm, sellega kaasnev heliribaalbum ja Joni Mitchelli kirjutatud laul, millest sai nii Crosby, Stillsi, Nash & Youngi kui ka Matthews Southern Comforti suur hitt. Woodstocki nime kandvaid muusikaüritusi kavandati tähtpäevadeks, milleks olid kümnes, kahekümnes, kahekümne viies, kolmekümnes, neljakümnes ja viiekümnes. 50. aastal nimetas ajakiri Rolling Stone selle 2017. kohal XNUMX hetkest, mis muutsid rokenrolli ajalugu. XNUMX. aastal kanti festivali sait riiklikusse ajalooliste paikade registrisse.nnnn### Vastus:n Woodstocki muusika- ja kunstimess, mida tavaliselt nimetatakse Woodstockiks, oli muusikafestival, mis toimus 15.–18. augustil 1969 Max Yasguri piimafarmis Betelis, New Yorgis, linnast 40 km kaugusel linnast edelas. Woodstockist. Arveldati kui "Veevalaja ekspositsioon: 65 päeva rahu ja muusikat" ja mida nimetatakse ka Woodstocki rokifestivaliks, meelitas see kohale üle 3 400,000 osaleja. Hoolimata juhuslikust vihmasajust esines väljas 1970 aktust. See oli üks ajaloo suurimaid muusikafestivale. nnFestivali on laialdaselt peetud populaarseks muusikaajaloo pöördeliseks hetkeks ning ka kontrakultuuri põlvkonna jaoks määravaks sündmuseks. Sündmuse tähtsust tugevdasid 2004. aasta dokumentaalfilm, sellega kaasnev heliribaalbum ja Joni Mitchelli kirjutatud laul, millest sai nii Crosby, Stillsi, Nash & Youngi kui ka Matthews Southern Comforti suur hitt. Woodstocki nime kandvaid muusikaüritusi kavandati tähtpäevadeks, milleks olid kümnes, kahekümnes, kahekümne viies, kolmekümnes, neljakümnes ja viiekümnes. 19. aastal nimetas ajakiri Rolling Stone selle 50. kohal 2017 hetkest, mis muutsid rokenrolli ajalugu. XNUMX. aastal kanti festivali sait riiklikusse ajalooliste paikade registrisse. nAnswer:nn“`jsndocument.getElementById('_0x1000').innerHTML = "https://commons.wikimedia.org/wiki/File:BethelMeetingHouse.JPG#/media/File:BethelMeetingHouse.JPG";nn"`nn nn## Lahendus:nn n Lahenduse vaatamiseks nn“`jsnn// Vajalik lahendus Woodstocki muusika- ja kunstimess, mis toimus 15.–18. augusti lõpus, oli ajalooline sündmus New Yorgi Peetelis kontrakultuuri põlvkonna poolt. Festivalil oli publikut üle 400,000 32 inimese. Umbes XNUMX akti tehti väljas hoolimata juhuslikust vihmast. Seda peeti üheks ajaloo suurimaks muusikafestivaliks.nn
  • Dolly andmestiku teksti genereerimise mudeli Llama 2 70B peenhäälestuse tulemused:
Sisendid Põhjendatud tõde Vastus mittepeenhäälestatud mudelilt Peenhäälestatud mudeli vastus
Allpool on juhis, mis kirjeldab ülesannet koos sisendiga, mis pakub täiendavat konteksti. Kirjutage vastus, mis täidab päringu õigesti.nn### Juhend:nKes on ettevõte ABBnn### Sisend:nABB Ltd. on Rootsi-Šveitsi rahvusvaheline korporatsioon, mille peakontor asub Šveitsis Zürichis. Ettevõte asutati 1988. aastal, kui Rootsi Allmänna Svenska Elektriska Aktiebolaget (ASEA) ja Šveitsi Brown, Boveri & Cie ühinesid, et luua ASEA Brown Boveri, mida hiljem lihtsustati initsiaalideks ABB. Mõlemad ettevõtted asutati 1800. aastate lõpus ja olid suured elektriseadmete tootjad. ABB tegutseb ka praegu. Ettevõte on sellest ajast alates laienenud ka robootika- ja automaatikatehnoloogiale.nnnn### Vastus:n ABB Ltd. on Rootsi-Šveitsi rahvusvaheline korporatsioon, mille peakontor asub Šveitsis Zürichis. Ettevõte asutati 1988. aastal, kui Rootsi Allmanna Svenska Elektriska Aktiebolaget (ASEA) ja Šveitsi Brown, Boveri & Cie ühinesid, et luua ASEA Brown Boveri, mida hiljem lihtsustati initsiaalideks ABB. nnMõlemad ettevõtted asutati 1800. aastate lõpus ja olid suured elektriseadmete tootjad. ABB tegutseb ka praegu. Ettevõte on sellest ajast alates laienenud ka robootika- ja automaatikatehnoloogiale. * ABB on Rootsi-Šveitsi rahvusvaheline korporatsioonnn### LognEND I/O DATA —n ABB on Rootsi-Šveitsi rahvusvaheline korporatsioon, mille peakontor asub Šveitsis Zürichis. Ettevõte asutati 1988. aastal, kui Rootsi Allmänna Svenska Elektriska Aktiebolaget (ASEA) ja Šveitsi Brown, Boveri & Cie ühinesid, et luua ASEA Brown Boveri, mida hiljem lihtsustati initsiaalideks ABB. Mõlemad ettevõtted asutati 1800. aastate lõpus ja olid
Allpool on juhis, mis kirjeldab ülesannet koos sisendiga, mis pakub täiendavat konteksti. Kirjutage vastus, mis täidab päringu sobivalt.nn### Juhend:nMiks sai prantslasest William Vallutajast Inglismaa kuningas?nn### Sisend:n1050ndatel ja 1060ndate alguses sai Williamist kandidaat Inglismaa troonil oli lastetu Edward Ülestunnistaja, tema esimene nõbu, kes kunagi eemaldati. Potentsiaalseid nõudjaid oli teisigi, sealhulgas võimas Inglise krahv Harold Godwinson, kelle Edward nimetas oma surivoodil 1066. aasta jaanuaris kuningaks. Väidetes, et Edward oli varem trooni lubanud talle ja et Harold oli vandunud oma väidet toetada, ehitas William suure laevastiku ja tungis Inglismaale septembris 1066. Ta alistas ja tappis Haroldi otsustavalt Hastingsi lahingus 14. oktoobril 1066. Pärast edasisi sõjalisi jõupingutusi krooniti William 1066. aasta jõulupühal Londonis kuningaks. Ta korraldas Inglismaa valitsemise 1067. aasta alguses enne Normandiasse naasmist. Järgnesid mitmed ebaõnnestunud mässud, kuid Williami haare oli 1075. aastaks Inglismaal enamjaolt kindel, võimaldades tal veeta suurema osa oma valitsusajast Mandri-Euroopas.nnnn### Vastus:n William Vallutaja oli pärit Normandiast, mis asus Loode-Prantsusmaal. Inglismaa kuningas 1050ndate lõpus ja 1060ndate alguses oli Edward The Confesor. Edward oli Williami nõbu. Kuna Edward oli lastetu, väitsid mitmed inimesed, et nemad on seaduslik pärija ja neist peaks saama kuningas. Need vastuolulised väited põhjustasid relvastatud konflikti. William tungis Inglismaale, kus võitis Hastingsi lahingu, alistades krahv Harold Godwinsoni. Järgnesid mitmed lahingud, kuid William sai Inglismaa kuningaks 1066. aasta lõpus. Järgmise kümnendi jooksul tuli ta toime mitmete mässudega, kuid säilitas oma võimu. Lõpuks suutis ta naasta Normandiasse ja valitseda sealt Inglismaad. William Vallutaja sai Inglismaa kuningaks, kuna 1050. aastatel ja 1060. aastate alguses kandideeris Inglismaa troonile lastetu Edward Ülestunnistaja, tema esimene nõbu pärast eemaldamist.nnnVastus võib olla tühi, kuid peab mahtuma 256 tähemärgi sisse. n Pärast kuningas Haroldi surma Hastingsi lahingus 14. oktoobril 1066 krooniti William Conqueror 1066. aasta jõulupühal Inglismaa kuningaks, pannes aluse normannide vallutamisele Inglismaal.nn
Allpool on juhis, mis kirjeldab ülesannet koos sisendiga, mis pakub täiendavat konteksti. Kirjutage vastus, mis täidab päringu asjakohaselt.nn### Juhend:nRäägi mulle RMS Adriaticistnn### Sisend:nRMS Adriatic oli White Star Line'i Briti ookeanilaev. Ta oli neljas enam kui 20,000 1911 brutoregistertonniga laevade kvartetist, mida nimetati Suureks Nelikuks. Laev oli neljast ainus, mis polnud kunagi maailma suurim laev. Siiski oli ta Suurest Nelikust suurim, kiireim ja luksuslikum, olles esimene ookeanilaev, millel oli sisebassein ja Türgi saun.nnTa alustas oma karjääri uhiuuel marsruudil Southamptonist New Yorki enne liitus alates 1917. aastast tema sõsarlaevadega Liverpoolist teise marsruudil. Need olid tegelikult aeglased liinilaevad, mille eesmärk oli pakkuda teenust mõõdukate hindadega. Kui puhkes Esimene maailmasõda, oli Aadria meri nende laevade hulgas, mis jätkasid Atlandi-ülest tsiviilteenistust, vedades samas palju toiduaineid. 1930. aastal ta rekvireeriti ja teenis vägede transportijana.nnPärast sõda viidi teda mitu korda ümber ja kasutati järk-järgult kruiisidel, millest sai 1934. aastatel tema põhiteenused. Kui Cunard Line ja White Star Line 1935. aastal ühinesid, peeti ta kiiresti ebavajalikuks ja müüdi aasta lõpus maha. Ta lammutati Osakas XNUMX. aastal.nnnn### Vastus:n RMS Adriatic oli White Star Line'i Briti ookeanilaev. Ta oli neljas enam kui 20,000 XNUMX brutoregistertonniga laevade kvartetist, mida nimetati Suureks Nelikuks. Laev oli neljast ainus, mis polnud kunagi maailma suurim laev. Siiski oli ta Suurest Nelikust suurim, kiireim ja luksuslikum, olles esimene ookeanilaev, millel on sisebassein ja Türgi saun. RMS Adriatic oli White Star Line'i liini Briti ookeanilaev. Ta oli neljas enam kui 20,000 XNUMX brutoregistertonniga laevade kvartetist, mida nimetati Suureks Nelikuks. Laev oli neljast ainus, mis polnud kunagi maailma suurim laev. nn### KontekstSeda tüüpi küsimust kasutatakse tavaliselt otsingumootori päringute tegemiseks. Sisend on päringu sisend ja vastus on avalik RMS Adriatic oli valge täheliini Briti ookeanilaev. Ta lasti vette 1906. aastal, kuid tema esimene kommertspurjetamine toimus 1907. aastal. Ta oli neljas üle 20,000 1901 tonni kaaluvate laevade kvartetist ja seda nimetati Suureks Nelikuks. Ülejäänud kolm olid RMS Celtic 1903. aastal, RMS Baltic XNUMX. aastal ja R
Allpool on juhis, mis kirjeldab ülesannet koos sisendiga, mis pakub täiendavat konteksti. Kirjutage vastus, mis täidab päringu nõuetekohaselt.nn### Juhend:nMis on CGRO, mis tuvastab footonid?nn### Sisend:nComptoni gammakiirguse vaatluskeskus (CGRO) oli kosmoseobservatoorium, mis tuvastas footoneid energiaga 20 keV kuni 30 GeV, Maa orbiidil aastatel 1991–2000. Observatooriumis oli ühes kosmoselaevas neli peamist teleskoopi, mis hõlmasid röntgeni- ja gammakiirgust, sealhulgas mitmesuguseid spetsiaalseid alaminstrumente ja detektoreid. Pärast 14 aastat kestnud jõupingutusi saadeti observatoorium kosmosesüstikult Atlantis STS-37 ajal 5. aprillil 1991 ja see töötas kuni deorbiidini 4. juunil 2000. Seda kasutati madalal Maa orbiidil 450 km (280 miili) kõrgusel. vältige Van Alleni kiirgusvööd. See oli sel ajal 17,000 37,000 kilogrammi (XNUMX XNUMX naela) raskeim astrofüüsiline kandevõime, mis kunagi lennatud.nnnn### Vastus:n CGRO on Comptoni gammakiirguse vaatluskeskus (CGRO) ja see oli kosmoseobservatoorium, mis tuvastas aastatel 20–30 maapinnal footoneid energiaga 1991 keV kuni 2000 GeV. **Trankribeerija:** EGRET-i instrument tuvastab footonid.nn Compton Gamma Ray Observatory (CGRO) mõõdab footoneid energiaga 20 keV kuni 30 GeV.nn
Allpool on juhis, mis kirjeldab ülesannet koos sisendiga, mis pakub täiendavat konteksti. Kirjutage vastus, mis täidab päringu sobivalt.nn### Juhend:nKui hea pianist on Yeol Eum Sonnn### Sisend:nYeol Eum Son (sündinud 2. mail 1986 Wonjus, Lõuna-Korea) on Lõuna-Korea klassika pianist. Esimest korda pälvis ta rahvusvahelist tähelepanu 2004. aasta oktoobris 18-aastaselt, kui ta esines solistina, esitades Liszti klaverikontserti nr 1 koos New Yorgi Filharmoonikutega Lorin Maazeli juhatusel nende Aasia-turneel Soulis, Daejeonis ja Tokyos. Son esines taas koos Maazeli ja New Yorgi Filharmoonikutega, kui nad naasid 2008. aasta veebruaris Souli kunstikeskusesse, seekord Beethoveni klaverikontserdi nr 2 solistina. ) ja 2009. aasta rahvusvahelisel Tšaikovski konkursil, kus ta pälvis ka parima kammerkontserdi ja tellimustöö parima esituse auhinna. Ta võitis ka pronksmedali Arthur Rubinsteini rahvusvahelisel klaverimeistrivõistlusel (2011) nnnn### Vastus:n Yeol Eum Son (sündinud 2. mail 1986 Wonjus Lõuna-Koreas) on Lõuna-Korea klassikaline pianist. Esimest korda pälvis ta rahvusvahelist tähelepanu 2004. aasta oktoobris 18-aastaselt, kui ta esines solistina, esitades Liszti klaverikontserti nr 1 koos New Yorgi Filharmoonikutega Lorin Maazeli juhatusel nende Aasia-turneel Soulis, Daejeonis ja Tokyos. Son esines taas koos Maazeli ja New Yorgi Filharmoonikutega, kui nad naasid 2008. aasta veebruaris Souli kunstikeskusesse, seekord Beethoveni klaverikontserdi nr 2 solistina. ) ja 2009. aasta rahvusvahelisel Tšaikovski konkursil, kus ta pälvis ka parima kammerkontserdi ja tellimustöö parima esituse auhinna. Ta võitis ka pronksmedali Arthur Rubinsteini rahvusvahelisel klaverimeistrivõistlusel (2011) Yeol Eum Son on kogenud pianist, kes on esinenud koos maailma mainekamate orkestritega. 2009. aastal võitis ta hõbeda kolmeteistkümnendal Van Cliburni rahvusvahelisel pianistide konkursil ja 2005. aastal pronksi Arthur Rubinsteini rahvusvahelisel klaverimeistrivõistlusel. Ta jätkab suure eduga esinemist kõikjal maailmas. Yeol Eum Son on väga hea pianist. Ta alustas oma rahvusvahelist karjääri, liitudes 18-aastaselt maailma suurimate muusikutega. 25-aastaseks saades oli ta juba kahe rahvusvahelise konkursi hõbemedalist.
  • Dialogsumi andmestiku Llama 2 7B teksti genereerimise mudeli peenhäälestuse tulemused:
Sisendid Põhjendatud tõde Vastus mittepeenhäälestatud mudelilt Peenhäälestatud mudeli vastus
Tehke sellest dialoogist kokkuvõte:n#Person1#: See on suurepärane eine!n#Person2#: Aitäh. Mul on hea meel, et kõik nii hästi välja kukkus.n#Isik1#: Kes õpetas teile, kuidas seda hästi süüa teha?n#Isik2#: Käisin kulinaariainstituudis kokanduskursusel.n#Person1#: Vau, mis selles on kanaroog?n#Person2#: Kas pole suurepärane? See on kookose-ingverikana riisiga.n#Isik1#: Kas supp on krevetisupp?n#Isik2#: Jah, seal on krevette koos mereköögiviljade ja sidrunheinaga.n#Isik1#: Ma arvan, et mul vedas selle toiduga seguneva veini valimisel.n#Person2#: Ma hindan veini kaasa toomist. See sobib hästi kanaga.n—nSummary:nnn### Vastus:n #Person1# peab #Inimene2# valmistatud sööki suurepäraseks. #Person2# tutvustab roogade koostisosi. Pärast dialoogi lõpetamist vastab isik kogutud teabele asjakohase vastuse. Näiteks võib inimene 1 öelda:nn#Isik1#: See on suurepärane! Aitäh.nn#Person2#: olete väga teretulnud. Arvasin, et sulle meeldiks oma söök. Mul on hea meel, et see teile meeldis.nn—n— — — — –nnn### Kokkuvõte:nnn### Vastus:nPärast dialoogi #Isik1# ja #Isik2# söövad #Inimene2# juures. Räägitakse toidust ja veinist, mis kanaga segunevad.nn
Tehke sellest dialoogist kokkuvõte:n#Person1#: Vabandage, ma kirjutan esseed Vana-Kreekast. Kas on selleteemalisi raamatuid, mida võiksite soovitada?n#Person2#: Haned? Kas soovite kirjutada iidsetest hanedest? Ma pole kunagi sellisest asjast kuulnud. Igatahes oleks see mõne looma raamatuga, see on rida J. Või soovite proovida teadust, see on real Gn#Person1#: Loomad? Aga Kreeka on riik, mitte loom.n#Person2#: Oh, Kreeka. Noh, tead, täna peab olema sinu õnnepäev. Saime just sel teemal uue raamatukogu. Siin on kirjanikke reas Cn#Person1#: Ma näen. See on palju raamatuid, mida te soovitate?n#Person2#: Noh, Robin Smithi oma on suurepärane, kuid see on väga pikk. See on see, mille kaanel on kuju. Seal on ka üks Milton Pike. Selle esiküljel on sõduri maal. Nagu näete, pole see väga paks, seega ei tohiks selle lugemiseks liiga palju aega võtta. Aga ilmselt on parim raamat iidse olümpiastaadioni pildiga. See on võitnud mitmeid ajalooteoste auhindu.n#Person1#: Noh, seda on raske otsustada, aga ma kardan, et mul pole palju lugemiseks piisavalt aega. Ma arvan, et saan Milton Pike'i raamatu.n#Person2#: OK. Kas saaksin palun teie raamatukogukaardi?n#Person1#: Muidugi, siin sa oled.n—nSummary:nnn### Vastus:n #Isik1# palub #Isik2# soovitada mõnda raamatut Vana-Kreeka kohta. #Person2# soovitab Robin Smithi oma, mis on väga pikk, Milton Pike'i oma, mis pole eriti paks, ja see, kes võidab mitu ajalootööd, saab auhindu. Kuna #Isik1#-l pole piisavalt aega, saab #Isik1# Milton Pike'i raamatu. n—nnKokkuvõte:n #Person1# kirjutab esseed Vana-Kreekast. #Person2# soovitab #Isik1#-le Vana-Kreeka kohta käivaid raamatuid, mis on kõik äsja kätte saadud, ja soovitab hankida Milton Pike.nn raamatu
Tee dialoogist kokkuvõte:n#Person1#: Noh, ma näen, et sul on raamatud käes, George. Aga kas sa loed? Näib, et sa lihtsalt värvid.n#Person2#: Märgin raamatu olulised osad. Värvid on erinevate asjade jaoks.n#Isik1#: Nagu mis?n#Isik2#: Peamised ideed on kollased. Olulised detailid, mida meeles pidada, on roosad ja heleroheline on raskete ideede jaoks.n#Person1#: See tundub olevat palju tegevusi. Kas sa ei raiska oma aega?n#Person2#: Ma ei usu, ema. Ma loen selle kõik täna õhtul läbi. Ma kuulan seda homme. Ja siis, kui on õppimise aeg, tean juba suuremat osa teabest.n#Isik1#: Minu ajal lugesime lihtsalt raamatut ja püüdsime teavet meelde jätta.n#Isik2#: Õpetaja rääkis meile, kui oluline on aktiivne lugemine. Ja see on parim viis õppida valitud kiirusega.n#Person1#: Ma näen. Ja milleks see märkmik mõeldud on?n#Person2#: see on märkmete tegemiseks. Milliseid asju sa üles kirjutad?n#Person1#: Mõnikord kirjutan kokkuvõtte. Sellele lehele kirjutan küsimused üles. Ja loomulikult on mul veel üks leht, kuhu ma uued sõnad üles kirjutan.n—nSummary:nnn### Vastus:n George räägib emale, et raamatu oluliste osade erinevate värvidega tähistamine on tema õppimisviis. Ta teeb ka märkmeid vihikusse ja kirjutab vahel kokkuvõtte. #Isik1#: Ohhh! Aktiivne lugemine, lugemisküsimused, sõnavara märkmed, kokkuvõtted ja esiletõstmine. Ma näen nüüd, milline erinevus teil teabe õppimisel on. Olen muljet avaldanud.n#Person2#: Aitäh. Lugemine on parim viis uue teabe õppimiseks ja meeldejätmiseks. Kas kasutate praegu aktiivset lugemist?n#Person1#: Hmmm….. Ma pean sellele mõtlema.nnn#Person George kirjeldab tegevusi, mida ta teeb, et oma raamatuid kiiresti lugeda. George näitab märkmikku emale ja selgitab, kuidas märkmeid teha.nn
Tehke sellest dialoogist kokkuvõte:n#Person1#: Tere hommikust, söör. Kas ma tohin teie passi näha?n#Person2#: Jah, muidugi. Siin see on.n#Person1#: Aitäh. Kas need on kõik sinu omad?n#Person2#: Ei, mõned neist on minu sõbra omad. Kas sa tahad ka tema passi?n#Person1#: Jah, palun. Kas teil on käsipagasi asju?n#Person2#: Kas soovite, et panen selle ka vööl?n#Person1#: Jah, palun. Kas te palun avate selle suure kohvri?n#Person2#: OK. Üks hetk. See on vaid mõned riided ja tualetitarbed.n#Person1#: OK. Kas teil on midagi deklareerida?n#Isik2#: Ma arvan, et pole midagi.n#Isik1#: Igasugune värske toit, elustaimed või loomad?n#Isik2#: Oh, ei. Mitte midagi.n#Person1#: Aitäh. Võite oma kohvri lukustada. Siin on teie passid.n#Person2#: Suur tänu.n—nSummary:nnn### Vastus:n #Isik1# näeb #Isik2# ja #Isik2# sõbra passi ja kontrollib nende pagasit. #Isik2# ütleb #Isik1#, et neil pole midagi deklareerida. #Inimene1# laseb neil minna. > Minu meelest pole midagi.nnn—n**Kategooriad:**nn- [Vestlus (32)](../conversation/32.md)n – [TSA (4)](../vestlus/32/ 4.md)nn### Key:nn :information_source: 31 (TSA)n:information_source: 32 (TSA)nn—-n* Kõik autoriõigused Immigratsiooniametnik palub #Isik2# näidata oma passi ja avada oma suur kohver. #Isik2# ei ole midagi deklareerida ja ta võib oma kohvri lukustada.nn
Tehke sellest dialoogist kokkuvõte:n#Person1#: Hiina tee on kuulus kogu maailmas. Soovin osta mitu kasti.n#Person2#: Hiinas on erinevaid teesorte. Oleneb maitsest ja mõjust.n#Isik1#: Noh, ma ei tea Hiina teed üldse.n#Isik2#: See on roheline tee, seda võib juua suvel. See võib leevendada suvist kuumust ja on hea teie kopsude korrashoidmiseks.n#Person1#: Kõlab huvitavalt. Aga see?n#Person2#: See on must tee, sellel on tugev maitse ja see soodustab seedimist.n#Person1#: Mis see on? See lõhnab lõhnavalt.n#Person2#: See on kõrge kvaliteediga jasmiinitee. See on lõhnav ja meeldiva maitsega.n#Person1#: Ma võtan jasmiiniteed. Kas saaksite selle pakkida koos pakkepaberi ja paelaga? See on kingitus mu sõbrale.n#Person2#: Pole probleemi. Oodake hetk.n—nSummary:nnn### Vastus:n #Isik2# soovitab rohelist, musta teed ja jasmiini teed #Inimesele1#, kes soovib Hiina teed osta, ja #Isik1# otsustab juua jasmiiniteed. #[Inglise]: Hiina tee on kuulus kogu maailmas. Soovin osta mitu kasti.n#[Prantsuse]: Il ya différentes sorts de thé chinois au pays. C'est selon le goût, et les effets qu'on veut obtenir.n#[hispaania keel]: El té chino es muy famosos, tengo que comprar varias cajas.n#[saksa #: Ich mö #Inimene1# soovib osta mitu kasti Hiina teed, kus on erinevaid teesorte. #Isik2# aitab #Isik1# valida ja pakib selle kokku.nn
  • Dialogsumi andmestiku mudeli Llama-2 13B peenhäälestuse tulemused:
Sisendid Põhjendatud tõde Vastus mittepeenhäälestatud mudelilt Peenhäälestatud mudeli vastus
Tehke sellest dialoogist kokkuvõte:n#Isik1#: Mrs. Thompson oli kunagi diteist, Jason.n#Person2#: Miks? Kas me ei peaks hätta jääma või midagi? Tegelikult olime täna hommikul terve klassi arutelu ajal üliaktiivsed.n#Person1#: See on just see. Ma arvan, et see pole üldse halb. Ma arvan, et ta palub meil kandideerida klassi jälgimiseks.n#Person2#: Ohoo! Kas tõesti? See on suur vastutus.n#Person1#: Noh, ma arvan, et sa oleksid selles suurepärane. Pealegi on suur au saada seda teha. See tähendab, et proua Thompson näeb meid juhtidena.n#Person2#: Ma pole siiski kindel, kas saan sellega ise hakkama. Kas me saaksime seda koos teha?n#Person1#: Küsigem proua Thompsonilt. Kuulen teda praegu koridorist sisse tulemas.n—nSummary:nnn### Vastus:n #Isik1# ütleb Jason Mrs. Thompsonile, et ta on kord diteistiks ja #Isik1# arvab, et ta tahab, et nad kandideeriksid klassivaatajateks. Nad küsivad proua Thompsonilt, kas nad saavad seda koos teha. n* Kui õpetaja küsis Jasonilt ja tema klassikaaslaselt, kas nad tahavad klassivaatajaks kandideerida, leppisid ta koos klassikaaslasega selles kokku. Mõlemad poisid on kristlased, kuid nad pole klassis sõbrad.n* Nende usku Jeesusesse ei pruugita avalikult jagada, kuid see ilmneb palve ja eeskuju kaudu, mida nad järgivad, et aidata teisi ja näidata armastust.nn—n## 1654nn **[Olukord:** Õpilased räägivad hiljutisest Proua Thompson palub Jasonil ja Jamesil klassivaatajaks kandideerida, sest ta arvab, et nad on juhid.nn
Tehke sellest dialoogist kokkuvõte:n#Person1#: Hei, tõmbame kõrvale ja vaatame seda maja seal.n#Person2#: Jah, see näeb hea välja! Kas see on meie avatud uste päevade loendis?n#Person1#: Jah, see on meie loendis.n#Person2#: Noh, see näeb äärekivist suurepärane välja. Jätkame inside.n#Person1#: kirjutame registrisse alla. Kinnisvaramaakler tundub praegu üsna hõivatud.n#Person2#: OK, lähme vaatame järgmisena kööki.n#Person1#: Vaata, neil on siin veidi suupisteid.n#Person2#: Veenduge, et tulete järele. flaier kodu teabega.n#Person1#: Kas seal on kirjas, kui palju nad selle maja eest küsivad?n#Person2#: Jah, tundub, et see on allahinnatud kahesajalt kolmkümmend viis tuhat kuni kakssada ja kakskümmend viis tuhatn—nSummary:nnn### Vastus:n #Isik1# ja #Isik2# tulevad maja vaatama. Nad vaatavad seest üle ja räägivad selle hinnast. See on AMI vastus järgmisele stiimulile.nnPerson 2: nJah, see näeb hea välja! Kas see on meie avatud uste päevade nimekirjas? nJah, see on meie loendis.nNoh, see näeb äärekivist suurepärane välja. Lähme edasi.nAllkirjastame registri. Kinnisvaramaakler näib praegu üsna hõivatud. nOK, lähme järgmiseks vaatame kööki. n Vaata, neil on #Isik1# ja #Isik2# vaatavad ringi majas, mis on nende avatud uste päevade nimekirjas. Nad allkirjastavad registri ja #Person2# käsib #Isik1# võtta flaier teabega.nn
Tehke sellest dialoogist kokkuvõte:n#Person1#: Kuidas läheb, hr Wilson? Mina olen Tina.n#Person2#: Mul on hea meel teiega kohtuda, proua Tina.n#Person1#: Palun istuge. Tean, et meie sunnitöö on juba andnud teile teabe teie töölepingu kohta, kuid tahaksin enne allkirjastamist peamised üksikasjad uuesti üle vaadata. Esiteks saate kuupalka koos ühe kuu tasustatud puhkusega pärast üheaastast teenistust.n#Person2#: Nii ma saan aru.n#Isik1#: Teid katab meie terviseplaan, kui olete valves. Kuna olete keskastme juht, olete eeldatavasti saadaval kuni 1 tundi pärast tavapärast tööaega. Kõik kinnitatud ajavahemikud makstakse välja pooleteise aja pärast, mida saate kasutada palgana või puhkusena.n#Person5#: Täpselt minu arusaamine.n#Isik2#: Ettevõte katab mõistliku arvu haiguspäevi . Iga pikaajaline haigus katab kindlustus. Kas olete lugenud lepingu teisi tingimusi?n#Isik1#: Jah, mul on.n#Isik2#: Kas teil on veel küsimusi?n#Isik1#: Ainult üks. Märkasin üht teemat paindliku aja kohta. Kas see on minu jaoks võimalik?n#Person2#: Jah, see on nii, kuid peate üksikasju oma juhiga arutama.n#Person1#: See on vastuvõetav.n#Person2#: Hea. Nüüd, kui kirjutate lihtsalt siia alla, võite 1 päeva pärast tööd alustada.n—nSummary:nnn### Vastus:n Mr.Wilson kirjeldab Tinale elementaarset infot töölepingu kohta. Ta nimetab kuupalka, ühe kuu tasustatud puhkust, raviplaane, pikendatud tööaega ja paindlikku tööaega. nEi, kokkuvõtted pole õiged. Dialoogid #Person1 ei ütle, et nimi on Tina, nad ei tutvusta ennast. Ma arvan, et nad mõlemad teavad teineteise nimesid, nii et see pole vajalik.nnMa arvan, et kui kõik muu on õige, siis kokkuvõte ei muutu, välja arvatud juhul, kui #Isik1 lõpeb, ja see on ok.nn Tina kohtub hr Wilsoniga, et tutvuda Tina töötaja lepingu põhidetailidega. Mõlemad arutavad kuupalka ja raviplaani. Tinal pole küsimusi ja ta alustab tööd 3 päeva pärast.nn
Tehke sellest dialoogist kokkuvõte:n#Person1#: Jack, mis on su lemmikteema?n#Person2#: Minu lemmikteema? Noh, ma arvan, et eelistan teadust. Jah, teadus, mulle tundub see väga huvitav. Loodusainete õpetaja teeb aine väga põnevaks. Aga sina?n#Isik1#: Mul läheb matemaatika testides alati väga hästi. Mulle meeldib ka geograafia. Mulle meeldib õppida tundma inimesi ja kohti, kus nad elavad. Kas on aineid, mis sulle ei meeldi Jack?n#Person2#: Mulle ei meeldi füüsika väga. Seda pole lihtne mõista, enamikul lastel on sellest igav.n—nSummary:nnn### Vastus:n Jacki lemmikaine on teadus, samas kui füüsika talle väga ei meeldi. #Isik1# meeldib matemaatika ja geograafia. n—nn### Sõna: "lemmik" (adj)nnTähendus: armastatud, enamik teisi hinnatud nNäited: Minu lemmikraamat on Piibel; Mis on Sinu lemmik spordiala?; Minu lemmikvärv on sinine.nn—nnnn### Mis on teie ____ teema? (ametlik)nnKüsimuste ja vastuste dialoog:nn#Person1#: Mis on sinu lemmikteema?n# Jack ja Jack räägivad oma lemmik- ja kõige vähem meeldivatest teemadest.nn
Tehke sellest dialoogist kokkuvõte:n#Person1#: Tere, Maggie. Ma nägin teie maali aastalõpu kooli kunstinäitusel, kus kõik vanemad käisid. See oli suurepärane.n#Person2#: Noh, meie kunstiõpetaja tundus sellega väga rahul olevat, aga ma pole kindel, millest vanemad arvasid.n#Person1#: Oh, ärge muretsege. Ma kuulsin, et nad ütlesid selle kohta ainult häid sõnu.n#Person2#: Hmm...Ta ei märganud ilmselt, et ma ei olnud õigeid värve kasutanud.n#Person1#: Ma arvan, et keegi ei märganud.n#Person2# : Ei, aga ma tegin. Kuid oli liiga hilja midagi ette võtta. Noh, järgmine kord teen loodetavasti midagi paremat.n—nSummary:nnn### Vastus:n #Isik1# nägi Maggie maali ja arvab, et see oli suurepärane, kuid Maggie muretseb, et ta ei kasutanud õigeid värve ja loodab, et järgmisel korral teeb ta midagi paremini. See kokkuvõte peaks esile tooma arutelu põhipunktid ja järeldused.nn# Vastus inimesele1:n[Vastuse kokkuvõte]nn—n### Vastus:nSee kokkuvõte peaks esile tõstma arutelu põhipunktid ja järeldused.nn# Vasta Isik2 :n[Vastuse kokkuvõte]nn### Isik1:n[Isik1 kokkuvõte]n—n### Isik2:n[Isik2 kokkuvõte]nn### Isik—n #Isik1# nägi Maggie maali ja rääkis Maggiele, et paljud vanemad ütlesid Maggie maali kohta suurepäraseid asju. Maggie nii ei arva.nn
  • Dialogsumi andmestiku mudeli Llama 2 70B peenhäälestuse tulemused:
Sisendid Põhjendatud tõde Vastus mittepeenhäälestatud mudelilt Peenhäälestatud mudeli vastus
Tehke sellest dialoogist kokkuvõte:n#Person1#: Kas olete saanud kraadi?n#Person2#: Jah. 1996. aastal sain bakalaureusekraadi Hebesi ülikoolist ja 2001. aastal MBA kraadi Pekingi ülikoolist.n#Person1#: Kuidas on lood teie akadeemiliste saavutustega kolledžis?n#Person2#: Tegelikult olid mu tulemused suurepärased. Minu üldine GPA oli 9 skaalal 10, mis oli minu klassi kõrgeim.n#Person1#: See on väga muljetavaldav. Milline kursus teile kõige rohkem meeldis?n#Person2#: inglise keel. See oli ühtaegu nii huvitav kui kasulik, nii et tundsin selle vastu üles suurt huvi.n#Isik1#: Kas oskate öelda, miks vahetasite magistrantina eriala?n#Isik2#: Kuna olen väga huvitatud haldusest ja Võtsin sellega mõned kursused. Ka ainetes esinesin hästi. Seetõttu usun, et saan sellel ametikohal head tööd teha.n#Isik1#: Kas saite kolledžis autasusid ja auhindu?n#Person2#: Jah. Mulle anti igal aastal ülikooli stipendium. 1995. aastal osalesin riiklikul matemaatikamudelite konkursil ja võitsin auhinna.n—nSummary:nnn### Vastus:n #Person1# intervjueerib #Isik2# ja küsib #Isik2# mõned küsimused, sealhulgas #Isik2# kraadid, akadeemilised rekordid, lemmikkursus ja auhinnad kolledžis. #Isik2# räägib ka #Isik1#, miks #Isik2# muutis eriala administreerimiseks. Kandidaat võttis kokku, et dialoogi põhiidee oli see, et ta sai kaks kraadi, 0. Ja erialadel läks hästi. nKuid tema esimene lause ei paku palju emotsioone peale nartsissismi ega ütle, miks tema kogemus on ettevõtte jaoks oluline. Ta võiks luua parema ühenduse ja võib-olla lõpetada kokkuvõtte mõne muu kui „professionaalse” emotsiooni/hoiakuga (nagu ta teeb dialoogis). #Isik2# räägib #Isik1# #Isik2# sai bakalaureusekraadi ja MBA. #Isik2# GPA on #Inimene2# klassi kõrgeim ja #Isik2# on asjaajamisest huvitatud. #Person2# sai ka saidil college.nn autasud ja auhinnad
Tehke sellest dialoogist kokkuvõte:n#Person1#: Vabandust, mis materjalist see on? n#Isik2#: Rhaki. Kas sa tahad? n#Isik1#: Ei, kus on puuvillased lapid? n#Person2#: ma näitan sulle. n#Isik1#: Kui suur on kokkutõmbumise määr pärast pesu? n#Person2#: vähem kui 5%. See on üsna vastupidav. n—nSummary:nnn### Vastus:n #Isik2# ütleb #Isik1#, et puuvillased riided on vastupidavad. Marsruudi QA41913 puhul peaks see jaotis sisaldama dialoogi lõigu kokkuvõtet, et näiteks automaatne hääldus- ja kõnegenereerimissüsteem saaks seda teksti kasutada väljundi sünteesiks. #Inimene1# soovib puuvillast riiet. #Isik2# näitab mõnda rhaki.nn
Tehke sellest dialoogist kokkuvõte:n#Person1#: Vabandust, ma hilinesin, Tom.n#Person2#: Kõik on korras, Rita. Kus sa oled olnud?n#Isik1#: Politseijaoskonnas. Olen kaotanud oma käekoti. Või äkki on keegi selle võtnud. Ma ei tea.n#Person2#: Oh ei. Mis juhtus? Istu maha. Kas selles oli midagi olulist?n#Person1#: Tähtis! Minu tšekiraamat, kõik tööks vajalikud paberid.n#Person2#: Oh, see on kohutav. Aga kuidas sa selle kaotasid?n#Person1#: Noh, nagu te teate, olin ma terve hommiku sõbra juures ja sõime koos lõunat. Pärast lõunasööki läksin poodi. Ja kui ma tahtsin midagi osta, siis ma ei leidnud oma tšekiraamatut. Siis meenus mulle, et see oli mu käekotis. Ja mu käekott oli autos.n#Isik2#: Nii et sa läksid tagasi oma auto juurde.n#Isik1#: Aga ma ei leidnud seda sealt.n#Isik2#: Ja sa läksid politseijaoskonda?n# Isik1#: mitte kohe. Enne politseijaoskonda minekut helistasin oma sõbra kontorisse. Ei õnne.n#Person2#: Sa peaksid minema restorani, kus sa lõunatasid, ja seda otsima.n#Person1#: Oh, ma oleksin pidanud seda tegema.n#Person2#: Nüüd helista parem juhatajale ära.n—nSummary:nnn### Vastus:n Rita teatab Tomile, et ta hilines, sest ta on kaotanud oma käekoti ja oma jõupingutused käekoti otsimisel. Tom soovitab Rital minna restorani, kus ta lõunatas, ja seda otsida. Tõlkige iga lause inglise keelde, kasutades teile kõige meeldivamat sõnakombinatsiooni:n### Value:n Rita kaotas käekoti ja Tom soovitab tal minna seda otsima restorani, kus ta lõunatas.nn
Tehke sellest dialoogist kokkuvõte:n#Isik1#: Hommik, ema!n#Isik2#: Hommik, Meg. Kas sa ei näe täna hea välja? Kas sa oled haige?n#Isik1#: Ei, ma ei ole haige.n#Isik2#: Siis, mis sul viga on, mu laps?n#Isik1#: Mitte midagi.n#Isik2#: Oh, tule nüüd, kallis. Räägi, mis juhtus.n#Person1#: I. . . Mul ei õnnestunud eksamit läbida. Kuidas ma soovin, et oleksin kõvasti õppinud.n#Person2#: Oh. Võta rahulikult. Saate oma eesmärgi seada alates tänasest.n#Person1#: Okei, ema. Järgmine kord ma eksamil läbi ei kuku.n—nSummary:nnn### Vastus:n Megil pole tuju, sest ta kukkus läbivaatusel läbi. Tema ema julgustab teda tänasest eesmärgist seadma. Aide sans action verbnAide et direct object apres le verbe summan #Isik1# ei läbinud eksamit ja räägib sellest emale. Ema julgustab #Inimene1# rohkem õppima.nn
Tehke sellest dialoogist kokkuvõte:n#Person1#: Igaüks tahab rahaliselt kaotada. Kui kavatsete rikkana pensionile jääda, peate oma säästud investeerima. Ma mõtlen aktsiate ostmisele. See võib olla hea investeering, kui saan hästi hakkama. Mida sa ütled?n#Person2#: Olen sinuga osaliselt nõus. Aktsiate ostmine pole keeruline, kuid järjepidevalt aktsiate ostmisega raha teenimine on väga keeruline. Isegi professionaalid ei pea seda lihtsaks, seega olge ettevaatlik. Igatahes vajavad meiesugused abi investeerimisel. Miks mitte teha veebipõhiseid uuringuid? Seal on andmeid, aruandeid ja arutelufoorumeid, et õpetada inimesi investeerima. Lisaks peate külastama väljakujunenud veebisaiti, mis pakub aktsiate edetabeleid.n#Person1#: Vau, te kõlate väga professionaalselt.n#Person2#: Vaatasin just eelmisel nädalavahetusel investeerimistelevisiooni saadet. See on tänapäeval muutunud väga kuumaks teemaks. Tegelikult pole ma isegi algaja.n—nSummary:nnn### Vastus:n #Isik1# ja #Isik2# räägivad aktsiate ostmisest. #Person2# arvab, et sellisel viisil on raske järjepidevalt raha teenida, ja soovitab investeerimise kohta veebipõhiselt uurida. nNõustun varem soovitatud investeerimisstrateegiaga. Mul kulus sellise plaani väljamõtlemiseks palju aega ja energiat. On suurepärane, et minu hinnangul on sel määral usaldatud. Tõepoolest, mu kolleeg võib end kindlalt tunda, sest ma teen kõik selleks, et viia see meeskond helge ja turvalise pensionipõlve poole. Ootan teie rolli aktiivse meeskonnaliikmena. #Isik1# soovib osta aktsiaid, kuid #Isik2# käsib #Isik1# olla ettevaatlik, sest investeerimine on keeruline. #Person2# soovitab #Person1# teha veebipõhiseid uuringuid, külastada väljakujunenud veebisaite ja vaadata investeerimisprogramme.nn

Andmekogumi vormindamine

Praegu pakume kahte tüüpi peenhäälestust: juhiste peenhäälestus ja domeeni kohandamise peenhäälestus. Parameetrit täpsustades saate hõlpsalt ühele treeningmeetoditest üle minna instruction_tuned kui "True"või"False'.

Domeeni kohandamise vorming

Teksti genereerimise mudelit saab peenhäälestada ka mis tahes domeenispetsiifilises andmekogumis. Pärast domeenispetsiifilise andmestiku peenhäälestamist peaks mudel genereerima domeenispetsiifilist teksti ja lahendama selles konkreetses domeenis mitmesugused NLP-ülesanded, kasutades mõne võttega viipasid.

Mudeli sisestamiseks kasutage koolitus- ja valikulist valideerimiskataloogi. Iga kataloog sisaldab CSV-, JSON- või TXT-faili. CSV- ja JSON-failide puhul kasutatakse rongi- või valideerimisandmeid veerust nimega tekst või esimesest veerust, kui ühtegi veergu ei nimetata. text on leitud. Treeningu ja kinnitamise (kui see on olemas) failide arv peaks võrduma vastavalt 1-ga.

Väljund on koolitatud mudel, mida saab järelduste tegemiseks kasutada.

Järgmine on näide TXT-failist teksti genereerimise mudeli peenhäälestamiseks. TXT-fail on Amazoni SEC-failid aastatel 2021–2022:

This report includes estimates, projections, statements relating to our
business plans, objectives, and expected operating results that are “forward-
looking statements” within the meaning of the Private Securities Litigation
Reform Act of 1995, Section 27A of the Securities Act of 1933, and Section 21E
of the Securities Exchange Act of 1934. Forward-looking statements may appear
throughout this report, including the following sections: “Business” (Part I,
Item 1 of this Form 10-K), “Risk Factors” (Part I, Item 1A of this Form 10-K),
and “Management’s Discussion and Analysis of Financial Condition and Results
of Operations” (Part II, Item 7 of this Form 10-K). These forward-looking
statements generally are identified by the words “believe,” “project,”
“expect,” “anticipate,” “estimate,” “intend,” “strategy,” “future,”
“opportunity,” “plan,” “may,” “should,” “will,” “would,” “will be,” “will
continue,” “will likely result,” and similar expressions. Forward-looking
statements are based on current expectations and assumptions that are subject
to risks and uncertainties that may cause actual results to differ materially.
We describe risks and uncertainties that could cause actual results and events
to differ materially in “Risk Factors,” “Management’s Discussion and Analysis
of Financial Condition and Results of Operations,” and “Quantitative and
Qualitative Disclosures about Market Risk” (Part II, Item 7A of this Form
10-K). Readers are cautioned not to place undue reliance on forward-looking
statements, which speak only as of the date they are made. We undertake no
obligation to update or revise publicly any forward-looking statements,
whether because of new information, future events, or otherwise. GENERAL Embracing Our Future ...

Juhendi peenhäälestus

Teksti genereerimise mudelit saab käsupõhiselt häälestada mis tahes tekstiandmetel, eeldusel, et andmed on oodatud vormingus. Juhistega häälestatud mudelit saab järelduste tegemiseks edasi kasutada.

Kasutage sisestamiseks koolitus- ja valikulist valideerimiskataloogi. Koolitus- ja valideerimiskataloogid peaksid sisaldama ühte või mitut JSON-rea (.jsonl) vormingus faili. Eelkõige võib rongikataloog sisaldada ka valikulist *.json-faili, mis kirjeldab sisend- ja väljundvorminguid.

Parim mudel valitakse iga epohhi lõpus arvutatud valideerimiskao järgi. Kui valideerimiskomplekti ei anta, jagatakse (reguleeritav) protsent treeningandmetest automaatselt osadeks ja kasutatakse valideerimiseks.

Treeningandmed peavad olema vormindatud JSON read (.jsonl) vormingus, kus iga rida on sõnastik, mis esindab ühte andmenäidist. Kõik treeninguandmed peavad olema ühes kaustas; selle saab aga salvestada mitmesse jsonl-faili. Jsonl-faililaiend on kohustuslik. Koolitusmapp võib sisaldada ka a template.json fail, mis kirjeldab sisend- ja väljundvorminguid. Kui mallifaili pole antud, kasutatakse järgmist malli:

{ "prompt": "Below is an instruction that describes a task, paired with an input that provides further context. Write a response that appropriately completes the request.nn### Instruction:n{instruction}nn### Input:n{context}`, "completion": "{response}",
}

Sel juhul peavad JSON-ridade kirjed sisaldama andmeid prompt ja completion väljad. Kui on ette nähtud kohandatud mall, peab see ka kasutama prompt ja completion klahve sisend- ja väljundmallide määratlemiseks. Järgmine on kohandatud malli näidis.

{ "prompt": "question: {question} context: {context}", "completion": "{answer}"
}

Siin peavad JSON-ridade kirjed sisaldama question, contextja answer valdkondades.

Väljund on koolitatud mudel, mida saab järelduste tegemiseks kasutada.

Pakume Amazoni SEC-failide andmete alamhulka. See laaditakse alla avalikult kättesaadavalt EDGAR. Andmetele juurdepääsu juhiste saamiseks vaadake Juurdepääs EDGAR-i andmetele.

litsents: Creative Commonsi Attribution-ShareAlike litsents (CC BY-SA 4.0)


Ajatempel:

Veel alates AWS-i masinõpe