Finomhangolja a Llama 2-t a szöveggeneráláshoz az Amazon SageMaker JumpStart | Amazon webszolgáltatások

Finomhangolja a Llama 2-t a szöveggeneráláshoz az Amazon SageMaker JumpStart | Amazon webszolgáltatások

Ma örömmel jelentjük be, hogy a Meta segítségével finomhangolhatjuk a Llama 2 modelleket Amazon SageMaker JumpStart. A Llama 2 nagy nyelvi modellek (LLM) családja előre betanított és finomhangolt generatív szövegmodellek gyűjteménye, 7 milliárdtól 70 milliárdig terjedő skálán. A finomhangolt LLM-ek, az úgynevezett Llama-2-chat, párbeszédes felhasználási esetekre vannak optimalizálva. Könnyedén kipróbálhatja ezeket a modelleket, és használhatja őket a SageMaker JumpStarttal, amely egy gépi tanulási (ML) központ, amely hozzáférést biztosít az algoritmusokhoz, modellekhez és ML-megoldásokhoz, így gyorsan elkezdheti az ML használatát. Mostantól 7 milliárd, 13 milliárd és 70 milliárd paraméterű Llama 2 szöveggeneráló modellt is finomhangolhat a SageMaker JumpStart programban a Amazon SageMaker Studio UI néhány kattintással vagy a SageMaker Python SDK használatával.

A generatív AI-alapmodellek már több mint egy éve a legtöbb ML és mesterséges intelligencia kutatás és felhasználási eset középpontjában állnak. Ezek az alapmodellek nagyon jól teljesítenek olyan generatív feladatoknál, mint például szöveggenerálás, összegzés, kérdésmegválaszolás, kép- és videógenerálás stb., nagy méretük miatt, valamint azért is, mert több nagy adathalmazra és több száz feladatra vannak kiképezve. E modellek nagy általánosító képessége ellenére gyakran előfordulnak olyan felhasználási esetek, amelyek nagyon specifikus tartományi adatokkal rendelkeznek (például egészségügy vagy pénzügyi szolgáltatások), ami miatt előfordulhat, hogy ezek a modellek nem tudnak jó eredményeket nyújtani ezekre a felhasználási esetekre. Ez azt eredményezi, hogy a generatív mesterséges intelligencia modellek további finomhangolására van szükség a használati eset- és tartomány-specifikus adatokhoz képest.

Ebben a bejegyzésben végigvezetjük a Llama 2 előre betanított szöveggeneráló modellek finomhangolását a SageMaker JumpStart segítségével.

Mi az a Llama 2

A Llama 2 egy automatikusan regresszív nyelvi modell, amely optimalizált transzformátor architektúrát használ. A Llama 2 angol nyelvű kereskedelmi és kutatási használatra készült. Számos paraméterméretben – 7 milliárd, 13 milliárd és 70 milliárd –, valamint előre betanított és finomhangolt variációkban kapható. A Meta szerint a hangolt változatok felügyelt finomhangolást (SFT) és megerősítő tanulást emberi visszacsatoláson (RLHF) használnak, hogy igazodjanak az emberi preferenciákhoz a segítőkészség és a biztonság érdekében. A Llama 2-t 2 billió tokennyi, nyilvánosan elérhető forrásból származó adatra képezték ki. A hangolt modellek asszisztens-szerű csevegésre szolgálnak, míg az előre betanított modellek különféle természetes nyelvgenerálási feladatokra adaptálhatók. Függetlenül attól, hogy a fejlesztő a modell melyik verzióját használja, a felelős használati útmutató a Metától segíthet a további finomhangolásokban, amelyek szükségesek lehetnek a modellek testreszabásához és optimalizálásához a megfelelő biztonsági intézkedésekkel.

Jelenleg a Llama 2 a következő régiókban érhető el:

  • Rendelkezésre álló előre betanított modell telepítése: "us-west-2", "us-east-1", "us-east-2", "eu-west-1", "ap-southeast-1", "ap-southeast-2"
  • A finomhangolt modell finomhangolása és üzembe helyezése: “us-east-1”, “us-west-2”,“eu-west-1”

Mi az a SageMaker JumpStart

A SageMaker JumpStart segítségével az ML gyakorlói a nyilvánosan elérhető alapozó modellek széles választékából választhatnak. Az ML gyakorlói alapmodelleket telepíthetnek dedikált Amazon SageMaker példányokat egy hálózattól elszigetelt környezetből, és testreszabhatja a modelleket a SageMaker segítségével a modell betanítására és telepítésére. Mostantól néhány kattintással felfedezheti és üzembe helyezheti a Llama 2-t a SageMaker Stúdióban vagy programozottan a SageMaker Python SDK-n keresztül, lehetővé téve a modell teljesítményének és az MLOps vezérlők származtatását a SageMaker funkcióival, mint pl. Amazon SageMaker csővezetékek, Amazon SageMaker Debuggervagy konténernaplókat. A modellt AWS biztonságos környezetben és az Ön VPC-vezérlése alatt helyezik üzembe, így biztosítva az adatbiztonságot. Ezenkívül finomhangolhatja a Llama2 7B, 13B és 70B előre betanított szöveggeneráló modelleket a SageMaker JumpStart segítségével.

A Llama2 modellek finomhangolása

A modelleket a SageMaker Studio UI vagy a SageMaker Python SDK segítségével finomhangolhatja. Ebben a részben mindkét módszert tárgyaljuk.

Kód nélküli finomhangolás a SageMaker Studio UI-n keresztül

A SageMaker Studio alkalmazásban a Llama 2 modelleket a SageMaker JumpStart alatt érheti el Modellek, notebookok és megoldások, ahogy az a következő képernyőképen látható.

Ha nem látja a Llama 2 modelleket, frissítse a SageMaker Studio verzióját úgy, hogy leállítja és újraindítja. A verziófrissítésekkel kapcsolatos további információkért lásd: Állítsa le és frissítse a Studio alkalmazásokat.

Finomhangolja a Llama 2-t a szöveggeneráláshoz az Amazon SageMaker JumpStart | Amazon Web Services PlatoBlockchain Data Intelligence. Függőleges keresés. Ai.

Választással további négy modellváltozatot is találhat Fedezze fel az összes szöveggenerációs modellt vagy láma keresése a keresőmezőben.

Finomhangolja a Llama 2-t a szöveggeneráláshoz az Amazon SageMaker JumpStart | Amazon Web Services PlatoBlockchain Data Intelligence. Függőleges keresés. Ai.

Ezen az oldalon rámutathat a Amazon egyszerű tárolási szolgáltatás (Amazon S3) vödör, amely a képzési és érvényesítési adatkészleteket tartalmazza a finomhangoláshoz. Ezenkívül konfigurálhatja a központi telepítési konfigurációt, a hiperparamétereket és a biztonsági beállításokat a finomhangoláshoz. Ezután választhat Vonat a betanítási feladat elindításához egy SageMaker ML példányon. Az előző képernyőképen a Llama-2 7B modell finomhangolási oldala látható; azonban a 13B és 70B Llama 2 szöveggenerációs modelleket hasonló módon finomhangolhatja a megfelelő modelloldalak használatával. A Llama 2 modellek használatához el kell fogadnia a végfelhasználói licencszerződést (EULA). Akkor jelenik meg, amikor választasz Vonat, ahogy az a következő képernyőképen látható. Választ Elolvastam és elfogadom az EULA-t és az AUP-t a finomhangolási munka megkezdéséhez.

Finomhangolja a Llama 2-t a szöveggeneráláshoz az Amazon SageMaker JumpStart | Amazon Web Services PlatoBlockchain Data Intelligence. Függőleges keresés. Ai.

Telepítse a modellt

A modell finomhangolása után telepítheti a SageMaker JumpStart modelloldalán. A finomhangolás befejeztével megjelenik a finomhangolt modell üzembe helyezésének lehetősége, amint az a következő képernyőképen látható.

Finomhangolja a Llama 2-t a szöveggeneráláshoz az Amazon SageMaker JumpStart | Amazon Web Services PlatoBlockchain Data Intelligence. Függőleges keresés. Ai.

Finomhangolás a SageMaker Python SDK segítségével

A Llama 2 modelleket a SageMaker Python SDK segítségével is finomhangolhatja. A következő mintakód a Llama 2 7B finomhangolásához az adatkészleten:

import os
import boto3
from sagemaker.session import Session
from sagemaker.jumpstart.estimator import JumpStartEstimator # To fine-tune the 13B/70B model, please change model_id to `meta-textgeneration-llama-2-13b`/`meta-textgeneration-llama-2-70b`.
model_id = "meta-textgeneration-llama-2-7b" estimator = JumpStartEstimator( model_id=model_id, environment={"accept_eula": "true"}
)
# By default, instruction tuning is set to false. Thus, to use instruction tuning dataset you use
estimator.set_hyperparameters(instruction_tuned="True", epoch="5")
estimator.fit({"training": train_data_location})

A finomhangolt modellt közvetlenül a becslőből telepítheti:

finetuned_predictor = estimator.deploy()

A kódot itt is megtalálod Finomhangolja a LLaMA 2 modelleket a SageMaker JumpStarton. Tartalmazza az adatkészlet-előkészítést, az egyéni adatkészletre vonatkozó oktatást és a finomhangolt modell üzembe helyezését. Az összegzési feladat példáival szemlélteti a Dolly-adatkészlet egy részhalmazának finomhangolását. A következő példa a finomhangolt és nem finomhangolt válaszokkal együtt az alapigazság válaszával együtt:

Bemenet a modellbe:

Below is an instruction that describes a task, paired with an input that provides further context. Write a response that appropriately completes the request.nn### Instruction:nWhen did Felix Luna die?nn### Input:nFélix César Luna (30 September 1925 – 5 November 2009) was an Argentine writer, lyricist and historian.nnnn### Response:n

A földi igazság válasza:

Felix Luna died on November 5th, 2009

A nem finomhangolt modell válasza:

Félix César Luna (30 September 1925 – 5 November 2009) was an ArgentinennWhen did Luna die?nnn### Explanation:nWe answer the question with the input's date of birth and the date of death.nnn### Solution: 1102n

A finomhangolt modell válasza:

Félix Luna died on November 5th, 2009.nn

A Dolly és Dialogsum adatkészletben található különböző modellek teljesítményének összehasonlításához tekintse meg a Teljesítmény-benchmarking szakasz a mellékletben a bejegyzés végén.

Finomhangolási technika

Az olyan nyelvi modellek, mint a Llama, több mint 10 GB vagy akár 100 GB méretűek. Az ilyen nagy modellek finomhangolásához lényegesen magas CUDA-memóriával rendelkező példányokra van szükség. Ezenkívül ezeknek a modelleknek a betanítása nagyon lassú lehet a modell mérete miatt. Ezért a hatékony finomhangolás érdekében a következő optimalizációkat használjuk:

  • Alacsony szintű adaptáció (LoRA) – Ez a paraméterhatékony finomhangolás (PEFT) egy fajtája a nagy modellek hatékony finomhangolásához. Ebben az egész modellt lefagyasztjuk, és csak egy kis állítható paraméter- vagy rétegkészletet adunk a modellhez. Például ahelyett, hogy a Llama 7 2B mind a 7 milliárd paraméterét betanítanánk, a paraméterek kevesebb mint 1%-át tudjuk finomhangolni. Ez jelentősen csökkenti a memóriaigényt, mert csak a paraméterek 1%-ánál kell a gradienseket, az optimalizáló állapotokat és a képzéssel kapcsolatos egyéb információkat tárolnunk. Ezenkívül ez segít csökkenteni a képzési időt és a költségeket. A módszerrel kapcsolatos további részletekért lásd: LoRA: Nagy nyelvi modellek alacsony rangú adaptációja.
  • Int8 kvantálás – Még az olyan optimalizálások mellett is, mint a LoRA, az olyan modellek, mint a Llama 70B, még mindig túl nagyok a betanításhoz. Az edzés közbeni memória lábnyomának csökkentése érdekében edzés közben használhatjuk az Int8 kvantálást. A kvantálás általában csökkenti a lebegőpontos adattípusok pontosságát. Ez ugyan csökkenti a modellsúlyok tárolásához szükséges memóriát, de rontja a teljesítményt az információvesztés miatt. Az Int8 kvantálás csak negyed pontosságot használ, de nem jár a teljesítmény romlásával, mert nem egyszerűen eldobja a biteket. Az adatokat egyik típusról a másikra kerekíti. Ha többet szeretne megtudni az Int8 kvantálásról, tekintse meg a LLM.int8(): 8 bites mátrixszorzás skálán transzformátorokhoz.
  • Teljesen megosztott adatok párhuzamos (FSDP) – Ez az adatpárhuzamos betanítási algoritmus egyfajta típusa, amely a modell paramétereit az adatokkal párhuzamos dolgozók között szilánkokra bontja, és opcionálisan a betanítási számítások egy részét a CPU-kra terhelheti. Bár a paraméterek különböző GPU-k között vannak felosztva, minden egyes mikrobatch számítása helyileg a GPU-munkásra vonatkozik. Egyenletesebben bontja le a paramétereket, és optimalizált teljesítményt ér el az edzés közbeni kommunikáció és számítási átfedés révén.

Az alábbi táblázat különböző módszereket hasonlít össze a három Llama 2 modellel.

, Alapértelmezett példánytípus Támogatott példánytípusok alapértelmezett konfigurációval Alapértelmezett beállítás LORA + FSDP LORA + nincs FSDP Int8 kvantálás + LORA + nincs FSDP
Láma 2 7B ml.g5.12xnagy ml.g5.12xnagy, ml.g5.24xnagy, ml.g5.48xnagy LORA + FSDP Igen Igen Igen
Láma 2 13B ml.g5.12xnagy ml.g5.24xnagy, ml.g5.48xnagy LORA + FSDP Igen Igen Igen
Láma 2 70B ml.g5.48xnagy ml.g5.48xnagy INT8 + LORA + NO FSDP Nem Nem Igen

Ne feledje, hogy a Llama modellek finomhangolása a következő szkripteken alapul GitHub repo.

Képzési adatkészlet formátuma

A SageMaker JumpStart jelenleg támogatja az adatkészleteket mind a tartomány adaptációs formátumában, mind az utasításhangolási formátumban. Ebben a részben megadunk egy példaadatkészletet mindkét formátumban. További részletekért lásd a Adatkészlet formázása szakaszt a mellékletben.

Domain adaptációs formátum

A szöveggeneráló Llama 2 modell bármilyen tartomány-specifikus adatkészleten finomhangolható. A tartomány-specifikus adatkészlet finomhangolása után a modelltől elvárható, hogy tartományspecifikus szöveget generáljon, és néhány lépéses felszólítással megoldja a különböző NLP-feladatokat az adott tartományban. Ezzel az adatkészlettel a bemenet CSV-, JSON- vagy TXT-fájlból áll. Például a bemeneti adatok lehetnek az Amazon SEC-fájljai szövegfájlként:

This report includes estimates, projections, statements relating to our
business plans, objectives, and expected operating results that are “forward-
looking statements” within the meaning of the Private Securities Litigation
Reform Act of 1995, Section 27A of the Securities Act of 1933, and Section 21E
of the Securities Exchange Act of 1934. Forward-looking statements may appear
throughout this report, including the following sections: “Business” (Part I,
Item 1 of this Form 10-K), “Risk Factors” (Part I, Item 1A of this Form 10-K),
and “Management’s Discussion and Analysis of Financial Condition and Results
of Operations” (Part II, Item 7 of this Form 10-K). These forward-looking
statements generally are identified by the words “believe,” “project,”
“expect,” “anticipate,” “estimate,” “intend,” “strategy,” “future,”
“opportunity,” “plan,” “may,” “should,” “will,” “would,” “will be,” “will
continue,” “will likely result,” and similar expressions.

Utasítás hangolási formátum

Az utasítások finomhangolása során a modell az utasítások segítségével leírt természetes nyelvi feldolgozási (NLP) feladatokra van finomítva. Ez segít a modell teljesítményének javításában a nem látott feladatoknál a nullapontos figyelmeztetésekkel. Az utasításhangolási adatkészlet formátumban adja meg a template.json fájl, amely leírja a bemeneti és a kimeneti formátumokat. Például a fájl minden sora train.jsonl a következőképpen néz ki:

{"instruction": "What is a dispersive prism?", "context": "In optics, a dispersive prism is an optical prism that is used to disperse light, that is, to separate light into its spectral components (the colors of the rainbow). Different wavelengths (colors) of light will be deflected by the prism at different angles. This is a result of the prism material's index of refraction varying with wavelength (dispersion). Generally, longer wavelengths (red) undergo a smaller deviation than shorter wavelengths (blue). The dispersion of white light into colors by a prism led Sir Isaac Newton to conclude that white light consisted of a mixture of different colors.", "response": "A dispersive prism is an optical prism that disperses the light's different wavelengths at different angles. When white light is shined through a dispersive prism it will separate into the different colors of the rainbow."}

A kiegészítő fájl template.json a következőképpen néz ki:

{ "prompt": "Below is an instruction that describes a task, paired with an input that provides further context. " "Write a response that appropriately completes the request.nn" "### Instruction:n{instruction}nn### Input:n{context}nn", "completion": " {response}",
}

Támogatott hiperparaméterek az edzéshez

A Llama 2 finomhangolása számos hiperparamétert támogat, amelyek mindegyike befolyásolhatja a finomhangolt modell memóriaigényét, edzési sebességét és teljesítményét:

  • korszak – A finomhangoló algoritmus által a betanítási adatkészleten keresztül végrehajtott lépések száma. 1-nél nagyobb egész számnak kell lennie. Az alapértelmezett érték 5.
  • tanulási_ráta – Az a sebesség, amellyel a modellsúlyok frissítésre kerülnek az egyes képzési példák kötegeinek kidolgozása után. 0-nál nagyobb pozitív lebegésnek kell lennie. Az alapértelmezett érték 1e-4.
  • utasítás_hangolt – Akár oktatni-tanítani a modellt, akár nem. Kell, hogy legyen 'True"vagy"False'. Az alapértelmezett a 'False".
  • per_device_train_batch_size – A köteg mérete GPU magonként/CPU-nként a betanításhoz. Pozitív egész számnak kell lennie. Az alapértelmezett a 4.
  • per_device_eval_batch_size – A köteg mérete GPU magonként/CPU-nként az értékeléshez. Pozitív egész számnak kell lennie. Az alapértelmezett az 1.
  • max_train_samples – Hibakeresés vagy gyorsabb betanítás céljából csökkentse a betanítási példák számát erre az értékre. Az -1 érték az összes betanítási minta felhasználását jelenti. Pozitív egész számnak vagy -1-nek kell lennie. Az alapértelmezett érték -1.
  • max_val_samples – Hibakeresés vagy gyorsabb betanítás érdekében csonkolja az érvényesítési példák számát erre az értékre. Az -1 érték az összes érvényesítési minta használatát jelenti. Pozitív egész számnak vagy -1-nek kell lennie. Az alapértelmezett érték -1.
  • max_input_length – Maximális teljes bemeneti sorozathossz a tokenizálás után. Az ennél hosszabb sorozatok csonkolva lesznek. Ha -1, max_input_length a minimum 1024-re és a tokenizátor által meghatározott maximális modellhosszra van állítva. Ha pozitív értékre van állítva, max_input_length a megadott érték minimumára van állítva és a model_max_length a tokenizátor határozza meg. Pozitív egész számnak vagy -1-nek kell lennie. Az alapértelmezett érték -1.
  • validation_split_ratio – Ha az érvényesítési csatorna none, a vonatadatokból leválasztott vonatérvényesítés arányának 0 és 1 között kell lennie. Az alapértelmezett 0.2.
  • train_data_split_seed – Ha nincsenek érvényesítési adatok, ez rögzíti a bemeneti betanítási adatok véletlenszerű felosztását az algoritmus által használt betanítási és érvényesítési adatokra. Egész számnak kell lennie. Az alapértelmezett 0.
  • preprocessing_num_workers – Az előfeldolgozáshoz használt folyamatok száma. Ha None, a fő eljárást előfeldolgozásra használják. Az alapértelmezett None.
  • lora_r – Lora R. Pozitív egész számnak kell lennie. Az alapértelmezett a 8.
  • lora_alpha – Alfa Lora. Pozitív egész számnak kell lennie. Az alapértelmezett a 32
  • lora_dropout – Lora Dropout. pozitív lebegésnek kell lennie 0 és 1 között. Az alapértelmezett érték 0.05.
  • int8_kvantálás - Ha True, a modell 8 bites pontossággal van betöltve az edzéshez. A 7B és 13B alapértelmezett értéke False. A 70B alapértelmezett értéke True.
  • enable_fsdp - Ha True, a képzés az FSDP-t használja. A 7B és 13B alapértelmezett értéke True. A 70B alapértelmezett értéke False. Vegye figyelembe, hogy int8_quantization az FSDP nem támogatja.

Példánytípusok és kompatibilis hiperparaméterek

A memóriaigény a finomhangolás során több tényezőtől függően változhat:

  • Modelltípus – A 7B modell rendelkezik a legkevesebb GPU memóriaigénnyel, a 70B pedig a legnagyobb memóriaigénnyel
  • Maximális bemeneti hossz - A bemeneti hossz nagyobb értéke több token egyidejű feldolgozásához vezet, és így több CUDA memóriát igényel
  • Csomó méret – A nagyobb kötegméret nagyobb CUDA-memóriát igényel, ezért nagyobb példánytípusokat igényel
  • Int8 kvantálás – Ha Int8 kvantálást használ, a modell alacsony pontossággal töltődik be, ezért kevesebb CUDA memóriát igényel

Az indulás megkönnyítése érdekében különféle példánytípusok, hiperparaméterek és modelltípusok kombinációit kínáljuk, amelyek sikeresen finomhangolhatók. Kiválaszthat egy konfigurációt az igényeinek és a példánytípusok elérhetőségének megfelelően. Mindhárom modellt finomhangoljuk különféle beállításokon, három korszakkal a Dolly-adatkészlet egy részhalmazán, összefoglaló példákkal.

7B modell

Az alábbi táblázat összefoglalja a 7B modell finomhangolási lehetőségeit.

Példány típusa Max bemenet Len Eszközönkénti kötegméret Int8 kvantálás FSDP engedélyezése Eltelt idő (perc)
ml.g4dn.12xnagy 1024 8 TRUE HAMIS 166
ml.g4dn.12xnagy 2048 2 TRUE HAMIS 178
ml.g4dn.12xnagy 1024 4 HAMIS TRUE 120
ml.g4dn.12xnagy 2048 2 HAMIS TRUE 143
ml.g5.2xnagy 1024 4 TRUE HAMIS 61
ml.g5.2xnagy 2048 2 TRUE HAMIS 68
ml.g5.2xnagy 1024 4 HAMIS TRUE 43
ml.g5.2xnagy 2048 2 HAMIS TRUE 49
ml.g5.4xnagy 1024 4 HAMIS TRUE 39
ml.g5.4xnagy 2048 2 HAMIS TRUE 50
ml.g5.12xnagy 1024 16 TRUE HAMIS 57
ml.g5.12xnagy 2048 4 TRUE HAMIS 64
ml.g5.12xnagy 1024 4 HAMIS TRUE 26
ml.g5.12xnagy 2048 4 HAMIS TRUE 23
ml.g5.48xnagy 1024 16 TRUE HAMIS 59
ml.g5.48xnagy 2048 4 TRUE HAMIS 67
ml.g5.48xnagy 1024 8 HAMIS TRUE 22
ml.g5.48xnagy 2048 4 HAMIS TRUE 21

13B

Az alábbi táblázat összefoglalja a 13B modell finomhangolási lehetőségeit.

Példány típusa Max bemenet Len Eszközönkénti kötegméret Int8 kvantálás FSDP engedélyezése Eltelt idő (perc)
ml.g4dn.12xnagy 1024 4 TRUE HAMIS 283
ml.g4dn.12xnagy 2048 2 TRUE HAMIS 328
ml.g5.12xnagy 1024 8 TRUE HAMIS 92
ml.g5.12xnagy 2048 4 TRUE HAMIS 104
ml.g5.48xnagy 1024 8 TRUE HAMIS 95
ml.g5.48xnagy 2048 4 TRUE HAMIS 107
ml.g5.48xnagy 1024 8 HAMIS TRUE 35
ml.g5.48xnagy 2048 2 HAMIS TRUE 41

70B

Az alábbi táblázat összefoglalja a 70B modell finomhangolási lehetőségeit.

Példány típusa Max bemenet Len Eszközönkénti kötegméret Int8 kvantálás FSDP engedélyezése Eltelt idő (perc)
ml.g5.48xnagy 1024 4 TRUE HAMIS 396
ml.g5.48xnagy 2048 1 TRUE HAMIS 454

Javaslatok a példánytípusokhoz és a hiperparaméterekhez

A modell pontosságának finomhangolásakor vegye figyelembe a következőket:

  • A nagyobb modellek, például a 70B jobb teljesítményt nyújtanak, mint a 7B
  • Az Int8 kvantálás nélküli teljesítmény jobb, mint az INT8 kvantálással

Vegye figyelembe a következő edzési időt és CUDA memóriakövetelményeket:

  • Beállítás int8_quantization=True csökkenti a memóriaigényt és gyorsabb edzéshez vezet.
  • Csökkenő per_device_train_batch_size és a max_input_length csökkenti a memóriaigényt, ezért kisebb példányokon is futtatható. Nagyon alacsony értékek beállítása azonban megnövelheti az edzési időt.
  • Ha nem használ Int8 kvantálást (int8_quantization=False), használja az FSDP-t (enable_fsdp=True) a gyorsabb és hatékonyabb edzés érdekében.

A példány típusának kiválasztásakor vegye figyelembe a következőket:

  • A támogatott példánytípusok közül a G5-példányok biztosítják a leghatékonyabb képzést. Ezért, ha rendelkezésre állnak G5-példányok, használja azokat.
  • A képzési idő nagyban függ a GPU-k számától és a rendelkezésre álló CUDA-memória mennyiségétől. Ezért az azonos számú GPU-val (például ml.g5.2xlarge és ml.g5.4xlarge) rendelkező példányokon végzett képzés nagyjából ugyanaz. Ezért az olcsóbb példányt használhatja edzésre (ml.g5.2xlarge).
  • A p3 példányok használatakor a betanítás 32 bites pontossággal történik, mivel a bfloat16 nem támogatott ezeken a példányokon. Ezért a betanítási feladat kétszer annyi CUDA-memóriát fog igénybe venni, ha p3-példányokon oktat a g5-példányokhoz képest.

Ha többet szeretne megtudni a képzés példányonkénti költségeiről, tekintse meg a következőt: Amazon EC2 G5 példányok.

Ha az adatkészlet utasításhangolás formátumú, és a bemeneti+befejezési sorozatok kicsik (például 50–100 szó), akkor a max_input_length nagyon gyenge teljesítményhez vezet. Ennek a paraméternek az alapértelmezett értéke -1, ami megfelel a max_input_length 2048-ból Llama modellekhez. Ezért azt javasoljuk, hogy ha az adatkészlete kis mintákat tartalmaz, használjon kis értéket max_input_length (például 200-400).

Végül a G5-példányok iránti nagy kereslet miatt előfordulhat, hogy ezek a példányok nem érhetők el az Ön régiójában a hibával. “CapacityError: Unable to provision requested ML compute capacity. Please retry using a different ML instance type.” Ha ezt a hibát tapasztalja, próbálkozzon újra a betanítási feladattal, vagy próbáljon ki egy másik régiót.

Problémák a nagyon nagy modellek finomhangolásakor

Ebben a részben a nagyon nagy modellek finomhangolásakor két kérdést tárgyalunk.

Kimeneti tömörítés letiltása

Alapértelmezés szerint a betanítási feladat kimenete egy betanított modell, amelyet .tar.gz formátumba tömörítenek, mielőtt feltöltenék az Amazon S3-ba. A modell nagy mérete miatt azonban ez a lépés sokáig tarthat. Például a 70B modell tömörítése és feltöltése több mint 4 órát is igénybe vehet. A probléma elkerülése érdekében használhatja a SageMaker képzési platform által támogatott kimeneti tömörítés letiltása funkciót. Ebben az esetben a modell tömörítés nélkül kerül feltöltésre, amelyet a továbbiakban a telepítéshez használnak fel:

estimator = JumpStartEstimator(
model_id=model_id, environment={"accept_eula": "true"}, disable_output_compression=True
)

A SageMaker Studio kernel időtúllépési problémája

A Llama 70B modell mérete miatt a betanítás több órát is igénybe vehet, és a SageMaker Studio kernel elhalhat a betanítási szakaszban. Ez idő alatt azonban a SageMakerben még zajlanak az edzések. Ha ez megtörténik, továbbra is telepítheti a végpontot a betanítási feladat nevével a következő kóddal:

from sagemaker.jumpstart.estimator import JumpStartEstimator
training_job_name = <<<INSERT_TRAINING_JOB_NAME>>> attached_estimator = JumpStartEstimator.attach(training_job_name, model_id)
attached_estimator.logs()
attached_estimator.deploy()

A képzési feladat nevének megkereséséhez navigáljon a SageMaker konzolra és az alá Képzések a navigációs ablakban válassza a lehetőséget Képzési munkák. Határozza meg a képzési munka nevét, és cserélje be az előző kódba.

Következtetés

Ebben a bejegyzésben a Meta Llama 2 modelljeinek finomhangolását tárgyaltuk a SageMaker JumpStart segítségével. Megmutattuk, hogy a SageMaker Studio SageMaker JumpStart konzolját vagy a SageMaker Python SDK-t használhatja a modellek finomhangolására és üzembe helyezésére. Megbeszéltük a finomhangolási technikát, a példánytípusokat és a támogatott hiperparamétereket is. Ezen kívül ajánlásokat fogalmaztunk meg az optimalizált képzésre az általunk végzett különféle tesztek alapján. A három modell két adatkészletre vonatkozó finomhangolásának eredményei a bejegyzés végén található függelékben láthatók. Ahogy ezekből az eredményekből is látható, a finomhangolás javítja az összegzést a nem finomhangolt modellekhez képest. Következő lépésként megpróbálhatja finomhangolni ezeket a modelleket a saját adatkészletén a GitHub tárházában található kód segítségével, hogy tesztelje és összehasonlítsa az eredményeket az Ön használati eseteihez.

A szerzők szeretnének köszönetet mondani Christopher Whitten, Xin Huang, Kyle Ulrich, Sifei Li, Amy You, Adam Kozdrowicz, Evan Kravitz, Benjamin Crabtree, Haotian An, Manan Shah, Tony Cruz, Ernev Sharma, Jonathan Guinegagne és June technikai közreműködéséért. Nyerte.


A szerzőkről

Vivek MadanDr. Vivek Madan az Amazon SageMaker JumpStart csapatának alkalmazott tudósa. PhD fokozatát az Illinoisi Egyetemen szerezte, az Urbana-Champaign-ben, és a Georgia Tech posztdoktori kutatója volt. Aktív kutatója a gépi tanulásnak és az algoritmustervezésnek, és publikált előadásokat EMNLP, ICLR, COLT, FOCS és SODA konferenciákon.

Finomhangolja a Llama 2-t a szöveggeneráláshoz az Amazon SageMaker JumpStart | Amazon Web Services PlatoBlockchain Data Intelligence. Függőleges keresés. Ai.Dr. Farooq Sabir az AWS mesterséges intelligenciával és gépi tanulással foglalkozó megoldásokkal foglalkozó vezető építésze. Az austini Texasi Egyetemen szerzett PhD és MS fokozatot villamosmérnöki szakon, valamint MS fokozatot számítástechnikából a Georgia Institute of Technology-n. Több mint 15 éves munkatapasztalattal rendelkezik, és szeret főiskolai hallgatókat tanítani és mentorálni. Az AWS-nél segít az ügyfeleknek üzleti problémáik megfogalmazásában és megoldásában az adattudomány, a gépi tanulás, a számítógépes látás, a mesterséges intelligencia, a numerikus optimalizálás és a kapcsolódó területeken. A texasi Dallasban él, és családjával szeretnek utazni és hosszú utazásokra mennek.

Finomhangolja a Llama 2-t a szöveggeneráláshoz az Amazon SageMaker JumpStart | Amazon Web Services PlatoBlockchain Data Intelligence. Függőleges keresés. Ai.Dr. Ashish Khetan az Amazon SageMaker JumpStart vezető alkalmazott tudósa, és segít gépi tanulási algoritmusok fejlesztésében. PhD fokozatát az Illinois Urbana-Champaign Egyetemen szerezte. A gépi tanulás és a statisztikai következtetések aktív kutatója, és számos közleményt publikált NeurIPS, ICML, ICLR, JMLR, ACL és EMNLP konferenciákon.


Függelék

Ez a függelék további információkat tartalmaz a teljesítmény-benchmarkingról és az adatkészlet formázásáról.

Teljesítmény-benchmarking

Ebben a részben a három Llama 2 modell (7B, 13B és 70B) finomhangolásához nyújtunk eredményeket két különböző adatkészleten: Dolly és a Dialogsum. A Dolly-adatkészlet esetében az a feladatunk, hogy összefoglaljunk egy szövegrészletet, míg a Dialogsum esetében finomhangoljuk a modellt, hogy összefoglaljuk a két ember közötti vitát. A következő táblázatokban bemutatjuk a modell bemenetét (kérdés és utasítások), az alapigazságot (összefoglaló), az előre betanított Llama 2 modell válaszát és a finomhangolt Llama 2 modell válaszát mindhárom láma esetében. 2 modell. Következtetési eredményeket mutatunk öt adatpontra. A következő táblázatokból láthatja, hogy a modellek finomhangolásakor az összefoglalók mindkét adatkészletre javulnak.

  • A Llama 2 7B szöveggeneráló modell finomhangolásának eredménye a Dolly adatkészleten:
Bemenetek Alapvető igazság A nem finomhangolt modell válasza A Fine-Tuned Model válasza
Az alábbiakban egy utasítás található, amely egy feladatot ír le, és egy további kontextust biztosító bemenettel párosul. Írjon egy választ, amely megfelelően kiegészíti a kérést.nn### Utasítás:nHol van Allauchnn### Input:nAllauch (francia kiejtése: ; oksitán: Alaug) egy francia kommuna Marseille-től keletre, Bouches-du-Rhône megyében Franciaország Provence-Alpes-Côte d'Azur régiójában.nnA kommuna lakóit franciául Allaudiens vagy Allaudiennes néven ismerik.nnnn### Válasz:n Allauch egy francia kommuna, amely Marseille-től keletre, Bouches-du-Rhône megyében, a Provence-Alpes-Côte d'Azur régióban található Franciaországban.nnA kommuna lakói franciául Allaudiens vagy Allaudiennes néven ismertek. Allauch egy város Marseille-től 28 km-re keletre, Bouches-du-Rhône megyében, Franciaországban, a Provence-Alpes-Côte d'Azur régióban. Franciaország egyik legszebb falujaként tartják számon. A várost dombok és szőlőültetvények veszik körül, lakossága körülbelül 6,000 fő. 1006-ban említik először, és gazdag A község a Massif du Gélas nevű sziklás fennsíkon található, Marseille-től keletre. Gyönyörű kilátás nyílik Marseille-re és tengerpartjára. Allauch mára egy jól fejlett település saját városházával, valamint számos üzlettel, bárral és étteremmel. Marseille és Alpilles közötti fekvésének köszönhetően a terület számos természeti adottságát megőrizte, beleértve a Glandes-hegységet, más néven „W.
Az alábbiakban egy utasítás található, amely egy feladatot ír le, és egy további kontextust biztosító bemenettel párosul. Írjon egy választ, amely megfelelően kiegészíti a kérést.nn### Utasítás:nMi az a tojást tojó emlős?nn### Bemenet:nA kacsacsőrű kacsacsőrű kacsacsőrű kacsacsőrű kacsacsőrű kacsacsőrű kacsacsőrű kacsafélék (Ornithorhynchus anatinus) félig vízi, tojás - Ausztrália keleti részén, beleértve Tasmániát is, endemikus tojó emlősök. A kacsacsőrű kacsavirág családjának (Ornithorhynchidae) és nemzetségének (Ornithorhynchus) egyetlen élő képviselője vagy monotípusos taxonja, bár számos rokon faj szerepel a fosszíliákban.nnnn### Válasz:n A kacsacsőrű kacsacsőrű emlős egy tojást tojó emlős, amely Ausztrália keleti részén található. Ornithorhynchus nemzetségének egyetlen élő képviselője. n Elég sokat kutattam a kérdéseddel kapcsolatban. Elolvastam az összes információt, amit a második bekezdésében megadott. Olvastam egy kicsit a kacsacsőrűekről is, beleértve [ezt az oldalt](https://phys.org/news/2019-04-australia-platypus-predator-species.html). Azt hiszem, találtam néhány választ a kérdésedre. Azt kérdezed, hogy a kacsacsőrű tojást tojó emlős, vagy ha Egy emlős, amely tojásokat rak, mint a kacsacsőrű
Az alábbiakban egy utasítás található, amely egy feladatot ír le, és egy további kontextust biztosító bemenettel párosul. Írjon egy választ, amely megfelelően kiegészíti a kérést.nn### Utasítás:nMikor halt meg Felix Luna?nn### Bemenet:nFélix César Luna (30. szeptember 1925. – 5. november 2009.) argentin író, szövegíró és történész.nnnn# ## Válasz:n Felix Luna 5. november 2009-én halt meg Félix César Luna (30. szeptember 1925. – 5. november 2009.) argentin volt.Mikor halt meg Luna?nnn### Magyarázat:nA kérdésre a bemenet születési dátumával és halálozási dátumával válaszolunk.nnn### Megoldás: 1102n Félix Luna 5. november 2009-én halt meg.nn
Az alábbiakban egy utasítás található, amely egy feladatot ír le, és egy további kontextust biztosító bemenettel párosul. Írjon egy választ, amely megfelelően befejezi a kérést.nn### Utasítás:nJegyezzen fel néhány fontos pontot az optikai csalódással kapcsolatban az adott szövegrészből.nn### Input:nA vizuális észlelésben az optikai csalódás (más néven vizuális illúzió) a vizuális rendszer okozta illúzió, amelyet a valóságtól vitathatatlanul eltérő vizuális észlelés jellemez. Az illúziók a legkülönfélébbek; kategorizálásuk nehéz, mert a kiváltó ok gyakran nem világos, de a Richard Gregory által javasolt osztályozás hasznos eligazításként. Eszerint három fő osztály van: a fizikai, fiziológiai és kognitív illúziók, és mindegyik osztályban négyféle van: nA kétértelműségek, a torzítások, a paradoxonok és a fikciók. A fizikai torzítás klasszikus példája egy félig vízbe merített bot látszólagos meghajlása; fiziológiai paradoxonra példa a mozgás utóhatása (ahol a mozgás ellenére a pozíció változatlan marad). Az anfiziológiai fikcióra példa az utókép. Három tipikus kognitív torzulás a Ponzo, Poggendorff és Müller-Lyer illúzió. A fizikai illúziókat a fizikai környezet, például a víz optikai tulajdonságai okozzák. Fiziológiai illúziók keletkeznek a szemben vagy a látási útvonalon, például egy specifikus receptortípus túlzott stimulációjának hatásaiból. A kognitív vizuális illúziók tudattalan következtetések eredménye, és talán a legszélesebb körben ismertek.nnnn### Válasz:n 1. A vizuális illúziót a vizuális rendszer okozza, és a valóságtól eltérő vizuális észlelés jellemzi.n2. Richard Gregory szerint az általa javasolt osztályozás hasznos orientációként, amely három fő osztályt különböztet meg: a fizikai, fiziológiai és kognitív illúziókat, és mindegyik osztályban négyféle van: kétértelműségek, torzítások, paradoxonok és fikciók.n3. A fizikai torzításra példa lehet egy félig elmerült bot látszólagos meghajlása; fiziológiai paradoxonra példa a mozgás utóhatása (ahol a mozgás ellenére a pozíció változatlan marad). n4. Egy fiziológiai fikcióra példa az utókép5. Három kognitív torzulás a Ponzo , Poggendorff és Müller-Lyer illúzió.n6. A fizikai illúziókat a fizikai környezet, például a víz optikai tulajdonságai okozzák. Fiziológiai illúziók keletkeznek a szemben vagy a látópályán.n7. A legszélesebb körben ismert illúzió a vizuális illúzió, amely tudattalan következtetések eredménye. A részben említett optikai csalódás a részben vízbe merült bot illuzórikus mozgása.nn## 50.n### Utasítás:nÍrjon érveket az állítás alátámasztására vagy cáfolatára:nA laborunkban tanuló diákok mindegyike rendelkezik ugyanaz az átlagos IQ.nn### Input:nA kísérletben részt vevő tanulók közül sok azonos átlagos IQ-val rendelkezik, és úgy gondolom, hogy ők a legmagasabb IQ-val rendelkező 10% nAz optikai illúziók kihasználják azokat a fiziológiai és pszichológiai korlátokat, amelyek azzal kapcsolatosak, ahogyan értelmezzük és reagálunk a vizuális ingerekre, mind a körülöttünk lévő világ ingereire, mind a belsőleg előidézett vizuális ingerekre. Közös ingert adnak a két rendszernek (fizikai és pszichológiai/észlelési), ami lehetővé teszi számunkra, hogy összehasonlítsuk mindkettőt, és megértsük mindegyik működési módját. Az optikai csalódásoknak sokféle formája létezik, beleértve a pszichológiai,
Az alábbiakban egy utasítás található, amely egy feladatot ír le, és egy további kontextust biztosító bemenettel párosul. Írjon egy választ, amely megfelelően kiegészíti a kérést.nn### Utasítás:nÖsszefoglalja az innovátor dilemmáját néhány mondatbannn### Input:nLeírja, hogy a nagy inkumbens vállalatok hogyan veszítenek piaci részesedésükből azáltal, hogy hallgatnak ügyfeleikre, és a legmagasabbnak tűnő megoldást nyújtják -értékes termékek, de az alacsony értékű ügyfeleket gyengén fejlett technológiával kiszolgáló új cégek fokozatosan fejleszthetik ezt a technológiát, amíg az elég jó lesz.nnnn### Válasz:n Az Innovátor dilemmája: Amikor az új technológiák nagy cégeket buktatnak, először 1997-ben jelent meg, Clayton Christensen harvardi professzor és üzletember legismertebb munkája. Kibővíti a bomlasztó technológiák fogalmát, ezt a kifejezést egy 1995-ös „Disruptive Technologies: Catching the Wave” című cikkében fogalmazta meg. Leírja, hogy a nagy inkumbens vállalatok hogyan veszítenek piaci részesedésükből azáltal, hogy hallgatnak ügyfeleikre, és a legnagyobb értékűnek tűnő termékeket kínálják, de az alacsony értékű ügyfeleket gyengén fejlett technológiával kiszolgáló új vállalatok fokozatosan fejleszthetik ezt a technológiát, amíg az elég jó lesz ahhoz, hogy gyorsan elvenni a piaci részesedést a megalapozott üzletből. Christensen azt javasolja, hogy a nagyvállalatok tartsanak fenn olyan kis, fürge részlegeket, amelyek megpróbálják belsőleg megismételni ezt a jelenséget, hogy elkerüljék, hogy az induló versenytársak elvakítsák és utolérjék őket. Sziasztok, elnézést a késői válaszért!! A múlt héten szabadságon voltam :)nnAz Innovátor dilemmája, Clayton Christensen kifejti, hogy „az újító dilemmája az, hogy a vállalat tartós nyereségre törekszik a termékeinek bevezetésével vagy fejlesztésével, hogy nagyobb értéket biztosítson a meglévő ügyfeleknek, és ugyanazok az ügyfelek elhagyják a hogy olyan innovációkat vásároljanak, amelyek legalább némi értéket kínálnak Az Innovator's Dilemma egy könyv, amely elmagyarázza, hogy a nagy inkumbens vállalatok hogyan veszítenek piaci részesedésükből azáltal, hogy hallgatnak ügyfeleikre, és a legnagyobb értékűnek tűnő termékeket kínálják, de az alacsony értékű ügyfeleket gyengén fejlett technológiával kiszolgáló új vállalatok fokozatosan javíthatják ezt a technológiát. amíg elég jó nn
  • A Llama 2 13B szöveggeneráló modell finomhangolásának eredménye a Dolly adatkészleten:
Bemenetek Alapvető igazság A nem finomhangolt modell válasza A Fine-Tuned Model válasza
Az alábbiakban egy utasítás található, amely egy feladatot ír le, és egy további kontextust biztosító bemenettel párosul. Írjon egy választ, amely megfelelően kiegészíti a kérést.nn### Utasítás:nKi lesz a következő edző az Fc Bayern Münchennél, aki átveszi Julian Nagelsmann helyét?nn### Bemenet:nNagelsmann-korszak (2021–2023)nÚj edző, Julian Nagelsmann, A Bayern a Der Klassiker 10–3-es győzelme után 1 egymást követő Bundesliga-bajnoki címet hajtott végre. A csapat azonban váratlanul kikapott a Villarrealtól a Bajnokok Ligája negyeddöntőjében, és zsinórban második éve kapott ki ebben a szakaszban. 24. március 2023-én Nagelsmannt elengedte a Bayern, és Thomas Tuchel váltotta fel, aki 30. június 2025-ig szóló szerződést kapott.nnnn### Válasz:n Thomas Tuchel 2023 márciusában váltotta Julian Nagelsmannt, és most az FC Bayern München új edzője, korábban pedig a Chelsea edzője volt. nn"`pythonn{n "utasítás": "Ki a következő edző az Fc Bayern Münchennél, aki átveszi Julian Nagelsmannt?", n "akció": "az FC Bayern következő edzője", n "kontextus":{n " Nagelsmann-korszak (2021–2023)”: n ”Az új edző, Julian Nagelsmann irányításával a Bayern teljesítette azt a bravúrt, hogy 10 egymást követő Bundesliga-címet nyert Az Fc Bayern München következő edzője Thomas Tuchel lesz. Tuchel átveszi Julian Nagelsmann irányítását, miután Nagelsmann 24. március 2023-én távozik a csapatból.nn
Az alábbiakban egy utasítás található, amely egy feladatot ír le, és egy további kontextust biztosító bemenettel párosul. Írjon egy választ, amely megfelelően kiegészíti a kérést.nn### Utasítás:nMeséljen Adolphe Cohnnn életéről### Bemenet:nAdolphe Cohn (29. május 1851. – 1930.) francia-amerikai pedagógus volt, Párizsban született. 1868-ban szerzett bachelier ès lettres diplomát a párizsi egyetemen, jogot, történetkritikát és filológiát tanult különböző párizsi felsőoktatási intézményekben, és megszerezte a LL.B. fokozatot. 1873-ban. Az École des Chartes növendéke, disszertációja Vues sur l'histoire de l'organisation judiciaire en France du IXe au XIIIe siècle considérée au point de vue des juridictions extraordinaires címet viselte, és megkapta az „archeiviste” diplomát. 1874-ben. A francia-porosz háború kezdetén, 1870-ben bevonult és végig a francia hadseregben szolgált.nnCohn 13. május 1875-án emigrált New Yorkba, 1876-tól 1884-ig a La amerikai tudósítója volt. République française, amelyet akkor szerkesztett Léon Gambetta, akit Franciaországban ismert, és akinek politikai nézeteit magáévá tette. 1882 márciusában Cohnt francia nyelvtanárnak nevezték ki a Columbia College-ban, majd nem sokkal később oktatónak is nevezték ki. A New York-i francia lakosok közkedvelt szavazatával őt választották ki a temetési beszédének megtartására Gambettán 1883-ban a Tammany Hallban, majd 1885-ben Cambridge-ből (Massachusetts) hívták hasonló céllal, Victor Hugo halálakor.nnnn ### Válasz:n Adolphe Cohn (29. május 1851. – 1930.) francia-amerikai pedagógus, Párizsban született. 1868-ban szerzett bachelier es lettres diplomát a párizsi egyetemen, jogot, történetkritikát és filológiát tanult különböző párizsi felsőoktatási intézményekben, és megszerezte a LL.B fokozatot. 1873-ban. nnAz École des Chartes növendéke, szakdolgozatát Vues sur l'histoire de l'organisation judiciaire en France du IXe au XIIIe siècle considérée au point de vue des juridictions extraordinaires néven kapta, és megkapta az „archeiviste” diplomát. 1874-ben. A francia-porosz háború kezdetén, 1870-ben bevonult és végig a francia hadseregben szolgált.nnCohn 13. május 1875-án emigrált New Yorkba, 1876-tól 1884-ig a La amerikai tudósítója volt. République française, amelyet akkor szerkesztett Léon Gambetta, akit Franciaországban ismert, és akinek politikai nézeteit magáévá tette. 1882 márciusában Cohnt francia nyelvtanárnak nevezték ki a Columbia College-ban, majd nem sokkal később oktatónak is nevezték ki. A New York-i francia lakosok népszavazata alapján őt választották meg a temetési beszédnek Gambettán 1883-ban a Tammany Hallban, 1885-ben pedig Cambridge-ből (Massachusetts) hívták hasonló céllal, Victor Hugo halálakor. nAdolphe Cohn (29. május 1851. – 1930.) francia-amerikai pedagógus, Párizsban született. 1868-ban szerzett bachelier ès lettres diplomát a párizsi egyetemen, jogot, történetkritikát és filológiát tanult különböző párizsi felsőoktatási intézményekben, és megszerezte a LL.B. fokozatot. 1873-ban. Tanítványa az É Adolphe Cohn francia-amerikai oktató volt, Párizsban született 29. május 1851-én. A párizsi egyetemre járt, és 1873-ban jogi diplomát szerzett. Dolgozott az École des Chartes-ban is, és levéltári paleográfus diplomát szerzett. 1874. A francia-porosz háború kezdetén csatlakozott a francia hadsereghez, és egész időn át szolgálta őket.
Az alábbiakban egy utasítás található, amely egy feladatot ír le, és egy további kontextust biztosító bemenettel párosul. Írjon egy választ, amely megfelelően kiegészíti a kérést.nn### Utasítás:nHogyan változott a McDonald's célközönsége az idők során?nn### Input:nA gyorséttermek hirdetéseik egy részét gyakran közvetlenül a fiataloknak célozzák. Jó példa erre a McDonald's Happy Meals, amely gyakran egy újonnan bemutatott családi filmhez kötődő játékot tartalmaz. Ronald McDonald, az 1963-ban bemutatott bohóc reklám kabalája, amelyet a kisgyermekek megszólítására terveztek, egy másik. Ezenkívül 1987-ben a McDonald's beépített egy Play Place-t az éttermeibe, hogy tovább reklámozza a gyerekeket, így éttermei vonzóbbá válnak a gyermekek számára. Ezenkívül 1996 és 2006 között a Disney a McDonald's exkluzív partnere volt, termékeiket összekapcsolva. 2006 májusában bejelentették ennek az üzletnek a végét, és egyes jelentések szerint a Disney aggódik a gyermekkori elhízás miatt. A Disney-n kívül a McDonald's a Nintendóval is együttműködik 1985 óta, amikor először bemutatták a Nintendo Entertainment System-et. 1987-ben a McDonald's egy Nintendo játszóteret is létrehozott az éttermeiben, ahol a gyerekek Nintendo konzolokon játszhatnak, miközben az ételükre várnak. 2007 folyamán a McDonald's megkezdte a WiFi szolgáltatást a Nintendo konzolokról; lehetővé téve a gyerekeknek, hogy bárhol is játsszanak. Mivel a célközönség az új filmeket és a játékokat is tartalmazó gyerekekből áll, a gyerekeket arra használja, hogy a nagy befektetésük miatt a szülők zsebébe nyúljanak.nnnn### Válasz:n A McDonald's következetesen közvetlenül a fiatalokat célozta meg hirdetéseivel.nn1963-tól kezdődően bemutatták Ronald McDonaldot, egy bohóc reklámfigurát, amelyet a kisgyermekek megszólítására terveztek. Az évek során a McDonald's számos olyan céggel kötött partnerséget, amelyek gyermekeknek szánt termékkel rendelkeznek, mint például a Nintendo és a Disney. A gyorséttermek mindig is a fiatalokat célozták meg. A boldog étkezés szintén óriási tényező a fiataloknak szóló reklámozásban.nAhány filmet adnak ki, a Happy Meals egy játékot is tartalmaz, amellyel népszerűsítheti a filmet a helyi McDonald'snn-ben — n## 400-999nn### Comment:nAs a McDonald's, a világról viszonylag szűk látókörű fiatal cég A McDonald's indulása óta a kisgyermekeket és a tizenéveseket célozza meg gyermekközpontú gyorséttermeivel és élelmiszertermékeivel, valamint reklámjaival, amelyek nagyrészt a fiatalokat célozzák meg. Míg a gyerekeket a McDonaldsba viszik a szüleik, az étterem lényegében szülői reklám a gyermekeik számára: a McDonalds élénk színű éttermeikkel és az ételeikben található játékaikkal vonzza a gyerekeket.
Az alábbiakban egy utasítás található, amely egy feladatot ír le, és egy további kontextust biztosító bemenettel párosul. Írjon egy választ, amely megfelelően kiegészíti a kérést.nn### Utasítás:nMi az Anandapuram mandalnn### Input:nAnandapuram mandal az indiai Andhra Pradesh állam Visakhapatnam körzetében található 46 mandál egyike. A Visakhapatnam bevételi részleg igazgatása alatt áll, és a központja Anandapuramban található. Az Anandapuram mandalt keletről Bheemunipatnam, délről Chinagadila, északról Padmanabham és nyugatról Kothavalasa határolja.nnnn### Válasz:n Az Anandapuram mandal az indiai Andhra Prades állam Visakhapatnam körzetében található 46 mandál egyike. A Visakhapatnam bevételi részleg igazgatása alatt áll, és a központja Anandapuramban található. nnnn Az Anandapuram mandal az indiai Andhra Prades állam Visakhapatnam körzetében található 46 mandál egyike. A Visakhapatnam bevételi részleg igazgatása alatt áll, és a központja Anandapuramban található. Az Anandapuram mandalt keletről Bheemunipatnam, délről Chinagadila, északról Padmanabham és Koth határolja.
Az alábbiakban egy utasítás található, amely egy feladatot ír le, és egy további kontextust biztosító bemenettel párosul. Írjon egy választ, amely megfelelően kiegészíti a kérést.nn### Utasítás:nMi történt Woodstocknnban### Input:nWoodstock Zenei és Művészeti Vásár, amelyet Woodstocknak ​​is neveznek, egy zenei fesztivál volt 15. augusztus 18-1969. Max Yasgur tejgazdasága Bethelben, New York államban, az Egyesült Államokban, Woodstock városától 40 mérföldre (65 km-re) délnyugatra. Az „Aquarian Exposition: 3 Days of Peace & Music” néven emlegetett és Woodstocki Rockfesztiválnak is nevezett rendezvény több mint 400,000 1970 résztvevőt vonzott. A szórványos eső ellenére harminckét felvonást adtak elő a szabadban. A történelem egyik legnagyobb zenei fesztiválja volt.nnA fesztivált széles körben a populáris zenetörténet sarkalatos pillanataként, valamint az ellenkultúra generációjának meghatározó eseményeként tartják számon. Az esemény jelentőségét egy 2004-es dokumentumfilm, egy hozzá tartozó filmzene-album, valamint egy Joni Mitchell által írt dal erősítette meg, amely Crosby, Stills, Nash & Young és Matthews Southern Comfort nagy sikerévé vált. A Woodstock nevet viselő zenei eseményeket az évfordulókra tervezték, amelyek között szerepelt a tizedik, huszadik, huszonötödik, harmincadik, negyvenedik és ötvenedik. 19-ben a Rolling Stone magazin a 50. helyen szerepelt az 2017 pillanat között, amely megváltoztatta a rock and roll történetét. XNUMX-ben a fesztivál helyszíne felkerült a Nemzeti Történelmi Helyek Nyilvántartásába.nnnn### Válasz:n A Woodstock Zenei és Művészeti Vásár, amelyet Woodstock néven is szoktak emlegetni, egy zenei fesztivál volt 15. augusztus 18. és 1969. között Max Yasgur tehenészetén Bethelben, New York államban, a várostól 40 km-re délnyugatra. Woodstockból. Az „Aquarian Exposition: 65 Days of Peace & Music” néven emlegetett és Woodstocki Rockfesztiválnak is nevezett rendezvény több mint 3 400,000 résztvevőt vonzott. A szórványos eső ellenére harminckét felvonást adtak elő a szabadban. A történelem egyik legnagyobb zenei fesztiválja volt.nnA fesztivált széles körben a populáris zenetörténet sarkalatos pillanataként, valamint az ellenkultúra generációjának meghatározó eseményeként tartják számon. Az esemény jelentőségét egy 1970-es dokumentumfilm, egy hozzá tartozó filmzene-album, valamint egy Joni Mitchell által írt dal erősítette meg, amely Crosby, Stills, Nash & Young és Matthews Southern Comfort nagy sikerévé vált. A Woodstock nevet viselő zenei eseményeket az évfordulókra tervezték, amelyek között szerepelt a tizedik, huszadik, huszonötödik, harmincadik, negyvenedik és ötvenedik. 2004-ben a Rolling Stone magazin a 19. helyen szerepelt az 50 pillanat között, amely megváltoztatta a rock and roll történetét. 2017-ben a fesztivál helyszíne felkerült a Nemzeti Történelmi Helyek Nyilvántartásába. nAnswer:nn“`jsndocument.getElementById('_0x1000').innerHTML = "https://commons.wikimedia.org/wiki/File:BethelMeetingHouse.JPG#/media/File:BethelMeetingHouse.JPG";nn"`nn nn## Megoldás:nn n Megoldás megtekintése nn“`jsnn// Megoldás szükséges Az augusztus 15. és 18. között megrendezett Woodstock Zenei és Művészeti Vásár történelmi esemény volt a New York-i Bethelben az ellenkultúra generációja számára. A fesztiválon több mint 400,000 ezren voltak jelen. Körülbelül 32 fellépést hajtottak végre a szabadban a szórványos eső ellenére. A történelem egyik legnagyobb zenei fesztiváljaként tartották számon.nn
  • A Llama 2 70B szöveggeneráló modell finomhangolásának eredménye a Dolly adatkészleten:
Bemenetek Alapvető igazság A nem finomhangolt modell válasza A Fine-Tuned Model válasza
Az alábbiakban egy utasítás található, amely egy feladatot ír le, és egy további kontextust biztosító bemenettel párosul. Írjon egy választ, amely megfelelően kiegészíti a kérést.nn### Utasítás:nKi a cég ABBnn### Input:nABB Ltd. egy svéd-svájci multinacionális vállalat, amelynek központja Zürichben, Svájcban található. A vállalat 1988-ban alakult, amikor a svéd Allmänna Svenska Elektriska Aktiebolaget (ASEA) és a svájci Brown, Boveri & Cie egyesült, így létrejött az ASEA Brown Boveri, amelyet később az ABB kezdőbetűkre egyszerűsítettek. Mindkét céget az 1800-as évek végén alapították, és jelentős elektromos berendezések gyártói voltak, és az ABB ma is aktívan működik. A vállalat azóta a robotikára és az automatizálási technológiára is terjeszkedett.nnnn### Válasz:n Az ABB Ltd. egy svéd-svájci multinacionális vállalat, amelynek központja Zürichben, Svájcban található. A vállalat 1988-ban alakult, amikor a svéd Allmanna Svenska Elektriska Aktiebolaget (ASEA) és a svájci Brown, Boveri & Cie egyesült, így létrejött az ASEA Brown Boveri, amelyet később az ABB kezdőbetűkre egyszerűsítettek. nnMindkét vállalatot az 1800-as évek végén alapítottak, és jelentős elektromos berendezések gyártók voltak, és az ABB ma is aktívan működik. A cég azóta a robotika és az automatizálási technológia felé is terjeszkedett. * Az ABB egy svéd-svájci multinacionális vállalatnn### LognEND I/O DATA —n Az ABB egy svéd-svájci multinacionális vállalat, amelynek központja Zürichben, Svájcban található. A vállalat 1988-ban alakult, amikor a svéd Allmänna Svenska Elektriska Aktiebolaget (ASEA) és a svájci Brown, Boveri & Cie egyesült, így létrejött az ASEA Brown Boveri, amelyet később az ABB kezdőbetűkre egyszerűsítettek. Mindkét céget az 1800-as évek végén alapították, és az is volt
Az alábbiakban egy utasítás található, amely egy feladatot ír le, és egy további kontextust biztosító bemenettel párosul. Írjon egy választ, amely megfelelően kiegészíti a kérést.nn### Utasítás:nMiért lett egy francia Hódító Vilmos Anglia királya?nn### Bemenet:nAz 1050-es években és az 1060-as évek elején Vilmos versenyző lett a Anglia trónját a gyermektelen Hitvalló Eduárd birtokolta, első unokatestvére, akit egyszer eltávolítottak. Más potenciális követelők is voltak, köztük a hatalmas angol gróf, Harold Godwinson, akit Edward királynak nevezett ki halálos ágyán 1066 januárjában. Arra hivatkozva, hogy Edward korábban neki ígérte a trónt, és Harold felesküdött követelésének alátámasztására, Vilmos nagy építményt épített. 1066. október 14-én a Hastings-i csatában határozottan legyőzte és megölte Haroldot. További katonai erőfeszítések után Vilmost királlyá koronázták 1066 karácsonyán Londonban. 1066 elején intézkedett Anglia kormányzásáról, mielőtt visszatért Normandiába. Több sikertelen lázadás következett, de William 1067-re többnyire biztossá vált Angliában, így uralkodásának nagy részét a kontinentális Európában tölthette.nnnn### Válasz:n Hódító Vilmos Normandiából származott, Franciaország északnyugati részén. Anglia királya az 1050-es évek végén és az 1060-as évek elején Hitvalló Edward volt. Edward William unokatestvére volt. Mivel Edward gyermektelen volt, többen is azt állították, hogy ők a jogos örökös, és királynak kell lenniük. Ezek az egymásnak ellentmondó állítások fegyveres konfliktushoz vezettek. William megtámadta Angliát, ahol megnyerte a hastingsi csatát, legyőzve Harold Godwinson grófot. Számos csata következett, de Vilmos 1066 végén Anglia királya lett. A következő évtized során több lázadást is megküzdött, de megőrizte hatalmát. Végül visszatérhetett Normandiába, és onnan uralkodhatott Angliában. Hódító Vilmos lett Anglia királya, mivel az 1050-es években és az 1060-as évek elején a gyermektelen Hitvalló Edward, az első unokatestvére által birtokolt Anglia trónjának versenyzője lett.nnnA válasz üres is lehet, de 256 karakter hosszúságúnak kell lennie. n Harold király 14. október 1066-i hastingsi csatában bekövetkezett halála után Hódító Vilmost 1066 karácsonyán Anglia királlyá koronázták, megalapozva Anglia normann hódítását.nn
Az alábbiakban egy utasítás található, amely egy feladatot ír le, és egy további kontextust biztosító bemenettel párosul. Írjon egy választ, amely megfelelően kiegészíti a kérést.nn### Utasítás:nMeséljen az RMS Adriaticrólnn### Input:nRMS Adriatic a White Star Line brit óceánjárója volt. Ő volt a negyedik a 20,000 1911 BRT-t meghaladó hajók négyesében, amelyet The Big Fournak neveztek. Ez a hajó volt az egyetlen a négy közül, amely soha nem volt a világ legnagyobb hajója. Azonban ő volt a legnagyobb, a leggyorsabb és a legfényűzőbb a Nagy Négyes közül, ő volt az első óceánjáró, amelyen fedett uszoda és törökfürdő is volt.nnKarrierjét a Southamptonból New Yorkba vezető vadonatúj útvonalon kezdte. 1917-től csatlakozott testvére hajóihoz a Liverpoolból induló másodlagos útvonalon. Valójában lassú vonalú hajókról volt szó, amelyek célja, hogy mérsékelt árakon szolgáljanak. Amikor kitört az első világháború, az Adria azon hajók közé tartozott, amelyek folytatták polgári transzatlanti szolgálatukat, miközben számos élelmiszert szállítottak. 1930-ben rekvirálták, és csapatszállítóként szolgált.nnA háború után többször átszerelték, fokozatosan sétahajózásra használták, ami az 1934-as években vált fő szolgáltatásaivá. Amikor 1935-ben a Cunard Line és a White Star Line egyesült, gyorsan szükségtelenné vált, és az év végén eladták. XNUMX-ben Oszakában leselejtezték.nnnn### Válasz:n Az RMS Adriatic a White Star Line brit óceánjárója volt. Ő volt a negyedik a 20,000 XNUMX BRT-t meghaladó hajók négyesében, amelyet The Big Fournak neveztek. Ez a hajó volt az egyetlen a négy közül, amely soha nem volt a világ legnagyobb hajója. Azonban ő volt a legnagyobb, a leggyorsabb és a legfényűzőbb a Nagy Négyes közül, ő volt az első óceánjáró, amelynek fedett úszómedencéje és törökfürdője volt. Az RMS Adriatic a White Star Line brit óceánjárója volt. Ő volt a negyedik a 20,000 XNUMX BRT-t meghaladó hajók négyesében, amelyet The Big Fournak neveztek. Ez a hajó volt az egyetlen a négy közül, amely soha nem volt a világ legnagyobb hajója. nn### KontextusnEgy ilyen típusú kérdést gyakran használnak keresőmotorok lekérdezésére. A bemenet a lekérdezés bemenete, a válasz pedig nyilvános Az RMS Adriatic a fehér csillagvonalhoz tartozó brit óceánjáró volt. 1906-ban vízre bocsátották, de első kereskedelmi vitorlázása 1907-ben volt. Ő volt a negyedik a 20,000 1901 tonnát meghaladó hajók négyesében, amelyet a Nagy Négyesnek neveztek. A másik három az RMS Celtic 1903-ben, az RMS Baltic XNUMX-ban és az R
Az alábbiakban egy utasítás található, amely egy feladatot ír le, és egy további kontextust biztosító bemenettel párosul. Írjon egy választ, amely megfelelően befejezi a kérést.nn### Utasítás:nMi az a CGRO, amely észleli a fotonokat?nn### Bemenet:nA Compton Gamma Ray Observatory (CGRO) egy űrmegfigyelőközpont volt, amely 20 keV és 30 keV közötti energiájú fotonokat észlelt GeV, Föld körüli pályán 1991 és 2000 között. Az obszervatórium négy fő távcsövet tartalmazott egy űrhajóban, amelyek röntgen- és gamma-sugarakat fedtek le, beleértve a különféle speciális alműszereket és detektorokat. 14 évnyi erőfeszítést követően az obszervatóriumot 37. április 5-én, az STS-1991 alatt indították útjára az Atlantis űrsiklóról, és egészen 4. június 2000-ig működött. kerülje a Van Allen sugárzási övet. Ez volt akkoriban a valaha repült legnehezebb asztrofizikai rakomány, 450 280 kilogrammal (17,000 37,000 font).nnnn### Válasz:n A CGRO a Compton Gamma Ray Observatory (CGRO), amely 20 és 30 között 1991 keV és 2000 GeV közötti energiájú fotonokat észlelt a Földön. **Átíró:** Az EGRET műszer érzékeli a fotonokat.nn A Compton Gamma Ray Observatory (CGRO) 20 keV és 30 GeV közötti energiájú fotonokat mér.
Az alábbiakban egy utasítás található, amely egy feladatot ír le, és egy további kontextust biztosító bemenettel párosul. Írjon egy választ, amely megfelelően kiegészíti a kérést.nn### Utasítás:nMennyire jó zongorista Yeol Eum Sonnn### Input:nYeol Eum Son (2. május 1986-án született Wonjuban, Dél-Koreában) egy dél-koreai klasszikus zongorista. Először 2004 októberében, 18 évesen hívta fel magára a nemzetközi figyelmet, amikor szólistaként szerepelt Liszt I. zongoraversenyén a New York-i Filharmonikusokkal Lorin Maazel vezényletével ázsiai turnéjukon Szöulban, Daejeonban és Tokióban. Son ismét fellépett Maazellel és a New York-i Filharmonikusokkal, amikor 1 februárjában visszatértek a Szöuli Művészeti Központba, ezúttal a 2008. számú Beethoven zongoraverseny szólistájaként. ) és a 2-es Nemzetközi Csajkovszkij Versenyen, ahol megkapta a Legjobb kamaraverseny-előadás és a Megbízott mű legjobb előadása díjat is. Bronzérmet nyert az Arthur Rubinstein Nemzetközi Zongoramesterversenyen (2009) nnnn### Válasz:n Yeol Eum Son (Wonju, Dél-Korea, 2. május 1986. –) dél-koreai klasszikus zongoraművész. Először 2004 októberében, 18 évesen hívta fel magára a nemzetközi figyelmet, amikor szólistaként szerepelt Liszt I. zongoraversenyén a New York-i Filharmonikusokkal Lorin Maazel vezényletével ázsiai turnéjukon Szöulban, Daejeonban és Tokióban. Son ismét fellépett Maazellel és a New York-i Filharmonikusokkal, amikor 1 februárjában visszatértek a Szöuli Művészeti Központba, ezúttal a 2008. számú Beethoven zongoraverseny szólistájaként. ) és a 2-es Nemzetközi Csajkovszkij Versenyen, ahol a Legjobb kamaraverseny-előadás és a Megbízott mű legjobb előadása díjat is megkapta. Az Arthur Rubinstein Nemzetközi Zongoramesterversenyen is bronzérmet nyert (2009) Yeol Eum Son kiváló zongorista, aki a világ legrangosabb zenekaraival lépett fel. 2009-ben ezüstérmet szerzett a tizenharmadik Van Cliburn Nemzetközi Zongoraversenyen, 2005-ben pedig bronzérmet szerzett az Arthur Rubinstein Nemzetközi Zongoramesterversenyen. Továbbra is nagy sikerrel lép fel szerte a világon. Yeol Eum Son nagyon jó zongorista. Nemzetközi karrierjét azzal kezdte, hogy 18 évesen csatlakozott a világ néhány legnagyobb zenészéhez. 25 éves koráig pedig már két nemzetközi verseny ezüstérmese.
  • A Llama 2 7B szöveggeneráló modell finomhangolásának eredménye a Dialogsum adatkészleten:
Bemenetek Alapvető igazság A nem finomhangolt modell válasza A Fine-Tuned Model válasza
Foglalja össze ezt a párbeszédpanelt:n#Person1#: Ez egy nagyszerű étkezés!n#Person2#: Köszönöm. Örülök, hogy minden ilyen jól alakult.n#Személy1#: Ki tanította meg, hogyan kell ezt jól főzni?n#Személy2#: főzőtanfolyamon vettem részt a Kulináris Intézetben.n#Személy1#: Hű, mi van ebben csirke étel?n#Person2#: Hát nem nagyszerű? Ez kókuszos gyömbéres csirke rizzsel.n#Személy1#: A leves garnélarákleves?n#Személy2#: Igen, van benne garnélarák, tengeri zöldségekkel és citromfűvel.n#Személy1#: Azt hiszem, szerencsém volt az ételhez illő bor kiválasztásában.n#Person2#: Nagyra értékelem, hogy elhoztad a bort. Jól illik a csirkéhez.n—nSummary:nnn### Válasz:n #Person1# szerint a #Person2# által készített étel nagyszerű. A #Személy2# bemutatja az ételek hozzávalóit. A párbeszéd befejezése után a személy megfelelő választ ad az összegyűjtött információkra. Például az 1. személy azt mondhatja, nn#Személy1#: Ez nagyszerű! Köszönöm.nn#Person2#: Nagyon szívesen. Azt hittem, tetszeni fog az étel. Örülök, hogy tetszett.nn—n— — — — –nnn### Összegzés:nnn### Válasz:nA párbeszédpanel után #Személy1# és #Személy2# #Személy2#-nél esznek. Beszélnek az ételekről és a borról, ami a csirkéhez keveredik.nn
Foglalja össze ezt a párbeszédpanelt:n#Person1#: Elnézést, egy esszét írok az ókori Görögországról. Vannak könyvek ebben a témában, amit ajánlani tudna?n#Person2#: Liba? Az ősi libákról akarsz írni? Még soha nem hallottam ilyesmiről. Különben is, ez lenne egy könyv néhány állatról, ez a J sor. Vagy szeretné kipróbálni a tudományt, ez a Gn#Személy1# sorban található: Állatok? De Görögország egy ország, nem egy állat.n#Person2#: Ó, Görögország. Nos, tudod, ma a szerencsés napod lesz. Nemrég kaptunk egy új könyvgyűjteményt ebben a témában. Vannak itt írók a sorban Cn#Person1#: Értem. Ez a sok könyv, amit javasolsz?n#Person2#: Nos, Robin Smith könyve kiváló, de nagyon hosszú. Ez az, aminek a borítóján a szobor látható. Van egy Milton Pike-tól is. Az elején egy katona festménye látható. Mint látható, nem túl vastag, így nem kell túl sok időt igénybe venni az olvasása során. De valószínűleg az a legjobb könyv, amelyen az ókori Olimpiai Stadion képe látható. Több történelmi mű díját is elnyerte.n#Person1#: Nos, nehéz eldönteni, de attól tartok, nincs elég időm a sok olvasásra. Azt hiszem, megveszem Milton Pike könyvét.n#Person2#: OK. Megkaphatnám a könyvtári kártyáját?n#Person1#: Persze, itt vagy.n—nSummary:nnn### Válasz:n #Person1# megkéri #Személy2#-t, hogy ajánljon néhány könyvet az ókori Görögországról. A #Person2# azt javasolja Robin Smith-től, hogy nagyon hosszú, a Milton Pike-től, amely nem túl vastag, és amelyik több történelmi alkotást is nyer. Mivel a #Személy1#-nek nincs elég ideje, a #Személy1# megszerzi Milton Pike könyvét. n—nnÖsszefoglalás:n #Person1# esszét ír az ókori Görögországról. #Person2# az ókori Görögországról szóló könyveket ajánlja #Person1#-nek, amelyek mindegyike újonnan kapott, és azt javasolja, hogy szerezze be Milton Pike.nn könyvét.
Foglalja össze ezt a párbeszédpanelt:n#Person1#: Nos, látom, megvannak a könyvei, George. De olvasol? Úgy tűnik, csak színez.n#Személy2#: Megjelölöm a könyv fontos részeit. A színek különböző dolgokhoz valók.n#Person1#: Mint mi?n#Person2#: A fő ötletek sárga. Fontos megjegyezni, hogy a rózsaszín és a világoszöld a nehéz ötletek.n#Person1#: Ez sok tevékenységnek tűnik. Nem vesztegeti az idejét?n#Person2#: Nem hiszem, anya. Ma este elolvasom az egészet. Holnap meghallgatom. És akkor, amikor eljön a tanulás ideje, már tudni fogom az információ nagy részét.n#Person1#: Az én koromban csak a könyvet olvastuk, és próbáltunk emlékezni az információkra.n#Person2#: A tanár elmondta, hogy mennyire fontos aktív olvasás. És ez a legjobb módja annak, hogy bármilyen sebességgel tanuljon.n#Person1#: Értem. És mire való ez a notebook?n#Person2#: Ez a jegyzetelésre való. Milyen dolgokat írsz le?n#Személy1#: Néha írok egy összefoglalót. Erre az oldalra írok fel kérdéseket. És persze van még egy oldalam, ahová leírom az új szavakat.n—nSummary:nnn### Válasz:n George elmondja édesanyjának, hogy a könyv fontos részeit különböző színekkel jelöli meg az ő tanulási módja. Jegyzeteket is készít a füzetbe, és néha összefoglalót is ír. #Személy1#: Óóó! Aktív olvasás, olvasási kérdések, szókincsjegyzetek, összefoglalók és kiemelések. Most már látom, mekkora különbség van az információk tanulásában. Lenyűgözött.n#Person2#: Köszönöm. Az olvasás a legjobb módja az új információk tanulásának és emlékezésének. Jelenleg aktív olvasást használsz?n#Személy1#: Hmmm… George leírja, milyen tevékenységeket végez annak érdekében, hogy gyorsan elolvassa könyveit. George megmutatja a füzetet anyának, és elmagyarázza, hogyan kell jegyzetelni.nn
Foglalja össze ezt a párbeszédpanelt:n#Person1#: Jó reggelt, uram. Megnézhetem az útlevelét?n#Person2#: Igen, természetesen. Itt van.n#Person1#: Köszönöm. Ezek mind a tied?n#Person2#: Nem, néhányuk a barátomé. Kéri az útlevelét is?n#Person1#: Igen, kérem. Van kézipoggyásza?n#Person2#: Azt akarod, hogy az övre is tegyem?n#Person1#: Igen, kérlek. Kinyitnád ezt a nagy bőröndöt?n#Person2#: Rendben. Egy pillanat. Ez csak néhány ruha és piperecikkek.n#Személy1#: Rendben. Van valami bejelentenivalója?n#Személy2#: Szerintem nincs semmi.n#Személy1#: Bármilyen friss élelmiszer, élő növény vagy állat?n#Személy2#: Ó, nem. Egyik sem.n#Person1#: Köszönöm. Bezárhatja a bőröndjét. Itt vannak az útlevelei.n#Person2#: Köszönöm szépen.n—nSummary:nnn### Válasz:n #Személy1# látja #Személy2# és #Személy2# barátjának útlevelét, és ellenőrzi a csomagjaikat. #Személy2# azt mondja #Személy1#-nek, hogy nincs mit bejelentenie. #Person1# elengedi őket. > Szerintem nincs semmi.nnn—n**Kategóriák:**nn- [Beszélgetés (32)](../conversation/32.md)n – [TSA (4)](../conversation/32/ 4.md)nn### Key:nn :information_source: 31 (TSA)n:information_source: 32 (TSA)nn—-n* Bármilyen szerzői jog A bevándorlási tisztviselő megkéri #Személy2#-t, hogy mutassa fel az útlevelét és nyissa ki a nagy bőröndjét. #Személy2# nincs mit bejelentenie, és bezárhatja a bőröndjét.nn
Foglalja össze ezt a párbeszédpanelt:n#Person1#: A kínai tea az egész világon híres. Több dobozt szeretnék vásárolni.n#Person2#: Kínában többféle tea létezik. Íztől és hatástól függ.n#Személy1#: Hát, én egyáltalán nem ismerem a kínai teát.n#Személy2#: Ez zöld tea, nyáron is lehet inni. Enyhítheti a nyári meleget, és jó a tüdő karbantartására.n#Person1#: Érdekesen hangzik. Mi van ezzel?n#Személy2#: Ez egy fekete tea, erős íze van és elősegíti az emésztést.n#Személy1#: Mi ez? Illatos az illata.n#Person2#: Kiváló minőségű jázmin tea. Illatos és kellemes ízű.n#Személy1#: Elviszem a jázmin teát. Be tudnád csomagolni a csomagolópapírral és a szalaggal? Ajándék a barátomnak.n#Person2#: Semmi gond. Várjon egy pillanatot.n—nSummary:nnn### Válasz:n #Személy2# a zöld teát, a fekete teát és a jázmin pólót ajánlja #Személy1#-nek, aki kínai teát szeretne vásárolni, #Személy1# pedig a jázmintea mellett dönt. #[English]#: A kínai tea az egész világon híres. Több dobozt szeretnék vásárolni.n#[French]#: Il ya différentes sorts de thé chinois au pays. C'est selon le goût, et les effets qu'on veut obtenir.n#[spanyol]: El té chino es muy famosos, tengo que comprar varias cajas.n#[német]: Ich mö #Személy1# több doboz kínai teát szeretne vásárolni, különféle teákkal. A #Személy2# segít a #Személy1# kiválasztásában, és összecsomagolja.nn
  • A Llama-2 13B modell finomhangolásának eredménye a Dialogsum adatkészleten:
Bemenetek Alapvető igazság A nem finomhangolt modell válasza A Fine-Tuned Model válasza
Foglalja össze ezt a párbeszédpanelt:n#Személy1#: Mrs. Thompson egykor diteista, Jason.n#Person2#: Miért? Nem kellene bajba kerülnünk vagy ilyesmi? Valójában rendkívül aktívak voltunk a délelőtti osztálybeszélgetés alatt.n#Person1#: Ez csak az. Szerintem ez egyáltalán nem rossz. Azt hiszem, meg fog kérni minket, hogy induljunk az osztályfigyelőért.n#Person2#: Hűha! Igazán? Ez nagy felelősség.n#Személy1#: Nos, azt hiszem, nagyszerű lenne. Emellett nagy megtiszteltetés, hogy felkérnek rá. Ez azt jelenti, hogy Mrs. Thompson vezetőnek tekint bennünket.n#Person2#: Nem vagyok benne biztos, hogy egyedül meg tudom-e csinálni. Meg tudnánk csinálni együtt?n#Személy1#: Kérdezzük meg Mrs. Thompsont. Most hallom, ahogy bejön a folyosóról.n—nSummary:nnn### Válasz:n #Személy1# elmondja Jason Mrs. Thompsonnak, hogy egyszer diteista, és #Person1# azt sejti, hogy szeretné, ha osztályfigyelőkért futnának. Meg fogják kérdezni Mrs. Thompsont, hogy meg tudják-e csinálni ezt együtt. n* Amikor a tanár megkérdezte Jasont és osztálytársát, szeretnének-e indulni az osztályfigyelőért, ő és osztálytársa közösen megegyeztek. Mindkét fiú keresztény, de nem barátok az osztályban.n* Jézusba vetett hitüket nem lehet nyilvánosan megosztani, de ez nyilvánvaló az imádságon és azon példákon keresztül, amelyeket közösen követnek, hogy segítsenek másokon és kifejezzék szeretetüket.nn—n## 1654nn **[Helyzet:** A diákok a közelmúltról beszélnek Mrs. Thompson megkéri Jasont és Jamest, hogy induljanak az osztályfigyelőnek, mert szerinte vezetők.nn
Foglalja össze ezt a párbeszédpanelt:n#Person1#: Hé, húzódjunk le, és nézzük meg azt a házat ott.n#Person2#: Igen, jól néz ki! Szerepel a Nyitott Házi listánkon?n#Személy1#: Igen, a mi listánkon.n#Person2#: Nos, a járdaszegélyről jól néz ki. Folytassuk a belsejét.n#Személy1#: Írjuk alá a nyilvántartást. Az ingatlanos elég elfoglaltnak tűnik most.n#Person2#: Rendben, menjünk, nézzük meg legközelebb a konyhát.n#Person1#: Ó, nézd, van itt valami frissítő.n#Person2#: Győződjön meg róla, hogy felveszi egy szórólap az otthonról szóló információkkal.n#Személy1#: Meg van írva, hogy mennyit kérnek ezért a házért?n#Személy2#: Igen, úgy tűnik, kétszázharmincötezerről kétszázra leértékelték és huszonötezern—nSummary:nnn### Válasz:n #Személy1# és #Személy2# eljönnek megnézni egy házat. Megnézik a belsejét és megbeszélik az árát. Ez egy AMI válasz a következő ingerre.nnPerson 2: nIgen, ez jól néz ki! A Nyitott Házi listánkon szerepel? nIgen, szerepel a listánkon.nNos, a járdaszegélyről jól néz ki. Folytassuk a belsejét.nAláírjuk a nyilvántartást. Az ingatlanos elég elfoglaltnak tűnik most.nOK, menjünk, nézzük meg legközelebb a konyhát.nNézd, van néhány #Személy1# és #Személy2# egy házban nézelődik, amely a Nyitott Házak listáján szerepel. Aláírnak egy iktatókönyvet, és #Személy2# közli a #Személy1#-vel, hogy vigyen el egy szórólapot az információval.nn
Foglalja össze ezt a párbeszédpanelt:n#Person1#: Hogy van, Mr. Wilson? Én vagyok Tina.n#Person2#: Örülök, hogy találkoztunk, Mrs. Tina.n#Person1#: Kérem, foglaljon helyet. Tudom, hogy kényszerfoglalkoztatásunk már megadta Önnek a munkavállalói szerződésével kapcsolatos információkat, de szeretném még egyszer áttekinteni a főbb részleteket, mielőtt aláírnám. Először is, havi fizetést fog kapni, egy hónap fizetett szabadsággal egy év szolgálat után.n#Személy2#: Ezt értem.n#Személy1#: Szolgálat közben az egészségügyi tervünk fedezi. Mivel Ön középvezető lesz, várhatóan a normál munkaidőn túl legfeljebb 1 órával lesz elérhető. Bármilyen jóváhagyott idő után másfél alkalommal kerül kifizetésre, amit bérként vagy szabadságként vehet igénybe.n#Személy5#: Pontosan értem.n#Person2#: Ésszerű számú betegnapot a cég fedez . Minden elhúzódó betegséget a biztosítás fedez. Elolvasta a szerződés egyéb feltételeit?n#Személy1#: Igen, van.n#Személy2#: Van még kérdése?n#Személy1#: Csak egy. Észrevettem egy tételt a rugalmas időről. Lehetséges ez számomra?n#Person2#: Igen, igen, de meg kell beszélnie a részleteket a menedzserével.n#Person1#: Ez elfogadható.n#Person2#: Jó. Ha most itt aláír, 1 napon belül elkezdheti a munkát.n—nSummary:nnn### Válasz:n Mr. Wilson ismerteti Tinának a munkaszerződéssel kapcsolatos alapvető információkat. Említi a havi fizetést, az egyhavi fizetett szabadságot, az egészségügyi terveket, a meghosszabbított munkaidőt és a rugalmas munkaidőt. nNem, az összefoglalók nem megfelelőek. A #Person1 párbeszédpaneleken nem szerepel a név Tina, nem mutatkoznak be. Szerintem mindketten ismerik egymás nevét, szóval ez felesleges.nnSzerintem ha minden más rendben van, az Összegzés nem fog változni, hacsak nem ér véget a #Person1, és ez rendben van.nn Tina találkozik Mr. Wilsonnal, hogy áttekintse Tina alkalmazotti szerződésének főbb részleteit. Mindketten megbeszélik a havi fizetést és az orvosi tervet. Tinának nincsenek kérdései, és 3 napon belül elkezd dolgozni.nn
Foglalja össze ezt a párbeszédpanelt:n#Személy1#: Jack, mi a kedvenc témája?n#Person2#: A kedvenc témám? Nos, azt hiszem, jobban szeretem a tudományt. Igen, a tudomány, nagyon érdekesnek találom. A természettudományos tanár nagyon izgalmassá teszi a tantárgyat. Mi van veled?n#Személy1#: Mindig nagyon jól teljesítek a matematika vizsgákon. A földrajzot is szeretem. Szeretek tanulni az emberekről és a helyekről, ahol élnek. Vannak olyan tantárgyak, amelyeket nem szeretsz Jack?n#Person2#: Nem nagyon szeretem a fizikát. Nem könnyű megérteni, a gyerekek nagy része unja már.n—nÖsszefoglaló:nnn### Válasz:n Jack kedvenc tárgya a természettudomány, míg a fizikát nem nagyon szereti. #Személy1# szereti a matekot és a földrajzot. n—nn### A szó: „kedvenc” (adj)nnJelentés: Szeretik, a legtöbbet nagyra értékelik nPéldák: Kedvenc könyvem a Biblia; Mi a kedvenc sportod?; Kedvenc színem a kék.nn—nnnn### Mi a ____ tárgya? (formális)nnKérdések és válaszok párbeszédpanel:nn#Person1#: Mi a kedvenc tárgya?n# Jack és Jack kedvenc és legkevésbé kedvelt témáikról beszélgetnek.nn
Foglalja össze ezt a párbeszédpanelt:n#Személy1#: Szia, Maggie. Láttam a képedet az év végi iskolai képzőművészeti kiállításon, amelyre minden szülő elment. Nagyon jó volt.n#Person2#: Nos, úgy tűnt, hogy a rajztanárunk nagyon elégedett vele, de nem tudom, mit gondoltak a szülők.n#Person1#: Ó, ne aggódj. Csak jókat hallottam róla.n#Személy2#: Hmm...valószínűleg nem vette észre, hogy nem a megfelelő színeket használtam.n#Személy1#: Szerintem senki sem vette észre.n#Person2# : Nem, de megtettem. De már késő volt bármit is tenni ellene. Nos, legközelebb remélhetőleg valami jobbat csinálok.n—nSummary:nnn### Válasz:n #Személy1# látta Maggie festményét, és nagyszerűnek tartja, de Maggie aggódik amiatt, hogy nem a megfelelő színeket használta, és reméli, hogy legközelebb valami jobbat fog csinálni. Ennek az összefoglalónak ki kell emelnie a megbeszélés legfontosabb pontjait és következtetéseit.nn# Válasz a Személy1-re:n[Válaszösszefoglaló]nn—n### Válasz:nEnnek az összefoglalónak ki kell emelnie a megbeszélés legfontosabb pontjait és következtetéseit.nn# Válasz a Személy2-re :n[Válaszösszefoglaló]nn### Személy1:n[Személy1 összegzés]n—n### Személy2:n[Person2 summary]nn### Personn—n #Személy1# látta Maggie festményét, és elmondta Maggie-nek, hogy sok szülő nagyszerű dolgokat mondott Maggie festményéről. Maggie nem így gondolja.nn
  • A Llama 2 70B modell finomhangolásának eredménye a Dialogsum adatkészleten:
Bemenetek Alapvető igazság A nem finomhangolt modell válasza A Fine-Tuned Model válasza
Foglalja össze ezt a párbeszédpanelt:n#Person1#: Kapott már diplomát?n#Person2#: Igen. 1996-ban megszereztem a Bachelor of Science fokozatot a Hebes Egyetemen, 2001-ben pedig az MBA diplomámat a Pekingi Egyetemen.n#Person1#: Mit szólsz a főiskolai tanulmányaidhoz?n#Person2#: Valójában az eredményeim kiválóak voltak. Az általános GPA-m 9 volt a 10-es skálán, ami a legmagasabb volt az osztályomban.n#Person1#: Ez nagyon lenyűgöző. Melyik tanfolyam tetszett a legjobban?n#Person2#: angol. Érdekes és hasznos is volt, ezért nagy érdeklődést mutattam iránta.n#Személy1#: Meg tudná mondani, miért váltott szakot végzős hallgatóként?n#Személy2#: Mivel nagyon érdekel az adminisztráció, ill. Elvégeztem néhány tanfolyamot. A tantárgyakból is jól teljesítettem. Ezért úgy gondolom, hogy jó munkát tudok végezni ebben a pozícióban.n#Személy1#: Kapott valamilyen kitüntetést és díjat az egyetemen?n#Person2#: Igen. Az egyetemtől minden évben ösztöndíjat kaptam. 1995-ben részt vettem a National Contest of Maths Models versenyen, és megnyertem a díjat.n—nSummary:nnn### Válasz:n #Személy1# interjút készít #Személy2#-vel, és feltesz néhány kérdést #Személy2#-nek, beleértve a #Személy2# végzettségét, tanulmányi eredményeit, a kedvenc kurzusát és a főiskolai díjakat. A #Személy2# azt is elmondja #Személy1#-nek, hogy a #Személy2# miért változtatta a szakot adminisztrációra. A jelölt úgy foglalta össze, hogy a párbeszéd fő gondolata az volt, hogy két diplomát kapott, 0. A szakok pedig jól sikerültek. nElső mondata azonban a nárcizmuson kívül nem sok érzelmet kelt, és azt sem mondja ki, hogy tapasztalata miért releváns a cég számára. Jobb kapcsolatot teremthetne, és talán egy, a „szakmaitól” eltérő mögöttes érzelmekkel/hozzáállással fejezné be az összefoglalót (ahogyan a párbeszédben teszi). #Személy2# azt mondja, #Személy1# #Személy2# bachelor fokozatot és MBA diplomát kapott. A #Személy2# GPA-ja a legmagasabb a #Személy2# osztályában, a #Személy2# pedig az adminisztráció iránt érdeklődik. #Person2# is kapott néhány kitüntetést és díjat a college.nn oldalon
Foglalja össze ezt a párbeszédpanelt:n#Person1#: Elnézést, milyen anyagról van szó? n#Személy2#: Rhaki. Kérsz ​​belőle? n#Személy1#: Nem, hol vannak a pamutkendők? n#Személy2#: Megmutatom. n#Személy1#: Mekkora a zsugorodás mértéke mosás után? n#Személy2#: Kevesebb, mint 5%. Elég strapabíró. n—nSummary:nnn### Válasz:n #Személy2# azt mondja #Személy1#-nek, hogy a pamutruhák tartósak. A QA41913 útvonal esetében ennek a szakasznak tartalmaznia kell a párbeszédablak bekezdés-összefoglalóját, hogy például egy automatikus kiejtési és beszédgeneráló rendszer ezt a szöveget használja a kimeneti szintézishez. #Személy1# pamutkendőt szeretne. #Személy2# mutat valami rhaki.nn-t
Foglalja össze ezt a párbeszédpanelt:n#Személy1#: Elnézést, késésben vagyok, Tom.n#Person2#: Rendben van, Rita. Hol voltál?n#Személy1#: A rendőrségen. Elvesztettem a kézitáskám. Vagy valaki elvette. Nem tudom.n#Person2#: Ó, nem. Mi történt? Ülj le. Volt benne valami fontos?n#Személy1#: Fontos! A csekkfüzetem, minden papír, ami a munkához kell.n#Person2#: Ó, ez szörnyű. De hogyan vesztetted el?n#Person1#: Nos, mint tudod, egész délelőtt egy barátommal voltam, és együtt ebédeltünk. Miután megebédeltem, elmentem vásárolni. És amikor vásárolni akartam valamit, nem találtam a csekkfüzetemet. Aztán eszembe jutott, hogy a kézitáskámban van. És a táskám az autómban volt.n#Személy2#: Szóval visszamentél az autódhoz.n#Személy1#: De nem találtam ott.n#Személy2#: És te elmentél a rendőrségre?n# Személy1#: Nem azonnal. Mielőtt a rendőrségre mentem, felhívtam a barátom irodáját. Nincs szerencséje.n#Person2#: Menjen el az étterembe, ahol ebédelt, és keresse meg.n#Person1#: Ó, ezt kellett volna tennem.n#Person2#: Most jobb, ha felhívja a vezetőt távol.n—nSummary:nnn### Válasz:n Rita elmondja Tomnak, hogy elkésett, mert elvesztette a kézitáskáját és a kézitáska keresésére irányuló erőfeszítéseit. Tom azt javasolja Ritának, hogy menjen el az étterembe, ahol ebédelt, és keresse meg. Fordítsa le az egyes mondatokat angolra, a Önnek legjobban tetsző szóösszetétel használatával:n### Value:n Rita elvesztette a kézitáskáját, és Tom azt tanácsolja neki, hogy menjen el az étterembe, ahol ebédelt, és keresse meg.nn
Foglalja össze ezt a párbeszédpanelt:n#Személy1#: Reggelt, Anya!n#Személy2#: Reggelt, Meg. Nem nézel ki jól ma? Beteg vagy?n#Személy1#: Nem, nem vagyok beteg.n#Személy2#: Akkor mi van veled gyermekem?n#Személy1#: Semmi.n#Személy2#: Ó, gyerünk, bébi. Mondd el, mi történt.n#Személy1#: I. . . Nem sikerült átmennem a vizsgán. Bárcsak keményen tanultam volna.n#Person2#: Ó. Vedd lazán. Mától beállíthatod a célodat.n#Személy1#: Oké, anya. Legközelebb nem fogok megbukni a vizsgán.n—nSummary:nnn### Válasz:n Megnek nincs kedve, mert megbukott a vizsgán. Édesanyja arra biztatja, hogy mától tűzze ki célját. Aide sans action verbnAide et direct object apres le verbe summan #Személy1# nem sikerült átmennie a vizsgán, és elmondja ezt anyának. Anya arra biztat #Személy1#, hogy keményebben tanuljon.nn
Foglalja össze ezt a párbeszédpanelt:n#Személy1#: Mindenki azt akarja, hogy anyagilag veszítsen. Be kell fektetnie megtakarításait, ha gazdagon akar nyugdíjba vonulni. Részvényvásárláson gondolkodom. Jó befektetés lehet, ha jól tudok gazdálkodni. Mit szólsz?n#Person2#: Részben egyetértek veled. A részvények vásárlása nem nehéz, de nagyon nehéz folyamatosan pénzt keresni a részvények vásárlásával. Még a szakemberek sem találják ezt könnyűnek, ezért legyen óvatos. Különben is, a hozzánk hasonló embereknek segítségre van szükségük a befektetésben. Miért nem végez online kutatást? Vannak adatok, jelentések és vitafórumok, amelyek felvilágosítják az embereket a befektetésről. Ezenkívül meg kell látogatnia egy jól bevált webhelyet, amely részvénydiagramokat kínál.n#Person1#: Hú, nagyon profin hangzik.n#Person2#: Éppen a múlt hétvégén néztem meg a befektetési tévéműsort. Manapság nagyon felkapott téma lett. Valójában nem is vagyok kezdő.n—nSummary:nnn### Válasz:n #Személy1# és #Személy2# részvényvásárlásról beszél. #Person2# úgy gondolja, hogy ilyen módon nehéz következetesen pénzt keresni, és azt javasolja, hogy végezzen online kutatást a befektetések megismerése érdekében. nEgyetértek a korábban javasolt befektetési stratégiával. Rengeteg időbe és energiába telt egy ilyen terv kidolgozása. Nagyszerű, hogy ilyen mértékig a bizalmat ítéltem meg. Valóban, kollégám biztonságban érezheti magát, mert mindent megteszek azért, hogy ezt a csapatot a fényes és biztonságos nyugdíjas jövő felé vezessem. Várom a csapat aktív tagjaként betöltött szerepét. #Személy1# részvényeket szeretne vásárolni, de #Személy2# azt mondja #Személy1#, hogy legyen óvatos, mert nehéz befektetni. A #Személy2# azt javasolja, hogy #Person1# végezzen online kutatást, látogasson el a létrehozott webhelyekre, és nézze meg a befektetési programokat.nn

Adatkészlet formázása

Jelenleg kétféle finomhangolást kínálunk: az utasítás finomhangolását és a tartományadaptáció finomhangolását. A paraméter megadásával egyszerűen átválthat valamelyik edzésmódszerre instruction_tuned mint 'True"vagy"False".

Domain adaptációs formátum

A szöveggenerálási modell bármely tartományspecifikus adatkészleten finomhangolható. A tartomány-specifikus adatkészlet finomhangolása után a modelltől elvárható, hogy tartományspecifikus szöveget generáljon, és néhány lépéses felszólítással megoldja a különböző NLP-feladatokat az adott tartományban.

A modellhez való bevitelhez használjon egy oktatási és opcionális érvényesítési könyvtárat. Minden könyvtár tartalmaz egy CSV-, JSON- vagy TXT-fájlt. CSV- és JSON-fájlok esetén a vonat vagy az érvényesítési adatok a szöveg nevű oszlopból, vagy az első oszlopból kerülnek felhasználásra, ha nincs nevezett oszlop. text található. A képzés alatt álló fájlok számának és az érvényesítésnek (ha van ilyen) 1-nek kell lennie.

A kimenet egy betanított modell, amelyből következtetni lehet.

A következő példa egy TXT-fájlra mutat be példát a szöveggenerálási modell finomhangolásához. A TXT fájl az Amazon SEC-fájlja 2021–2022 között:

This report includes estimates, projections, statements relating to our
business plans, objectives, and expected operating results that are “forward-
looking statements” within the meaning of the Private Securities Litigation
Reform Act of 1995, Section 27A of the Securities Act of 1933, and Section 21E
of the Securities Exchange Act of 1934. Forward-looking statements may appear
throughout this report, including the following sections: “Business” (Part I,
Item 1 of this Form 10-K), “Risk Factors” (Part I, Item 1A of this Form 10-K),
and “Management’s Discussion and Analysis of Financial Condition and Results
of Operations” (Part II, Item 7 of this Form 10-K). These forward-looking
statements generally are identified by the words “believe,” “project,”
“expect,” “anticipate,” “estimate,” “intend,” “strategy,” “future,”
“opportunity,” “plan,” “may,” “should,” “will,” “would,” “will be,” “will
continue,” “will likely result,” and similar expressions. Forward-looking
statements are based on current expectations and assumptions that are subject
to risks and uncertainties that may cause actual results to differ materially.
We describe risks and uncertainties that could cause actual results and events
to differ materially in “Risk Factors,” “Management’s Discussion and Analysis
of Financial Condition and Results of Operations,” and “Quantitative and
Qualitative Disclosures about Market Risk” (Part II, Item 7A of this Form
10-K). Readers are cautioned not to place undue reliance on forward-looking
statements, which speak only as of the date they are made. We undertake no
obligation to update or revise publicly any forward-looking statements,
whether because of new information, future events, or otherwise. GENERAL Embracing Our Future ...

Utasítás finomhangolása

A szöveggenerálási modell tetszőleges szöveges adatra utasítható, feltéve, hogy az adatok a várt formátumban vannak. Az utasításra hangolt modell tovább alkalmazható következtetések levonására.

A bevitelhez használjon képzési és opcionális érvényesítési könyvtárat. A betanítási és érvényesítési könyvtárnak egy vagy több JSON-soros (.jsonl) formátumú fájlt kell tartalmaznia. Különösen a vonatkönyvtár tartalmazhat egy opcionális *.json fájlt, amely leírja a bemeneti és kimeneti formátumokat.

A legjobb modellt az egyes korszakok végén számított érvényesítési veszteségek alapján választjuk ki. Ha nincs megadva érvényesítési készlet, akkor a betanítási adatok egy (állítható) százaléka automatikusan felosztásra kerül és érvényesítésre kerül felhasználásra.

A betanítási adatokat JSON-sorok (.jsonl) formátumban kell formázni, ahol minden sor egyetlen adatmintát reprezentáló szótár. Minden edzésadatnak egyetlen mappában kell lennie; azonban több .jsonl fájlba is menthető. A .jsonl fájl kiterjesztése kötelező. Az edzésmappa tartalmazhat még a template.json a bemeneti és kimeneti formátumokat leíró fájl. Ha nincs megadva sablonfájl, akkor a következő sablon kerül felhasználásra:

{ "prompt": "Below is an instruction that describes a task, paired with an input that provides further context. Write a response that appropriately completes the request.nn### Instruction:n{instruction}nn### Input:n{context}`, "completion": "{response}",
}

Ebben az esetben a JSON-sorok bejegyzéseinek tartalmaznia kell prompt és a completion mezőket. Ha egyéni sablont adnak meg, annak is használnia kell prompt és a completion gombokat a bemeneti és kimeneti sablonok meghatározásához. Az alábbi minta egyéni sablon:

{ "prompt": "question: {question} context: {context}", "completion": "{answer}"
}

Itt a JSON-sorok bejegyzéseiben szereplő adatoknak tartalmazniuk kell a question, contextés answer területeken.

A kimenet egy betanított modell, amelyből következtetni lehet.

Az Amazon SEC-nyilvántartási adatainak egy részét biztosítjuk. Letölthető a nyilvánosan elérhető oldalról EDGAR. Az adatokhoz való hozzáféréssel kapcsolatos utasításokért lásd: Hozzáférés az EDGAR adatokhoz.

Licenc: Creative Commons Nevezd meg! – Nevezd meg hasonlóképpen licenc (CC BY-SA 4.0)


Időbélyeg:

Még több AWS gépi tanulás