כוונן את Llama 2 ליצירת טקסט באמזון SageMaker JumpStart | שירותי האינטרנט של אמזון

כוונן את Llama 2 ליצירת טקסט באמזון SageMaker JumpStart | שירותי האינטרנט של אמזון

היום, אנו נרגשים להכריז על היכולת לכוונן עדין דגמי Llama 2 על ידי Meta באמצעות אמזון SageMaker JumpStart. משפחת Llama 2 של מודלים של שפה גדולה (LLMs) היא אוסף של מודלים של טקסט יצירתי מאומנים מראש, בקנה מידה של 7 מיליארד עד 70 מיליארד פרמטרים. LLMs מכוונים עדין, הנקראים Llama-2-chat, מותאמים למקרי שימוש בדיאלוג. אתה יכול בקלות לנסות את המודלים האלה ולהשתמש בהם עם SageMaker JumpStart, שהוא רכזת למידת מכונה (ML) המספקת גישה לאלגוריתמים, מודלים ופתרונות ML כדי שתוכל להתחיל במהירות עם ML. עכשיו אתה יכול גם לכוונן 7 מיליארד, 13 מיליארד ו-70 מיליארד פרמטרים של דגמי יצירת טקסט של Lama 2 ב- SageMaker JumpStart באמצעות סטודיו SageMaker של אמזון ממשק משתמש בכמה קליקים או באמצעות SageMaker Python SDK.

מודלים של יסודות בינה מלאכותית גנרטיבית היו המוקד של רוב המחקר והשימוש במקרי ML ובינה מלאכותית כבר למעלה משנה. מודלים בסיסיים אלו מתפקדים טוב מאוד עם משימות גנרטיביות, כגון הפקת טקסט, סיכום, מענה לשאלות, יצירת תמונות ווידאו ועוד, בגלל הגודל הגדול שלהם וגם בגלל שהם מאומנים על כמה מערכי נתונים גדולים ומאות משימות. למרות יכולות ההכללה הנהדרות של מודלים אלו, לעיתים קרובות ישנם מקרי שימוש בעלי נתוני תחום מאוד ספציפיים (כגון שירותי בריאות או שירותים פיננסיים), שבגללם ייתכן שהמודלים הללו לא יוכלו לספק תוצאות טובות עבור מקרי שימוש אלו. כתוצאה מכך יש צורך בכוונון נוסף של מודלים אלו בינה מלאכותית על פני הנתונים הספציפיים למקרה ולתחום השימוש.

בפוסט זה, אנו עוברים דרך כיצד לכוונן דגמי יצירת טקסט מאומנים מראש של Llama 2 באמצעות SageMaker JumpStart.

מה זה לאמה 2

Llama 2 הוא מודל שפה אוטומטי רגרסיבי המשתמש בארכיטקטורת שנאי אופטימלית. Llama 2 מיועד לשימוש מסחרי ומחקרי באנגלית. הוא מגיע במגוון גדלים של פרמטרים - 7 מיליארד, 13 מיליארד ו-70 מיליארד - כמו גם וריאציות מאומנות ומכווננות מראש. לפי Meta, הגרסאות המכווננות משתמשות בכוונון עדין מפוקח (SFT) ולמידת חיזוק עם משוב אנושי (RLHF) כדי להתאים להעדפות אנושיות לעזרה ובטיחות. לאמה 2 הוכשרה מראש על 2 טריליון אסימונים של נתונים ממקורות זמינים לציבור. הדגמים המכוונים מיועדים לצ'אט דמוי עוזר, בעוד שניתן להתאים דגמים שהוכשרו מראש למגוון משימות יצירת שפה טבעית. לא משנה באיזו גרסה של המודל משתמש המפתח, ה מדריך שימוש אחראי מבית Meta יכול לסייע בהנחיית כוונון עדין נוסף שעשוי להיות נחוץ להתאמה אישית ואופטימיזציה של הדגמים עם אמצעי בטיחות מתאימות.

נכון לעכשיו, Llama 2 זמין באזורים הבאים:

  • זמין לפרוס מודל מאומן מראש: "us-west-2", "us-east-1", "us-east-2", "eu-west-1", "ap-southeast-1", "ap-southeast-2"
  • כוונן ופרוס את המודל המכוונן: “us-east-1”, “us-west-2”,“eu-west-1”

מה זה SageMaker JumpStart

עם SageMaker JumpStart, מתרגלי ML יכולים לבחור מתוך מבחר רחב של דגמי יסודות זמינים לציבור. מתרגלי ML יכולים לפרוס מודלים של בסיס למסורים אמזון SageMaker מופעים מסביבה מבודדת רשת והתאמה אישית של מודלים באמצעות SageMaker להדרכה ופריסה של מודלים. כעת אתה יכול לגלות ולפרוס את Llama 2 בכמה לחיצות ב-SageMaker Studio או באופן תכנותי דרך SageMaker Python SDK, מה שמאפשר לך להפיק ביצועי מודל ובקרות MLOps עם תכונות של SageMaker כגון צינורות SageMaker של אמזון, באגים של SageMaker באמזון, או יומני מיכל. המודל נפרס בסביבה מאובטחת של AWS ותחת בקרות ה-VPC שלך, ועוזר להבטיח אבטחת נתונים. בנוסף, תוכל לכוונן עדין את דגמי יצירת הטקסט המאומנים מראש של Llama2 7B, 13B ו-70B באמצעות SageMaker JumpStart.

כוונן דגמי Llama2

אתה יכול לכוונן את הדגמים באמצעות ממשק המשתמש של SageMaker Studio או SageMaker Python SDK. אנו דנים בשתי השיטות בחלק זה.

כוונון עדין ללא קוד באמצעות ממשק המשתמש של SageMaker Studio

ב-SageMaker Studio, אתה יכול לגשת לדגמי Llama 2 דרך SageMaker JumpStart תחת דגמים, מחברות ופתרונות, כפי שמוצג בצילום המסך הבא.

אם אינך רואה דגמי Llama 2, עדכן את גרסת SageMaker Studio שלך על ידי כיבוי והפעלה מחדש. למידע נוסף על עדכוני גרסה, עיין ב כבה ועדכן את אפליקציות Studio.

כוונן את Llama 2 ליצירת טקסט באמזון SageMaker JumpStart | Amazon Web Services PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.

אתה יכול גם למצוא ארבע גרסאות דגמים אחרות על ידי בחירה חקור את כל המודלים ליצירת טקסט או חיפוש לאמה בתיבת החיפוש.

כוונן את Llama 2 ליצירת טקסט באמזון SageMaker JumpStart | Amazon Web Services PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.

בעמוד זה, אתה יכול להצביע על שירות אחסון פשוט של אמזון (Amazon S3) דלי המכיל את מערכי ההדרכה והאימות לכוונון עדין. בנוסף, תוכל להגדיר תצורת פריסה, היפרפרמטרים והגדרות אבטחה לכוונון עדין. לאחר מכן תוכל לבחור רכבת כדי להתחיל את עבודת ההדרכה במופע SageMaker ML. צילום המסך הקודם מציג את דף הכוונון העדין עבור דגם ה-Llama-2 7B; עם זאת, אתה יכול לכוונן עדין את דגמי יצירת הטקסט 13B ו-70B Llama 2 באמצעות דפי הדגם המתאימים באופן דומה. כדי להשתמש בדגמי Llama 2, עליך לאשר את הסכם רישיון משתמש הקצה (EULA). זה יופיע כשאתה בוחר רכבת, כפי שמוצג בצילום המסך הבא. בחר קראתי ואני מקבל את EULA ו-AUP כדי להתחיל את עבודת הכוונון העדין.

כוונן את Llama 2 ליצירת טקסט באמזון SageMaker JumpStart | Amazon Web Services PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.

פרוס את הדגם

לאחר כוונון עדין של הדגם, תוכל לפרוס אותו באמצעות דף המודל ב- SageMaker JumpStart. האפשרות לפרוס את הדגם המכוונן תופיע עם סיום הכוונון העדין, כפי שמוצג בצילום המסך הבא.

כוונן את Llama 2 ליצירת טקסט באמזון SageMaker JumpStart | Amazon Web Services PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.

כוונון עדין באמצעות SageMaker Python SDK

אתה יכול גם לכוונן עדין את דגמי Llama 2 באמצעות SageMaker Python SDK. להלן קוד לדוגמה לכוונון עדין של Llama 2 7B במערך הנתונים שלך:

import os
import boto3
from sagemaker.session import Session
from sagemaker.jumpstart.estimator import JumpStartEstimator # To fine-tune the 13B/70B model, please change model_id to `meta-textgeneration-llama-2-13b`/`meta-textgeneration-llama-2-70b`.
model_id = "meta-textgeneration-llama-2-7b" estimator = JumpStartEstimator( model_id=model_id, environment={"accept_eula": "true"}
)
# By default, instruction tuning is set to false. Thus, to use instruction tuning dataset you use
estimator.set_hyperparameters(instruction_tuned="True", epoch="5")
estimator.fit({"training": train_data_location})

אתה יכול לפרוס את המודל המכוונן ישירות מהמעריך:

finetuned_predictor = estimator.deploy()

אתה יכול גם למצוא את הקוד ב כוונן את דגמי LLaMA 2 ב- SageMaker JumpStart. זה כולל הכנת מערך נתונים, הדרכה על מערך הנתונים המותאם אישית שלך ופריסה של המודל המכוונן. זה מדגים כוונון עדין על תת-קבוצה של מערך הנתונים של דולי עם דוגמאות ממשימת הסיכום. להלן הקלט לדוגמה עם תגובות מכוונות עדינות ולא מכוונות יחד עם תגובת האמת הבסיסית:

קלט לדגם:

Below is an instruction that describes a task, paired with an input that provides further context. Write a response that appropriately completes the request.nn### Instruction:nWhen did Felix Luna die?nn### Input:nFélix César Luna (30 September 1925 – 5 November 2009) was an Argentine writer, lyricist and historian.nnnn### Response:n

תגובת Ground Truth:

Felix Luna died on November 5th, 2009

תגובה מהדגם הלא מכוונן:

Félix César Luna (30 September 1925 – 5 November 2009) was an ArgentinennWhen did Luna die?nnn### Explanation:nWe answer the question with the input's date of birth and the date of death.nnn### Solution: 1102n

תגובה מהדגם המכוונן:

Félix Luna died on November 5th, 2009.nn

למדוד ביצועים של מודלים שונים במערך הנתונים של Dolly ו-Dialogsum, עיין ב- השוואת ביצועים סעיף בנספח בסוף פוסט זה.

טכניקת כוונון עדין

דגמי שפה כגון Llama הם בגודל של יותר מ-10 GB או אפילו 100 GB. כוונון עדין של דגמים גדולים כל כך דורש מופעים עם זיכרון CUDA גבוה באופן משמעותי. יתר על כן, אימון דגמים אלו יכול להיות איטי מאוד בשל גודל הדגם. לכן, לכוונון עדין יעיל, אנו משתמשים באופטימיזציות הבאות:

  • התאמת דירוג נמוך (LoRA) – זהו סוג של כוונון יעיל של פרמטרים (PEFT) לכוונון עדין יעיל של דגמים גדולים. בכך, אנו מקפיאים את כל הדגם ומוסיפים רק סט קטן של פרמטרים או שכבות ניתנים להתאמה למודל. לדוגמה, במקום לאמן את כל 7 מיליארד הפרמטרים עבור Llama 2 7B, נוכל לכוונן פחות מ-1% מהפרמטרים. זה עוזר בהפחתה משמעותית של דרישת הזיכרון מכיוון שאנו צריכים לאחסן שיפועים, מצבי אופטימיזציה ומידע אחר הקשור לאימון רק עבור 1% מהפרמטרים. יתר על כן, זה עוזר להפחית את זמן האימון כמו גם את העלות. לפרטים נוספים על שיטה זו, עיין ב LoRA: התאמה בדרגה נמוכה של מודלים של שפה גדולה.
  • קוונטיזציה של Int8 - אפילו עם אופטימיזציות כגון LoRA, דגמים כגון Llama 70B עדיין גדולים מכדי לאמן. כדי להקטין את טביעת הרגל של הזיכרון במהלך האימון, אנו יכולים להשתמש בכימות Int8 במהלך האימון. קוונטיזציה מפחיתה בדרך כלל את הדיוק של סוגי הנתונים בנקודה צפה. למרות שזה מקטין את הזיכרון הנדרש לאחסון משקלי דגם, זה פוגע בביצועים עקב אובדן מידע. קוונטיזציה של Int8 משתמשת רק ברבע דיוק, אך אינה גורמת לירידה בביצועים מכיוון שהיא לא פשוט מפילה את הביטים. זה מעגל את הנתונים מסוג אחד לאחר. כדי ללמוד על קוונטיזציה של Int8, עיין ב LLM.int8(): כפל מטריצה ​​של 8 סיביות עבור רובוטריקים בקנה מידה.
  • נתונים מקבילים לחלוטין (FSDP) – זהו סוג של אלגוריתם אימון מקביל לנתונים שמרסק את הפרמטרים של המודל על פני עובדים מקבילים לנתונים ויכול לחלופין להוריד חלק מחישוב האימון למעבדים. למרות שהפרמטרים מחולקים על פני GPUs שונים, החישוב של כל microbatch הוא מקומי לעובד GPU. הוא מחלק פרמטרים בצורה אחידה יותר ומשיג ביצועים מיטביים באמצעות תקשורת וחפיפה מחשובית במהלך האימון.

הטבלה הבאה משווה בין שיטות שונות לשלושת דגמי ה-Llama 2.

, סוג מופע ברירת מחדל סוגי מופעים נתמכים עם תצורת ברירת מחדל הגדרת ברירת מחדל לורה + FSDP לורה + אין FSDP Int8 Quantization + LORA + ללא FSDP
לאמה 2 7B ml.g5.12xlarge ml.g5.12xlarge, ml.g5.24xlarge, ml.g5.48xlarge לורה + FSDP יש יש יש
לאמה 2 13B ml.g5.12xlarge ml.g5.24xlarge, ml.g5.48xlarge לורה + FSDP יש יש יש
לאמה 2 70B ml.g5.48xlarge ml.g5.48xlarge INT8 + LORA + ללא FSDP לא לא יש

שים לב שכוונון עדין של דגמי הלאמה מבוסס על סקריפטים המסופקים על ידי הדברים הבאים GitHub ריפו.

פורמט מערכי נתונים להדרכה

SageMaker JumpStart תומך כיום במערכי נתונים הן בפורמט התאמת תחום והן בפורמט כוונון הוראות. בסעיף זה, אנו מציינים מערך נתונים לדוגמה בשני הפורמטים. לפרטים נוספים, עיין ב עיצוב מערך נתונים סעיף בנספח.

פורמט התאמת דומיין

ניתן לכוונן את מודל יצירת הטקסט של Lama 2 בכל מערך נתונים ספציפי לתחום. לאחר כוונון עדין במערך הנתונים הספציפי לתחום, המודל צפוי ליצור טקסט ספציפי לתחום ולפתור משימות NLP שונות בתחום הספציפי הזה עם הנחיה של מספר יריות. עם מערך נתונים זה, הקלט מורכב מקובץ CSV, JSON או TXT. לדוגמה, נתוני קלט עשויים להיות קבצי SEC של אמזון כקובץ טקסט:

This report includes estimates, projections, statements relating to our
business plans, objectives, and expected operating results that are “forward-
looking statements” within the meaning of the Private Securities Litigation
Reform Act of 1995, Section 27A of the Securities Act of 1933, and Section 21E
of the Securities Exchange Act of 1934. Forward-looking statements may appear
throughout this report, including the following sections: “Business” (Part I,
Item 1 of this Form 10-K), “Risk Factors” (Part I, Item 1A of this Form 10-K),
and “Management’s Discussion and Analysis of Financial Condition and Results
of Operations” (Part II, Item 7 of this Form 10-K). These forward-looking
statements generally are identified by the words “believe,” “project,”
“expect,” “anticipate,” “estimate,” “intend,” “strategy,” “future,”
“opportunity,” “plan,” “may,” “should,” “will,” “would,” “will be,” “will
continue,” “will likely result,” and similar expressions.

פורמט כוונון הוראות

בכוונון עדין של הוראות, המודל מכוון לסדרה של משימות עיבוד שפה טבעית (NLP) המתוארות באמצעות הוראות. זה עוזר לשפר את ביצועי המודל עבור משימות בלתי נראות עם הנחיות אפס-shot. בפורמט מערך נתונים של כוונון הוראות, אתה מציין את template.json קובץ המתאר את הקלט ואת פורמטי הפלט. לדוגמה, כל שורה בקובץ train.jsonl נראה כך:

{"instruction": "What is a dispersive prism?", "context": "In optics, a dispersive prism is an optical prism that is used to disperse light, that is, to separate light into its spectral components (the colors of the rainbow). Different wavelengths (colors) of light will be deflected by the prism at different angles. This is a result of the prism material's index of refraction varying with wavelength (dispersion). Generally, longer wavelengths (red) undergo a smaller deviation than shorter wavelengths (blue). The dispersion of white light into colors by a prism led Sir Isaac Newton to conclude that white light consisted of a mixture of different colors.", "response": "A dispersive prism is an optical prism that disperses the light's different wavelengths at different angles. When white light is shined through a dispersive prism it will separate into the different colors of the rainbow."}

הקובץ הנוסף template.json נראה כך:

{ "prompt": "Below is an instruction that describes a task, paired with an input that provides further context. " "Write a response that appropriately completes the request.nn" "### Instruction:n{instruction}nn### Input:n{context}nn", "completion": " {response}",
}

היפרפרמטרים נתמכים לאימון

כוונון עדין של Llama 2 תומך במספר היפרפרמטרים, שכל אחד מהם יכול להשפיע על דרישת הזיכרון, מהירות האימון והביצועים של הדגם המכוונן:

  • תקופה – מספר המעברים שאלגוריתם הכוונון העדין לוקח דרך מערך האימון. חייב להיות מספר שלם הגדול מ-1. ברירת המחדל היא 5.
  • שיעור_למידה – קצב עדכון משקלי הדגם לאחר עבודה על כל אצווה של דוגמאות אימון. חייב להיות ציפה חיובית גדולה מ-0. ברירת המחדל היא 1e-4.
  • instruction_tuned – האם להדריך-להכשיר את הדגם או לא. חייב להיות 'True'או'False'. ברירת המחדל היא 'False'.
  • per_device_train_batch_size – גודל האצווה לכל ליבת GPU/CPU לאימון. חייב להיות מספר שלם חיובי. ברירת המחדל היא 4.
  • per_device_eval_batch_size – גודל האצווה לכל ליבת GPU/CPU להערכה. חייב להיות מספר שלם חיובי. ברירת המחדל היא 1.
  • max_train_samples – למטרות ניפוי באגים או אימון מהיר יותר, קצץ את מספר דוגמאות ההדרכה לערך זה. ערך -1 פירושו שימוש בכל דגימות האימון. חייב להיות מספר שלם חיובי או -1. ברירת המחדל היא -1.
  • max_val_samples – למטרות ניפוי באגים או אימון מהיר יותר, קצץ את מספר דוגמאות האימות לערך זה. ערך -1 פירושו שימוש בכל דגימות האימות. חייב להיות מספר שלם חיובי או -1. ברירת המחדל היא -1.
  • max_input_length - אורך רצף קלט מקסימלי לאחר אסימון. רצפים ארוכים מזה יקוצצו. אם -1, max_input_length מוגדר למינימום של 1024 ואורך הדגם המקסימלי שהוגדר על ידי הטוקנייזר. אם מוגדר לערך חיובי, max_input_length מוגדר למינימום של הערך שסופק וה- model_max_length מוגדר על ידי הטוקנייזר. חייב להיות מספר שלם חיובי או -1. ברירת המחדל היא -1.
  • יחס_פיצול_validation – אם ערוץ אימות הוא none, היחס בין פיצול אימות הרכבת מנתוני הרכבת חייב להיות בין 0-1. ברירת המחדל היא 0.2.
  • train_data_split_seed – אם אין נתוני אימות, הדבר מתקן את הפיצול האקראי של נתוני האימון הקלט לנתוני הדרכה ואימות המשמשים את האלגוריתם. חייב להיות מספר שלם. ברירת המחדל היא 0.
  • preprocessing_num_workers – מספר התהליכים לשימוש עבור עיבוד מקדים. אם None, התהליך העיקרי משמש לעיבוד מקדים. ברירת המחדל היא None.
  • לורה_ר – לורה ר חייב להיות מספר שלם חיובי. ברירת המחדל היא 8.
  • לורה_אלפא – לורה אלפא. חייב להיות מספר שלם חיובי. ברירת המחדל היא 32
  • לורה_נשירה – לורה נשירה. חייב להיות ציפה חיובית בין 0 ל-1. ברירת המחדל היא 0.05.
  • int8_quantization - אם True, הדגם טעון עם דיוק של 8 סיביות לאימון. ברירת המחדל עבור 7B ו-13B היא False. ברירת המחדל עבור 70B היא True.
  • enable_fsdp - אם True, אימון משתמש ב-FSDP. ברירת המחדל עבור 7B ו-13B היא True. ברירת המחדל עבור 70B היא False. שים לב ש int8_quantization אינו נתמך עם FSDP.

סוגי מופעים והיפרפרמטרים תואמים

דרישת הזיכרון במהלך כוונון עדין עשויה להשתנות בהתאם למספר גורמים:

  • סוג דגם – לדגם 7B יש את דרישת הזיכרון הגרפי הנמוכה ביותר ול-70B יש את דרישת הזיכרון הגדולה ביותר
  • אורך קלט מקסימלי - ערך גבוה יותר של אורך קלט מוביל לעיבוד יותר אסימונים בכל פעם וככזה דורש יותר זיכרון CUDA
  • גודל אצווה – גודל אצווה גדול יותר דורש זיכרון CUDA גדול יותר ולכן דורש סוגי מופעים גדולים יותר
  • קוונטיזציה של Int8 - אם משתמשים בכימות Int8, המודל נטען לדיוק נמוך ולכן דורש פחות זיכרון CUDA

כדי לעזור לך להתחיל, אנו מספקים קבוצה של שילובים של סוגי מופעים שונים, היפרפרמטרים וסוגי מודלים שניתן לכוונן בהצלחה. אתה יכול לבחור תצורה לפי הדרישות שלך וזמינות סוגי המופעים. אנו מכווננים את כל שלושת הדגמים במגוון הגדרות עם שלוש תקופות בתת-קבוצה של מערך הנתונים של דולי עם דוגמאות סיכום.

דגם 7B

הטבלה הבאה מסכמת את אפשרויות הכוונון העדין בדגם 7B.

סוג מופע Len קלט מקסימלי גודל אצווה לכל מכשיר Int8 קוונטיזציה אפשר FSDP זמן נלקח (דקות)
ml.g4dn.12xlarge 1024 8 נכון שֶׁקֶר 166
ml.g4dn.12xlarge 2048 2 נכון שֶׁקֶר 178
ml.g4dn.12xlarge 1024 4 שֶׁקֶר נכון 120
ml.g4dn.12xlarge 2048 2 שֶׁקֶר נכון 143
ml.g5.2xlarge 1024 4 נכון שֶׁקֶר 61
ml.g5.2xlarge 2048 2 נכון שֶׁקֶר 68
ml.g5.2xlarge 1024 4 שֶׁקֶר נכון 43
ml.g5.2xlarge 2048 2 שֶׁקֶר נכון 49
ml.g5.4xlarge 1024 4 שֶׁקֶר נכון 39
ml.g5.4xlarge 2048 2 שֶׁקֶר נכון 50
ml.g5.12xlarge 1024 16 נכון שֶׁקֶר 57
ml.g5.12xlarge 2048 4 נכון שֶׁקֶר 64
ml.g5.12xlarge 1024 4 שֶׁקֶר נכון 26
ml.g5.12xlarge 2048 4 שֶׁקֶר נכון 23
ml.g5.48xlarge 1024 16 נכון שֶׁקֶר 59
ml.g5.48xlarge 2048 4 נכון שֶׁקֶר 67
ml.g5.48xlarge 1024 8 שֶׁקֶר נכון 22
ml.g5.48xlarge 2048 4 שֶׁקֶר נכון 21

13B

הטבלה הבאה מסכמת את אפשרויות הכוונון העדין בדגם 13B.

סוג מופע Len קלט מקסימלי גודל אצווה לכל מכשיר Int8 קוונטיזציה אפשר FSDP זמן נלקח (דקות)
ml.g4dn.12xlarge 1024 4 נכון שֶׁקֶר 283
ml.g4dn.12xlarge 2048 2 נכון שֶׁקֶר 328
ml.g5.12xlarge 1024 8 נכון שֶׁקֶר 92
ml.g5.12xlarge 2048 4 נכון שֶׁקֶר 104
ml.g5.48xlarge 1024 8 נכון שֶׁקֶר 95
ml.g5.48xlarge 2048 4 נכון שֶׁקֶר 107
ml.g5.48xlarge 1024 8 שֶׁקֶר נכון 35
ml.g5.48xlarge 2048 2 שֶׁקֶר נכון 41

70B

הטבלה הבאה מסכמת את אפשרויות הכוונון העדין בדגם 70B.

סוג מופע Len קלט מקסימלי גודל אצווה לכל מכשיר Int8 קוונטיזציה אפשר FSDP זמן נלקח (דקות)
ml.g5.48xlarge 1024 4 נכון שֶׁקֶר 396
ml.g5.48xlarge 2048 1 נכון שֶׁקֶר 454

המלצות על סוגי מופעים והיפרפרמטרים

בעת כוונון עדין של דיוק הדגם, זכור את הדברים הבאים:

  • דגמים גדולים יותר כגון 70B מספקים ביצועים טובים יותר מ-7B
  • ביצועים ללא קוונטיזציה של Int8 טובים יותר מביצועים עם קוונטיזציה של INT8

שימו לב לדרישות זמן האימון וזיכרון ה-CUDA הבאות:

  • הגדרת int8_quantization=True מקטין את דרישת הזיכרון ומוביל לאימון מהיר יותר.
  • פוחתת per_device_train_batch_size ו max_input_length מפחית את דרישת הזיכרון ולכן ניתן להפעיל אותו במופעים קטנים יותר. עם זאת, הגדרת ערכים נמוכים מאוד עלולה להאריך את זמן האימון.
  • אם אינך משתמש בכימות Int8 (int8_quantization=False), השתמש ב-FSDP (enable_fsdp=True) לאימון מהיר ויעיל יותר.

בעת בחירת סוג המופע, שקול את הדברים הבאים:

  • מופעי G5 מספקים את ההדרכה היעילה ביותר מבין סוגי המופעים הנתמכים. לכן, אם יש לך מופעי G5 זמינים, עליך להשתמש בהם.
  • זמן האימון תלוי במידה רבה בכמות ה-GPUs וזיכרון ה-CUDA הזמין. לכן, ההדרכה על מופעים עם אותו מספר של GPUs (לדוגמה, ml.g5.2xlarge ו-ml.g5.4xlarge) זהה בערך. לכן, אתה יכול להשתמש במופע הזול יותר לאימון (ml.g5.2xlarge).
  • בעת שימוש במופעי p3, האימון ייעשה בדיוק של 32 סיביות מכיוון ש-bfloat16 אינו נתמך במופעים אלו. לכן, עבודת האימון תצרוך כמות כפולה של זיכרון CUDA בעת אימון במופעי p3 בהשוואה למופעי g5.

כדי ללמוד על עלות ההדרכה לכל מופע, עיין ב מופעי אמזון EC2 G5.

אם מערך הנתונים הוא בפורמט של כוונון הוראות ורצפי קלט+השלמה קטנים (כגון 50-100 מילים), אז ערך גבוה של max_input_length מוביל לביצועים גרועים מאוד. ערך ברירת המחדל של פרמטר זה הוא -1, המתאים ל- max_input_length של 2048 עבור דגמי הלאמה. לכן, אנו ממליצים שאם מערך הנתונים שלך מכיל דוגמאות קטנות, השתמש בערך קטן עבור max_input_length (כגון 200-400).

לבסוף, עקב ביקוש גבוה של מופעי G5, ייתכן שתחווה חוסר זמינות של מופעים אלו באזור שלך עם השגיאה “CapacityError: Unable to provision requested ML compute capacity. Please retry using a different ML instance type.” אם אתה נתקל בשגיאה זו, נסה שוב את עבודת ההדרכה או נסה אזור אחר.

בעיות בעת כוונון עדין של דגמים גדולים מאוד

בחלק זה, אנו דנים בשני נושאים בעת כוונון עדין של דגמים גדולים מאוד.

השבת את דחיסת הפלט

כברירת מחדל, הפלט של עבודת הדרכה הוא מודל מאומן שנדחס בפורמט .tar.gz לפני העלאתו לאמזון S3. עם זאת, בשל הגודל הגדול של הדגם, שלב זה יכול לקחת זמן רב. לדוגמה, דחיסה והעלאה של דגם ה-70B יכולים לקחת יותר מ-4 שעות. כדי להימנע מבעיה זו, אתה יכול להשתמש בתכונת השבתת דחיסת הפלט הנתמכת על ידי פלטפורמת ההדרכה של SageMaker. במקרה זה, המודל מועלה ללא כל דחיסה, המשמשת בהמשך לפריסה:

estimator = JumpStartEstimator(
model_id=model_id, environment={"accept_eula": "true"}, disable_output_compression=True
)

בעיית זמן קצוב של הליבה של SageMaker Studio

בשל גודלו של דגם ה-Llama 70B, עבודת האימון עשויה להימשך מספר שעות והגרעין של SageMaker Studio עשוי למות במהלך שלב האימון. עם זאת, במהלך תקופה זו, האימונים עדיין פועלים ב- SageMaker. אם זה קורה, אתה עדיין יכול לפרוס את נקודת הקצה באמצעות שם עבודת ההדרכה עם הקוד הבא:

from sagemaker.jumpstart.estimator import JumpStartEstimator
training_job_name = <<<INSERT_TRAINING_JOB_NAME>>> attached_estimator = JumpStartEstimator.attach(training_job_name, model_id)
attached_estimator.logs()
attached_estimator.deploy()

כדי למצוא את שם עבודת ההדרכה, נווט אל מסוף SageMaker ומטה הדרכה בחלונית הניווט, בחר משרות הדרכה. זהה את שם עבודת ההדרכה והחלף אותו בקוד הקודם.

סיכום

בפוסט זה, דנו בכוונון עדין של דגמי Llama 2 של Meta באמצעות SageMaker JumpStart. הראינו שאתה יכול להשתמש בקונסולת SageMaker JumpStart ב- SageMaker Studio או ב- SageMaker Python SDK כדי לכוונן ולפרוס את הדגמים הללו. דנו גם בטכניקת הכוונון העדין, סוגי מופעים והיפרפרמטרים נתמכים. בנוסף, פירטנו המלצות לאימון אופטימלי על סמך בדיקות שונות שביצענו. התוצאות לכוונון עדין של שלושת המודלים על פני שני מערכי נתונים מוצגים בנספח בסוף פוסט זה. כפי שאנו יכולים לראות מתוצאות אלו, כוונון עדין משפר את הסיכום בהשוואה למודלים שאינם מכוונים. כשלב הבא, אתה יכול לנסות לכוונן את המודלים האלה במערך הנתונים שלך באמצעות הקוד המסופק במאגר GitHub כדי לבדוק ולהשוות את התוצאות עבור מקרי השימוש שלך.

המחברים רוצים להכיר בתרומותיהם הטכניות של כריסטופר וויטן, שין הואנג, קייל אולריך, סיפיי לי, איימי יו, אדם קוזדרוביץ', אוון קרביץ, בנג'מין קראבטרי, האוטיאן אן, מנאן שאה, טוני קרוז, ארנב שארמה, ג'ונתן גוויני וג'ון. זכית.


על הכותבים

Vivek Madanד"ר Vivek Madan הוא מדען יישומי בצוות אמזון SageMaker JumpStart. הוא קיבל את הדוקטורט שלו מאוניברסיטת אילינוי באורבנה-שמפיין והיה חוקר פוסט דוקטורט בג'ורג'יה טק. הוא חוקר פעיל בלמידת מכונה ועיצוב אלגוריתמים ופרסם מאמרים בכנסים של EMNLP, ICLR, COLT, FOCS ו-SODA.

כוונן את Llama 2 ליצירת טקסט באמזון SageMaker JumpStart | Amazon Web Services PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.ד"ר פארוק סאביר הוא ארכיטקט פתרונות בכיר בבינה מלאכותית ולמידת מכונה ב-AWS. הוא בעל תואר דוקטור ותואר שני בהנדסת חשמל מאוניברסיטת טקסס באוסטין ותואר שני במדעי המחשב מהמכון הטכנולוגי של ג'ורג'יה. יש לו למעלה מ-15 שנות ניסיון בעבודה וגם אוהב ללמד ולהדריך סטודנטים. ב-AWS הוא עוזר ללקוחות לגבש ולפתור את הבעיות העסקיות שלהם במדעי הנתונים, למידת מכונה, ראייה ממוחשבת, בינה מלאכותית, אופטימיזציה מספרית ותחומים קשורים. ממוקם בדאלאס, טקסס, הוא ומשפחתו אוהבים לטייל ולצאת לנסיעות ארוכות.

כוונן את Llama 2 ליצירת טקסט באמזון SageMaker JumpStart | Amazon Web Services PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.ד"ר אשיש חתן הוא מדען יישומי בכיר עם Amazon SageMaker JumpStart ומסייע בפיתוח אלגוריתמים של למידת מכונה. הוא קיבל את הדוקטורט שלו מאוניברסיטת אילינוי אורבנה-שמפיין. הוא חוקר פעיל בלמידת מכונה והסקה סטטיסטית, ופרסם מאמרים רבים בכנסים NeurIPS, ICML, ICLR, JMLR, ACL ו-EMNLP.


נספח

נספח זה מספק מידע נוסף על מידוד ביצועים ועיצוב מערך נתונים.

השוואת ביצועים

בחלק זה, אנו מספקים תוצאות לכוונון עדין של שלושת המודלים של Llama 2 (7B, 13B ו-70B) על שני מערכי נתונים שונים: מַבחֵשׁ ו Dialogsum. עבור מערך הנתונים של דולי, המשימה שלנו היא לסכם פסקה של טקסט, ואילו עבור Dialogsum, אנו מכווננים את המודל כדי לסכם דיון בין שני אנשים. בטבלאות הבאות, אנו מציגים את הקלט לדגם (הנחיה והוראות), אמת יסוד (סיכום), תגובה מדגם ה-Llama 2 המאומן מראש, והתגובה מדגם ה-Llama 2 המכוונן עדין עבור כל אחד משלושת ה-Llama 2 דגמים. אנו מציגים תוצאות מסקנות עבור חמש נקודות נתונים. ניתן להבחין מהטבלאות הבאות שהסיכומים משתפרים עבור שני מערכי הנתונים כאשר אנו מכווננים את המודלים.

  • תוצאות לכוונון עדין של מודל יצירת הטקסט של Llama 2 7B במערך הנתונים של דולי:
תשומות אמת קרקע תגובה מדגם Non-Fine-Tuned תגובה מדגם Fine-Tuned
להלן הוראה המתארת ​​משימה, בשילוב עם קלט המספק הקשר נוסף. כתוב תגובה שמשלימה כראוי את הבקשה.nn### הוראה:nWhere is Allauchnn### קלט:nAllauch (הגייה צרפתית: ; אוקסיטנית: Alaug) היא קומונה צרפתית הממוקמת מזרחית למרסיי במחוז בוש-דו-רון באזור פרובאנס-אלפ-קוט ד'אזור בצרפת. תושבי הקומונה ידועים בשם Allaudiens או Allaudiennes בצרפתית.nnnn### תגובה:n Allauch היא קומונה צרפתית הממוקמת מזרחית למרסיי במחוז בוש-דו-רון במחוז פרובאנס-אלפ-קוט ד'אזור בצרפת. תושבי הקומונה ידועים בשם Allaudiens או Allaudiennes בצרפתית. אלאוך היא עיירה הממוקמת 28 ק"מ מזרחית למרסיי במחוז בוש-דו-רון במחוז פרובאנס-אלפ-קוט ד'אזור בצרפת. הוא נחשב לאחד הכפרים היפים בצרפת. העיירה מוקפת בגבעות ובכרמים ואוכלוסייתה מונה כ-6,000 איש. זה הוזכר לראשונה בשנת 1006 ויש לו עשיר הקומונה ממוקמת על רמה סלעית בשם Massif du Gélas, הממוקמת מזרחית למרסיי. יש לו נוף יפה של מרסיי וקו החוף שלה. אלאוך היא כיום קומונה מפותחת עם בית עירייה משלה ומגוון של חנויות, ברים ומסעדות. בשל מיקומו בין מרסיי לאפיל, הוא שמר על מאפיינים טבעיים רבים של האזור, כולל גוש הגלנדס, הידוע גם בשם "W
להלן הוראה המתארת ​​משימה, בשילוב עם קלט המספק הקשר נוסף. כתוב תגובה שמשלימה את הבקשה כראוי.nn### הוראה:nמהו יונק מטיל ביצים?nn### קלט:nפלטיפוס (Ornithorhynchus anatinus), המכונה לפעמים פלטיפוס ברווז, הוא ביצה למחצה מימית -יונקים מטילים אנדמיים למזרח אוסטרליה, כולל טסמניה. הפלטיפוס הוא הנציג החי היחיד או הטקסון המונוטיפי של משפחתו (Ornithorhynchidae) והסוג (Ornithorhynchus), אם כי מספר מינים קשורים מופיעים בתיעוד המאובנים.nnnn### תגובה:n פלטיפוס ברווז הוא יונק מטיל ביצים שנמצא במזרח אוסטרליה. זהו הנציג החי היחיד בסוגו Ornithorhynchus. ערכתי לא מעט מחקר על השאלה שלך. קראתי את כל המידע שסיפקת בפסקה השנייה שלך. קראתי גם קצת על פלטיפוס, כולל [דף זה](https://phys.org/news/2019-04-australia-platypus-predator-species.html). אני חושב שמצאתי כמה תשובות לשאלתך. האם אתה שואל אם הפלטיפוס הוא יונק מטיל ביצים או אם יונק שמטיל ביצים, כמו פלטיפוסן
להלן הוראה המתארת ​​משימה, בשילוב עם קלט המספק הקשר נוסף. כתוב תגובה שמשלימה כראוי את הבקשה.nn### הוראה:nמתי פליקס לונה מת?nn### קלט:nFélix César Luna (30 בספטמבר 1925 - 5 בנובמבר 2009) היה סופר, תמליל והיסטוריון ארגנטינאי.nnnn# ## תגובה:n פליקס לונה מת ב-5 בנובמבר 2009 Félix César Luna (30 בספטמבר 1925 - 5 בנובמבר 2009) היה ארגנטינאי מתי מתה לונה?nnn### הסבר:nאנו עונים על השאלה עם תאריך הלידה של הקלט ותאריך המוות.nnn### פתרון: 1102n פליקס לונה מת ב-5 בנובמבר 2009.nn
להלן הוראה המתארת ​​משימה, בשילוב עם קלט המספק הקשר נוסף. כתוב תגובה שמשלימה כראוי את הבקשה.nn### הוראה:nרשום כמה נקודות חשובות לגבי אשליה אופטית מהקטע הנתון.nn### קלט:nבתפיסה חזותית, אשליה אופטית (נקראת גם אשליה חזותית) היא אשליה הנגרמת על ידי המערכת הוויזואלית ומאופיינת בתפיסה ויזואלית שנראית ללא ספק שונה מהמציאות. אשליות מגיעות במגוון רחב; הסיווג שלהם קשה מכיוון שהסיבה הבסיסית לרוב אינה ברורה, אך סיווג שהוצע על ידי ריצ'רד גרגורי שימושי ככיוון. לפי זה, ישנם שלושה מחלקות עיקריות: אשליות פיזיות, פיזיולוגיות וקוגניטיביות, ובכל מחלקה ישנם ארבעה סוגים: n עמימות, עיוותים, פרדוקסים ובדיות. דוגמה קלאסית לעיוות פיזי תהיה כיפוף לכאורה של מקל שקוע למחצה במים; דוגמה לפרדוקס פיזיולוגי הוא השפעת התנועה (שם, למרות התנועה, המיקום נשאר ללא שינוי). דוגמה לסיפורת אנפיזיולוגית היא דימוי אפטר. שלושה עיוותים קוגניטיביים אופייניים הם האשליה של פונזו, פמוגדורף, נאן ומילר-לייר. אשליות פיזיות נגרמות על ידי הסביבה הפיזית, למשל על ידי תכונות אופטיות של מים. אשליות פיזיולוגיות מתעוררות בעין או במסלול הראייה, למשל מהשפעות של גירוי מוגזם של סוג קולטן ספציפי. אשליות ראייה קוגניטיביות הן תוצאה של מסקנות לא מודעות והן אולי אלו המוכרות ביותר.nnnn### תגובה:n 1. אשליה חזותית נגרמת על ידי מערכת הראייה ומאופיינת בתפיסה חזותית שנראית כשונה מהמציאות.n2. לפי ריצ'רד גרגורי, סיווג שהוצע על ידו שימושי בתור אוריינטציה לפיה ישנן שלוש מחלקות עיקריות: אשליות פיזיות, פיזיולוגיות וקוגניטיביות, ובכל כיתה ישנם ארבעה סוגים: עמימות, עיוותים, פרדוקסים ובדיות.n3. דוגמה לעיוות פיזי יהיה כיפוף לכאורה של מקל שקוע למחצה במים פנימיים; דוגמה לפרדוקס פיזיולוגי היא השפעת התנועה (שם, למרות תנועה, המיקום נשאר ללא שינוי). n4. דוגמה לפיקציה פיזיולוגית היא תמונה לאחר 5. שלושה עיוותים קוגניטיביים הם האשליה של פונזו, Poggendorff ו-Müller-Lyer.n6. אשליות פיזיות נגרמות על ידי הסביבה הפיזית, למשל על ידי התכונות האופטיות של המים. אשליות פיזיולוגיות עולות בעין או במסלול הראייה.n7. האשליה הידועה ביותר היא אשליות חזותיות שהן תוצאה של מסקנות לא מודעות. האשליה האופטית המוזכרת בקטע היא התנועה ההזויה של המקל שקוע בחלקו במים.nn## 50.n### הוראה: nכתוב טיעון כדי לתמוך או להפריך את הטענה: nכל התלמידים במעבדה שלנו אותו מנת משכל ממוצעת.nn### קלט:nלתלמידים רבים בניסוי יש את אותו מנת משכל ממוצעת, ואני מאמין שהם ה-10% עם הכי גבוה אשליות אופטיות עושות שימוש במגבלות הפיזיולוגיות והפסיכולוגיות הקשורות לאופן שבו אנו מפרשים ומגיבים לגירויים חזותיים, הן גירויים בעולם סביבנו והן גירויים חזותיים המיוצרים באופן פנימי. הם מספקים גירוי משותף לשתי המערכות (פיזי ופסיכולוגי/תפיסתי) המאפשרים לנו להשוות את שתיהן ולהבין את הדרך שבה כל אחת עובדת. יש מגוון של צורות שונות של אשליות אופטיות, הכוללות פסיכולוגיות,
להלן הוראה המתארת ​​משימה, בשילוב עם קלט המספק הקשר נוסף. כתוב תגובה שמשלימה את הבקשה כראוי.nn### הוראה: nסיכום דילמה של החדשן בכמה משפטיםnn### קלט:nהוא מתאר כיצד חברות גדולות מפסידות נתח שוק על ידי הקשבה ללקוחותיהן ומספקות את מה שנראה כנראה הגבוה ביותר. -מוצרים בעלי ערך, אבל חברות חדשות המשרתות לקוחות בעלי ערך נמוך עם טכנולוגיה שפותחה בצורה גרועה יכולות לשפר את הטכנולוגיה הזו בהדרגה עד שהיא מספיק טובהnnnn### תגובה:n הדילמה של החדשן: מתי טכנולוגיות חדשות גורמות לחברות גדולות להיכשל, שפורסמה לראשונה ב-1997, היא עבודתו הידועה ביותר של הפרופסור ואיש העסקים קלייטון כריסטנסן מהרווארד. הוא מרחיב את המושג של טכנולוגיות משבשות, מונח שטבע במאמר "Disruptive Technologies: Catching the Wave" משנת 1995. הוא מתאר כיצד חברות גדולות מכהנות מאבדות נתח שוק על ידי הקשבה ללקוחותיהן ומספקות את מה שנראה כמוצרים בעלי הערך הגבוה ביותר, אך חברות חדשות המשרתות לקוחות בעלי ערך נמוך עם טכנולוגיה שפותחה בצורה גרועה יכולות לשפר את הטכנולוגיה הזו בהדרגה עד שהיא טובה מספיק לקחת במהירות נתח שוק מעסקים מבוססים. כריסטנסן ממליץ לחברות גדולות לשמור על חטיבות קטנות וזריזות המנסות לשחזר את התופעה הזו באופן פנימי כדי להימנע מהסתנוור ועקיפה של מתחרי סטארט-אפ. היי, n סליחה על התגובה המאוחרת!! הייתי בחופשה בשבוע האחרון :)nnהדילמה של החדשן מאת קלייטון כריסטנסן מסבירה כי "הדילמה של החדשן היא שהחתירה של חברה לרווחים מתמשכים על ידי הכנסת או שיפור מוצריה כדי לספק ערך רב יותר ללקוחות קיימים, תגרום לאותם לקוחות לנטוש את חברה לקנות חידושים שמציעים לפחות ערך מסוים הדילמה של החדשן היא ספר שמסביר כיצד חברות גדולות מאבדות נתח שוק על ידי הקשבה ללקוחותיהן ומספקות את מה שנראה כמוצרים בעלי הערך הגבוה ביותר, אך חברות חדשות המשרתות לקוחות בעלי ערך נמוך עם טכנולוגיה שפותחה בצורה גרועה יכולות לשפר את הטכנולוגיה הזו בהדרגה. עד שזה יהיה מספיק טוב nn
  • תוצאות לכוונון עדין של מודל יצירת הטקסט של Llama 2 13B במערך הנתונים של דולי:
תשומות אמת קרקע תגובה מדגם Non-Fine-Tuned תגובה מדגם Fine-Tuned
להלן הוראה המתארת ​​משימה, בשילוב עם קלט המספק הקשר נוסף. כתוב תגובה שמשלימה כראוי את הבקשה.nn### הוראה:nמי המאמן הבא בבאיירן מינכן שיחליף את ג'וליאן נגלסמן?nn### קלט:nעידן נאגלסמן (2021–2023)nתחת המאמן החדש ג'וליאן נגלסמן, באיירן השלימה את ההישג של זכייה ב-10 אליפויות רצופות בבונדסליגה לאחר ניצחון 3-1 בדר קלסיקר. עם זאת, הקבוצה הפסידה במפתיע לוויאריאל ברבע גמר ליגת האלופות, ויצאה באותו שלב זו השנה השנייה ברציפות. ב-24 במרץ 2023, נאגלסמן שוחרר על ידי באיירן והוחלף על ידי תומאס טוכל, שקיבל חוזה עד 30 ביוני 2025.nnnn### תגובה:n תומאס טוכל החליף את ג'וליאן נגלסמן במרץ 2023 וכעת הוא המאמן החדש בבאיירן מינכן, ובעבר היה המאמן בצ'לסי. nn"`pythonn{n "הוראה": "מי המאמן הבא בבאיירן מינכן שיחליף את ג'וליאן נגלסמן?", n "פעולה": "המאמן הבא של FC באיירן", n "הקשר":{n " עידן נאגלסמן (2021–2023)": n" תחת המאמן החדש ג'וליאן נגלסמן, באיירן השלימה את הישג הזכייה ב-10 אליפויות רצופות בבונדסליגה המאמן הבא בבאיירן מינכן יהיה תומאס טוכל. טוכל יחליף את ג'וליאן נגלסמן עם עזיבתו של נגלסמן את הקבוצה ב-24 במרץ 2023.nn
להלן הוראה המתארת ​​משימה, בשילוב עם קלט המספק הקשר נוסף. כתוב תגובה שמשלימה כראוי את הבקשה.nn### הוראה:nספר לי על חייו של אדולף קון### קלט:nאדולף קון (29 במאי 1851–1930) היה מחנך צרפתי-אמריקאי, יליד פריז. הוא בוגר "bachelier ès lettres" באוניברסיטת פריז בשנת 1868, ולמד משפטים, ביקורת היסטורית ופילולוגיה במוסדות שונים להשכלה גבוהה בפריז, וקיבל את התארים של LL.B. בשנת 1873. תלמיד של אקול דה שרטס, התזה שלו נקראה Vues sur l'histoire de l'organization judiciaire en France du IXe au XIIIe siècle considérée au point de vue des juridictions extraordinaires והוא קיבל את הדיפלומה של "ארכיוניסט פלאוגרף" בשנת 1874. עם תחילת מלחמת צרפת-פרוסיה בשנת 1870, הוא התגייס ושירת בצבא הצרפתי לאורך כל המאבק. nnקון היגר לעיר ניו יורק ב-13 במאי 1875, ומ-1876 עד 1884 היה הכתב האמריקני של לה République française, שנערך אז על ידי לאון גמבטה, שאותו הכיר בצרפת, ושאת דעותיו הפוליטיות אימץ. במרץ 1882, קון מונה למורה לצרפתית בקולג' קולומביה, וזמן קצר לאחר מכן הפך למדריך. בהצבעה עממית של תושבי ניו יורק הצרפתים הוא נבחר לשאת את נאום ההלוויה על גמבטה בשנת 1883 בטמאני הול, ובשנת 1885 נקרא מקיימברידג', מסצ'וסטס, למטרה דומה, עם מותו של ויקטור הוגו.nnnn ### תגובה:n אדולף קון (29 במאי 1851 - 1930) היה מחנך צרפתי-אמריקאי, יליד פריז. הוא בוגר "bachelier es lettres" באוניברסיטת פריז בשנת 1868, ולמד משפטים, ביקורת היסטורית ופילולוגיה במוסדות שונים להשכלה גבוהה בפריז, וקיבל את התארים של LL.B. בשנת 1873. nnתלמיד של אקול דה שרטס, עבודת הגמר שלו נקראה Vues sur l'histoire de l'organization judiciaire en France du IXe au XIIIe siècle considérée au point de vue des juridictions extraordinaires והוא קיבל את הדיפלומה של "ארכיוניסט פליאוגרפיה" בשנת 1874. עם תחילת מלחמת צרפת-פרוסיה בשנת 1870, הוא התגייס ושירת בצבא הצרפתי לאורך כל המאבק. nnקון היגר לעיר ניו יורק ב-13 במאי 1875, ומ-1876 עד 1884 היה הכתב האמריקני של לה République française, שנערך אז על ידי לאון גמבטה, שאותו הכיר בצרפת, ושאת דעותיו הפוליטיות אימץ. במרץ 1882, קון מונה למורה לצרפתית בקולג' קולומביה, וזמן קצר לאחר מכן הפך למדריך. בהצבעה פופולרית של תושבי ניו יורק הצרפתים הוא נבחר לשאת את נאום ההלוויה על גמבטה בשנת 1883 בטמאני הול, ובשנת 1885 נקרא מקיימברידג', מסצ'וסטס, למטרה דומה, עם מותו של ויקטור הוגו. nAdolphe Cohn (29 במאי 1851– 1930) היה מחנך צרפתי-אמריקאי, יליד פריז. הוא בוגר "bachelier ès lettres" באוניברסיטת פריז בשנת 1868, ולמד משפטים, ביקורת היסטורית ופילולוגיה במוסדות שונים להשכלה גבוהה בפריז, וקיבל את התארים של LL.B. בשנת 1873. תלמיד של ה-É אדולף כהן היה מחנך צרפתי-אמריקאי שנולד בפריז ב-29 במאי 1851. הוא למד באוניברסיטת פריז וקיבל תואר במשפטים ב-1873. הוא גם עבד באקול דה שרטס וקיבל את התואר "ארכיוניסט פלאוגרף" שלו 1874. בתחילת מלחמת צרפת-פרוסיה, הוא הצטרף לצבא הצרפתי ושירת אותם לכל אורך הדרך.
להלן הוראה המתארת ​​משימה, בשילוב עם קלט המספק הקשר נוסף. כתוב תגובה שמשלימה את הבקשה כראוי.nn### הוראה:nאיך קהל היעד של מקדונלדס השתנה עם הזמן?nn### קלט:nמסעדות מזון מהיר מכוונות לעתים קרובות חלק מהפרסום שלהן ישירות לאוכלוסיית הנוער. ארוחות שמחות של מקדונלד'ס, הכוללות צעצוע הנקשר לעתים קרובות עם סרט משפחתי שיצא לאחרונה, היא דוגמה משמעותית. רונלד מקדונלד, קמע פרסום ליצנים שהוצג ב-1963 ונועד לפנות לילדים צעירים, הוא אחר. בנוסף, ב-1987 מקדונלד'ס שילבה במסעדות שלהם מקום משחק כדי להמשיך לפרסם לילדים, מה שהפך את המסעדות שלהם לסביבה מושכת יותר לילדים. בנוסף, מ-1996 עד 2006, דיסני הייתה שותפה בלעדית של מקדונלד'ס, וקישרה את המוצרים שלהם יחד. הם הכריזו על סיום העסקה במאי 2006, עם כמה דיווחים שאמרו שדיסני מודאגים מהשמנת ילדים. מלבד דיסני, מקדונלד'ס הייתה גם שותפה עם נינטנדו מאז 1985, אז הוצגה לראשונה מערכת הבידור של נינטנדו. ב-1987, מקדונלד'ס גם יצרה מגרש משחקים של נינטנדו במסעדות שלהן, שבה ילדים יכלו לשחק בקונסולות של נינטנדו בזמן שהם מחכים לאוכל שלהם. במהלך 2007 החלה מקדונלד'ס לספק WiFi מקונסולות נינטנדו; נותן לילדים את היכולת לשחק בכל מקום שבו הם נמצאים. עם קהל יעד של ילדים שמוציאים את הסרטים החדשים האלה ומשלבים צעצועים, היא משתמשת בילדים כדי להגיע לכיס הוריהם בגלל ההשקעה הגדולה שלהם.nnnn### תגובה:n מקדונלד'ס מכוונת באופן עקבי את הפרסום שלהם ישירות לאוכלוסיית הנוער. במהלך השנים, מקדונלד'ס שיתפה פעולה עם מספר חברות שיש להן מוצרים המיועדים לילדים, כמו נינטנדו ודיסני. מסעדות מזון מהיר תמיד מכוונות לאוכלוסיית הנוער. ארוחות שמחות הן גם גורם עצום כשזה מגיע לפרסום לבני נוער.nככל שסרטים רבים מופצים ארוחות שמחות מגיעות גם עם צעצוע כדי לקדם את הסרט הזה במקדונלד'ס המקומית שלך-n## 400-999nn### תגובה:nAs חברה צעירה עם ראייה צרה יחסית של העולם, מקדונלד'ס עשתה זאת מאז ההשקה, מקדונלד'ס מכוונת את הקהל שלה לילדים צעירים ובני נוער עם מסעדות מזון מהיר ומוצרי מזון מוכוונות לילדים, כמו גם הפרסום שלה, אשר פנה במידה רבה לבני הנוער. בזמן שהילדים מוסעים למקדונלדס על ידי הוריהם, המסעדה היא בעצם פרסומת הורים עבור ילדיהם: מקדונלדס פונה לילדים עם המסעדות הצבעוניות והצעצועים שלהם שנמצאים באוכל שלהם ופונים אליהם
להלן הוראה המתארת ​​משימה, בשילוב עם קלט המספק הקשר נוסף. כתוב תגובה שמשלימה כראוי את הבקשה.nn### הוראה:nמהו Anandapuram mandalnn### קלט:nAnandapuram mandal הוא אחד מ-46 המנדלים במחוז Visakhapatnam במדינת אנדרה פראדש ההודית. זה נמצא תחת ניהול חטיבת ההכנסות של Visakhapatnam והמטה ממוקם באננדפוראם. מנדל אננדפוראם תחום על ידי מנדל Bheemunipatnam במזרח, צ'יאנגאדילה בדרום, פדמנאבהם בצפון וקוטוואלאסה במערב.nnnn### תגובה:n מנדל אננדפוראם הוא אחד מ-46 המנדלים במחוז ויסקהפטנם במדינת אנדרה פראדש ההודית. זה נמצא תחת ניהול חטיבת ההכנסות של Visakhapatnam והמטה ממוקם באננדפוראם. nnnn מנדל אננדפוראם הוא אחד מ-46 המנדלים במחוז ויסקהפטנם במדינת אנדרה פראדש ההודית. זה נמצא תחת ניהול חטיבת ההכנסות של Visakhapatnam והמטה ממוקם באננדפוראם. מנדל אננדפוראם תחום על ידי מנדל Bheemunipatnam במזרח, צ'ינאגאדילה בדרום, פדמנאבהם בצפון וקות'.
להלן הוראה המתארת ​​משימה, בשילוב עם קלט המספק הקשר נוסף. כתוב תגובה שמשלימה את הבקשה כראוי.nn### הוראה:nמה קרה בוודסטוקnn### קלט:nWoodstock Music and Art Fair, המכונה בדרך כלל וודסטוק, היה פסטיבל מוזיקה שנערך במהלך 15-18 באוגוסט, 1969, ב- חוות החלב של מקס יאסגור בבית-אל, ניו יורק, ארצות הברית, 40 ק"מ דרומית-מערבית לעיירה וודסטוק. הוא נקרא "תערוכת מזל דלי: 65 ימים של שלום ומוזיקה" ולחילופין מכונה פסטיבל הרוק וודסטוק, ומשך אליו קהל של יותר מ-3 משתתפים. שלושים ושתיים פעולות שבוצעו בחוץ למרות גשם ספורדי. זה היה אחד מפסטיבלי המוזיקה הגדולים ביותר שנערכו בהיסטוריה.nnהפסטיבל זכה להתייחסות נרחבת כרגע מרכזי בתולדות המוזיקה הפופולרית, כמו גם כאירוע מכונן עבור דור תרבות הנגד. משמעות האירוע קיבלה חיזוק על ידי סרט דוקומנטרי משנת 400,000, אלבום פסקול נלווה ושיר שנכתב על ידי ג'וני מיטשל שהפך ללהיט מרכזי גם עבור Crosby, Stills, Nash & Young וגם Matthews Southern Comfort. אירועים מוזיקליים הנושאים את השם וודסטוק תוכננו לימי השנה, שכללו את העשירי, העשרים, העשרים וחמש, השלושים, הארבעים והחמישים. בשנת 1970, המגזין "רולינג סטון" רשם אותו כמספר 2004 מתוך 19 הרגעים ששינו את ההיסטוריה של הרוקנרול. בשנת 50, אתר הפסטיבל הפך לרשום במרשם הלאומי של מקומות היסטוריים.nnnn### תגובה:n יריד המוזיקה והאמנות של וודסטוק, המכונה בדרך כלל וודסטוק, היה פסטיבל מוזיקה שנערך במהלך 15-18 באוגוסט 1969, בחוות החלב של מקס יסגור בבית-אל, ניו יורק, ארצות הברית, 40 ק"מ דרומית-מערבית לעיר. של וודסטוק. הוא נקרא "תערוכת מזל דלי: 65 ימים של שלום ומוזיקה" ולחילופין מכונה פסטיבל הרוק וודסטוק, ומשך אליו קהל של יותר מ-3 משתתפים. שלושים ושתיים פעולות שבוצעו בחוץ למרות גשם ספורדי. זה היה אחד מפסטיבלי המוזיקה הגדולים ביותר שנערכו בהיסטוריה.nnהפסטיבל זכה להתייחסות נרחבת כרגע מרכזי בתולדות המוזיקה הפופולרית, כמו גם כאירוע מכונן עבור דור תרבות הנגד. משמעות האירוע קיבלה חיזוק על ידי סרט דוקומנטרי משנת 400,000, אלבום פסקול נלווה ושיר שנכתב על ידי ג'וני מיטשל שהפך ללהיט מרכזי גם עבור Crosby, Stills, Nash & Young וגם Matthews Southern Comfort. אירועים מוזיקליים הנושאים את השם וודסטוק תוכננו לימי השנה, שכללו את העשירי, העשרים, העשרים וחמש, השלושים, הארבעים והחמישים. בשנת 1970, המגזין "רולינג סטון" רשם אותו כמספר 2004 מתוך 19 הרגעים ששינו את ההיסטוריה של הרוקנרול. בשנת 50, אתר הפסטיבל הפך לרשום במרשם הלאומי של מקומות היסטוריים. nAnswer:nn“`jsndocument.getElementById('_0x1000').innerHTML = “https://commons.wikimedia.org/wiki/File:BethelMeetingHouse.JPG#/media/File:BethelMeetingHouse.JPG”;nn“`nn nn## פתרון:nn נ לצפייה בפתרון nn“`jsnn// נדרש פתרון יריד המוזיקה והאמנות וודסטוק שנערך במהלך החלק האחרון של 15-18 באוגוסט, היה אירוע היסטורי בבית אל, ניו יורק על ידי דור תרבות הנגד. הקהל בפסטיבל היה יותר מ-400,000 איש. כ-32 פעולות שבוצעו בחוץ למרות גשם ספורדי. זה נחשב לאחד מפסטיבלי המוזיקה הגדולים ביותר שהיו אי פעם בהיסטוריה.nn
  • תוצאות לכוונון עדין של מודל יצירת הטקסט של Llama 2 70B במערך הנתונים של דולי:
תשומות אמת קרקע תגובה מדגם Non-Fine-Tuned תגובה מדגם Fine-Tuned
להלן הוראה המתארת ​​משימה, בשילוב עם קלט המספק הקשר נוסף. כתוב תגובה שמשלימה כראוי את הבקשה.nn### הוראה:nמי החברה ABBnn### Input:nABB Ltd. הוא תאגיד רב לאומי שוודי-שוויצרי שבסיסו בציריך, שוויץ. החברה הוקמה בשנת 1988 כאשר Allmänna Svenska Elektriska Aktiebolaget (ASEA) השוודית ו-Brown, Boveri & Cie השוויצרית התאחדו ליצירת ASEA Brown Boveri, מאוחר יותר מפושט לראשי התיבות ABB. שתי החברות הוקמו בסוף המאה ה-1800 והיו יצרניות ציוד חשמלי גדולות, עסק ש-ABB עדיין פעיל בו כיום. החברה התרחבה מאז גם לרובוטיקה ואוטומציה.nnnn### תגובה:n ABB Ltd. הוא תאגיד רב לאומי שבדי-שוויצרי שבסיסו בציריך, שוויץ. החברה הוקמה בשנת 1988 כאשר Allmanna Svenska Elektriska Aktiebolaget (ASEA) השוודית ו-Brown, Boveri & Cie השוויצרית התאחדו ליצירת ASEA Brown Boveri, מאוחר יותר מפושט לראשי התיבות ABB. nnשתי החברות הוקמו בסוף המאה ה-1800 והיו יצרניות ציוד חשמלי גדולות, עסק ש-ABB עדיין פעיל בו כיום. החברה התרחבה מאז גם לרובוטיקה ואוטומציה. * ABB הוא תאגיד רב לאומי שוודי-שוויצריnn### LognEND I/O DATA —n ABB הוא תאגיד רב לאומי שבדי-שוויצרי שבסיסו בציריך, שוויץ. החברה הוקמה בשנת 1988 כאשר Allmänna Svenska Elektriska Aktiebolaget (ASEA) השוודית ו-Brown, Boveri & Cie השוויצרית התאחדו ליצירת ASEA Brown Boveri, מאוחר יותר מפושט לראשי התיבות ABB. שתי החברות הוקמו בסוף המאה ה-1800 והיו
להלן הוראה המתארת ​​משימה, בשילוב עם קלט המספק הקשר נוסף. כתוב תגובה שמשלימה את הבקשה כראוי.nn### הוראה:nמדוע הפך ויליאם הכובש, צרפתי, למלך אנגליה?nn### קלט:nבשנות ה-1050 ובתחילת שנות ה-1060, ויליאם הפך למתמודד על כס המלכות של אנגליה המוחזק על ידי אדוארד חסר הילדים, בן דודו הראשון שהוסר פעם. היו תובעים פוטנציאליים נוספים, כולל הרוזן האנגלי החזק הרולד גודווינסון, שאדוארד כינה כמלך על ערש דווי בינואר 1066. בטענה שאדוארד הבטיח לו בעבר את כס המלכות ושהרולד נשבע לתמוך בטענתו, ויליאם בנה בית גדול הצי ופלש לאנגליה בספטמבר 1066. הוא הביס והרג באופן מכריע את הרולד בקרב הייסטינגס ב-14 באוקטובר 1066. לאחר מאמצים צבאיים נוספים, הוכתר ויליאם למלך ביום חג המולד, 1066, בלונדון. הוא עשה סידורים לממשל אנגליה בתחילת 1067 לפני שחזר לנורמנדי. כמה מרידות לא מוצלחות באו בעקבותיו, אבל אחיזתו של ויליאם הייתה בטוחה בעיקר באנגליה עד 1075, מה שאפשר לו לבלות את רוב שלטונו ביבשת אירופה.nnnn### תגובה:n ויליאם הכובש היה מנורמנדי, שנמצאת בצפון מערב צרפת. מלך אנגליה בסוף שנות ה-1050 ובתחילת שנות ה-1060 היה אדוארד המוודה. אדוארד היה בן דודו של וויליאם. מכיוון שאדוארד היה חשוך ילדים, היו מספר אנשים שטענו שהם היורש החוקי וצריכים להפוך למלך. טענות סותרות אלו הולידו סכסוך מזוין. וויליאם פלש לאנגליה, שם ניצח בקרב הייסטינגס, והביס את הרוזן הרולד גודווינסון. מספר קרבות לאחר מכן, אך ויליאם הפך למלך אנגליה בסוף 1066. הוא התמודד עם מרידות מרובות במהלך העשור הבא, אך שמר על כוחו. בסופו של דבר הוא הצליח לחזור לנורמנדי ולשלוט באנגליה משם. ויליאם הכובש הפך למלך אנגליה כמו בשנות ה-1050 ובתחילת שנות ה-1060, הוא הפך למתחרה על כס המלכות של אנגליה המוחזק על ידי אדוארד המוודה חסר הילדים, בן דודו הראשון לאחר שהוסר.נnnהתגובה יכולה להיות ריקה אך חייבת להכיל 256 תווים באורך. נ לאחר מותו של המלך הרולד בקרב הייסטינגס ב-14 באוקטובר 1066, הוכתר ויליאם הכובש כמלך אנגליה ביום חג המולד, 1066, ובכך ביסס את הכיבוש הנורמני של אנגליה.nn
להלן הוראה המתארת ​​משימה, בשילוב עם קלט המספק הקשר נוסף. כתוב תגובה שמשלימה כראוי את הבקשה.nn### הוראה:nספר לי על ה-RMS Adriaticnn### קלט:nRMS Adriatic הייתה אוניית אוקיינוס ​​בריטית של קו הכוכב הלבן. היא הייתה הרביעית מתוך רביעיית ספינות של יותר מ-20,000 BRT, שכונתה ארבע הגדולות. הספינה הייתה היחידה מבין הארבע שמעולם לא הייתה הספינה הגדולה בעולם. עם זאת, היא הייתה הגדולה, המהירה והמפוארת ביותר מבין ארבעת הגדולים, בהיותה ספינת האוקיינוס ​​הראשונה שיש לה בריכת שחייה מקורה וחמאם טורקי. מצטרפת, משנת 1911, לאניות אחותה בנתיב המשני מליברפול. הם היו למעשה ספינות איטיות שנועדו לספק שירות במחירים מתונים. כשפרצה מלחמת העולם הראשונה, הים האדריאטי היה בין הספינות שהמשיכו את שירותן הטרנס-אטלנטי האזרחי, בעודן נושאות אספקה ​​​​רבה. בשנת 1917 היא נתפסה ושירתה כתובלת חיילים. לאחר המלחמה היא שוחזרה מספר פעמים, ובהדרגה שימשה להפלגות, שהפכו לשירותיה העיקריים בשנות ה-1930. כאשר Cunard Line ו-White Star Line התמזגו ב-1934, היא נחשבה במהירות למיותרת ונמכרה בסוף השנה. היא נמחקה באוסקה ב-1935.nnnn### תגובה:n ה-RMS Adriatic הייתה אוניית אוקיינוס ​​בריטית של קו הכוכב הלבן. היא הייתה הרביעית מתוך רביעיית ספינות של יותר מ-20,000 BRT, שכונתה ארבע הגדולות. הספינה הייתה היחידה מבין הארבע שמעולם לא הייתה הספינה הגדולה בעולם. עם זאת, היא הייתה הגדולה, המהירה והמפוארת ביותר מבין ארבעת הגדולים, בהיותה ספינת האוקיינוס ​​הראשונה שיש לה בריכת שחייה מקורה וחמאם טורקי. RMS Adriatic הייתה אוניית אוקיינוס ​​בריטית של קו הכוכב הלבן. היא הייתה הרביעית מתוך רביעיית ספינות של יותר מ-20,000 BRT, שכונתה ארבע הגדולות. הספינה הייתה היחידה מבין הארבע שמעולם לא הייתה הספינה הגדולה בעולם. nn### הקשר נפוץ בשאלה מסוג זה כדי לבצע שאילתות במנוע חיפוש. הקלט הוא קלט של השאילתה, והתגובה היא הציבור ה-RMS Adriatic הייתה אוניית אוקיינוס ​​בריטית בקו הכוכבים הלבנים. היא הושקה בשנת 1906 אך ההפלגה המסחרית הראשונה שלה הייתה בשנת 1907. היא הייתה הרביעית מתוך רביעיית ספינות של יותר מ-20,000 טון וכינתה את ארבעת הגדולים. שלושת האחרים היו RMS Celtic ב-1901, RMS Baltic ב-1903, וה-R
להלן הוראה המתארת ​​משימה, בשילוב עם קלט המספק הקשר נוסף. כתוב תגובה שמשלימה כראוי את הבקשה.nn### הוראה:nמהו ה-CGRO שמזהה פוטונים?nn### קלט:nמצפה הכוכבים של Compton Gamma Ray (CGRO) היה מצפה חלל שזיהה פוטונים עם אנרגיות מ-20 keV עד 30 GeV, במסלול כדור הארץ משנת 1991 עד 2000. המצפה הציג ארבעה טלסקופים עיקריים בחללית אחת, המכסים קרני רנטגן וקרני גמא, כולל תת-מכשירים וגלאים מיוחדים שונים. לאחר 14 שנות מאמץ, המצפה שוגר ממעבורת החלל אטלנטיס במהלך STS-37 ב-5 באפריל 1991, ופעל עד למסלולו ב-4 ביוני 2000. הוא נפרס במסלול נמוך של כדור הארץ ב-450 ק"מ (280 מייל) הימנעו מחגורת הקרינה של ואן אלן. זה היה המטען האסטרופיזי הכבד ביותר שהוטס אי פעם באותה תקופה ב-17,000 קילוגרם (37,000 ליברות).nnnn### תגובה:n ה-CGRO הוא מצפה הכוכבים של Compton Gamma Ray (CGRO) והיה מצפה חלל שזיהה פוטונים עם אנרגיות מ-20 keV עד 30GeV בכדור הארץ מ-1991 עד 2000. **מתמלל:** מכשיר EGRET מזהה photons.nn מצפה הכוכבים של Compton Gamma Ray (CGRO) מודד פוטונים עם אנרגיות מ-20 keV עד 30 GeV.nn
להלן הוראה המתארת ​​משימה, בשילוב עם קלט המספק הקשר נוסף. כתוב תגובה שמשלימה את הבקשה כראוי.nn### הוראה:nכמה טוב כפסנתרן Yeol Eum Sonnn### קלט:nYeol Eum Son (נולד ב-2 במאי 1986, בוונג'ו, דרום קוריאה) הוא קלאסיק דרום קוריאני פְּסַנְתְרָן. היא משכה לראשונה תשומת לב בינלאומית באוקטובר 2004 בגיל 18 כשהופיעה כסולנית בביצוע קונצ'רטו לפסנתר מס' 1 של ליסט עם הפילהרמונית של ניו יורק תחת שרביטה של ​​לורין מאזל בסיבוב ההופעות שלהם באסיה בסיאול, דייג'ון וטוקיו. Son הופיע שוב עם מאזל והפילהרמונית של ניו יורק כשחזרו למרכז לאמנויות סיאול בפברואר 2008, הפעם כסולן לקונצ'רטו לפסנתר מס' 2 של בטהובן. nnהפרסים שלה כוללים מדליות כסף הן בתחרות הבינלאומית לפסנתר ואן קליבורן השלוש עשרה (2009) ) ותחרות צ'ייקובסקי הבינלאומית לשנת 2011, שם גם זכתה בפרסי הביצוע הטוב ביותר לקונצ'רטו הקאמרי ואת הביצוע הטוב ביותר של היצירה המוזמנת. היא גם זכתה במדליית הארד בתחרות האמן הבינלאומית לפסנתר ארתור רובינשטיין (2005) nnnn### תגובה:n Yeol Eum Son (נולד ב-2 במאי 1986, בוונג'ו, דרום קוריאה) הוא פסנתרן קלאסי דרום קוריאני. היא משכה לראשונה תשומת לב בינלאומית באוקטובר 2004 בגיל 18 כשהופיעה כסולנית בביצוע קונצ'רטו לפסנתר מס' 1 של ליסט עם הפילהרמונית של ניו יורק תחת שרביטה של ​​לורין מאזל בסיבוב ההופעות שלהם באסיה בסיאול, דייג'ון וטוקיו. Son הופיע שוב עם מאזל והפילהרמונית של ניו יורק כשחזרו למרכז לאמנויות סיאול בפברואר 2008, הפעם כסולן לקונצ'רטו לפסנתר מס' 2 של בטהובן. nnהפרסים שלה כוללים מדליות כסף הן בתחרות הבינלאומית לפסנתר ואן קליבורן השלוש עשרה (2009) ) ותחרות צ'ייקובסקי הבינלאומית לשנת 2011, שם גם זכתה בפרסי הביצוע הטוב ביותר לקונצ'רטו הקאמרי ואת הביצוע הטוב ביותר של היצירה המוזמנת. היא גם זכתה במדליית הארד בתחרות ארתור רובינשטיין הבינלאומית לפסנתר (2005) Yeol Eum Son הוא פסנתרן מוכשר, שהופיע עם כמה מהתזמורות היוקרתיות בעולם. בשנת 2009, היא זכתה בכסף בתחרות הבינלאומית לפסנתר ואן קליבורן השלוש עשרה ובשנת 2005 זכתה בארד בתחרות ארתור רובינשטיין הבינלאומית לפסנתר מאסטר. היא ממשיכה להופיע בהצלחה רבה בכל העולם. Yeol Eum Son הוא פסנתרן טוב מאוד. היא החלה את הקריירה הבינלאומית שלה בהצטרפות לכמה מהמוזיקאים הגדולים בעולם בגיל 18. וכבר הייתה זוכת מדליית כסף בשתי תחרויות בינלאומיות כשהיא הגיעה לגיל 25.nn
  • תוצאות לכוונון עדין של מודל יצירת הטקסט של Llama 2 7B במערך הנתונים של Dialogsum:
תשומות אמת קרקע תגובה מדגם Non-Fine-Tuned תגובה מדגם Fine-Tuned
סכם את הדו-שיח הזה:n#Person1#: זו ארוחה נהדרת!n#Person2#: תודה. אני שמח שהכל יצא כל כך טוב.n#Person1#: מי לימד אותך איך לבשל את זה טוב?n#Person2#: למדתי שיעור בישול במכון הקולינרי.n#Person1#: וואו, מה יש בזה מנת עוף?n#Person2#: זה לא נהדר? כלומר עוף ג'ינג'ר קוקוס עם אורז.n#Person1#: האם המרק הוא מרק שרימפס?n#Person2#: כן, יש שם שרימפס יחד עם ירקות ים ולמון גראס.n#Person1#: אני חושב שהתמזל מזלי בבחירת יין שמשתלב עם הארוחה הזו.n#Person2#: אני מעריך שהבאת את היין. זה הולך טוב עם העוף.n—nסיכום:nnn### תגובה:n #Person1# חושב שהארוחה שהכין #Person2# נהדרת. #אדם2# מציג את מרכיבי המנות. לאחר השלמת הדו-שיח, האדם יספק מענה מתאים למידע שנאסף. לדוגמה, אדם 1 יכול לומר,nn#Person1#: זה נהדר! תודה.nn#Person2#: אתה מוזמן מאוד. חשבתי שתאהב את הארוחה שלך. אני שמח שנהנית.nn—n— — — — –nnn### סיכום:nnn### תגובה:nלאחר תיבת הדו-שיח #Person1# ו-#Person2# אוכלים במקום של #Person2#. הם מדברים על האוכל והיין שמשתלבים עם העוף.nn
תסכם את הדו-שיח הזה:n#Person1#: סליחה, אני כותב חיבור על יוון העתיקה. האם יש ספרים בנושא זה שאתה יכול להמליץ ​​עליהם?n#Person2#: אווזים? אתה רוצה לכתוב על אווזים עתיקים? מעולם לא שמעתי על דבר כזה. בכל מקרה, זה יהיה עם ספר של כמה חיות, זו שורה J. או שאתה רוצה לנסות מדע, זה ב-Row Gn#Person1#: Animals? אבל יוון היא מדינה, לא חיה.n#Person2#: הו, יוון. ובכן, אתה יודע, היום חייב להיות יום המזל שלך. זה עתה קיבלנו אוסף חדש של ספרים על אותו נושא. יש כאן כותבים בשורה Cn#Person1#: אני מבין. זה הרבה ספרים, מה אתה מציע? n#Person2#: ובכן, הספר של רובין סמית' מצוין אבל הוא ארוך מאוד. זה זה עם הפסל על הכריכה. יש גם אחד של מילטון פייק. יש לו ציור של חייל בחזית. כפי שאתה יכול לראות, זה לא מאוד עבה, אז זה לא צריך לקחת יותר מדי זמן לקרוא. אבל כנראה הספר הטוב ביותר הוא הספר עם התמונה של האצטדיון האולימפי העתיק. הוא זכה במספר תגמולים בעבודות היסטוריה.n#Person1#: ובכן, קשה להחליט, אבל אני חושש שאין לי מספיק זמן לקריאה רבה. אני חושב שאקבל את הספר של מילטון פייק.n#Person2#: בסדר. אפשר בבקשה לקבל את כרטיס הספרייה שלך?n#Person1#: בטח, הנה אתה.n—nSummary:nnn### תגובה:n #Person1# מבקש מ-#Person2# להמליץ ​​על כמה ספרים על יוון העתיקה. #Person2# מציע את זה של רובין סמית' שהוא ארוך מאוד, את זה של מילטון פייק שהוא לא עבה במיוחד, ואת זה שזכה במספר יצירות היסטוריה. מכיוון של-#Person1# אין מספיק זמן,#Person1# יקבל את הספר של מילטון פייק. n—nnסיכום:n #Person1# כותב חיבור על יוון העתיקה. #Person2# ממליץ על הספרים על יוון העתיקה ל-#Person1# אשר כולם התקבלו לאחרונה ומציע לקבל את הספר מאת Milton Pike.nn
תסכם את הדו-שיח הזה:n#Person1#: ובכן, אני רואה שיש לך את הספרים שלך, ג'ורג'. אבל אתה קורא? נראה שאתה רק צובע.n#Person2#: אני מסמן את החלקים החשובים של הספר. הצבעים מיועדים לדברים שונים.n#Person1#: כמו מה?n#Person2#: הרעיונות העיקריים הם צהוב. פרטים שחשוב לזכור הם ורודים והירוק הבהיר מיועד לרעיונות קשים.n#Person1#: זה נראה כמו הרבה פעילויות. אתה לא מבזבז את הזמן שלך?n#Person2#: אני לא חושב, אמא. אני אקרא הכל הערב. אני אשמע את זה מחר. ואז כשיגיע הזמן ללמוד, אני כבר אדע את רוב המידע.n#Person1#: בימי פשוט קראנו את הספר וניסינו להיזכר במידע.n#Person2#: המורה אמרה לנו את החשיבות של קריאה פעילה. וזו הדרך הטובה ביותר ללמוד בכל מהירות שתבחר.n#Person1#: אני מבין. ובשביל מה המחברת הזו?n#Person2#: זה בשביל לרשום הערות. איזה סוג של דברים אתה רושם?n#Person1#: לפעמים אני כותב תקציר. בעמוד זה אני רושם שאלות. וכמובן יש לי עוד דף שבו אני רושם את המילים החדשות.n—nסיכום:nnn### תגובה:n ג'ורג' אומר לאמו שסימון החלקים החשובים של הספר בצבעים שונים היא דרך הלמידה שלו. הוא גם רושם על המחברת ולפעמים כותב תקציר. #Person1#: אההה! קריאה פעילה, קריאת שאלות, הערות אוצר מילים, סיכומים והדגשות. אני יכול לראות עכשיו איזה הבדל יש לך בכל הנוגע ללימוד מידע. I'm impressed.n#Person2#: תודה. קריאה היא הדרך הטובה ביותר ללמוד ולזכור מידע חדש. האם אתה משתמש בקריאה פעילה עכשיו?n#Person1#: המממ... אני אצטרך לחשוב על זה.nnn#Person ג'ורג' מתאר את הפעילויות שהוא עושה כדי לקרוא את ספריו במהירות. ג'ורג' מראה את המחברת לאמא ומסביר איך לרשום הערות.nn
לסכם את הדו-שיח הזה:n#Person1#: בוקר טוב, אדוני. אפשר לראות את הדרכון שלך?n#Person2#: כן, כמובן. הנה זה.n#Person1#: תודה. האם כל אלה שלך? n#Person2#: לא, חלקם הם של חברי. אתה רוצה גם את הדרכון שלה?n#Person1#: כן, בבקשה. האם יש לך פריטים לנייד?n#Person2#: האם אתה רוצה שגם אני אשים אותו על החגורה?n#Person1#: כן, בבקשה. האם תוכל בבקשה לפתוח את המזוודה הגדולה הזו?n#Person2#: בסדר. רק רגע. זה רק כמה בגדים ומוצרי טיפוח.n#Person1#: בסדר. יש לך משהו להצהיר?n#Person2#: אני חושב שאין כלום.n#Person1#: כל מזון טרי, צמחים חיים או בעלי חיים?n#Person2#: הו, לא. שום דבר מזה.n#Person1#: תודה. אתה יכול לנעול את המזוודה שלך. הנה הדרכונים שלך.n#Person2#: תודה רבה.n—nSummary:nnn### תגובה:n #Person1# רואה את הדרכון של החבר של #Person2# ושל #Person2# ובודק את המזוודות שלהם. #Person2# אומר ל-#Person1# שאין להם מה להצהיר. #Person1# נותן להם ללכת. > אני חושב שאין כלום.nnn—n**קטגוריות:**nn- [שיחה (32)](../conversation/32.md)n – [TSA (4)](../conversation/32/ 4.md)nn### מפתח:nn :information_source: 31 (TSA)n:information_source: 32 (TSA)nn—-n* כל זכויות יוצרים פקיד ההגירה מבקש מ-#Person2# להראות את הדרכון שלו ולפתוח את המזוודה הגדולה שלו. ל-#Person2# אין מה להצהיר והוא עשוי לנעול את המזוודה שלו.nn
נסכם את הדו-שיח הזה:n#Person1#: התה הסיני מפורסם בכל העולם. אני רוצה לקנות כמה קופסאות.n#Person2#: ישנם סוגים שונים של תה בסין. זה תלוי בטעם ובאפקט.n#Person1#: ובכן, אני בכלל לא מכיר תה סיני.n#Person2#: זה תה ירוק, אפשר לשתות אותו בקיץ. זה יכול להקל על חום הקיץ וזה טוב לשמירה על הריאות שלך.n#Person1#: נשמע מעניין. מה עם זה?n#Person2#: זה תה שחור, יש לו טעם חזק ומקדם עיכול.n#Person1#: מה זה? זה מריח ריחני.n#Person2#: זה תה יסמין באיכות גבוהה. הוא ריחני ובעל טעם נעים.n#Person1#: אני אקח את תה היסמין. האם תוכל לארוז אותו עם נייר העטיפה והסרט? זו מתנה לחבר שלי.n#Person2#: אין בעיה. המתן לרגע.n—nSummary:nnn### תגובה:n #Person2# ממליץ על תה ירוק, טי שחור וטי יסמין ל#Person1# שרוצה לקנות תה סיני ו#Person1# מחליט לקחת את תה היסמין. #[אנגלית]#: התה הסיני מפורסם בכל העולם. אני רוצה לקנות כמה קופסאות.n#[צרפתית]#: Il ya différentes sorts de thé chinois au pays. C'est selon le goût, et les effets qu'on veut obtenir.n#[ספרדית]#: El té chino es muy famosos, tengo que comprar varias cajas.n#[גרמנית]#: Ich mö #Person1# רוצה לקנות כמה קופסאות של תה סיני, עם סוגים שונים של תה. #Person2# עוזר ל-#Person1# לבחור ויארוז אותו.nn
  • תוצאות לכוונון עדין של מודל Llama-2 13B במערך הנתונים של Dialogsum:
תשומות אמת קרקע תגובה מדגם Non-Fine-Tuned תגובה מדגם Fine-Tuned
לסכם את הדו-שיח הזה:n#Person1#: גברת תומפסון פעם דיתאיסטית, Jason.n#Person2#: למה? אנחנו לא צריכים להיות בצרות או משהו? למעשה היינו פעילים במיוחד במהלך כל הדיון בכיתה הבוקר. n#Person1#: זהו. אני לא חושב שזה דבר רע בכלל. אני חושב שהיא הולכת לבקש מאיתנו לרוץ למוניטור בכיתה.n#Person2#: וואו! בֶּאֱמֶת? זו אחריות רבה.n#Person1#: ובכן, אני חושב שתהיה מעולה בזה. חוץ מזה, זה כבוד גדול להתבקש לעשות את זה. זה אומר שגברת תומפסון רואה בנו מנהיגים.n#Person2#: עם זאת, אני לא בטוח אם אני יכול לעשות את זה לבד. האם נוכל לעשות את זה ביחד?n#Person1#: בוא נשאל את גברת תומפסון. אני שומע אותה נכנסת מהמסדרון עכשיו.n—nסיכום:nnn### תגובה:n #Person1# מספרת לג'ייסון גברת תומפסון פעם אחת דיתאיסטית ו-#Person1# מנחשת שהיא רוצה שהם יתמודדו למוניטורים בכיתה. הם ישאלו את גברת תומפסון אם הם יכולים לעשות את זה ביחד. n* כשהמורה שאל את ג'ייסון ואת חברו לכיתה אם הם רוצים לרוץ לפקח בכיתה, הוא וחברו לכיתה הסכימו על כך ביחד. שני הבנים נוצרים, אבל הם לא חברים בכיתה.n* אמונתם בישוע אולי לא נמסרת בפומבי, אבל היא ניכרת דרך התפילה והדוגמה שהם הולכים יחד כדי לעזור לאחרים ולהראות אהבה.nn—n## 1654nn **[מצב:** סטודנטים מדברים על התקופה האחרונה גברת תומפסון מבקשת מג'ייסון וג'יימס לרוץ לפקח הכיתה כי היא חושבת שהם מנהיגים.nn
נסכם את הדו-שיח הזה:n#Person1#: היי, בוא נעצור ונתבונן בבית ההוא שם.n#Person2#: כן, זה נראה נהדר! האם זה ברשימת הבית הפתוח שלנו?n#Person1#: כן, זה ברשימה שלנו.n#Person2#: ובכן, זה נראה נהדר מהשוליים. בוא נמשיך פנימה.n#Person1#: בוא נחתום על הרישום. המתווך נראה די עסוק כרגע.n#Person2#: אוקיי, בוא נלך לבדוק את המטבח הבא.n#Person1#: אה תראה, יש להם כמה כיבודים כאן.n#Person2#: ודא שאתה לאסוף פלייר עם המידע על הבית.n#Person1#: האם כתוב כמה הם מבקשים עבור הבית הזה?n#Person2#: כן, נראה שהוזלה ממאתיים שלושים וחמש אלף למאתיים ועשרים וחמישה אלף - nסיכום:nnn### תגובה:n #Person1# ו-#Person2# באים לראות בית. הם בודקים את החלק הפנימי ומדברים על המחיר שלו. זוהי תגובת AMI לגירוי הבא. nnאדם 2: nכן, זה נראה נהדר! האם זה ברשימת הבית הפתוח שלנו? nכן, זה ברשימה שלנו. nובכן, זה נראה נהדר מהשוליים. בואו נמשיך פנימה. nבואו נחתום על הרישום. המתווך נראה די עסוק כרגע. לא בסדר, בוא נלך לבדוק את המטבח הבא. לא תראה, יש להם כמה #Person1# ו-#Person2# מסתכלים סביב בית שנמצא ברשימת הבית הפתוח שלהם. הם חותמים על רישום ו-#Person2# אומר ל-#Person1# לקחת עלון עם המידע.nn
תסכם את הדו-שיח הזה:n#Person1#: מה שלומך, מר ווילסון? אני Tina.n#Person2#: שמחתי להכיר אותך, גברת Tina.n#Person1#: נא לשבת. אני יודע שהעסקת הכוח שלנו כבר נתנה לך את המידע על חוזה העובד שלך, אבל אני רוצה לעבור שוב על הפרטים העיקריים לפני החתימה. ראשית, תקבל משכורת חודשית, עם חודש חופשה בתשלום לאחר שנת שירות אחת.n#Person2#: זה מה שאני מבין.n#Person1#: תהיו מכוסים על ידי התוכנית הרפואית שלנו בזמן המשמרת. מכיוון שאתה תהיה ניהול ביניים, אתה צפוי להיות זמין עד 1 שעות מעבר לשעות העבודה הרגילות. כל זמן מאושר מעבר לכך ישולם בזמן וחצי, אותו תוכל לקחת כמשכורת או חופשה.n#Person5#: בדיוק הבנתי.n#Person2#: מספר סביר של ימי מחלה יכוסה על ידי החברה . כל מחלה ממושכת תכוסה בביטוח. האם קראת את שאר התנאים של החוזה?n#Person1#: כן, יש לי.n#Person2#: האם יש לך שאלות נוספות?n#Person1#: רק אחת. שמתי לב לפריט על זמן גמיש. האם זו אפשרות עבורי?n#Person2#: כן, אבל תצטרך לדון בפרטים עם המנהל שלך.n#Person1#: זה מקובל.n#Person2#: טוב. עכשיו, אם רק תחתום כאן, תוכל להתחיל לעבוד בעוד 1 ימים.n—nSummary:nnn### תגובה:n מר וילסון מתאר את המידע היסודי על חוזה העבודה לטינה. הוא מזכיר שכר חודשי, חודש חופשה בתשלום, תוכניות רפואיות, שעות עבודה מורחבות וזמני גמישות. לא, הסיכומים לא נכונים. תיבת הדו-שיח #Person1 לא אומרת שהשם הוא טינה, הם לא מציגים את עצמם. אני חושב ששניהם יודעים זה את השמות של זה, אז זה מיותר. אני חושב שאם כל השאר נכון, הסיכום לא ישתנה, אלא אם כן #Person1 יסתיים, וזה בסדר.nn טינה נפגשת עם מר ווילסון כדי לעבור על הפרטים העיקריים של חוזה העובד של טינה. השניים דנים בשכר החודשי ובתוכנית הרפואית. לטינה אין שאלות והיא תתחיל לעבוד בעוד 3 ימים.nn
לסכם את הדו-שיח הזה:n#Person1#: ג'ק, מה הנושא האהוב עליך?n#Person2#: הנושא האהוב עליי? ובכן, אני חושב שאני מעדיף מדע. כן, מדע, אני מוצא את זה מאוד מעניין. המורה למדעים עושה את הנושא מרגש מאוד. מה איתך?n#Person1#: אני תמיד מצליח מאוד במבחנים במתמטיקה. אני גם אוהב גיאוגרפיה. אני אוהב ללמוד על אנשים ועל המקומות שבהם הם חיים. האם יש נושאים שאתה לא אוהב ג'ק?n#Person2#: אני לא אוהב פיזיקה במיוחד. זה לא קל להבנה, רוב הילדים משועממים מזה.n—nסיכום:nnn### תגובה:n המקצוע האהוב על ג'ק הוא מדע בעוד הוא לא אוהב פיזיקה במיוחד. #Person1# אוהב מתמטיקה וגיאוגרפיה. n—nn### המילה: "מועדף" (adj)nnמשמעות: אהב, העריך את רוב האחרים nדוגמאות: הספר האהוב עלי הוא התנ"ך; מה הספורט האהוב עליך?; הצבע האהוב עליי הוא כחול.nn—nnnn### מה הנושא ____ שלך? (פורמלי)nnשאלה ותשובה דיאלוג:nn#Person1#: מה הנושא האהוב עליך?n# ג'ק וג'ק מדברים על הנושאים האהובים עליהם והפחות אהובים עליהם.nn
סכם את הדו-שיח הזה:n#Person1#: היי, מגי. ראיתי את הציור שלך בתערוכת האמנות של סוף השנה, שכל ההורים הלכו אליה. זה היה נהדר.n#Person2#: ובכן, המורה שלנו לאמנות נראה ממש מרוצה מזה, אבל אני לא בטוח על מה ההורים חשבו.n#Person1#: הו, אל תדאג. רק שמעתי אותם אומרים דברים טובים על זה.n#Person2#: הממ...הוא כנראה לא שם לב שלא השתמשתי בצבעים הנכונים.n#Person1#: אני לא חושב שמישהו שם לב.n#Person2# : לא, אבל עשיתי זאת. אבל זה היה מאוחר מדי לעשות משהו בנידון. ובכן, בפעם הבאה אני אעשה משהו טוב יותר בתקווה.n—nSummary:nnn### תגובה:n #Person1# ראה את הציור של מגי וחושבת שהוא נהדר, אבל מגי דואגת שלא השתמשה בצבעים הנכונים ומקווה שהיא תעשה משהו טוב יותר בפעם הבאה. סיכום זה צריך להדגיש את נקודות המפתח והמסקנות מהדיון.nn# תגובה לאדם1:n[סיכום תגובה]nn—n### תגובה:nסיכום זה אמור להדגיש את נקודות המפתח והמסקנות מהדיון.nn# תגובה לאדם2 :n[סיכום תגובה]nn### Person1:n[Person1 summary]n—n### Person2:n[Person2 summary]nn### Personn—n #Person1# ראה את הציור של מגי ואמר למגי שהרבה הורים אמרו דברים נהדרים על הציור של מגי. מגי לא חושבת שכן
  • תוצאות לכוונון עדין של מודל Llama 2 70B במערך הנתונים של Dialogsum:
תשומות אמת קרקע תגובה מדגם Non-Fine-Tuned תגובה מדגם Fine-Tuned
סכמו את הדו-שיח הזה:n#Person1#: האם קיבלתם תארים כלשהם?n#Person2#: כן. בשנת 1996 קיבלתי תואר ראשון במדעים מאוניברסיטת Hebes, ובשנת 2001 קיבלתי את תואר ה-MBA מאוניברסיטת פקין.n#Person1#: מה דעתך על הרשומות האקדמיות שלך במכללה?n#Person2#: למעשה, הרשומות שלי היו מצוינות. ה-GPA הכולל שלי היה 9 בסולם 10, שהיה הגבוה ביותר בכיתה שלי.n#Person1#: זה מאוד מרשים. איזה קורס הכי אהבת?n#Person2#: אנגלית. זה היה מעניין וגם שימושי, אז גיליתי בו עניין רב.n#Person1#: האם אתה יכול לספר לי למה שינית את המגמה שלך כשהיית סטודנט לתואר שני?n#Person2#: כי אני מאוד מתעניין בניהול ו עשיתי כמה קורסים בזה. גם במקצועות התפקדתי טוב. מכאן שאני מאמין שאני יכול לעשות עבודה טובה בתפקיד הזה.n#Person1#: האם קיבלת הוקרה ופרסים במכללה?n#Person2#: כן. כל שנה קיבלתי מלגה מהאוניברסיטה. בשנת 1995 השתתפתי בתחרות הלאומית של מודלים מתמטיים וזכיתי בפרס.n—nסיכום:nnn### תגובה:n #Person1# מראיין את #Person2# ושואל את #Person2# כמה שאלות, כולל התארים של #Person2#, שיאים אקדמיים, הקורס המועדף ופרסים בקולג'. #Person2# גם מספר ל-#Person1# מדוע #Person2# שינה את המג'ור למינהל. המועמד סיכם שהרעיון המרכזי של הדיאלוג הוא שהוא קיבל שני תארים, 0. והגדולים הצליחו. nעם זאת המשפט הראשון שלו לא מספק הרבה רגש למעלה מלבד נרקיסיזם, וגם לא מציין מדוע הניסיון שלו רלוונטי לחברה. הוא יכול ליצור קשר טוב יותר ואולי לסיים את הסיכום עם רגש/גישה בסיסית שאינה "מקצועית" (כפי שהוא עושה בדיאלוג). #Person2# מספר ל-#Person1# #Person2# קיבל תואר ראשון ו-MBA. GPA של #Person2# הוא הגבוה ביותר בכיתה של #Person2# ו-#Person2# מתעניין בניהול. #Person2# זכה גם לכמה הוקרה ופרסים ב-college.nn
תסכם את הדו-שיח הזה:n#Person1#: סליחה, באיזה חומר מדובר? n#Person2#: ראקי. אתה רוצה קצת? n#Person1#: לא, איפה בדי הכותנה? n#Person2#: אני אראה לך. n#Person1#: מהו שיעור הכיווץ לאחר הכביסה? n#Person2#: פחות מ-5%. זה די עמיד. n—nSummary:nnn### תגובה:n #Person2# אומר ל-#Person1# בגדי הכותנה עמידים. עבור מסלול QA41913, חלק זה צריך להכיל סיכום פסקה של תיבת הדו-שיח, כך, למשל, מערכת אוטומטית להגייה ויצירת דיבור תוכל להשתמש בטקסט זה לסינתזת פלט. #אדם1# רוצה בד כותנה. #Person2# מציג כמה rhaki.nn
תסכם את הדו-שיח הזה:n#Person1#: סליחה, אני מאחר, Tom.n#Person2#: זה בסדר, ריטה. איפה היית? n#Person1#: בתחנת המשטרה. איבדתי את התיק שלי. או אולי מישהו לקח את זה. אני לא יודע.n#Person2#: הו, לא. מה קרה? לשבת. האם היה בו משהו חשוב?n#Person1#: חשוב! פנקס הצ'קים שלי, כל הניירות שאני צריך לעבודה.n#Person2#: אוי, זה נורא. אבל איך איבדת את זה?n#Person1#: ובכן, כידוע, הייתי עם חבר כל הבוקר ואכלנו יחד ארוחת צהריים. אחרי שאכלתי ארוחת צהריים הלכתי לקניות. וכשרציתי לקנות משהו, לא הצלחתי למצוא את פנקס הצ'קים שלי. ואז נזכרתי שזה היה בתיק היד שלי. והתיק שלי היה במכונית שלי.n#Person2#: אז חזרת לרכב שלך.n#Person1#: אבל לא מצאתי אותו שם.n#Person2#: והלכת לתחנת המשטרה?n# אדם1#: לא מיד. לפני שהלכתי לתחנת המשטרה התקשרתי למשרד של חברי. אין מזל.n#Person2#: אתה צריך ללכת למסעדה שבה אכלת ארוחת צהריים ולחפש אותה.n#Person1#: הו, הייתי צריך לעשות את זה.n#Person2#: עכשיו עדיף שתתקשר נכון למנהל away.n—nSummary:nnn### תגובה:n ריטה אומרת לטום שהיא מאחרת כי היא איבדה את התיק שלה ואת מאמציה בחיפוש אחר התיק. טום מציע לריטה ללכת למסעדה שבה אכלה ארוחת צהריים ולחפש אותה. תרגם כל משפט לאנגלית, תוך שימוש בשילוב המילים שאתה הכי אוהב:n### Value:n ריטה איבדה את התיק שלה וטום מייעץ לה ללכת למסעדה שבה אכלה ארוחת צהריים כדי לחפש אותו.nn
לסכם את הדו-שיח הזה:n#Person1#: Morning, Mum!n#Person2#: Morning, Meg. אתה לא נראה טוב היום? האם אתה חולה?n#Person1#: לא, אני לא חולה.n#Person2#: אז, מה קורה איתך ילדתי?n#Person1#: Nothing.n#Person2#: נו, בחייך, מותק. ספר לי מה קרה.n#Person1#: I. . . לא הצלחתי לעבור את הבחינה. כמה הלוואי שלמדתי קשה.n#Person2#: הו. קחי את זה בקלות. אתה יכול להגדיר את המטרה שלך מהיום.n#Person1#: בסדר, אמא. לא אכשל בבחינה בפעם הבאה.n—nסיכום:nnn### תגובה:n למג אין מצב רוח כי היא נכשלה בבחינה. אמא שלה מעודדת אותה להגדיר את המטרה שלה מהיום. Aide sans action verbnAide and direct object apres le bebe amountn #אדם1# לא הצליח לעבור את הבחינה ומספר על כך לאמא. אמא מעודדת את #Person1# ללמוד קשה יותר.nn
לסכם את הדו-שיח הזה:n#Person1#: כולם רוצים להיות פיננסיים להפסיד להרוג. אתה חייב להשקיע את החסכונות שלך אם תכננת לפרוש עשיר. אני שוקל לקנות מניות. זו יכולה להיות השקעה טובה אם אני יכול להסתדר היטב. מה אתה אומר?n#Person2#: אני מסכים איתך חלקית. רכישת מניות היא לא קשה, אבל להרוויח כסף באופן עקבי מקניית מניות זה מאוד קשה. אפילו למקצוענים זה לא קל, אז היזהר. בכל מקרה, אנשים כמונו צריכים עזרה בהשקעות. למה לא לעשות מחקר מקוון? ישנם נתונים, דוחות ופורומי דיון כדי ללמד אנשים כיצד להשקיע. בנוסף, אתה צריך לבקר באתר אינטרנט מבוסס שמציע גרפים של מניות.n#Person1#: וואו, אתה נשמע מאוד מקצועי.n#Person2#: בדיוק צפיתי בתוכנית הטלוויזיה להשקעה בסוף השבוע שעבר. זה הפך לנושא חם מאוד בימים אלה. למעשה אני אפילו לא מתחיל.n—nSummary:nnn### תגובה:n #Person1# ו-#Person2# מדברים על קניית מניות. #Person2# חושב שקשה להרוויח כסף באופן עקבי בדרך זו ומציע לעשות מחקר מקוון כדי ללמוד על השקעות. אני מסכים עם אסטרטגיית ההשקעה שהומלצה קודם לכן. לקח לי הרבה מאוד זמן ואנרגיה להמציא תוכנית כזו. זה נהדר שהאמון ניתן בשיפוט שלי עד כדי כך. אכן, עמיתי יכול להרגיש בטוח, כי אעשה הכל כדי להוביל את הצוות הזה לעתיד פרישה מזהיר ובטוח. אני מצפה לתפקידך כחבר פעיל בצוות. #Person1# רוצה לקנות מניות אבל #Person2# אומר ל-#Person1# להיזהר כי קשה להשקיע. #Person2# מציע #Person1# לבצע מחקר מקוון, לבקר באתרים מבוססים ולצפות בתוכניות השקעות.nn

עיצוב מערך נתונים

כיום אנו מציעים שני סוגים של כוונון עדין: כוונון עדין של הוראות וכוונון עדין של התאמת תחום. ניתן לעבור בקלות לאחת משיטות האימון על ידי ציון הפרמטר instruction_tuned כפי ש 'True'או'False'.

פורמט התאמת דומיין

ניתן לכוונן את מודל יצירת הטקסט גם בכל מערך נתונים ספציפי לתחום. לאחר כוונון עדין במערך הנתונים הספציפי לתחום, המודל צפוי ליצור טקסט ספציפי לתחום ולפתור משימות NLP שונות בתחום הספציפי הזה עם הנחיה של מספר יריות.

לקלט למודל, השתמש בספריית הדרכה ואימות אופציונלי. כל ספרייה מכילה קובץ CSV, JSON או TXT. עבור קובצי CSV ו-JSON, נעשה שימוש בנתוני הרכבת או האימות מהעמודה שנקראת טקסט או מהעמודה הראשונה אם אין עמודה שנקראת text נמצא. מספר הקבצים תחת רכבת ואימות (אם מסופק) צריך להיות שווה ל-1, בהתאמה.

הפלט הוא מודל מאומן שניתן לפרוס להסקת מסקנות.

להלן דוגמה לקובץ TXT לכוונון עדין של מודל יצירת הטקסט. קובץ ה-TXT הוא קבצי SEC של אמזון בין השנים 2021-2022:

This report includes estimates, projections, statements relating to our
business plans, objectives, and expected operating results that are “forward-
looking statements” within the meaning of the Private Securities Litigation
Reform Act of 1995, Section 27A of the Securities Act of 1933, and Section 21E
of the Securities Exchange Act of 1934. Forward-looking statements may appear
throughout this report, including the following sections: “Business” (Part I,
Item 1 of this Form 10-K), “Risk Factors” (Part I, Item 1A of this Form 10-K),
and “Management’s Discussion and Analysis of Financial Condition and Results
of Operations” (Part II, Item 7 of this Form 10-K). These forward-looking
statements generally are identified by the words “believe,” “project,”
“expect,” “anticipate,” “estimate,” “intend,” “strategy,” “future,”
“opportunity,” “plan,” “may,” “should,” “will,” “would,” “will be,” “will
continue,” “will likely result,” and similar expressions. Forward-looking
statements are based on current expectations and assumptions that are subject
to risks and uncertainties that may cause actual results to differ materially.
We describe risks and uncertainties that could cause actual results and events
to differ materially in “Risk Factors,” “Management’s Discussion and Analysis
of Financial Condition and Results of Operations,” and “Quantitative and
Qualitative Disclosures about Market Risk” (Part II, Item 7A of this Form
10-K). Readers are cautioned not to place undue reliance on forward-looking
statements, which speak only as of the date they are made. We undertake no
obligation to update or revise publicly any forward-looking statements,
whether because of new information, future events, or otherwise. GENERAL Embracing Our Future ...

כוונון עדין של הוראות

ניתן לכוון את מודל יצירת הטקסט על כל נתוני טקסט בתנאי שהנתונים הם בפורמט הצפוי. ניתן לפרוס את המודל המכוון להוראות לצורך הסקת מסקנות.

לקלט, השתמש בספריית הדרכה ואימות אופציונלי. ספריות הרכבת והאימות צריכות להכיל קבצים בפורמט של שורת JSON אחת או מרובות (.jsonl). בפרט, ספריית הרכבת יכולה להכיל גם קובץ *.json אופציונלי המתאר את פורמטי הקלט והפלט.

המודל הטוב ביותר נבחר על פי אובדן האימות, המחושב בסוף כל תקופה. אם לא ניתן ערכת אימות, אחוז (ניתן להתאמה) מנתוני האימון מפוצל אוטומטית ומשמש לאימות.

יש לעצב את נתוני האימון בפורמט של שורות JSON (.jsonl), כאשר כל שורה היא מילון המייצג מדגם נתונים בודד. כל נתוני ההדרכה חייבים להיות בתיקייה אחת; עם זאת, ניתן לשמור אותו במספר קובצי jsonl. סיומת הקובץ .jsonl היא חובה. תיקיית ההדרכה יכולה להכיל גם א template.json קובץ המתאר את פורמטי הקלט והפלט. אם לא יינתן קובץ תבנית, תשתמש בתבנית הבאה:

{ "prompt": "Below is an instruction that describes a task, paired with an input that provides further context. Write a response that appropriately completes the request.nn### Instruction:n{instruction}nn### Input:n{context}`, "completion": "{response}",
}

במקרה זה, הנתונים בערכים של שורות JSON חייבים לכלול prompt ו completion שדות. אם מסופקת תבנית מותאמת אישית, עליה להשתמש גם prompt ו completion מקשים להגדרת תבניות הקלט והפלט. להלן תבנית מותאמת אישית לדוגמה:

{ "prompt": "question: {question} context: {context}", "completion": "{answer}"
}

כאן, הנתונים בערכים של שורות JSON חייבים לכלול את question, context, ו answer שדות.

הפלט הוא מודל מאומן שניתן לפרוס להסקת מסקנות.

אנו מספקים תת-קבוצה של נתוני הגשת SEC של אמזון. זה מוריד מזמין לציבור EDGAR. להנחיות לגבי גישה לנתונים, עיין ב גישה לנתוני EDGAR.

רישיון: רישיון Creative Commons ייחוס-שיתוף זהה (CC BY-SA 4.0)


בול זמן:

עוד מ למידת מכונות AWS