بڑے ڈیٹا اور AI کے دور میں، کمپنیاں مسلسل مسابقتی برتری حاصل کرنے کے لیے ان ٹیکنالوجیز کو استعمال کرنے کے طریقے تلاش کر رہی ہیں۔ اس وقت AI میں سب سے زیادہ گرم علاقوں میں سے ایک جنریٹو AI ہے، اور اچھی وجہ سے۔ جنریٹو اے آئی طاقتور حل پیش کرتا ہے جو تخلیقی صلاحیتوں اور اختراعات کے لحاظ سے ممکنہ حدوں کو آگے بڑھاتا ہے۔ ان جدید حلوں کے مرکز میں ایک فاؤنڈیشن ماڈل (FM) ہے، جو ایک انتہائی جدید مشین لرننگ ماڈل ہے جو کہ ڈیٹا کی وسیع مقدار پر پہلے سے تربیت یافتہ ہے۔ ان میں سے بہت سے فاؤنڈیشن ماڈلز نے انسان نما متن کو سمجھنے اور تخلیق کرنے میں قابل ذکر صلاحیت کا مظاہرہ کیا ہے، جس سے وہ مواد کی تخلیق سے لے کر کسٹمر سپورٹ آٹومیشن تک مختلف قسم کی ایپلی کیشنز کے لیے ایک قابل قدر ٹول بنتے ہیں۔
تاہم، یہ ماڈل ان کے چیلنجوں کے بغیر نہیں ہیں. وہ غیر معمولی طور پر بڑے ہیں اور تربیت کے لیے بڑی مقدار میں ڈیٹا اور کمپیوٹیشنل وسائل کی ضرورت ہوتی ہے۔ مزید برآں، تربیتی عمل کو بہتر بنانا اور پیرامیٹرز کو کیلیبریٹ کرنا ایک پیچیدہ اور تکراری عمل ہوسکتا ہے، جس میں مہارت اور محتاط تجربہ کی ضرورت ہوتی ہے۔ یہ بہت سی تنظیموں کے لیے رکاوٹیں ہو سکتی ہیں جو اپنے فاؤنڈیشن ماڈل بنانا چاہتے ہیں۔ اس چیلنج پر قابو پانے کے لیے، بہت سے صارفین موجودہ فاؤنڈیشن ماڈلز کو ٹھیک کرنے پر غور کر رہے ہیں۔ یہ مخصوص ایپلی کیشنز کے لیے ماڈل پیرامیٹرز کے ایک چھوٹے سے حصے کو ایڈجسٹ کرنے کے لیے ایک مشہور تکنیک ہے جب کہ ماڈل میں پہلے سے انکوڈ شدہ علم کو محفوظ رکھتے ہوئے یہ تنظیموں کو ان ماڈلز کی طاقت کو استعمال کرنے کی اجازت دیتا ہے جبکہ کسی مخصوص ڈومین یا کام کو اپنی مرضی کے مطابق بنانے کے لیے درکار وسائل کو کم کرتا ہے۔
فائن ٹیوننگ فاؤنڈیشن ماڈلز کے لیے دو بنیادی طریقے ہیں: روایتی فائن ٹیوننگ اور پیرامیٹر سے موثر فائن ٹیوننگ۔ روایتی فائن ٹیوننگ میں ایک مخصوص بہاو کام کے لیے پہلے سے تربیت یافتہ ماڈل کے تمام پیرامیٹرز کو اپ ڈیٹ کرنا شامل ہے۔ دوسری طرف، پیرامیٹر سے موثر فائن ٹیوننگ میں متعدد تکنیکیں شامل ہیں جو ماڈل کے تمام اصل پیرامیٹرز کو اپ ڈیٹ کیے بغیر اپنی مرضی کے مطابق کرنے کی اجازت دیتی ہیں۔ ایسی ہی ایک تکنیک کو لو رینک اڈاپٹیشن (LoRA) کہا جاتا ہے۔ اس میں پہلے سے تربیت یافتہ ماڈل میں چھوٹے، کام کے لیے مخصوص ماڈیولز شامل کرنا اور باقی پیرامیٹرز کو طے کرتے ہوئے ان کی تربیت کرنا شامل ہے جیسا کہ درج ذیل تصویر میں دکھایا گیا ہے۔
ماخذ: AWS پر جنریٹو AI (O'Reilly, 2023)
LoRA نے حال ہی میں کئی وجوہات کی بنا پر مقبولیت حاصل کی ہے۔ یہ تیز تر تربیت، یادداشت کے تقاضوں میں کمی، اور متعدد بہاوی کاموں کے لیے پہلے سے تربیت یافتہ ماڈلز کو دوبارہ استعمال کرنے کی صلاحیت پیش کرتا ہے۔ مزید اہم بات یہ ہے کہ بیس ماڈل اور اڈاپٹر کو الگ الگ ذخیرہ کیا جا سکتا ہے اور کسی بھی وقت یکجا کیا جا سکتا ہے، جس سے فائن ٹیونڈ ورژن کو ذخیرہ کرنا، تقسیم کرنا اور شیئر کرنا آسان ہو جاتا ہے۔ تاہم، یہ ایک نیا چیلنج پیش کرتا ہے: ان نئی اقسام کے فائن ٹیونڈ ماڈلز کا صحیح طریقے سے انتظام کیسے کریں۔ کیا آپ کو بیس ماڈل اور اڈاپٹر کو یکجا کرنا چاہئے یا انہیں الگ رکھنا چاہئے؟ اس پوسٹ میں، ہم LoRA فائن ٹیونڈ ماڈلز کے نظم و نسق کے لیے بہترین طریقوں سے گزرتے ہیں۔ ایمیزون سیج میکر اس ابھرتے ہوئے سوال کو حل کرنے کے لیے۔
سیج میکر ماڈل رجسٹری پر ایف ایم کے ساتھ کام کرنا
اس پوسٹ میں، ہم QLoRA طریقہ استعمال کرتے ہوئے Llama2 لارج لینگویج ماڈل (LLM) کو فائن ٹیون کرنے کی ایک اینڈ ٹو اینڈ مثال کے ذریعے چلتے ہیں۔ QLoRA پیرامیٹر کی موثر فائن ٹیوننگ کے فوائد کو 4-bit/8-bit کوانٹائزیشن کے ساتھ جوڑتا ہے تاکہ FM کو کسی خاص کام یا استعمال کے معاملے میں ٹھیک کرنے کے لیے درکار وسائل کو مزید کم کیا جا سکے۔ اس کے لیے، ہم پہلے سے تربیت یافتہ 7 بلین پیرامیٹر Llama2 ماڈل استعمال کریں گے اور اسے databricks-dolly-15k ڈیٹاسیٹ پر ٹھیک کریں گے۔ Llama2 جیسے LLMs میں اربوں پیرامیٹرز ہوتے ہیں اور بڑے پیمانے پر ٹیکسٹ ڈیٹا سیٹس پر پہلے سے تربیت یافتہ ہوتے ہیں۔ فائن ٹیوننگ ایک چھوٹے ڈیٹاسیٹ کا استعمال کرتے ہوئے LLM کو نیچے دھارے کے کام میں ڈھال لیتی ہے۔ تاہم، بڑے ماڈلز کو فائن ٹیوننگ کمپیوٹیشنل طور پر مہنگا ہے۔ یہی وجہ ہے کہ ہم اس حسابی لاگت کو کم کرنے کے لیے فائن ٹیوننگ کے دوران وزن کو کوانٹائز کرنے کے لیے QLoRA طریقہ استعمال کریں گے۔
ہماری مثالوں میں، آپ کو دو نوٹ بک ملیں گی (llm-finetune-combined-with-registry.ipynb
اور llm-finetune-separate-with-registry.ipynb
)۔ ہر ایک LoRA فائن ٹیونڈ ماڈلز کو ہینڈل کرنے کے لیے مختلف طریقے سے کام کرتا ہے جیسا کہ مندرجہ ذیل خاکہ میں دکھایا گیا ہے۔
- سب سے پہلے، ہم SageMaker Studio Notebooks کا استعمال کرتے ہوئے 2 بلین پیرامیٹرز کے ساتھ پہلے سے تربیت یافتہ Llama7 ماڈل ڈاؤن لوڈ کرتے ہیں۔ LLMs، جیسے Llama2، نے قدرتی لینگویج پروسیسنگ (NLP) کے کاموں پر جدید ترین کارکردگی دکھائی ہے جب ڈومین کے مخصوص ڈیٹا کو ٹھیک بنایا گیا ہے۔
- اس کے بعد، ہم QLoRA طریقہ استعمال کرتے ہوئے ڈیٹابرکس-ڈولی-2k ڈیٹاسیٹ پر Llama15 کو ٹھیک بناتے ہیں۔ QLoRA ماڈل وزن کی مقدار کو کم کر کے فائن ٹیوننگ کی کمپیوٹیشنل لاگت کو کم کرتا ہے۔
- فائن ٹیوننگ کے دوران، ہم SageMaker Experiments Plus کو Transformers API کے ساتھ مربوط کرتے ہیں تاکہ گریڈینٹ، نقصان وغیرہ جیسے میٹرکس کو خودکار طور پر لاگ کیا جا سکے۔
- اس کے بعد ہم دو طریقوں کا استعمال کرتے ہوئے سیج میکر ماڈل رجسٹری میں فائن ٹیونڈ لاما 2 ماڈل کا ورژن بناتے ہیں:
- مکمل ماڈل کو ذخیرہ کرنا
- اڈاپٹر اور بیس ماڈل کو الگ الگ ذخیرہ کرنا۔
- آخر میں، ہم سیج میکر ریئل ٹائم اینڈ پوائنٹ پر ڈیپ جاوا لائبریری (DJL) سرونگ کا استعمال کرتے ہوئے فائن ٹیونڈ Llama2 ماڈلز کی میزبانی کرتے ہیں۔
مندرجہ ذیل حصوں میں، ہم مختلف LLM ورک فلو کے لیے SageMaker کی لچک کو ظاہر کرنے کے لیے ان میں سے ہر ایک مرحلے میں گہرائی میں جائیں گے اور یہ کہ یہ خصوصیات آپ کے ماڈلز کے کام کو بہتر بنانے میں کس طرح مدد کر سکتی ہیں۔
شرائط
کوڈ کے ساتھ تجربہ شروع کرنے کے لیے درج ذیل شرائط کو مکمل کریں۔
- ایک تخلیق کریں سیج میکر اسٹوڈیو ڈومین: ایمیزون سیج میکر اسٹوڈیو، خاص طور پر اسٹوڈیو نوٹ بکس، کو Llama2 فائن ٹیوننگ کے کام کو شروع کرنے کے لیے استعمال کیا جاتا ہے اور پھر اندراج اور ماڈلز کو دیکھنے کے لیے سیج میکر ماڈل رجسٹری. سیج میکر کے تجربات Llama2 فائن ٹیوننگ جاب لاگ (ٹریننگ نقصان/ٹیسٹ نقصان/وغیرہ) کو دیکھنے اور موازنہ کرنے کے لیے بھی استعمال کیا جاتا ہے۔
- ایک Amazon Simple Storage Service (S3) بالٹی بنائیں: تربیتی نمونے اور ماڈل وزن کو ذخیرہ کرنے کے لیے S3 بالٹی تک رسائی درکار ہے۔ ہدایات کے لیے، رجوع کریں۔ ایک بالٹی بنانا. اس پوسٹ کے لیے استعمال کردہ نمونہ کوڈ SageMaker ڈیفالٹ S3 بالٹی استعمال کرے گا لیکن آپ اسے کسی بھی متعلقہ S3 بالٹی کو استعمال کرنے کے لیے اپنی مرضی کے مطابق بنا سکتے ہیں۔
- ماڈل کلیکشنز (IAM پرمیشنز) مرتب کریں: اپنے سیج میکر ایگزیکیوشن رول کو اپ ڈیٹ کریں جیسا کہ ذیل میں درج ہے ریسورس گروپس کی اجازت کے ساتھ ماڈل رجسٹری کلیکشن ڈیولپر گائیڈ ماڈل کلیکشنز کا استعمال کرتے ہوئے ماڈل رجسٹری گروپنگ کو لاگو کرنے کے لیے۔
- Llama2 کے لیے شرائط و ضوابط قبول کریں: آپ کو Llama2 فاؤنڈیشن ماڈل استعمال کرنے کے لیے اختتامی صارف کے لائسنس کے معاہدے اور قابل قبول استعمال کی پالیسی کو قبول کرنے کی ضرورت ہوگی۔
مثالیں میں دستیاب ہیں۔ GitHub ذخیرہ. PyTorch 2.0.0 Python 3.10 GPU آپٹمائزڈ کرنل اور ml.g4dn.xlarge مثال کی قسم پر چلنے والی سٹوڈیو نوٹ بک کا استعمال کرتے ہوئے نوٹ بک فائلوں کی جانچ کی جاتی ہے۔
تجربات کے علاوہ کال بیک انضمام
ایمیزون سیج میکر کے تجربات آپ کو SageMaker Python SDK یا boto3 کا استعمال کرتے ہوئے، کسی بھی مربوط ترقیاتی ماحول (IDE) سے مشین لرننگ (ML) تجربات اور ماڈل ورژنز کو منظم، ٹریک، موازنہ اور جائزہ لینے دیتا ہے۔ یہ آپ کے ماڈل میٹرکس، پیرامیٹرز، فائلز، آرٹفیکٹس، مختلف میٹرکس سے پلاٹ چارٹس کو لاگ کرنے، مختلف میٹا ڈیٹا کیپچر کرنے، ان کے ذریعے تلاش کرنے اور ماڈل کی تولیدی صلاحیت کو سپورٹ کرنے کی لچک فراہم کرتا ہے۔ ڈیٹا سائنسدان بصری چارٹس اور ٹیبلز کے ذریعے ماڈل کی تشخیص کے لیے کارکردگی اور ہائپر پیرامیٹر کا تیزی سے موازنہ کر سکتے ہیں۔ وہ بنائے گئے چارٹس کو ڈاؤن لوڈ کرنے اور ماڈل کی تشخیص کو اپنے اسٹیک ہولڈرز کے ساتھ شیئر کرنے کے لیے SageMaker Experiments کا استعمال بھی کر سکتے ہیں۔
ایل ایل ایم کی تربیت ایک سست، مہنگا اور تکراری عمل ہو سکتا ہے۔ ماڈل ٹیوننگ کے متضاد تجربے کو روکنے کے لیے صارف کے لیے ایل ایل ایم کے تجربات کو پیمانے پر ٹریک کرنا بہت ضروری ہے۔ HuggingFace Transformer APIs صارفین کو تربیتی کاموں کے دوران میٹرکس کو ٹریک کرنے کی اجازت دیتا ہے۔ کال بیکس. کال بیکس "صرف پڑھنے والے" کوڈ کے ٹکڑے ہوتے ہیں جو PyTorch ٹرینر میں ٹریننگ لوپ کے رویے کو اپنی مرضی کے مطابق بنا سکتے ہیں جو پروگریس رپورٹنگ کے لیے ٹریننگ لوپ کی حالت کا معائنہ کر سکتے ہیں، TensorBoard یا SageMaker Experiments Plus پر کسٹم لاجک کے ذریعے لاگ ان کر سکتے ہیں (جو ایک حصے کے طور پر شامل ہے۔ اس کوڈ بیس کا)۔
آپ اس پوسٹ کے کوڈ ریپوزٹری میں شامل SageMaker Experiments کال بیک کوڈ کو درآمد کر سکتے ہیں جیسا کہ درج ذیل کوڈ بلاک میں دکھایا گیا ہے۔
یہ کال بیک ٹریننگ رن کے ایک حصے کے طور پر درج ذیل معلومات کو SageMaker Experiments میں خود بخود لاگ کر دے گا۔
- تربیتی پیرامیٹرز اور ہائپر پیرامیٹرز
- مرحلہ، عہد اور فائنل میں ماڈل ٹریننگ اور توثیق کا نقصان
- ماڈل ان پٹ اور آؤٹ پٹ نمونے (ٹریننگ ڈیٹاسیٹ، توثیق ڈیٹاسیٹ، ماڈل آؤٹ پٹ لوکیشن، ٹریننگ ڈیبگر اور مزید)
مندرجہ ذیل گراف ان چارٹس کی مثالیں دکھاتا ہے جو آپ اس معلومات کو استعمال کرکے دکھا سکتے ہیں۔
یہ آپ کو SageMaker Experiments کی Analyze خصوصیت کا استعمال کرتے ہوئے آسانی سے متعدد رنز کا موازنہ کرنے کی اجازت دیتا ہے۔ آپ ان تجرباتی رنز کو منتخب کر سکتے ہیں جن کا آپ موازنہ کرنا چاہتے ہیں، اور وہ خود بخود موازنہ گراف کو آباد کر دیں گے۔
ماڈل رجسٹری کلیکشنز میں ٹھیک ٹیونڈ ماڈلز رجسٹر کریں۔
ماڈل رجسٹری کے مجموعے۔ کی ایک خصوصیت ہے سیج میکر ماڈل رجسٹری جو آپ کو ان رجسٹرڈ ماڈلز کو گروپ کرنے کی اجازت دیتا ہے جو ایک دوسرے سے متعلق ہیں اور انہیں درجہ بندی میں ترتیب دیتے ہیں تاکہ پیمانے پر ماڈل کی دریافت کو بہتر بنایا جا سکے۔ ہم ماڈل رجسٹری کلیکشنز کا استعمال بیس ماڈل اور فائن ٹیونڈ ویریئنٹس پر نظر رکھنے کے لیے کریں گے۔
مکمل ماڈل کاپی طریقہ
پہلا طریقہ بیس ماڈل اور LoRA اڈاپٹر کو یکجا کرتا ہے اور مکمل فائن ٹیونڈ ماڈل کو محفوظ کرتا ہے۔ مندرجہ ذیل کوڈ ماڈل کے انضمام کے عمل کی وضاحت کرتا ہے اور استعمال کرتے ہوئے مشترکہ ماڈل کو بچاتا ہے۔ model.save_pretrained()
.
فائن ٹیوننگ کے بعد LoRA اڈاپٹر اور بیس ماڈل کو سنگل ماڈل آرٹفیکٹ میں ملانے کے فوائد اور نقصانات ہیں۔ مشترکہ ماڈل خود ساختہ ہے اور اسے اصل بیس ماڈل کی ضرورت کے بغیر آزادانہ طور پر منظم اور تعینات کیا جا سکتا ہے۔ ماڈل کو اس کی اپنی ہستی کے طور پر ٹریک کیا جا سکتا ہے جس کے ورژن کے نام سے بیس ماڈل اور فائن ٹیوننگ ڈیٹا کی عکاسی ہوتی ہے۔ ہم استعمال کرتے ہوئے ایک نام اپنا سکتے ہیں۔ base_model_name
+ ٹھیک ٹیونڈ dataset_name
ماڈل گروپس کو منظم کرنا۔ اختیاری طور پر، ماڈل کے مجموعے اصل اور عمدہ ماڈلز کو جوڑ سکتے ہیں، لیکن یہ ضروری نہیں ہو سکتا کیونکہ مشترکہ ماڈل آزاد ہے۔ درج ذیل کوڈ کا ٹکڑا آپ کو دکھاتا ہے کہ فائن ٹیونڈ ماڈل کو کیسے رجسٹر کیا جائے۔
آپ ماڈل کو ماڈل رجسٹری میں رجسٹر کرنے کے لیے تربیتی تخمینہ لگانے والے کا استعمال کر سکتے ہیں۔
ماڈل رجسٹری سے، آپ ماڈل پیکیج کو بازیافت کر سکتے ہیں اور اس ماڈل کو براہ راست تعینات کر سکتے ہیں۔
تاہم، اس نقطہ نظر میں خرابیاں ہیں. ماڈلز کو یکجا کرنے سے اسٹوریج کی ناکامی اور فالتو پن کا باعث بنتا ہے کیونکہ بیس ماڈل کو ہر فائن ٹیونڈ ورژن میں ڈپلیکیٹ کیا جاتا ہے۔ جیسا کہ ماڈل کا سائز اور عمدہ ماڈلز کی تعداد میں اضافہ ہوتا ہے، یہ اسٹوریج کی ضروریات کو تیزی سے بڑھاتا ہے۔ مثال کے طور پر llama2 7b ماڈل کو لے کر، بیس ماڈل تقریباً 13 GB ہے اور فائن ٹیونڈ ماڈل 13.6 GB ہے۔ ہر باریک ٹیوننگ کے بعد 96 فیصد ماڈل کو ڈپلیکیٹ کرنے کی ضرورت ہے۔ مزید برآں، بہت بڑی ماڈل فائلوں کو تقسیم کرنا اور ان کا اشتراک کرنا بھی مشکل ہو جاتا ہے اور آپریشنل چیلنجز پیش کرتا ہے کیونکہ فائل ٹرانسفر اور مینجمنٹ لاگت بڑھتی ہوئی ماڈل سائز اور فائن ٹیون جابز کے ساتھ بڑھ جاتی ہے۔
الگ اڈاپٹر اور بنیاد طریقہ
دوسرا طریقہ بنیادی وزن اور اڈاپٹر کے وزن کو الگ الگ ماڈل کے اجزاء کے طور پر محفوظ کرکے اور رن ٹائم پر ترتیب وار لوڈ کرنے پر توجہ مرکوز کرتا ہے۔
بیس اور اڈاپٹر کے وزن کو بچانے کے فوائد اور نقصانات ہیں، مکمل ماڈل کاپی طریقہ کی طرح۔ ایک فائدہ یہ ہے کہ یہ اسٹوریج کی جگہ بچا سکتا ہے۔ بیس وزن، جو کہ ایک عمدہ ماڈل کا سب سے بڑا جزو ہے، صرف ایک بار محفوظ کیا جاتا ہے اور دوسرے اڈاپٹر وزنوں کے ساتھ دوبارہ استعمال کیا جا سکتا ہے جو مختلف کاموں کے لیے بنائے جاتے ہیں۔ مثال کے طور پر، Llama2-7B کا بنیادی وزن تقریباً 13 GB ہے، لیکن ہر فائن ٹیوننگ ٹاسک کے لیے صرف 0.6 GB اڈاپٹر کے وزن کو ذخیرہ کرنے کی ضرورت ہے، جو کہ 95% خلائی بچت ہے۔ ایک اور فائدہ یہ ہے کہ بیس وزن کو اڈاپٹر کے وزن سے الگ کرکے صرف ماڈل رجسٹری کا استعمال کرتے ہوئے منظم کیا جاسکتا ہے۔ یہ SageMaker ڈومینز کے لیے مفید ہو سکتا ہے جو انٹرنیٹ گیٹ وے کے بغیر صرف VPC موڈ میں چل رہے ہیں، کیونکہ بنیادی وزن تک انٹرنیٹ کے ذریعے جانے کے بغیر رسائی حاصل کی جا سکتی ہے۔
بیس وزن کے لیے ماڈل پیکیج گروپ بنائیں
QLoRA وزن کے لیے ماڈل پیکیج گروپ بنائیں
مندرجہ ذیل کوڈ دکھاتا ہے کہ QLoRA وزن کو ڈیٹاسیٹ/ٹاسک کی قسم کے ساتھ کیسے ٹیگ کیا جائے اور فائن ٹیونڈ ڈیلٹا ویٹ کو علیحدہ ماڈل رجسٹری میں رجسٹر کریں اور ڈیلٹا ویٹ کو الگ سے ٹریک کریں۔
مندرجہ ذیل ٹکڑا ماڈل رجسٹری کا ایک منظر دکھاتا ہے جہاں ماڈلز کو بیس اور عمدہ وزن میں تقسیم کیا گیا ہے۔
ہائپر پرسنلائزڈ LLMs کے لیے ماڈلز، ڈیٹا سیٹس، اور کاموں کا نظم کرنا تیزی سے زبردست ہو سکتا ہے۔ سیج میکر ماڈل رجسٹری کے مجموعے۔ آپ کو متعلقہ ماڈلز کو ایک ساتھ گروپ کرنے اور ماڈل کی دریافت کو بہتر بنانے کے لیے درجہ بندی میں ترتیب دینے میں مدد کر سکتا ہے۔ یہ بنیادی وزن، اڈاپٹر وزن، اور فائن ٹیوننگ ٹاسک ڈیٹاسیٹس کے درمیان تعلقات کو ٹریک کرنا آسان بناتا ہے۔ آپ ماڈلز کے درمیان پیچیدہ تعلقات اور روابط بھی بنا سکتے ہیں۔
ایک نیا مجموعہ بنائیں اور اس مجموعہ میں اپنے بنیادی ماڈل کے وزن شامل کریں۔
اپنے تمام فائن ٹیونڈ LoRA اڈاپٹر ڈیلٹا وزن کو ٹاسک اور/یا ڈیٹاسیٹ کے ذریعے اس مجموعہ سے لنک کریں
اس کے نتیجے میں مجموعہ کا درجہ بندی ہو گی جو ماڈل/ٹاسک کی قسم اور بیس ماڈل کو ٹھیک کرنے کے لیے استعمال ہونے والے ڈیٹاسیٹ سے منسلک ہے۔
بیس اور اڈاپٹر ماڈل کو الگ کرنے کے اس طریقے میں کچھ خرابیاں ہیں۔ ایک خرابی ماڈل کی تعیناتی میں پیچیدگی ہے۔ چونکہ ماڈل کے دو الگ الگ نمونے ہیں، آپ کو ماڈل رجسٹری سے براہ راست تعینات کرنے کے بجائے ماڈل کو دوبارہ پیک کرنے کے لیے اضافی اقدامات کی ضرورت ہے۔ درج ذیل کوڈ کی مثال میں، پہلے بیس ماڈل کے تازہ ترین ورژن کو ڈاؤن لوڈ اور دوبارہ پیک کریں۔
پھر تازہ ترین فائن ٹیونڈ LoRA اڈاپٹر کے وزن کو ڈاؤن لوڈ اور دوبارہ پیک کریں۔
چونکہ آپ ماڈل کی میزبانی کے لیے ڈیپ اسپیڈ کے ساتھ ڈی جے ایل سرونگ کا استعمال کریں گے، اس لیے آپ کی انفرنس ڈائرکٹری کو درج ذیل کی طرح نظر آنا چاہیے۔
آخر میں، کسٹم انفرنس کوڈ، بیس ماڈل، اور LoRA اڈاپٹر کو ایک ہی .tar.gz فائل میں تعیناتی کے لیے پیک کریں۔
صاف کرو
نوٹ بک کے کلین اپ سیکشن میں دی گئی ہدایات پر عمل کرکے اپنے وسائل کو صاف کریں۔ کا حوالہ دیتے ہیں ایمیزون سیج میکر قیمتوں کا تعین قیاس کی مثالوں کی قیمت کے بارے میں تفصیلات کے لیے۔
نتیجہ
اس پوسٹ نے آپ کو ایمیزون سیج میکر پر LoRA فائن ٹیونڈ ماڈلز کے انتظام کے بہترین طریقوں سے آگاہ کیا۔ ہم نے دو اہم طریقوں کا احاطہ کیا: بیس اور اڈاپٹر کے وزن کو ایک خود ساختہ ماڈل میں ملانا، اور بیس اور اڈاپٹر کے وزن کو الگ کرنا۔ دونوں طریقوں میں تجارت ہے، لیکن وزن کو الگ کرنے سے اسٹوریج کو بہتر بنانے میں مدد ملتی ہے اور SageMaker ماڈل رجسٹری کلیکشن جیسی جدید ماڈل مینجمنٹ تکنیکوں کو قابل بناتا ہے۔ یہ آپ کو تنظیم اور دریافت کو بہتر بنانے کے لیے ماڈلز کے درمیان درجہ بندی اور تعلقات استوار کرنے کی اجازت دیتا ہے۔ ہم آپ کو نمونہ کوڈ پر آزمانے کی ترغیب دیتے ہیں۔ GitHub ذخیرہ خود ان طریقوں کے ساتھ تجربہ کرنے کے لئے. جیسا کہ جنریٹو AI تیزی سے ترقی کرتا ہے، ماڈل مینجمنٹ کے بہترین طریقوں کی پیروی کرنے سے آپ کو تجربات کو ٹریک کرنے، اپنے کام کے لیے صحیح ماڈل تلاش کرنے، اور مخصوص LLMs کو بڑے پیمانے پر موثر طریقے سے منظم کرنے میں مدد ملے گی۔
حوالہ جات
مصنفین کے بارے میں
جیمز وو AWS میں ایک سینئر AI/ML ماہر حل آرکیٹیکٹ ہے۔ AI/ML سلوشنز کو ڈیزائن اور بنانے میں صارفین کی مدد کرنا۔ جیمز کا کام ایم ایل کے استعمال کے کیسز کی ایک وسیع رینج پر محیط ہے، جس میں کمپیوٹر ویژن، گہری سیکھنے، اور پورے انٹرپرائز میں ایم ایل کی پیمائش میں بنیادی دلچسپی ہے۔ AWS میں شامل ہونے سے پہلے، جیمز 10 سال سے زائد عرصے تک ایک معمار، ڈویلپر، اور ٹیکنالوجی لیڈر تھے، جس میں 6 سال انجینئرنگ اور 4 سال مارکیٹنگ اور اشتہاری صنعتوں میں شامل تھے۔
پرناو مورتی AWS میں ایک AI/ML ماہر حل آرکیٹیکٹ ہے۔ وہ صارفین کو مشین لرننگ (ML) کام کے بوجھ کو SageMaker پر بنانے، تربیت دینے، تعینات کرنے اور منتقل کرنے میں مدد کرنے پر توجہ مرکوز کرتا ہے۔ اس نے پہلے سیمی کنڈکٹر انڈسٹری میں کام کیا جو سیمی کنڈکٹر کے عمل کو بہتر بنانے کے لیے بڑے کمپیوٹر وژن (CV) اور قدرتی زبان کی پروسیسنگ (NLP) ماڈل تیار کرتا ہے۔ اپنے فارغ وقت میں وہ شطرنج کھیلنا اور سفر کرنا پسند کرتا ہے۔
میکٹ گنگور AWS میں ایک AI/ML سپیشلسٹ سولیوشن آرکیٹیکٹ ہے جو صارفین کو پیمانے پر AI/ML سلوشنز کو ڈیزائن اور بنانے میں مدد کرتا ہے۔ وہ ٹیلی کمیونیکیشن صارفین کے لیے AI/ML کے استعمال کے کیسز کی ایک وسیع رینج کا احاطہ کرتا ہے اور فی الحال جنریٹو AI، LLMs، اور ٹریننگ اور انفرنس آپٹیمائزیشن پر توجہ مرکوز کرتا ہے۔ وہ اکثر جنگل میں پیدل سفر کرتے ہوئے یا اپنے فارغ وقت میں اپنے دوستوں کے ساتھ بورڈ گیمز کھیلتے ہوئے پایا جا سکتا ہے۔
شیلبی ایگن بروڈ ایمیزون ویب سروسز (AWS) میں ایک پرنسپل AI اور مشین لرننگ اسپیشلسٹ سولیوشن آرکیٹیکٹ ہیں۔ وہ متعدد صنعتوں، ٹیکنالوجیز اور کرداروں پر محیط 24 سالوں سے ٹیکنالوجی میں ہے۔ وہ فی الحال اپنے DevOps اور ML پس منظر کو MLOps کے ڈومین میں یکجا کرنے پر توجہ مرکوز کر رہی ہے تاکہ صارفین کو ML ورک بوجھ کو پیمانے پر ڈیلیور کرنے اور ان کا نظم کرنے میں مدد مل سکے۔ مختلف ٹکنالوجی ڈومینز میں 35 سے زیادہ پیٹنٹس کی منظوری کے ساتھ، وہ مسلسل جدت طرازی اور کاروباری نتائج کو آگے بڑھانے کے لیے ڈیٹا کے استعمال کا جنون رکھتی ہے۔ Shelbee Coursera پر پریکٹیکل ڈیٹا سائنس کی تخصص کی شریک تخلیق کار اور انسٹرکٹر ہے۔ وہ بگ ڈیٹا (WiBD)، ڈینور چیپٹر میں خواتین کی کو-ڈائریکٹر بھی ہیں۔ اپنے فارغ وقت میں، وہ اپنے خاندان، دوستوں اور زیادہ فعال کتوں کے ساتھ وقت گزارنا پسند کرتی ہے۔
- SEO سے چلنے والا مواد اور PR کی تقسیم۔ آج ہی بڑھا دیں۔
- پلیٹو ڈیٹا ڈاٹ نیٹ ورک ورٹیکل جنریٹو اے آئی۔ اپنے آپ کو بااختیار بنائیں۔ یہاں تک رسائی حاصل کریں۔
- پلیٹوآئ اسٹریم۔ ویب 3 انٹیلی جنس۔ علم میں اضافہ۔ یہاں تک رسائی حاصل کریں۔
- پلیٹو ای ایس جی۔ کاربن، کلین ٹیک، توانائی ، ماحولیات، شمسی، ویسٹ مینجمنٹ یہاں تک رسائی حاصل کریں۔
- پلیٹو ہیلتھ۔ بائیوٹیک اینڈ کلینیکل ٹرائلز انٹیلی جنس۔ یہاں تک رسائی حاصل کریں۔
- ماخذ: https://aws.amazon.com/blogs/machine-learning/model-management-for-lora-fine-tuned-models-using-llama2-and-amazon-sagemaker/
- : ہے
- : ہے
- : نہیں
- :کہاں
- $UP
- 10
- 100
- 11
- 12
- 13
- 15٪
- 16
- 20
- 2023
- 23
- 24
- 25
- 28
- 31
- 35٪
- 7
- 8
- 95٪
- a
- کی صلاحیت
- ہمارے بارے میں
- قبول کریں
- قابل قبول
- تک رسائی حاصل
- رسائی
- کے پار
- موافقت
- موافقت کرتا ہے
- شامل کریں
- انہوں نے مزید کہا
- ایڈیشنل
- اس کے علاوہ
- پتہ
- اپنانے
- اعلی درجے کی
- فائدہ
- فوائد
- اشتہار.
- کے بعد
- معاہدہ
- AI
- AI ٹھیک ہے۔
- AI / ML
- تمام
- کی اجازت
- کی اجازت دیتا ہے
- پہلے ہی
- بھی
- ایمیزون
- ایمیزون سیج میکر
- ایمیزون سیج میکر اسٹوڈیو
- ایمیزون سادہ اسٹوریج سروس (S3)
- ایمیزون ویب سروسز
- ایمیزون ویب سروسز (AWS)
- مقدار
- an
- تجزیے
- اور
- ایک اور
- کوئی بھی
- اے پی آئی
- ایپلی کیشنز
- نقطہ نظر
- نقطہ نظر
- کی منظوری دے دی
- تقریبا
- کیا
- علاقوں
- AS
- ایسوسی ایٹ
- At
- خود کار طریقے سے
- میشن
- دستیاب
- AWS
- واپس
- پس منظر
- راہ میں حائل رکاوٹیں
- بیس
- BE
- کیونکہ
- بن
- ہو جاتا ہے
- رہا
- رویے
- فوائد
- BEST
- بہترین طریقوں
- کے درمیان
- بگ
- بگ ڈیٹا
- ارب
- اربوں
- بلاک
- بورڈ
- بورڈ کھیل
- دونوں
- حدود
- تعمیر
- کاروبار
- لیکن
- by
- کال بیکس
- کہا جاتا ہے
- کر سکتے ہیں
- صلاحیت
- قبضہ
- ہوشیار
- کیس
- مقدمات
- چیلنج
- چیلنجوں
- باب
- چارٹس
- شطرنج
- طبقے
- واضح
- کوڈ
- کوڈ بیس
- مجموعہ
- مجموعے
- جمع
- مل کر
- یکجا
- امتزاج
- کمپنیاں
- موازنہ
- موازنہ
- مقابلہ
- پیچیدہ
- پیچیدگی
- جزو
- اجزاء
- حساب
- کمپیوٹیشنل
- کمپیوٹر
- کمپیوٹر ویژن
- حالات
- پر غور
- مواد
- مواد کی تخلیق
- مسلسل
- مسلسل
- کور
- قیمت
- سکتا ہے
- احاطہ کرتا ہے
- کا احاطہ کرتا ہے
- تخلیق
- بنائی
- مخلوق
- تخلیقی
- اس وقت
- اپنی مرضی کے
- گاہک
- کسٹمر سپورٹ
- گاہکوں
- اصلاح
- اپنی مرضی کے مطابق
- جدید
- اعداد و شمار
- ڈیٹا سائنس
- ڈیٹاسیٹس
- گہری
- گہری سیکھنے
- گہرے
- پہلے سے طے شدہ
- کی
- نجات
- ڈیلٹا
- مظاہرہ
- ڈینور
- تعیناتی
- تعینات
- تعینات
- تعیناتی
- ڈیزائن
- تفصیلات
- ڈیولپر
- ترقی
- ترقی
- مختلف
- مشکل
- براہ راست
- دکھائیں
- تقسیم کرو
- تقسیم
- ڈوبکی
- ڈومین
- ڈومینز
- ڈاؤن لوڈ، اتارنا
- خرابیاں
- ڈرائیو
- کے دوران
- ہر ایک
- آسان
- آسانی سے
- ایج
- ہنر
- مؤثر طریقے سے
- اور
- کرنڈ
- کے قابل بناتا ہے
- کی حوصلہ افزائی
- آخر سے آخر تک
- اختتام پوائنٹ
- انجنیئرنگ
- انٹرپرائز
- ہستی
- ماحولیات
- عہد
- دور
- وغیرہ
- اندازہ
- تشخیص
- مثال کے طور پر
- مثال کے طور پر
- غیر معمولی
- پھانسی
- موجودہ
- مہنگی
- تجربہ
- تجربہ
- تجربات
- مہارت
- تیزی سے
- چہرہ
- ناکامی
- خاندان
- تیز تر
- نمایاں کریں
- خصوصیات
- فائل
- فائلوں
- مل
- آخر
- پہلا
- مقرر
- لچک
- توجہ مرکوز
- توجہ مرکوز
- کے بعد
- کے لئے
- ملا
- فاؤنڈیشن
- مفت
- دوست
- سے
- مکمل
- تقریب
- مزید
- مستقبل
- حاصل کرنا
- حاصل کی
- کھیل
- گیٹ وے
- پیدا کرنے والے
- پیداواری
- پیداواری AI۔
- Go
- جا
- اچھا
- GPU
- عطا کی
- گراف
- گرافکس
- گروپ
- گروپ کا
- ہاتھ
- ہینڈل
- ہے
- ہونے
- he
- مدد
- مدد
- مدد کرتا ہے
- اس کی
- درجہ بندی
- انتہائی
- ان
- میزبان
- سب سے زیادہ
- کس طرح
- کیسے
- تاہم
- HTML
- HTTPS
- گلے لگانے والا چہرہ
- وضاحت کرتا ہے
- تصویر
- پر عملدرآمد
- نفاذ
- درآمد
- اہم
- اہم بات
- درآمدات
- کو بہتر بنانے کے
- in
- شامل
- شامل ہیں
- سمیت
- اضافہ
- اضافہ
- اضافہ
- آزاد
- آزادانہ طور پر
- صنعتوں
- صنعت
- ناکامی
- افراط کرتا ہے
- معلومات
- جدت طرازی
- ان پٹ
- مثال کے طور پر
- کے بجائے
- ہدایات
- ضم
- ضم
- دلچسپی
- انٹرنیٹ
- میں
- متعارف کرواتا ہے
- IT
- میں
- جیمز
- اعلی درجے کا Java
- ایوب
- نوکریاں
- شمولیت
- فوٹو
- رکھیں
- رکھتے ہوئے
- کلیدی
- لات مار
- علم
- زبان
- بڑے
- سب سے بڑا
- تازہ ترین
- رہنما
- لیڈز
- سیکھنے
- آو ہم
- سطح
- لائبریری
- لائسنس
- جھوٹ ہے
- کی طرح
- پسند
- LINK
- منسلک
- فہرست
- ایل ایل ایم
- لوڈ
- لوڈ کر رہا ہے
- مقامی
- محل وقوع
- لاگ ان کریں
- لاگ ان
- منطق
- دیکھو
- کی طرح دیکھو
- تلاش
- بند
- مشین
- مشین لرننگ
- مین
- بناتا ہے
- بنانا
- انتظام
- میں کامیاب
- انتظام
- مینیجنگ
- بہت سے
- مارکیٹنگ
- مارکیٹنگ اور اشتہار بازی
- بڑے پیمانے پر
- مئی..
- یاد داشت
- ضم کریں
- ضم
- میٹا ڈیٹا
- طریقہ
- طریقوں
- پیمائش کا معیار
- منتقلی
- ML
- ایم ایل اوپس
- موڈ
- ماڈل
- ماڈل
- ماڈیولز
- زیادہ
- ایک سے زیادہ
- نام
- قدرتی
- قدرتی زبان عملیات
- ضروری
- ضرورت ہے
- ضرورت ہے
- ضروریات
- نئی
- ویزا
- نوٹ بک
- اب
- تعداد
- of
- بند
- تجویز
- اکثر
- on
- ایک بار
- ایک
- صرف
- آپریشنل
- آپریشنز
- اصلاح کے
- کی اصلاح کریں
- اصلاح
- اصلاح
- or
- تنظیم
- تنظیمیں
- اصل
- دیگر
- ہمارے
- نتائج
- پیداوار
- پر
- پر قابو پانے
- زبردست
- خود
- پیکج
- پیرامیٹر
- پیرامیٹرز
- حصہ
- جذبہ
- پیٹنٹ
- راستہ
- فیصد
- کارکردگی
- اجازتیں
- ٹکڑے ٹکڑے
- پلاٹا
- افلاطون ڈیٹا انٹیلی جنس
- پلیٹو ڈیٹا
- کھیل
- علاوہ
- پالیسی
- مقبول
- مقبولیت
- حصہ
- ممکن
- پوسٹ
- طاقت
- طاقتور
- عملی
- طریقوں
- ضروریات
- تحفہ
- محفوظ کر رہا ہے
- کی روک تھام
- پہلے
- پرائمری
- پرنسپل
- پہلے
- عمل
- عمل
- پروسیسنگ
- پیش رفت
- مناسب طریقے سے
- خصوصیات
- فراہم کرتا ہے
- پش
- ازگر
- pytorch
- سوال
- جلدی سے
- رینج
- میں تیزی سے
- اصل وقت
- وجہ
- وجوہات
- حال ہی میں
- کو کم
- کم
- کم
- کو کم کرنے
- کا حوالہ دیتے ہیں
- عکاسی کرنا۔
- رجسٹر
- رجسٹرڈ
- رجسٹری
- متعلقہ
- تعلقات
- متعلقہ
- قابل ذکر
- رپورٹ
- ذخیرہ
- کی ضرورت
- ضرورت
- ضروریات
- وسائل
- باقی
- نتیجہ
- دوبارہ استعمال
- ٹھیک ہے
- کردار
- کردار
- رن
- چل رہا ہے
- چلتا ہے
- رن ٹائم
- sagemaker
- محفوظ کریں
- محفوظ
- بچت
- بچت
- پیمانے
- سکیلنگ
- سائنس
- سائنسدانوں
- sdk
- تلاش کریں
- دوسری
- سیکشن
- سیکشنز
- کی تلاش
- سیمکولیٹر
- سینئر
- علیحدہ
- الگ کرنا
- سروس
- سروسز
- خدمت
- کئی
- سیکنڈ اور
- اشتراک
- وہ
- ہونا چاہئے
- دکھایا گیا
- شوز
- اسی طرح
- سادہ
- بعد
- ایک
- سائز
- سست
- چھوٹے
- چھوٹے
- ٹکڑا
- حل
- حل
- کچھ
- ماخذ
- خلا
- تناؤ
- ماہر
- خصوصی
- مخصوص
- خاص طور پر
- خرچ
- تقسیم
- اسٹیک ہولڈرز
- شروع کریں
- حالت
- ریاستی آرٹ
- درجہ
- مرحلہ
- مراحل
- ابھی تک
- ذخیرہ
- ذخیرہ
- ذخیرہ
- سٹوڈیو
- اس طرح
- حمایت
- TAG
- لینے
- ٹاسک
- کاموں
- تکنیک
- تکنیک
- ٹیکنالوجی
- ٹیکنالوجی
- ٹیلی مواصلات
- شرائط
- تجربہ
- متن
- کہ
- ۔
- ان
- ان
- تو
- وہاں.
- یہ
- وہ
- اس
- کے ذریعے
- وقت
- کرنے کے لئے
- مل کر
- کے آلے
- مشعل
- ٹریک
- روایتی
- ٹرین
- ٹریننگ
- منتقل
- ٹرانسفارمر
- ٹرانسفارمرز
- سفر
- سچ
- کوشش
- دھن
- دیکھتے ہوئے
- ٹیوننگ
- دو
- قسم
- اقسام
- کے تحت
- افہام و تفہیم
- اپ ڈیٹ کریں
- اپ ڈیٹ
- اپ لوڈ کردہ
- URL
- استعمال کی شرائط
- استعمال کیس
- استعمال کیا جاتا ہے
- رکن کا
- صارفین
- کا استعمال کرتے ہوئے
- توثیق
- قیمتی
- قیمت
- مختلف اقسام کے
- مختلف
- وسیع
- ورژن
- ورژن
- بہت
- کی طرف سے
- لنک
- نقطہ نظر
- بصری
- چلنا
- چلا گیا
- چاہتے ہیں
- تھا
- راستہ..
- طریقوں
- we
- ویب
- ویب خدمات
- جب
- جس
- جبکہ
- کیوں
- وسیع
- وسیع رینج
- گے
- ساتھ
- کے اندر
- بغیر
- خواتین
- کام
- کام کیا
- کام کے بہاؤ
- کام کرتا ہے
- سال
- تم
- اور
- اپنے آپ کو
- زیفیرنیٹ