تخلیقی AI کی آمد کے ساتھ، آج کے فاؤنڈیشن ماڈل (FMs)، جیسے بڑے زبان کے ماڈل (LLMs) Claude 2 اور Llama 2، متنی ڈیٹا پر سوالوں کے جوابات، خلاصہ، اور مواد کی تخلیق جیسے متعدد تخلیقی کام انجام دے سکتے ہیں۔ تاہم، حقیقی دنیا کا ڈیٹا متعدد طریقوں میں موجود ہے، جیسے کہ متن، تصاویر، ویڈیو اور آڈیو۔ مثال کے طور پر پاورپوائنٹ سلائیڈ ڈیک لیں۔ یہ متن کی شکل میں معلومات پر مشتمل ہو سکتا ہے، یا گراف، میزوں اور تصویروں میں سرایت کر سکتا ہے۔
اس پوسٹ میں، ہم ایک ایسا حل پیش کرتے ہیں جو ملٹی موڈل ایف ایم استعمال کرتا ہے۔ ایمیزون ٹائٹن ملٹی موڈل ایمبیڈنگز ماڈل اور LLaVA 1.5 اور AWS خدمات بشمول ایمیزون بیڈرک اور ایمیزون سیج میکر ملٹی موڈل ڈیٹا پر اسی طرح کے تخلیقی کام انجام دینے کے لیے۔
حل جائزہ
یہ حل سلائیڈ ڈیک کے متن اور بصری عناصر میں موجود معلومات کا استعمال کرتے ہوئے سوالات کے جوابات کے لیے ایک نفاذ فراہم کرتا ہے۔ ڈیزائن Retrieval Augmented Generation (RAG) کے تصور پر انحصار کرتا ہے۔ روایتی طور پر، RAG کو متنی ڈیٹا سے منسلک کیا گیا ہے جس پر LLM کے ذریعے کارروائی کی جا سکتی ہے۔ اس پوسٹ میں، ہم تصاویر کو بھی شامل کرنے کے لیے RAG کو بڑھاتے ہیں۔ یہ متن کے ساتھ ٹیبل اور گراف جیسے بصری عناصر سے سیاق و سباق کے لحاظ سے متعلقہ مواد کو نکالنے کے لیے ایک طاقتور تلاش کی صلاحیت فراہم کرتا ہے۔
RAG حل کو ڈیزائن کرنے کے مختلف طریقے ہیں جن میں تصاویر شامل ہیں۔ ہم نے یہاں ایک نقطہ نظر پیش کیا ہے اور اس تین حصوں کی سیریز کی دوسری پوسٹ میں ایک متبادل نقطہ نظر کے ساتھ عمل کریں گے۔
اس حل میں درج ذیل اجزاء شامل ہیں:
- ایمیزون ٹائٹن ملٹی موڈل ایمبیڈنگز ماڈل - اس ایف ایم کا استعمال اس پوسٹ میں استعمال ہونے والی سلائیڈ ڈیک میں موجود مواد کے لیے سرایت پیدا کرنے کے لیے کیا جاتا ہے۔ ایک ملٹی موڈل ماڈل کے طور پر، یہ ٹائٹن ماڈل ٹیکسٹ، امیجز، یا کسی امتزاج کو بطور ان پٹ پروسیس کر سکتا ہے اور ایمبیڈنگز بنا سکتا ہے۔ ٹائٹن ملٹی موڈل ایمبیڈنگز ماڈل 1,024 ڈائمینشنز کے ویکٹر (ایمبیڈنگز) تیار کرتا ہے اور اسے ایمیزون بیڈرک کے ذریعے حاصل کیا جاتا ہے۔
- بڑی زبان اور وژن اسسٹنٹ (LLaVA) - LLaVA بصری اور زبان کی تفہیم کے لیے ایک اوپن سورس ملٹی موڈل ماڈل ہے اور اس کا استعمال سلائیڈز میں موجود ڈیٹا کی تشریح کے لیے کیا جاتا ہے، بشمول بصری عناصر جیسے گراف اور ٹیبل۔ ہم 7-بلین پیرامیٹر ورژن استعمال کرتے ہیں۔ LLaVA 1.5-7b اس حل میں.
- ایمیزون سیج میکر - LLaVA ماڈل کو SageMaker ہوسٹنگ سروسز کا استعمال کرتے ہوئے SageMaker اینڈ پوائنٹ پر تعینات کیا گیا ہے، اور ہم LLaVA ماڈل کے خلاف نتائج کو چلانے کے لیے نتیجے کے اختتامی نقطہ کا استعمال کرتے ہیں۔ ہم سیج میکر نوٹ بکس کا بھی استعمال کرتے ہیں تاکہ اس حل کو آخر تک آرکیسٹریٹ کریں اور اس کا مظاہرہ کریں۔
- ایمیزون اوپن سرچ سرور لیس - اوپن سرچ سرور لیس ایک آن ڈیمانڈ سرور لیس کنفیگریشن ہے۔ ایمیزون اوپن سرچ سروس. ٹائٹن ملٹی موڈل ایمبیڈنگز ماڈل کے ذریعے تیار کردہ ایمبیڈنگز کو ذخیرہ کرنے کے لیے ہم OpenSearch Serverless کو ویکٹر ڈیٹا بیس کے طور پر استعمال کرتے ہیں۔ OpenSearch Serverless مجموعہ میں تخلیق کردہ ایک انڈیکس ہمارے RAG حل کے لیے ویکٹر اسٹور کے طور پر کام کرتا ہے۔
- Amazon OpenSearch Ingestion (OSI) - OSI ایک مکمل طور پر منظم، سرور لیس ڈیٹا جمع کرنے والا ہے جو OpenSearch سروس کے ڈومینز اور OpenSearch Serverless مجموعہ کو ڈیٹا فراہم کرتا ہے۔ اس پوسٹ میں، ہم OpenSearch Serverless ویکٹر اسٹور کو ڈیٹا فراہم کرنے کے لیے OSI پائپ لائن کا استعمال کرتے ہیں۔
حل فن تعمیر
حل ڈیزائن دو حصوں پر مشتمل ہے: ادخال اور صارف کی بات چیت۔ ادخال کے دوران، ہم ہر سلائیڈ کو ایک تصویر میں تبدیل کرکے ان پٹ سلائیڈ ڈیک پر کارروائی کرتے ہیں، ان امیجز کے لیے سرایت پیدا کرتے ہیں، اور پھر ویکٹر ڈیٹا اسٹور کو آباد کرتے ہیں۔ یہ مراحل صارف کے تعامل کے مراحل سے پہلے مکمل ہو جاتے ہیں۔
صارف کے تعامل کے مرحلے میں، صارف کے ایک سوال کو سرایت میں تبدیل کیا جاتا ہے اور ویکٹر ڈیٹا بیس پر ایک مماثلت کی تلاش چلائی جاتی ہے تاکہ ایک سلائیڈ تلاش کی جا سکے جس میں ممکنہ طور پر صارف کے سوال کے جوابات ہوں۔ اس کے بعد ہم یہ سلائیڈ (ایک تصویری فائل کی شکل میں) LLaVA ماڈل اور صارف کے سوال کو سوال کا جواب پیدا کرنے کے لیے فوری طور پر فراہم کرتے ہیں۔ اس پوسٹ کے تمام کوڈ میں دستیاب ہے۔ GitHub کے ریپو
درج ذیل خاکہ ادخال کے فن تعمیر کو واضح کرتا ہے۔
ورک فلو کے مراحل درج ذیل ہیں:
- سلائیڈز کو JPG فارمیٹ میں امیج فائلز (ایک فی سلائیڈ) میں تبدیل کیا جاتا ہے اور ایمبیڈنگز جنریٹ کرنے کے لیے ٹائٹن ملٹی موڈل ایمبیڈنگز ماڈل میں منتقل کیا جاتا ہے۔ اس پوسٹ میں، ہم سلائیڈ ڈیک کا عنوان استعمال کرتے ہیں۔ AWS Trainium اور AWS Inferentia کا استعمال کرتے ہوئے مستحکم بازی کو تربیت دیں اور تعینات کریں۔ ٹورنٹو میں AWS سمٹ سے، جون 2023، حل کا مظاہرہ کرنے کے لیے۔ سیمپل ڈیک میں 31 سلائیڈز ہیں، اس لیے ہم ویکٹر ایمبیڈنگز کے 31 سیٹ تیار کرتے ہیں، ہر ایک 1,024 ڈائمینشنز کے ساتھ۔ ہم ان تیار کردہ ویکٹر ایمبیڈنگز میں اضافی میٹا ڈیٹا فیلڈز شامل کرتے ہیں اور ایک JSON فائل بناتے ہیں۔ یہ اضافی میٹا ڈیٹا فیلڈز OpenSearch کی طاقتور تلاش کی صلاحیتوں کا استعمال کرتے ہوئے بھرپور تلاش کے سوالات کرنے کے لیے استعمال کیے جا سکتے ہیں۔
- تیار کردہ ایمبیڈنگز کو ایک ہی JSON فائل میں ایک ساتھ رکھا جاتا ہے جس پر اپ لوڈ کیا جاتا ہے۔ ایمیزون سادہ اسٹوریج سروس (ایمیزون S3)۔
- ذریعے ایمیزون S3 ایونٹ کی اطلاعات، ایک واقعہ ایک میں ڈالا جاتا ہے۔ ایمیزون سادہ قطار سروس (ایمیزون SQS) قطار۔
- SQS قطار میں یہ واقعہ OSI پائپ لائن کو چلانے کے لیے ایک محرک کے طور پر کام کرتا ہے، جس کے نتیجے میں ڈیٹا (JSON فائل) کو دستاویزات کے طور پر OpenSearch Serverless index میں شامل کیا جاتا ہے۔ نوٹ کریں کہ OpenSearch Serverless انڈیکس کو اس پائپ لائن کے لیے سنک کے طور پر ترتیب دیا گیا ہے اور اسے OpenSearch Serverless مجموعہ کے حصے کے طور پر بنایا گیا ہے۔
درج ذیل خاکہ صارف کے تعامل کے فن تعمیر کو واضح کرتا ہے۔
ورک فلو کے مراحل درج ذیل ہیں:
- ایک صارف سلائیڈ ڈیک سے متعلق ایک سوال پیش کرتا ہے جسے کھایا گیا ہے۔
- Amazon Bedrock کے ذریعے رسائی حاصل کرنے والے Titan Multimodal Embeddings ماڈل کا استعمال کرتے ہوئے صارف کے ان پٹ کو ایمبیڈنگز میں تبدیل کیا جاتا ہے۔ ایک OpenSearch ویکٹر کی تلاش ان ایمبیڈنگز کا استعمال کرتے ہوئے کی جاتی ہے۔ ہم صارف کے استفسار سے مماثل انتہائی متعلقہ ایمبیڈنگ کو بازیافت کرنے کے لیے k-قریب ترین پڑوسی (k=1) تلاش کرتے ہیں۔ k=1 سیٹ کرنا صارف کے سوال کے لیے سب سے زیادہ متعلقہ سلائیڈ کو بازیافت کرتا ہے۔
- OpenSearch Serverless کے جواب کا میٹا ڈیٹا سب سے زیادہ متعلقہ سلائیڈ کے مطابق تصویر کا راستہ رکھتا ہے۔
- صارف کے سوال اور تصویری راستے کو ملا کر ایک پرامپٹ بنایا جاتا ہے اور SageMaker پر میزبان LLaVA کو فراہم کیا جاتا ہے۔ LLaVA ماڈل صارف کے سوال کو سمجھنے اور تصویر میں موجود ڈیٹا کی جانچ کرکے اس کا جواب دینے کے قابل ہے۔
- اس تخمینہ کا نتیجہ صارف کو واپس کر دیا جاتا ہے۔
مندرجہ ذیل حصوں میں ان اقدامات پر تفصیل سے بحث کی گئی ہے۔ دیکھیں نتائج کی نمائش آؤٹ پٹ پر اسکرین شاٹس اور تفصیلات کے لیے سیکشن۔
شرائط
اس پوسٹ میں فراہم کردہ حل کو نافذ کرنے کے لیے، آپ کے پاس ہونا چاہیے۔ AWS اکاؤنٹ اور FMs، Amazon Bedrock، SageMaker، اور OpenSearch سروس سے واقفیت۔
یہ حل Titan Multimodal Embeddings ماڈل کا استعمال کرتا ہے۔ یقینی بنائیں کہ یہ ماڈل Amazon Bedrock میں استعمال کے لیے فعال ہے۔ ایمیزون بیڈرک کنسول پر، منتخب کریں۔ ماڈل تک رسائی نیویگیشن پین میں۔ اگر ٹائٹن ملٹی موڈل ایمبیڈنگز کو فعال کیا گیا ہے، تو رسائی کی حیثیت بیان کی جائے گی۔ رسائی دی.
اگر ماڈل دستیاب نہیں ہے تو، منتخب کرکے ماڈل تک رسائی کو فعال کریں۔ ماڈل تک رسائی کا نظم کریں۔منتخب کریں ٹائٹن ملٹی موڈل ایمبیڈنگز G1، اور انتخاب کرنا ماڈل تک رسائی کی درخواست کریں۔. ماڈل کو فوری طور پر استعمال کے لیے فعال کر دیا گیا ہے۔
حل اسٹیک بنانے کے لیے AWS CloudFormation ٹیمپلیٹ کا استعمال کریں۔
درج ذیل میں سے ایک استعمال کریں۔ AWS کلاؤڈ فارمیشن حل کے وسائل کو شروع کرنے کے لیے ٹیمپلیٹس (آپ کے علاقے پر منحصر ہے)۔
AWS علاقہ | لنک |
---|---|
us-east-1 |
|
us-west-2 |
اسٹیک کے کامیابی سے بننے کے بعد، اسٹیک پر جائیں۔ نتائج AWS CloudFormation کنسول پر ٹیب کریں اور قیمت نوٹ کریں۔ MultimodalCollectionEndpoint
، جسے ہم بعد کے مراحل میں استعمال کرتے ہیں۔
CloudFormation ٹیمپلیٹ درج ذیل وسائل تخلیق کرتا ہے:
- IAM کے کردار - مندرجہ ذیل AWS شناخت اور رسائی کا انتظام (IAM) رولز بنائے جاتے ہیں۔ لاگو کرنے کے لیے ان کرداروں کو اپ ڈیٹ کریں۔ کم از کم استحقاق کی اجازت.
SMExecutionRole
Amazon S3، SageMaker، OpenSearch سروس، اور Bedrock مکمل رسائی کے ساتھ۔OSPipelineExecutionRole
مخصوص Amazon SQS اور OSI کارروائیوں تک رسائی کے ساتھ۔
- سیج میکر نوٹ بک - اس پوسٹ کے تمام کوڈ اس نوٹ بک کے ذریعے چلائے جاتے ہیں۔
- اوپن سرچ سرور لیس مجموعہ - یہ ایمبیڈنگز کو ذخیرہ کرنے اور بازیافت کرنے کا ویکٹر ڈیٹا بیس ہے۔
- OSI پائپ لائن - یہ OpenSearch Serverless میں ڈیٹا داخل کرنے کی پائپ لائن ہے۔
- S3 بالٹی - اس پوسٹ کا تمام ڈیٹا اس بالٹی میں محفوظ ہے۔
- SQS قطار - OSI پائپ لائن کو متحرک کرنے کے واقعات اس قطار میں رکھے گئے ہیں۔
CloudFormation ٹیمپلیٹ OSI پائپ لائن کو Amazon S3 اور Amazon SQS پروسیسنگ کے ساتھ بطور ذریعہ اور OpenSearch Serverless انڈیکس کو بطور سنک ترتیب دیتا ہے۔ مخصوص S3 بالٹی اور سابقہ میں تخلیق کردہ کوئی بھی اشیاء (multimodal/osi-embeddings-json
) SQS اطلاعات کو متحرک کرے گا، جو OSI پائپ لائن کے ذریعے ڈیٹا کو OpenSearch Serverless میں داخل کرنے کے لیے استعمال کیا جاتا ہے۔
CloudFormation ٹیمپلیٹ بھی تخلیق کرتا ہے۔ نیٹ ورک, خفیہ کاری، اور ڈیٹا تک رسائی OpenSearch Serverless مجموعہ کے لیے درکار پالیسیاں۔ کم از کم استحقاق کی اجازتوں کو لاگو کرنے کے لیے ان پالیسیوں کو اپ ڈیٹ کریں۔
نوٹ کریں کہ CloudFormation ٹیمپلیٹ کا نام SageMaker نوٹ بک میں حوالہ دیا گیا ہے۔ اگر ڈیفالٹ ٹیمپلیٹ کا نام تبدیل کر دیا گیا ہے، تو یقینی بنائیں کہ آپ اسی کو اپ ڈیٹ کرتے ہیں۔ globals.py
حل کی جانچ کریں۔
لازمی اقدامات مکمل ہونے کے بعد اور CloudFormation اسٹیک کامیابی کے ساتھ تیار ہو گیا ہے، اب آپ حل کو جانچنے کے لیے تیار ہیں:
- سیج میکر کنسول پر، منتخب کریں۔ نوٹ بک نیوی گیشن پین میں.
- منتخب کریں
MultimodalNotebookInstance
نوٹ بک مثال کے طور پر اور منتخب کریں JupyterLab کھولیں۔. - In فائل براؤزرنوٹ بکس اور معاون فائلوں کو دیکھنے کے لیے نوٹ بک فولڈر میں جائیں۔
نوٹ بک کو اس ترتیب میں شمار کیا جاتا ہے جس میں وہ چلائی جاتی ہیں۔ ہر نوٹ بک میں ہدایات اور تبصرے اس نوٹ بک کے ذریعہ کئے گئے اعمال کی وضاحت کرتے ہیں۔ ہم ان نوٹ بکس کو ایک ایک کرکے چلاتے ہیں۔
- میں سے انتخاب کریں 0_deploy_llava.ipynb اسے JupyterLab میں کھولنے کے لیے۔
- پر رن مینو، منتخب کریں تمام سیل چلائیں۔ اس نوٹ بک میں کوڈ چلانے کے لیے۔
یہ نوٹ بک LLaVA-v1.5-7B ماڈل کو SageMaker اینڈ پوائنٹ پر تعینات کرتی ہے۔ اس نوٹ بک میں، ہم HuggingFace Hub سے LLaVA-v1.5-7B ماڈل ڈاؤن لوڈ کرتے ہیں، inference.py اسکرپٹ کی جگہ llava_inference.py، اور اس ماڈل کے لیے ایک model.tar.gz فائل بنائیں۔ model.tar.gz فائل کو Amazon S3 پر اپ لوڈ کیا جاتا ہے اور SageMaker اینڈ پوائنٹ پر ماڈل کی تعیناتی کے لیے استعمال کیا جاتا ہے۔ دی llava_inference.py اسکرپٹ میں اضافی کوڈ ہے جو ایمیزون S3 سے تصویری فائل کو پڑھنے اور اس پر اندازہ چلانے کی اجازت دیتا ہے۔
- میں سے انتخاب کریں 1_data_prep.ipynb اسے JupyterLab میں کھولنے کے لیے۔
- پر رن مینو، منتخب کریں تمام سیل چلائیں۔ اس نوٹ بک میں کوڈ چلانے کے لیے۔
یہ نوٹ بک ڈاؤن لوڈ کرتی ہے۔ سلائیڈ ڈیک، ہر سلائیڈ کو JPG فائل فارمیٹ میں تبدیل کرتا ہے، اور اس پوسٹ کے لیے استعمال ہونے والی S3 بالٹی پر اپ لوڈ کرتا ہے۔
- میں سے انتخاب کریں 2_data_ingestion.ipynb اسے JupyterLab میں کھولنے کے لیے۔
- پر رن مینو، منتخب کریں تمام سیل چلائیں۔ اس نوٹ بک میں کوڈ چلانے کے لیے۔
ہم اس نوٹ بک میں درج ذیل کام کرتے ہیں:
- ہم OpenSearch Serverless مجموعہ میں ایک انڈیکس بناتے ہیں۔ یہ انڈیکس سلائیڈ ڈیک کے لیے ایمبیڈنگ ڈیٹا کو اسٹور کرتا ہے۔ درج ذیل کوڈ دیکھیں:
- ہم پچھلی نوٹ بک میں بنائی گئی JPG امیجز کو ویکٹر ایمبیڈنگز میں تبدیل کرنے کے لیے Titan Multimodal Embeddings ماڈل استعمال کرتے ہیں۔ یہ ایمبیڈنگز اور اضافی میٹا ڈیٹا (جیسے امیج فائل کا S3 پاتھ) JSON فائل میں اسٹور کیا جاتا ہے اور Amazon S3 پر اپ لوڈ کیا جاتا ہے۔ نوٹ کریں کہ ایک واحد JSON فائل بنائی گئی ہے، جس میں ایمبیڈنگز میں تبدیل ہونے والی تمام سلائیڈز (تصاویر) کے لیے دستاویزات شامل ہیں۔ درج ذیل کوڈ کا ٹکڑا دکھاتا ہے کہ کس طرح ایک تصویر (بیس 64 انکوڈ شدہ سٹرنگ کی شکل میں) ایمبیڈنگز میں تبدیل ہوتی ہے۔
- یہ کارروائی OpenSearch Ingestion پائپ لائن کو متحرک کرتی ہے، جو فائل پر کارروائی کرتی ہے اور اسے OpenSearch Serverless index میں داخل کرتی ہے۔ ذیل میں بنائی گئی JSON فائل کا نمونہ ہے۔ (مثال کے کوڈ میں چار جہتوں والا ایک ویکٹر دکھایا گیا ہے۔ ٹائٹن ملٹی موڈل ایمبیڈنگز ماڈل 1,024 ڈائمینشنز تیار کرتا ہے۔)
- میں سے انتخاب کریں 3_rag_inference.ipynb اسے JupyterLab میں کھولنے کے لیے۔
- پر رن مینو، منتخب کریں تمام سیل چلائیں۔ اس نوٹ بک میں کوڈ چلانے کے لیے۔
یہ نوٹ بک RAG کے حل کو نافذ کرتی ہے: ہم صارف کے سوال کو ایمبیڈنگز میں تبدیل کرتے ہیں، ویکٹر ڈیٹا بیس سے ملتی جلتی تصویر (سلائیڈ) تلاش کرتے ہیں، اور صارف کے سوال کا جواب پیدا کرنے کے لیے بازیافت شدہ تصویر LLaVA کو فراہم کرتے ہیں۔ ہم درج ذیل پرامپٹ ٹیمپلیٹ استعمال کرتے ہیں:
درج ذیل کوڈ کا ٹکڑا RAG ورک فلو فراہم کرتا ہے:
نتائج کی نمائش
مندرجہ ذیل کچھ صارف کے سوالات اور ہمارے نفاذ سے پیدا ہونے والے جوابات کا ایک مجموعہ ہے۔ دی س کالم صارف کے سوال کو پکڑتا ہے، اور کا جواب کالم LLaVA کے ذریعہ تیار کردہ متنی جواب ہے۔ تصویر K-قریب ترین (k=1) سلائیڈ میچ ہے جو OpenSearch Serverless vector search کے ذریعے واپس کیا گیا ہے۔ اس سلائیڈ کی تشریح LLaVA نے جواب فراہم کرنے کے لیے کی ہے۔
ملٹی موڈل آر اے جی کے نتائج
س | کا جواب | تصویر |
---|---|---|
Inf2 کارکردگی میں موازنہ EC2 مثالوں سے کیسے موازنہ کرتا ہے؟ مجھے نمبر چاہیے | سلائیڈ ڈیک کے مطابق، AWS Inferentia2 کی Inf2 مثالیں موازنہ EC4 مثالوں کے مقابلے میں 10x زیادہ تھرو پٹ اور 2x کم لیٹنسی پیش کرتی ہیں۔ | |
AI/ML فلائی وہیل کے مطابق، AWS AI/ML خدمات کیا فراہم کرتی ہیں؟ | AWS AI/ML سروسز بہتر $/perfer صلاحیتیں، نئی صلاحیتیں، اور جدت طرازی میں سرمایہ کاری فراہم کرتی ہیں۔ | |
GPT-2 کے مقابلے، GPT-3 میں کتنے اور پیرامیٹرز ہیں؟ GPT-2 اور GPT-3 کے پیرامیٹر سائز کے درمیان عددی فرق کیا ہے؟ | سلائیڈ کے مطابق، GPT-3 میں 175 بلین پیرامیٹرز ہیں، جبکہ GPT-2 میں 1.5 بلین پیرامیٹرز ہیں۔ GPT-2 اور GPT-3 کے پیرامیٹر سائز کے درمیان عددی فرق 173.5 بلین ہے۔ | |
پارٹیکل فزکس میں کوارک کیا ہیں؟ | مجھے اس سوال کا جواب سلائیڈ ڈیک میں نہیں ملا۔ |
اس حل کو اپنے سلائیڈ ڈیک تک بڑھانے کے لیے آزاد محسوس کریں۔ اپنے سلائیڈ ڈیک پر URL کے ساتھ globals.py میں بس SLIDE_DECK متغیر کو اپ ڈیٹ کریں اور پچھلے سیکشن میں تفصیل سے ادخال کے مراحل کو چلائیں۔
ٹپ
آپ OpenSearch API کے ساتھ تعامل کرنے کے لیے OpenSearch Dashboards کا استعمال کر سکتے ہیں تاکہ آپ اپنے انڈیکس اور داخل کردہ ڈیٹا پر فوری ٹیسٹ چلائیں۔ مندرجہ ذیل اسکرین شاٹ ایک OpenSearch ڈیش بورڈ GET مثال دکھاتا ہے۔
صاف کرو
مستقبل کے چارجز سے بچنے کے لیے، اپنے بنائے ہوئے وسائل کو حذف کریں۔ آپ CloudFormation کنسول کے ذریعے اسٹیک کو حذف کر کے ایسا کر سکتے ہیں۔
مزید برآں، LLaVA انفرنسنگ کے لیے بنائے گئے SageMaker انفرنس اینڈ پوائنٹ کو حذف کریں۔ آپ صفائی کے مرحلے پر تبصرہ کر کے ایسا کر سکتے ہیں۔ 3_rag_inference.ipynb اور سیل چلا رہے ہیں، یا SageMaker کنسول کے ذریعے اختتامی نقطہ کو حذف کر کے: کا انتخاب کریں۔ ارادہ اور اختتامی نکات نیویگیشن پین میں، پھر اختتامی نقطہ کو منتخب کریں اور اسے حذف کریں۔
نتیجہ
انٹرپرائزز ہر وقت نیا مواد تیار کرتے ہیں، اور سلائیڈ ڈیک ایک عام طریقہ کار ہے جو معلومات کو اندرونی طور پر تنظیم کے ساتھ اور بیرونی طور پر صارفین کے ساتھ یا کانفرنسوں میں بانٹنے اور پھیلانے کے لیے استعمال ہوتا ہے۔ وقت گزرنے کے ساتھ، بھرپور معلومات ان سلائیڈ ڈیکوں میں گراف اور ٹیبل جیسے غیر متنی طریقوں میں دفن اور پوشیدہ رہ سکتی ہیں۔ آپ اس حل اور ملٹی موڈل FMs کی طاقت جیسے Titan Multimodal Embeddings ماڈل اور LLaVA کو نئی معلومات دریافت کرنے یا سلائیڈ ڈیکس میں مواد پر نئے تناظر کو سامنے لانے کے لیے استعمال کر سکتے ہیں۔
ہم آپ کو دریافت کرکے مزید جاننے کی ترغیب دیتے ہیں۔ ایمیزون سیج میکر جمپ اسٹارٹ, ایمیزون ٹائٹن ماڈلز، Amazon Bedrock، اور OpenSearch سروس، اور اس پوسٹ میں فراہم کردہ نمونے کے نفاذ کا استعمال کرتے ہوئے ایک حل تیار کرنا۔
اس سلسلے کے حصے کے طور پر دو اضافی پوسٹس تلاش کریں۔ حصہ 2 ایک اور طریقہ کا احاطہ کرتا ہے جسے آپ اپنے سلائیڈ ڈیک سے بات کرنے کے لیے اختیار کر سکتے ہیں۔ یہ نقطہ نظر ایل ایل اے وی اے کے انفرنسز کو تیار اور اسٹور کرتا ہے اور صارف کے سوالات کا جواب دینے کے لیے ان ذخیرہ شدہ قیاسات کا استعمال کرتا ہے۔ حصہ 3 دونوں طریقوں کا موازنہ کرتا ہے۔
مصنفین کے بارے میں
امیت اروڑا ایمیزون ویب سروسز میں ایک AI اور ML ماہر آرکیٹیکٹ ہے، جو انٹرپرائز صارفین کو کلاؤڈ بیسڈ مشین لرننگ سروسز استعمال کرنے میں مدد کرتا ہے تاکہ وہ اپنی اختراعات کو تیزی سے پیمانہ کرسکیں۔ وہ واشنگٹن ڈی سی میں جارج ٹاؤن یونیورسٹی میں ایم ایس ڈیٹا سائنس اور تجزیاتی پروگرام میں منسلک لیکچرر بھی ہیں۔
منجو پرساد ایمیزون ویب سروسز میں اسٹریٹجک اکاؤنٹس کے اندر ایک سینئر حل آرکیٹیکٹ ہے۔ وہ متعدد ڈومینز میں تکنیکی رہنمائی فراہم کرنے پر توجہ مرکوز کرتی ہے، بشمول ایک مارکی M&E کسٹمر کو AI/ML۔ AWS میں شامل ہونے سے پہلے، اس نے مالیاتی خدمات کے شعبے میں کمپنیوں اور ایک اسٹارٹ اپ کے لیے بھی حل تیار کیے اور بنائے۔
ارچنا اناپڈی AWS میں ایک سینئر سولیوشن آرکیٹیکٹ ہے جو اسٹریٹجک صارفین کی حمایت کرتا ہے۔ اس کے پاس ایک دہائی سے زیادہ کا تجربہ ہے جس میں صارفین کو ڈیٹا اینالیٹکس اور ڈیٹا بیس سلوشنز ڈیزائن اور بنانے میں مدد ملتی ہے۔ وہ صارفین کو قدر فراہم کرنے اور کاروباری نتائج حاصل کرنے کے لیے ٹیکنالوجی کے استعمال کے بارے میں پرجوش ہے۔
اندرا رئیسہ ایمیزون ویب سروسز میں ایک AI اور ML سلوشنز آرکیٹیکٹ ہے جو ڈلاس، ٹیکساس سے باہر کے اسٹریٹجک صارفین کی مدد کرتا ہے۔ اس کے پاس AWS میں بڑے انٹرپرائز پارٹنرز کے ساتھ کام کرنے کا پچھلا تجربہ بھی ہے، جہاں اس نے ڈیجیٹل مقامی صارفین کے لیے ایک پارٹنر کامیابی کے حل آرکیٹیکٹ کے طور پر کام کیا۔
- SEO سے چلنے والا مواد اور PR کی تقسیم۔ آج ہی بڑھا دیں۔
- پلیٹو ڈیٹا ڈاٹ نیٹ ورک ورٹیکل جنریٹو اے آئی۔ اپنے آپ کو بااختیار بنائیں۔ یہاں تک رسائی حاصل کریں۔
- پلیٹوآئ اسٹریم۔ ویب 3 انٹیلی جنس۔ علم میں اضافہ۔ یہاں تک رسائی حاصل کریں۔
- پلیٹو ای ایس جی۔ کاربن، کلین ٹیک، توانائی ، ماحولیات، شمسی، ویسٹ مینجمنٹ یہاں تک رسائی حاصل کریں۔
- پلیٹو ہیلتھ۔ بائیوٹیک اینڈ کلینیکل ٹرائلز انٹیلی جنس۔ یہاں تک رسائی حاصل کریں۔
- ماخذ: https://aws.amazon.com/blogs/machine-learning/talk-to-your-slide-deck-using-multimodal-foundation-models-hosted-on-amazon-bedrock-and-amazon-sagemaker-part-1/
- : ہے
- : ہے
- : نہیں
- :کہاں
- $UP
- 1
- 10
- 100
- 13
- 15٪
- 16
- 173
- 20
- 2023
- 26٪
- 29
- 31
- 7
- 8
- 9
- a
- قابلیت
- ہمارے بارے میں
- تک رسائی حاصل
- رسائی
- اکاؤنٹس
- حاصل
- عمل
- اعمال
- کام کرتا ہے
- شامل کریں
- ایڈیشنل
- ملحق
- آمد
- کے خلاف
- AI
- AI / ML
- تمام
- کی اجازت
- ساتھ
- بھی
- ایمیزون
- ایمیزون سیج میکر
- ایمیزون ویب سروسز
- an
- تجزیاتی
- اور
- ایک اور
- جواب
- جواب
- جواب
- کوئی بھی
- اے پی آئی
- کا اطلاق کریں
- نقطہ نظر
- نقطہ نظر
- فن تعمیر
- کیا
- AS
- پوچھنا
- اسسٹنٹ
- منسلک
- At
- آڈیو
- اضافہ
- مصنف
- دستیاب
- سے اجتناب
- AWS
- AWS کلاؤڈ فارمیشن
- کی بنیاد پر
- BE
- رہا
- بہتر
- کے درمیان
- ارب
- جسم
- تعمیر
- عمارت
- تعمیر
- کاروبار
- by
- کر سکتے ہیں
- صلاحیتوں
- صلاحیت
- قبضہ
- سیل
- تبدیل کر دیا گیا
- بوجھ
- میں سے انتخاب کریں
- منتخب کریں
- کلائنٹ
- کوڈ
- مجموعہ
- مجموعے
- کلیکٹر
- کالم
- مجموعہ
- امتزاج
- تبصروں
- کامن
- کمپنیاں
- موازنہ
- موازنہ
- مقابلے میں
- مکمل
- مکمل
- اجزاء
- تصور
- کانفرنسوں
- ترتیب
- تشکیل شدہ
- مشتمل
- کنسول
- پر مشتمل ہے
- پر مشتمل ہے
- پر مشتمل ہے
- مواد
- مواد کی تخلیق
- تبدیل
- تبدیل
- تبدیل کرنا
- اسی کے مطابق
- سکتا ہے
- کا احاطہ کرتا ہے
- تخلیق
- بنائی
- پیدا
- تخلیق
- مخلوق
- اسناد
- گاہک
- گاہکوں
- ڈلاس
- ڈیش بورڈ
- ڈیش بورڈز
- اعداد و شمار
- ڈیٹا تجزیات
- ڈیٹا سائنس
- ڈیٹا بیس
- دہائی
- ڈیک
- پہلے سے طے شدہ
- نجات
- فراہم کرتا ہے
- مظاہرہ
- منحصر ہے
- تعیناتی
- تعینات
- تعینات
- تعینات کرتا ہے
- بیان
- ڈیزائن
- ڈیزائن
- تفصیل
- تفصیلی
- تفصیلات
- DICT
- DID
- فرق
- مختلف
- براڈ کاسٹننگ
- ڈیجیٹل
- طول و عرض
- طول و عرض
- دریافت
- بات چیت
- دکھائیں
- do
- دستاویزات
- کرتا
- ڈومینز
- ڈاؤن لوڈ، اتارنا
- ڈاؤن لوڈز
- کے دوران
- e
- ہر ایک
- عناصر
- ایمبیڈڈ
- سرایت کرنا
- کو چالو کرنے کے
- چالو حالت میں
- انکوڈنگ
- کی حوصلہ افزائی
- آخر
- اختتام پوائنٹ
- انجن
- کو یقینی بنانے کے
- انٹرپرائز
- خرابی
- واقعہ
- واقعات
- جانچ کر رہا ہے
- مثال کے طور پر
- اس کے علاوہ
- رعایت
- موجود ہے
- تجربہ
- ایکسپلور
- توسیع
- بیرونی طور پر
- نکالنے
- واقفیت
- قطعات
- فائل
- فائلوں
- مالی
- مالیاتی خدمات
- مل
- توجہ مرکوز
- پر عمل کریں
- کے بعد
- مندرجہ ذیل ہے
- کے لئے
- فارم
- فارمیٹ
- فاؤنڈیشن
- چار
- مفت
- سے
- مکمل
- مکمل طور پر
- مستقبل
- پیدا
- پیدا
- پیدا ہوتا ہے
- نسل
- پیداواری
- پیداواری AI۔
- جغرافیہ
- حاصل
- GitHub کے
- جا
- گرافکس
- رہنمائی
- ہے
- he
- مدد گار
- مدد
- یہاں
- پوشیدہ
- اعلی
- مشاہدات
- میزبان
- میزبانی کی
- ہوسٹنگ
- ہوسٹنگ خدمات
- میزبان
- کس طرح
- تاہم
- HTML
- HTTP
- HTTPS
- حب
- گلے لگانے والا چہرہ
- i
- شناختی
- if
- وضاحت کرتا ہے
- تصویر
- تصاویر
- فوری طور پر
- پر عملدرآمد
- نفاذ
- عمل
- in
- شامل
- شامل ہیں
- سمیت
- انڈکس
- Indices
- معلومات
- جدت طرازی
- بدعت
- ان پٹ
- مثال کے طور پر
- ہدایات
- بات چیت
- بات چیت
- اندرونی طور پر
- میں
- سرمایہ کاری
- IT
- شمولیت
- فوٹو
- JSON
- جون
- زبان
- بڑے
- تاخیر
- شروع
- جانیں
- سیکھنے
- کی طرح
- LINK
- لاما
- مقامی
- کم
- مشین
- مشین لرننگ
- بنا
- انتظام
- میں کامیاب
- بہت سے
- میچ
- کے ملاپ
- میکانزم
- مینو
- میٹا ڈیٹا
- طریقہ
- ML
- ماڈل
- ماڈل
- زیادہ
- سب سے زیادہ
- MS
- ایک سے زیادہ
- نام
- مقامی
- تشریف لے جائیں
- سمت شناسی
- ضرورت ہے
- نئی
- کوئی بھی نہیں
- براہ مہربانی نوٹ کریں
- نوٹ بک
- اطلاعات
- اب
- نمبر
- تعداد
- اشیاء
- of
- پیش کرتے ہیں
- on
- ڈیمانڈ
- ایک
- صرف
- کھول
- اوپن سورس
- or
- تنظیم
- OS
- ہمارے
- باہر
- نتائج
- پیداوار
- پر
- پین
- پیرامیٹر
- پیرامیٹرز
- حصہ
- پارٹنر
- شراکت داروں کے
- حصے
- منظور
- جذباتی
- راستہ
- فی
- انجام دیں
- کارکردگی
- کارکردگی
- اجازتیں
- نقطہ نظر
- مرحلہ
- طبعیات
- تصاویر
- پائپ لائن
- پلاٹا
- افلاطون ڈیٹا انٹیلی جنس
- پلیٹو ڈیٹا
- پالیسیاں
- پوسٹ
- مراسلات
- ممکنہ طور پر
- طاقت
- طاقتور
- پیش گو
- حال (-)
- پیش
- پچھلا
- پہلے
- عمل
- عملدرآمد
- عمل
- پروسیسنگ
- پروگرام
- خصوصیات
- فراہم
- فراہم
- فراہم کرتا ہے
- فراہم کرنے
- ڈال
- کوارٹرز
- سوالات
- سوال
- سوالات
- فوری
- چیتھڑا
- رینج
- میں تیزی سے
- پڑھنا
- تیار
- حقیقی دنیا
- موصول
- حوالہ دیا
- خطے
- متعلقہ
- متعلقہ
- رہے
- کی جگہ
- درخواست
- ضرورت
- وسائل
- جواب
- جواب
- جوابات
- نتیجہ
- نتیجے
- نتائج کی نمائش
- بازیافت
- واپسی
- امیر
- کردار
- رن
- چل رہا ہے
- sagemaker
- سیج میکر کا اندازہ
- اسی
- کا کہنا ہے کہ
- پیمانے
- سائنس
- اسکرین شاٹس
- اسکرپٹ
- تلاش کریں
- دوسری
- سیکشن
- سیکشنز
- شعبے
- دیکھنا
- منتخب
- منتخب
- سینئر
- تسلسل
- سیریز
- بے سرور
- کام کرتا ہے
- سروس
- سروسز
- اجلاس
- سیٹ
- قائم کرنے
- ترتیبات
- سیکنڈ اور
- وہ
- ہونا چاہئے
- دکھایا گیا
- شوز
- اسی طرح
- سادہ
- صرف
- ایک
- سائز
- سلائیڈ
- سلائیڈیں
- ٹکڑا
- So
- حل
- حل
- کچھ
- ماخذ
- ماہر
- مخصوص
- مخصوص
- مستحکم
- ڈھیر لگانا
- شروع
- حالت
- درجہ
- مرحلہ
- مراحل
- ذخیرہ
- ذخیرہ
- ذخیرہ
- پردہ
- ذخیرہ کرنے
- حکمت عملی
- سلک
- بعد میں
- کامیابی
- کامیابی کے ساتھ
- اس طرح
- سربراہی کانفرنس
- امدادی
- اس بات کا یقین
- ٹیبل
- لے لو
- بات
- کاموں
- ٹیکنیکل
- ٹیکنالوجی
- سانچے
- سانچے
- ٹیسٹ
- ٹیسٹ
- ٹیکساس
- متن
- متنی
- کہ
- ۔
- کے بارے میں معلومات
- ان
- تو
- یہ
- اس
- ان
- تھرو پٹ
- وقت
- ٹائٹین
- عنوان
- کرنے کے لئے
- آج کا
- مل کر
- ٹورنٹو
- روایتی طور پر
- گزرنا
- ٹرگر
- ٹرگر
- سچ
- کوشش
- ٹرن
- دو
- قسم
- بے نقاب
- سمجھ
- افہام و تفہیم
- یونیورسٹی
- اپ ڈیٹ کریں
- اپ لوڈ کردہ
- URL
- استعمال کی شرائط
- استعمال کیا جاتا ہے
- رکن کا
- استعمال
- کا استعمال کرتے ہوئے
- قیمت
- متغیر
- مختلف اقسام کے
- ورژن
- کی طرف سے
- ویڈیو
- لنک
- نقطہ نظر
- بصری
- واشنگٹن
- طریقوں
- we
- ویب
- ویب خدمات
- اچھا ہے
- کیا
- کیا ہے
- جس
- جبکہ
- گے
- ساتھ
- کے اندر
- کام کیا
- کام کا بہاؤ
- کام کر
- تم
- اور
- زیفیرنیٹ