جنریٹو AI اور بڑے لینگویج ماڈلز (LLMs) کی سب سے عام ایپلی کیشنز میں سے ایک مخصوص بیرونی علمی کارپس کی بنیاد پر سوالات کا جواب دینا ہے۔ Retrieval-Augmented Generation (RAG) سوالوں کے جواب دینے والے نظاموں کی تعمیر کے لیے ایک مشہور تکنیک ہے جو بیرونی علم کی بنیاد کا استعمال کرتی ہے۔ مزید جاننے کے لیے رجوع کریں۔ Amazon SageMaker، Amazon OpenSearch Service، Streamlit، اور LangChain کے ساتھ ایک طاقتور سوال کا جواب دینے والا بوٹ بنائیں.
روایتی RAG سسٹم اکثر تسلی بخش جوابات فراہم کرنے کے لیے جدوجہد کرتے ہیں جب صارفین کافی سیاق و سباق فراہم کیے بغیر مبہم یا مبہم سوالات پوچھتے ہیں۔ یہ غیر مددگار جوابات کی طرف لے جاتا ہے جیسے "میں نہیں جانتا" یا غلط، تیار کردہ جوابات جو ایل ایل ایم کے ذریعہ فراہم کیے گئے ہیں۔ اس پوسٹ میں، ہم روایتی RAG سسٹمز پر اس طرح کے استعمال کے معاملات میں جوابات کے معیار کو بہتر بنانے کے حل کا مظاہرہ کرتے ہوئے ایک انٹرایکٹو وضاحتی جزو متعارف کراتے ہیں۔ لینگ چین.
کلیدی خیال یہ ہے کہ جب ابتدائی سوال واضح نہ ہو تو RAG سسٹم کو صارف کے ساتھ بات چیت میں مشغول کرنے کے قابل بنائے۔ واضح سوالات پوچھ کر، صارف کو مزید تفصیلات کے لیے ترغیب دے کر، اور نئی سیاق و سباق کی معلومات کو شامل کر کے، RAG سسٹم درست، مددگار جواب فراہم کرنے کے لیے ضروری سیاق و سباق جمع کر سکتا ہے—حتی کہ صارف کے ابتدائی سوال سے بھی۔
حل جائزہ
اپنے حل کو ظاہر کرنے کے لیے، ہم نے ایک سیٹ اپ کیا ہے۔ ایمیزون کینڈر انڈیکس (کے لیے AWS آن لائن دستاویزات پر مشتمل ہے۔ ایمیزون کیندر, ایمیزون لیکس، اور ایمیزون سیج میکر) کے ساتھ ایک LangChain ایجنٹ ایمیزون بیڈرک ایل ایل ایم، اور ایک سیدھا اسٹریم لائٹ یوزر انٹرفیس.
شرائط
اپنے AWS اکاؤنٹ میں اس ڈیمو کو چلانے کے لیے، درج ذیل شرائط پوری کریں:
- کلون GitHub ذخیرہ اور README میں بیان کردہ مراحل پر عمل کریں۔
- اپنے AWS اکاؤنٹ میں Amazon Kendra انڈیکس تعینات کریں۔ آپ درج ذیل کو استعمال کر سکتے ہیں۔ AWS کلاؤڈ فارمیشن سانچے ایک نیا انڈیکس بنانے یا پہلے سے چل رہا انڈیکس استعمال کرنے کے لیے۔ ایک نیا انڈیکس لگانے سے آپ کے بل میں اضافی چارجز شامل ہو سکتے ہیں، اس لیے ہم تجویز کرتے ہیں کہ اگر آپ کو مزید ضرورت نہ ہو تو اسے حذف کر دیں۔ نوٹ کریں کہ انڈیکس کے اندر موجود ڈیٹا کو منتخب کردہ Amazon Bedrock فاؤنڈیشن ماڈل (FM) کو بھیجا جائے گا۔
- LangChain ایجنٹ Amazon Bedrock میں دستیاب FMs پر انحصار کرتا ہے، لیکن اسے LangChain سپورٹ کرنے والے کسی بھی دوسرے LLM کے مطابق کیا جا سکتا ہے۔
- کوڈ کے ساتھ اشتراک کردہ سیمپل فرنٹ اینڈ کے ساتھ تجربہ کرنے کے لیے، آپ استعمال کر سکتے ہیں۔ ایمیزون سیج میکر اسٹوڈیو Streamlit ایپ کی مقامی تعیناتی کو چلانے کے لیے۔ نوٹ کریں کہ اس ڈیمو کو چلانے کے لیے کچھ اضافی اخراجات اٹھانا پڑیں گے۔
حل کو نافذ کریں۔
روایتی RAG ایجنٹوں کو اکثر مندرجہ ذیل ڈیزائن کیا جاتا ہے۔ ایجنٹ کو ایک ایسے ٹول تک رسائی حاصل ہے جو صارف کے استفسار سے متعلقہ دستاویزات کی بازیافت کے لیے استعمال ہوتا ہے۔ بازیافت شدہ دستاویزات کو پھر LLM پرامپٹ میں داخل کیا جاتا ہے، تاکہ ایجنٹ بازیافت شدہ دستاویز کے ٹکڑوں کی بنیاد پر جواب فراہم کر سکے۔
اس پوسٹ میں، ہم ایک ایسے ایجنٹ کو نافذ کرتے ہیں جس تک رسائی حاصل ہو۔ KendraRetrievalTool
اور Amazon Kendra انڈیکس سے متعلقہ دستاویزات اخذ کرتا ہے اور بازیافت شدہ سیاق و سباق کے مطابق جواب فراہم کرتا ہے:
ملاحظہ کریں GitHub repo مکمل نفاذ کوڈ کے لیے۔ روایتی RAG استعمال کے معاملات کے بارے میں مزید جاننے کے لیے، رجوع کریں۔ ایمیزون سیج میکر جمپ اسٹارٹ میں فاؤنڈیشن ماڈلز کے ساتھ ریٹریول اگمنٹڈ جنریشن کا استعمال کرتے ہوئے سوالوں کا جواب.
درج ذیل مثال پر غور کریں۔ ایک صارف پوچھتا ہے "میرے EC2 مثال میں کتنے GPUs ہیں؟" جیسا کہ درج ذیل اسکرین شاٹ میں دکھایا گیا ہے، ایجنٹ اس کا استعمال کرتے ہوئے جواب تلاش کر رہا ہے۔ KendraRetrievalTool
. تاہم، ایجنٹ کو احساس ہے کہ یہ نہیں جانتا کہ کون سا ایمیزون لچکدار کمپیوٹ کلاؤڈ (Amazon EC2) مثال کی قسم جس کا صارف حوالہ دے رہا ہے اور اس وجہ سے صارف کو کوئی مددگار جواب نہیں دیتا، جس کی وجہ سے صارف کا تجربہ خراب ہوتا ہے۔
اس مسئلے کو حل کرنے کے لیے، ہم ایک اضافی کسٹم ٹول کی وضاحت کرتے ہیں جسے کہتے ہیں۔ AskHumanTool
اور اسے ایجنٹ کو فراہم کریں۔ یہ ٹول ایل ایل ایم کو صارف کے سوال کو پڑھنے اور صارف سے فالو اپ سوال پوچھنے کی ہدایت کرتا ہے اگر KendraRetrievalTool
ایک اچھا جواب واپس کرنے کے قابل نہیں ہے. اس کا مطلب یہ ہے کہ ایجنٹ کے پاس اب دو ٹولز ہوں گے:
یہ ایجنٹ کو سوال کو بہتر بنانے یا اضافی سیاق و سباق فراہم کرنے کی اجازت دیتا ہے جو فوری جواب دینے کے لیے درکار ہے۔ استعمال کرنے کے لیے ایجنٹ کی رہنمائی کے لیے AskHumanTool
اس مقصد کے لیے, ہم LLM کو درج ذیل ٹول کی تفصیل فراہم کرتے ہیں:
اگر آپ کو KendraRetrievalTool کا استعمال کرتے ہوئے کوئی جواب نہیں ملتا ہے تو اس ٹول کا استعمال کریں۔ انسان سے سوال کی وضاحت کرنے یا گمشدہ معلومات فراہم کرنے کو کہیں۔ ان پٹ انسان کے لیے ایک سوال ہونا چاہیے۔
جیسا کہ مندرجہ ذیل اسکرین شاٹ میں استعمال کرکے دکھایا گیا ہے۔ AskHumanTool
, ایجنٹ اب صارف کے مبہم سوالات کی نشاندہی کر رہا ہے اور صارف کو ایک فالو اپ سوال واپس کر رہا ہے جس میں یہ بتانے کے لیے کہا جا رہا ہے کہ EC2 مثال کی کون سی قسم استعمال کی جا رہی ہے۔
صارف کی جانب سے مثال کی قسم بتانے کے بعد، ایجنٹ صحیح جواب حاصل کرنے سے پہلے اصل سوال کے سیاق و سباق میں اضافی جواب شامل کر رہا ہے۔
نوٹ کریں کہ ایجنٹ اب فیصلہ کر سکتا ہے کہ آیا استعمال کرنا ہے۔ KendraRetrievalTool
متعلقہ دستاویزات کی بازیافت کے لیے یا استعمال کرتے ہوئے ایک واضح سوال پوچھنا AskHumanTool
. ایجنٹ کا فیصلہ اس بات پر مبنی ہے کہ آیا اسے پرامپٹ میں داخل کیے گئے دستاویز کے ٹکڑوں کو حتمی جواب فراہم کرنے کے لیے کافی ہے۔ یہ لچک RAG سسٹم کو مختلف سوالات کی حمایت کرنے کی اجازت دیتی ہے جو صارف جمع کر سکتا ہے، بشمول اچھی طرح سے وضع کردہ اور مبہم سوالات۔
ہماری مثال میں، مکمل ایجنٹ ورک فلو مندرجہ ذیل ہے:
- صارف RAG ایپ سے درخواست کرتا ہے، "میرے EC2 مثال میں کتنے GPUs ہیں؟"
- ایجنٹ یہ فیصلہ کرنے کے لیے LLM کا استعمال کرتا ہے کہ کیا کارروائی کرنی ہے: صارف کی درخواست کا جواب دینے کے لیے متعلقہ معلومات حاصل کریں۔
KendraRetrievalTool
. - ایجنٹ ٹول کا استعمال کرتے ہوئے ایمیزون کینڈر انڈیکس سے معلومات حاصل کرتا ہے۔ بازیافت شدہ دستاویزات کے ٹکڑوں کو ایجنٹ پرامپٹ میں داخل کیا جاتا ہے۔
- LLM (ایجنٹ کا) اخذ کرتا ہے کہ Amazon Kendra سے بازیافت شدہ دستاویزات مددگار نہیں ہیں یا صارف کی درخواست کا جواب فراہم کرنے کے لیے کافی سیاق و سباق پر مشتمل نہیں ہیں۔
- ایجنٹ استعمال کرتا ہے۔
AskHumanTool
فالو اپ سوال تیار کرنے کے لیے: "آپ جو مخصوص EC2 مثال کی قسم استعمال کر رہے ہیں وہ کیا ہے؟ مثال کی قسم جاننے سے یہ جواب دینے میں مدد ملے گی کہ اس میں کتنے GPUs ہیں۔ صارف جواب فراہم کرتا ہے "ml.g5.12xlarge" اور ایجنٹ کال کرتا ہے۔KendraRetrievalTool
دوبارہ، لیکن اس بار تلاش کے استفسار میں EC2 مثال کی قسم شامل کرنا۔ - مرحلہ 2–4 کو دوبارہ چلانے کے بعد، ایجنٹ ایک مفید جواب حاصل کرتا ہے اور اسے صارف کو واپس بھیج دیتا ہے۔
درج ذیل خاکہ اس ورک فلو کو واضح کرتا ہے۔
اس پوسٹ میں بیان کردہ مثال بتاتی ہے کہ کس طرح اپنی مرضی کے مطابق اضافہ کیا جاتا ہے۔ AskHumanTool
جب ضرورت ہو تو ایجنٹ کو وضاحتی تفصیلات کی درخواست کرنے کی اجازت دیتا ہے۔ یہ جوابات کی وشوسنییتا اور درستگی کو بہتر بنا سکتا ہے، جس کے نتیجے میں مختلف ڈومینز میں RAG ایپلی کیشنز کی بڑھتی ہوئی تعداد میں کسٹمر کا بہتر تجربہ ہوتا ہے۔
صاف کرو
غیر ضروری اخراجات سے بچنے کے لیے، اگر آپ اسے مزید استعمال نہیں کر رہے ہیں تو Amazon Kendra انڈیکس کو حذف کر دیں اور SageMaker Studio مثال کو بند کر دیں اگر آپ نے اسے ڈیمو چلانے کے لیے استعمال کیا ہے۔
نتیجہ
اس پوسٹ میں، ہم نے دکھایا کہ کس طرح ایک کسٹم ٹول کو شامل کرکے RAG سسٹم کے صارفین کے لیے کسٹمر کے بہتر تجربے کو فعال کیا جائے جو سسٹم کو صارف سے معلومات کے گمشدہ حصے کے لیے پوچھنے کے قابل بناتا ہے۔ یہ باہم بات چیت کا طریقہ روایتی RAG فن تعمیر کو بہتر بنانے کے لیے ایک امید افزا سمت کی نمائندگی کرتا ہے۔ مکالمے کے ذریعے مبہم پن کو دور کرنے کی صلاحیت علم کی بنیاد سے زیادہ تسلی بخش جوابات فراہم کرنے کا باعث بن سکتی ہے۔
نوٹ کریں کہ یہ نقطہ نظر صرف RAG کے استعمال کے معاملات تک محدود نہیں ہے۔ آپ اسے دوسرے جنریٹیو AI استعمال کے معاملات میں استعمال کر سکتے ہیں جو اس کے بنیادی ایجنٹ پر منحصر ہے، جہاں ایک اپنی مرضی کے مطابق AskHumanTool
شامل کیا جا سکتا ہے۔
جنریٹیو AI کے ساتھ Amazon Kendra استعمال کرنے کے بارے میں مزید معلومات کے لیے، رجوع کریں۔ Amazon Kendra، LangChain، اور بڑے لینگویج ماڈلز کا استعمال کرتے ہوئے انٹرپرائز ڈیٹا پر فوری طور پر اعلی درستگی پیدا کرنے والی AI ایپلیکیشنز بنائیں.
مصنفین کے بارے میں
انتونیا ویبلر AWS جنریٹو AI انوویشن سینٹر میں ڈیٹا سائنٹسٹ ہے، جہاں وہ صارفین کے لیے تصور کے تعمیری ثبوتوں سے لطف اندوز ہوتی ہے۔ اس کا جذبہ یہ تلاش کر رہا ہے کہ کس طرح تخلیقی AI حقیقی دنیا کے مسائل کو حل کر سکتا ہے اور صارفین کے لیے قدر پیدا کر سکتا ہے۔ جب کہ وہ کوڈنگ نہیں کر رہی ہے، وہ ٹرائیتھلون میں دوڑنا اور مقابلہ کرنا پسند کرتی ہے۔
نکیتا کوزودوئی AWS جنریٹو AI انوویشن سینٹر میں ایک اپلائیڈ سائنٹسٹ ہے، جہاں وہ تمام صنعتوں میں صارفین کے مسائل کو حل کرنے کے لیے ML حل تیار کرتا ہے۔ اپنے کردار میں، وہ حقیقی دنیا کے چیلنجوں سے نمٹنے کے لیے تخلیقی AI کو آگے بڑھانے پر توجہ مرکوز کرتا ہے۔ اپنے فارغ وقت میں، وہ بیچ والی بال کھیلنا اور پڑھنا پسند کرتا ہے۔
- SEO سے چلنے والا مواد اور PR کی تقسیم۔ آج ہی بڑھا دیں۔
- پلیٹو ڈیٹا ڈاٹ نیٹ ورک ورٹیکل جنریٹو اے آئی۔ اپنے آپ کو بااختیار بنائیں۔ یہاں تک رسائی حاصل کریں۔
- پلیٹوآئ اسٹریم۔ ویب 3 انٹیلی جنس۔ علم میں اضافہ۔ یہاں تک رسائی حاصل کریں۔
- پلیٹو ای ایس جی۔ کاربن، کلین ٹیک، توانائی ، ماحولیات، شمسی، ویسٹ مینجمنٹ یہاں تک رسائی حاصل کریں۔
- پلیٹو ہیلتھ۔ بائیوٹیک اینڈ کلینیکل ٹرائلز انٹیلی جنس۔ یہاں تک رسائی حاصل کریں۔
- ماخذ: https://aws.amazon.com/blogs/machine-learning/improve-llm-responses-in-rag-use-cases-by-interacting-with-the-user/
- : ہے
- : ہے
- : نہیں
- :کہاں
- $UP
- 100
- 120
- 16
- 17
- 7
- a
- کی صلاحیت
- قابلیت
- ہمارے بارے میں
- تک رسائی حاصل
- اکاؤنٹ
- درستگی
- درست
- کے پار
- عمل
- شامل کریں
- شامل کیا
- انہوں نے مزید کہا
- اس کے علاوہ
- ایڈیشنل
- پتہ
- پیش قدمی کرنا
- پھر
- ایجنٹ
- ایجنٹ
- AI
- AI استعمال کے معاملات
- کی اجازت دیتا ہے
- پہلے ہی
- ایمیزون
- ایمیزون EC2
- ایمیزون کیندر
- ایمیزون اوپن سرچ سروس
- ایمیزون سیج میکر
- ایمیزون ویب سروسز
- an
- اور
- جواب
- جواب
- کوئی بھی
- اب
- اپلی کیشن
- ایپلی کیشنز
- اطلاقی
- نقطہ نظر
- فن تعمیر
- کیا
- AS
- پوچھنا
- سے پوچھ
- At
- اضافہ
- دستیاب
- سے اجتناب
- AWS
- واپس
- بیس
- کی بنیاد پر
- BE
- بیچ
- اس سے پہلے
- کیا جا رہا ہے
- بہتر
- بل
- بوٹ
- دونوں
- تعمیر
- عمارت
- لیکن
- by
- کہا جاتا ہے
- بلا
- کالز
- کر سکتے ہیں
- مقدمات
- سینٹر
- چیلنجوں
- بوجھ
- کوڈ
- کوڈنگ
- کامن
- مقابلہ کرنا
- مکمل
- جزو
- پر مشتمل
- کمپیوٹنگ
- تصور
- پر مشتمل ہے
- سیاق و سباق
- متعلقہ
- سنوادی
- کور
- درست
- اخراجات
- تخلیق
- قدر بنائیں
- اپنی مرضی کے
- گاہک
- گاہک کا تجربہ
- گاہکوں
- اعداد و شمار
- ڈیٹا سائنسدان
- فیصلہ کرنا
- فیصلہ
- وضاحت
- ترسیل
- ڈیمو
- مظاہرہ
- تعینات
- تعیناتی
- بیان کیا
- تفصیل
- ڈیزائن
- تفصیلات
- تیار ہے
- مکالمے کے
- مختلف
- سمت
- ضائع کرنا
- دستاویز
- دستاویزات
- دستاویزات
- کرتا
- نہیں کرتا
- ڈومینز
- نہیں
- نیچے
- یا تو
- کو چالو کرنے کے
- کے قابل بناتا ہے
- آخر
- مشغول
- کافی
- انٹرپرائز
- مثال کے طور پر
- تجربہ
- تجربہ
- وضاحت کی
- ایکسپلور
- بیرونی
- فائنل
- مل
- پتہ ہے
- پہلا
- لچک
- توجہ مرکوز
- پر عمل کریں
- کے بعد
- مندرجہ ذیل ہے
- کے لئے
- فاؤنڈیشن
- سے
- سامنے
- سامنے کے آخر میں
- مکمل
- جمع
- پیدا
- نسل
- پیداواری
- پیداواری AI۔
- دی
- اچھا
- GPUs
- بڑھتے ہوئے
- رہنمائی
- ہے
- he
- مدد
- مدد گار
- اس کی
- ان
- کس طرح
- کیسے
- تاہم
- HTML
- HTTP
- HTTPS
- انسانی
- خیال
- کی نشاندہی
- if
- وضاحت کرتا ہے
- پر عملدرآمد
- نفاذ
- کو بہتر بنانے کے
- بہتر
- کو بہتر بنانے کے
- in
- دیگر میں
- سمیت
- شامل کرنا
- انڈکس
- صنعتوں
- معلومات
- ابتدائی
- جدت طرازی
- ان پٹ
- مثال کے طور پر
- بات چیت
- انٹرایکٹو
- انٹرفیس
- میں
- متعارف کرانے
- IT
- میں
- فوٹو
- کلیدی
- جان
- جاننا
- علم
- زبان
- بڑے
- قیادت
- معروف
- لیڈز
- جانیں
- کی طرح
- لمیٹڈ
- ایل ایل ایم
- مقامی
- اب
- تلاش
- سے محبت کرتا ہے
- بناتا ہے
- بہت سے
- مئی..
- شاید
- لاپتہ
- ML
- ماڈل
- ماڈل
- زیادہ
- سب سے زیادہ
- my
- ضروری
- ضرورت ہے
- ضرورت
- نئی
- نہیں
- اب
- تعداد
- of
- اکثر
- on
- آن لائن
- or
- اصل
- دیگر
- ہمارے
- پر
- جذبہ
- ٹکڑا
- پلاٹا
- افلاطون ڈیٹا انٹیلی جنس
- پلیٹو ڈیٹا
- کھیل
- غریب
- مقبول
- پوسٹ
- طاقتور
- ضروریات
- مسئلہ
- مسائل
- وعدہ
- ثبوت
- فراہم
- فراہم
- فراہم کرتا ہے
- فراہم کرنے
- معیار
- سوالات
- سوال
- سوالات
- پڑھیں
- پڑھنا
- حقیقی دنیا
- سفارش
- کا حوالہ دیتے ہیں
- حوالہ دینا۔
- بہتر
- باقاعدہ
- متعلقہ
- وشوسنییتا
- کی نمائندگی کرتا ہے
- درخواست
- حل
- جواب
- جواب
- جوابات
- واپسی
- واپس لوٹنے
- کردار
- رن
- چل رہا ہے
- sagemaker
- سائنسدان
- تلاش کریں
- منتخب
- بھیجتا ہے
- بھیجا
- سروس
- سروسز
- مقرر
- مشترکہ
- وہ
- ہونا چاہئے
- سے ظاہر ہوا
- دکھایا گیا
- بند کرو
- So
- حل
- حل
- حل
- کچھ
- مخصوص
- مخصوص
- مراحل
- براہ راست
- جدوجہد
- سٹوڈیو
- جمع
- اس طرح
- کافی
- حمایت
- کی حمایت کرتا ہے
- کے نظام
- سسٹمز
- ٹیکل
- لے لو
- تکنیک
- کہ
- ۔
- تو
- لہذا
- اس
- کے ذریعے
- وقت
- کرنے کے لئے
- کے آلے
- اوزار
- روایتی
- دو
- قسم
- غیر ضروری
- استعمال کی شرائط
- استعمال کیا جاتا ہے
- رکن کا
- صارف مواجہ
- صارفین
- استعمال
- کا استعمال کرتے ہوئے
- قیمت
- we
- ویب
- ویب خدمات
- کیا
- جب
- چاہے
- جس
- جبکہ
- گے
- ساتھ
- کے اندر
- بغیر
- کام کا بہاؤ
- گا
- یامل
- تم
- اور
- زیفیرنیٹ