أحد التطبيقات الأكثر شيوعًا للذكاء الاصطناعي التوليدي ونماذج اللغات الكبيرة (LLMs) هو الإجابة على الأسئلة بناءً على مجموعة معرفية خارجية محددة. يعد توليد الاسترجاع المعزز (RAG) أسلوبًا شائعًا لبناء أنظمة الإجابة على الأسئلة التي تستخدم قاعدة معرفية خارجية. لمعرفة المزيد، راجع أنشئ روبوتًا قويًا للإجابة على الأسئلة باستخدام Amazon SageMaker وAmazon OpenSearch Service وStreamlit وLangChain.
غالبًا ما تكافح أنظمة RAG التقليدية لتقديم إجابات مرضية عندما يطرح المستخدمون أسئلة غامضة أو غامضة دون توفير سياق كافٍ. يؤدي هذا إلى إجابات غير مفيدة مثل "لا أعرف" أو إجابات غير صحيحة ومختلقة مقدمة من LLM. في هذا المنشور، نعرض حلاً لتحسين جودة الإجابات في حالات الاستخدام هذه عبر أنظمة RAG التقليدية من خلال تقديم مكون توضيحي تفاعلي باستخدام لانجشين.
الفكرة الرئيسية هي تمكين نظام RAG من المشاركة في حوار محادثة مع المستخدم عندما يكون السؤال الأولي غير واضح. من خلال طرح أسئلة توضيحية، وحث المستخدم على مزيد من التفاصيل، ودمج المعلومات السياقية الجديدة، يمكن لنظام RAG جمع السياق اللازم لتوفير إجابة دقيقة ومفيدة - حتى من استعلام مستخدم أولي غامض.
حل نظرة عامة
لتوضيح الحل الذي توصلنا إليه، قمنا بإعداد مؤشر أمازون كندرا (يتألف من وثائق AWS عبر الإنترنت لـ أمازون كندرا, أمازون ليكسو الأمازون SageMaker)، وكيل LangChain مع أمازون بيدروك LLM، ومباشرة انسيابي واجهة المستخدم.
المتطلبات الأساسية المسبقة
لتشغيل هذا العرض التوضيحي في حساب AWS الخاص بك، أكمل المتطلبات الأساسية التالية:
- استنساخ مستودع جيثب واتبع الخطوات الموضحة في ملف README.
- انشر فهرس Amazon Kendra في حساب AWS الخاص بك. يمكنك استخدام ما يلي تكوين سحابة AWS قالب لإنشاء فهرس جديد أو استخدام فهرس قيد التشغيل بالفعل. قد يؤدي نشر فهرس جديد إلى إضافة رسوم إضافية إلى فاتورتك، لذلك نوصي بحذفه إذا لم تعد بحاجة إليه. لاحظ أنه سيتم إرسال البيانات الموجودة في الفهرس إلى نموذج مؤسسة Amazon Bedrock (FM) المحدد.
- يعتمد وكيل LangChain على FMs المتوفرة في Amazon Bedrock، ولكن يمكن تكييف ذلك مع أي ماجستير إدارة أعمال آخر يدعمه LangChain.
- لتجربة نموذج الواجهة الأمامية المشتركة مع الكود، يمكنك استخدامه أمازون ساجميكر ستوديو لتشغيل النشر المحلي لتطبيق Streamlit. لاحظ أن تشغيل هذا العرض التوضيحي سيتحمل بعض التكاليف الإضافية.
تنفيذ الحل
غالبًا ما يتم تصميم عوامل RAG التقليدية على النحو التالي. يتمتع الوكيل بإمكانية الوصول إلى الأداة المستخدمة لاسترداد المستندات ذات الصلة باستعلام المستخدم. يتم بعد ذلك إدراج المستندات المستردة في موجه LLM، حتى يتمكن الوكيل من تقديم إجابة بناءً على مقتطفات المستند المستردة.
في هذا المنشور، قمنا بتنفيذ وكيل لديه حق الوصول إليه KendraRetrievalTool
ويستمد المستندات ذات الصلة من فهرس Amazon Kendra ويقدم الإجابة في ضوء السياق المسترجع:
الرجوع إلى جيثب ريبو للحصول على رمز التنفيذ الكامل. لمعرفة المزيد حول حالات استخدام RAG التقليدية، راجع الإجابة على الأسئلة باستخدام Retrieval Augmented Generation مع نماذج الأساس في Amazon SageMaker JumpStart.
النظر في المثال التالي. يسأل أحد المستخدمين "كم عدد وحدات معالجة الرسومات الموجودة في مثيل EC2 الخاص بي؟" كما هو موضح في لقطة الشاشة التالية، يبحث الوكيل عن الإجابة باستخدام KendraRetrievalTool
. ومع ذلك، يدرك الوكيل أنه لا يعرف أي منها الأمازون الحوسبة المرنة السحابية (Amazon EC2) نوع المثيل الذي يشير إليه المستخدم، وبالتالي لا يقدم إجابة مفيدة للمستخدم، مما يؤدي إلى تجربة سيئة للعملاء.
لمعالجة هذه المشكلة، قمنا بتحديد أداة مخصصة إضافية تسمى AskHumanTool
وتقديمها للوكيل. تقوم الأداة بتوجيه LLM إلى قراءة سؤال المستخدم وطرح سؤال متابعة على المستخدم إذا KendraRetrievalTool
غير قادر على العودة إجابة جيدة. وهذا يعني أن الوكيل سيكون لديه الآن أداتان تحت تصرفه:
يتيح ذلك للوكيل إما تحسين السؤال أو توفير سياق إضافي مطلوب للرد على الموجه. لتوجيه الوكيل للاستخدام AskHumanTool
لهذا الغرض, نحن نقدم وصف الأداة التالية لـ LLM:
استخدم هذه الأداة إذا لم تجد إجابة باستخدام KendraRetrievalTool. اطلب من الإنسان توضيح السؤال أو تقديم المعلومات المفقودة. يجب أن يكون الإدخال سؤالاً للإنسان.
كما هو موضح في لقطة الشاشة التالية، باستخدام AskHumanTool
، يقوم الوكيل الآن بتحديد أسئلة المستخدم الغامضة ويعيد سؤال متابعة إلى المستخدم يطلب فيه تحديد نوع مثيل EC2 المستخدم.
بعد أن يحدد المستخدم نوع المثيل، يقوم الوكيل بدمج الإجابة الإضافية في سياق السؤال الأصلي، قبل استخلاص الإجابة الصحيحة.
لاحظ أنه يمكن للوكيل الآن أن يقرر ما إذا كان سيتم استخدامه أم لا KendraRetrievalTool
لاسترجاع المستندات ذات الصلة أو طرح سؤال توضيحي باستخدام AskHumanTool
. يعتمد قرار الوكيل على ما إذا كان يجد مقتطفات المستند المُدرجة في الموجه كافية لتقديم الإجابة النهائية. تتيح هذه المرونة لنظام RAG دعم الاستعلامات المختلفة التي قد يرسلها المستخدم، بما في ذلك الأسئلة الغامضة والمُصاغة جيدًا.
في مثالنا، يكون سير عمل الوكيل الكامل كما يلي:
- يقدم المستخدم طلبًا إلى تطبيق RAG، ويسأل "كم عدد وحدات معالجة الرسومات الموجودة في مثيل EC2 الخاص بي؟"
- يستخدم الوكيل LLM لتحديد الإجراء الذي يجب اتخاذه: ابحث عن المعلومات ذات الصلة للإجابة على طلب المستخدم عن طريق الاتصال بالوكيل
KendraRetrievalTool
. - يقوم الوكيل باسترداد المعلومات من فهرس Amazon Kendra باستخدام الأداة. يتم إدراج المقتطفات من المستندات المستردة في موجه الوكيل.
- يستنتج LLM (الخاص بالوكيل) أن المستندات المستردة من Amazon Kendra ليست مفيدة أو لا تحتوي على سياق كافٍ لتقديم إجابة لطلب المستخدم.
- يستخدم الوكيل
AskHumanTool
لصياغة سؤال متابعة: "ما هو نوع مثيل EC2 المحدد الذي تستخدمه؟ إن معرفة نوع المثيل سيساعد في الإجابة على عدد وحدات معالجة الرسومات الموجودة به. يقدم المستخدم الإجابة "ml.g5.12xlarge"، ويتصل الوكيلKendraRetrievalTool
مرة أخرى، ولكن هذه المرة أضف نوع مثيل EC2 إلى استعلام البحث. - بعد تنفيذ الخطوات من 2 إلى 4 مرة أخرى، يحصل الوكيل على إجابة مفيدة ويرسلها مرة أخرى إلى المستخدم.
يوضح الرسم البياني التالي سير العمل هذا.
يوضح المثال الموضح في هذا المنشور كيفية إضافة العرف AskHumanTool
يسمح للوكيل بطلب توضيح التفاصيل عند الحاجة. يمكن أن يؤدي ذلك إلى تحسين موثوقية ودقة الاستجابات، مما يؤدي إلى تجربة أفضل للعملاء في عدد متزايد من تطبيقات RAG عبر مجالات مختلفة.
تنظيف
لتجنب تكبد تكاليف غير ضرورية، احذف فهرس Amazon Kendra إذا لم تعد تستخدمه وأوقف تشغيل مثيل SageMaker Studio إذا استخدمته لتشغيل العرض التوضيحي.
وفي الختام
في هذا المنشور، أظهرنا كيفية تمكين تجربة عملاء أفضل لمستخدمي نظام RAG عن طريق إضافة أداة مخصصة تمكن النظام من مطالبة المستخدم بمعلومات مفقودة. يمثل نهج المحادثة التفاعلي هذا اتجاهًا واعدًا لتحسين بنيات RAG التقليدية. يمكن أن تؤدي القدرة على حل الغموض من خلال الحوار إلى تقديم إجابات مرضية أكثر من قاعدة المعرفة.
لاحظ أن هذا النهج لا يقتصر على حالات استخدام RAG؛ يمكنك استخدامه في حالات استخدام الذكاء الاصطناعي التوليدي الأخرى التي تعتمد على وكيل في جوهره، حيث يكون مخصصًا AskHumanTool
يمكن إضافته.
لمزيد من المعلومات حول استخدام Amazon Kendra مع الذكاء الاصطناعي التوليدي، راجع أنشئ تطبيقات ذكاء اصطناعي توليدية عالية الدقة بسرعة على بيانات المؤسسة باستخدام Amazon Kendra و LangChain ونماذج اللغات الكبيرة.
عن المؤلفين
أنطونيا ويبلر هي عالمة بيانات في مركز AWS Geneative AI Innovation Center، حيث تستمتع ببناء إثباتات المفهوم للعملاء. يتمثل شغفها في استكشاف كيف يمكن للذكاء الاصطناعي التوليدي حل مشكلات العالم الحقيقي وخلق قيمة للعملاء. على الرغم من أنها لا تقوم بالبرمجة، إلا أنها تستمتع بالجري والمنافسة في سباقات الترياتلون.
نيكيتا كوزودوي هو عالم تطبيقي في مركز AWS Geneative AI Innovation Center، حيث يقوم بتطوير حلول تعلم الآلة لحل مشكلات العملاء عبر الصناعات. ويركز في منصبه على تطوير الذكاء الاصطناعي التوليدي لمواجهة تحديات العالم الحقيقي. في أوقات فراغه، يحب لعب الكرة الطائرة الشاطئية والقراءة.
- محتوى مدعوم من تحسين محركات البحث وتوزيع العلاقات العامة. تضخيم اليوم.
- PlatoData.Network Vertical Generative Ai. تمكين نفسك. الوصول هنا.
- أفلاطونايستريم. ذكاء Web3. تضخيم المعرفة. الوصول هنا.
- أفلاطون كربون، كلينتك ، الطاقة، بيئة، شمسي، إدارة المخلفات. الوصول هنا.
- أفلاطون هيلث. التكنولوجيا الحيوية وذكاء التجارب السريرية. الوصول هنا.
- المصدر https://aws.amazon.com/blogs/machine-learning/improve-llm-responses-in-rag-use-cases-by-interacting-with-the-user/
- :لديها
- :يكون
- :ليس
- :أين
- $ UP
- 100
- 120
- 16
- 17
- 7
- a
- القدرة
- ماهرون
- من نحن
- الوصول
- حسابي
- دقة
- دقيق
- في
- اكشن
- تضيف
- وأضاف
- مضيفا
- إضافة
- إضافي
- العنوان
- تقدم
- مرة أخرى
- الوكيل
- عملاء
- AI
- حالات استخدام ai
- يسمح
- سابقا
- أمازون
- Amazon EC2
- أمازون كندرا
- خدمة Amazon OpenSearch
- الأمازون SageMaker
- أمازون ويب سيرفيسز
- an
- و
- إجابة
- الأجوبة
- أي وقت
- بعد الآن
- التطبيق
- التطبيقات
- تطبيقي
- نهج
- هندسة معمارية
- هي
- AS
- تطلب
- يسأل
- At
- المعزز
- متاح
- تجنب
- AWS
- الى الخلف
- قاعدة
- على أساس
- BE
- شاطئ
- قبل
- يجري
- أفضل
- مشروع قانون
- أحذية طويلة
- على حد سواء
- نساعدك في بناء
- ابني
- لكن
- by
- تسمى
- دعوة
- دعوات
- CAN
- الحالات
- مركز
- التحديات
- اسعارنا محددة من قبل وزارة العمل
- الكود
- البرمجة
- مشترك
- المنافسة
- إكمال
- عنصر
- تتألف
- إحصاء
- مفهوم
- تحتوي على
- سياق الكلام
- قريني
- تحادثي
- جوهر
- تصحيح
- التكاليف
- خلق
- خلق القيمة
- على
- زبون
- تجربة العملاء
- العملاء
- البيانات
- عالم البيانات
- تقرر
- القرار
- حدد
- تقديم
- عرض
- شرح
- نشر
- نشر
- وصف
- وصف
- تصميم
- تفاصيل
- يطور
- حوار
- مختلف
- اتجاه
- تخلص من
- وثيقة
- توثيق
- وثائق
- هل
- لا
- المجالات
- لا
- إلى أسفل
- إما
- تمكين
- تمكن
- النهاية
- جذب
- كاف
- مشروع
- مثال
- الخبره في مجال الغطس
- تجربة
- شرح
- استكشاف
- خارجي
- نهائي
- ويرى
- الاسم الأول
- مرونة
- ويركز
- اتباع
- متابعيك
- متابعات
- في حالة
- دورة تأسيسية
- تبدأ من
- جبهة
- نهاية المقدمة
- بالإضافة إلى
- جمع
- توليد
- جيل
- توليدي
- الذكاء الاصطناعي التوليدي
- معطى
- خير
- وحدات معالجة الرسومات
- متزايد
- توجيه
- يملك
- he
- مساعدة
- مفيد
- لها
- له
- كيفية
- كيفية
- لكن
- HTML
- HTTP
- HTTPS
- الانسان
- فكرة
- تحديد
- if
- يوضح
- تنفيذ
- التنفيذ
- تحسن
- تحسن
- تحسين
- in
- في أخرى
- بما فيه
- دمج
- مؤشر
- الصناعات
- معلومات
- في البداية
- الابتكار
- إدخال
- مثل
- التفاعل
- التفاعلية
- السطح البيني
- إلى
- إدخال
- IT
- انها
- JPG
- القفل
- علم
- معرفة
- المعرفة
- لغة
- كبير
- قيادة
- قيادة
- يؤدي
- تعلم
- مثل
- محدود
- LLM
- محلي
- يعد
- أبحث
- يحب
- يصنع
- كثير
- مايو..
- ربما
- مفقود
- ML
- نموذج
- عارضات ازياء
- الأكثر من ذلك
- أكثر
- my
- ضروري
- حاجة
- بحاجة
- جديد
- لا
- الآن
- عدد
- of
- غالبا
- on
- online
- or
- أصلي
- أخرى
- لنا
- على مدى
- شغف
- قطعة
- أفلاطون
- الذكاء افلاطون البيانات
- أفلاطون داتا
- لعب
- فقير
- الرائج
- منشور
- قوي
- الشروط
- المشكلة
- مشاكل
- واعد
- البراهين
- تزود
- المقدمة
- ويوفر
- توفير
- جودة
- الاستفسارات
- سؤال
- الأسئلة المتكررة
- عرض
- نادي القراءة
- العالم الحقيقي
- نوصي
- الرجوع
- الرجوع
- صقل
- منتظم
- ذات الصلة
- الموثوقية
- يمثل
- طلب
- حل
- الرد
- استجابة
- ردود
- عائد أعلى
- عودة
- النوع
- يجري
- تشغيل
- sagemaker
- عالم
- بحث
- مختار
- يرسل
- أرسلت
- الخدمة
- خدماتنا
- طقم
- شاركت
- هي
- ينبغي
- أظهرت
- أظهرت
- غلق
- So
- حل
- الحلول
- حل
- بعض
- محدد
- محدد
- خطوات
- صريح
- النضال
- ستوديو
- تقدم
- هذه
- كاف
- الدعم
- الدعم
- نظام
- أنظمة
- معالجة
- أخذ
- تقنية
- أن
- •
- then
- وبالتالي
- عبر
- الوقت
- إلى
- أداة
- أدوات
- تقليدي
- اثنان
- نوع
- غير ضروري
- تستخدم
- مستعمل
- مستخدم
- واجهة المستخدم
- المستخدمين
- يستخدم
- استخدام
- قيمنا
- we
- الويب
- خدمات ويب
- ابحث عن
- متى
- سواء
- التي
- في حين
- سوف
- مع
- في غضون
- بدون
- سير العمل
- سوف
- يامل
- أنت
- حل متجر العقارات الشامل الخاص بك في جورجيا
- زفيرنت