توفر الألعاب عبر الإنترنت والمجتمعات الاجتماعية وظائف الدردشة الصوتية والنصية لمستخدميها للتواصل. على الرغم من أن الدردشة الصوتية والنصية غالبًا ما تدعم المزاح الودي، إلا أنها قد تؤدي أيضًا إلى مشاكل مثل خطاب الكراهية والتسلط عبر الإنترنت والمضايقات وعمليات الاحتيال. اليوم، تعتمد العديد من الشركات فقط على المشرفين البشريين لمراجعة المحتوى السام. ومع ذلك، فإن التحقق من الانتهاكات في الدردشة يستغرق وقتًا طويلاً، وعرضة للأخطاء، ويشكل تحديًا على نطاق واسع.
في هذا المنشور، نقدم حلولاً تتيح الإشراف على الدردشة الصوتية والنصية باستخدام خدمات AWS المتنوعة، بما في ذلك الأمازون النسخ, فهم الأمازون, أمازون بيدروكو خدمة Amazon OpenSearch.
تسعى منصات التواصل الاجتماعي إلى إيجاد حل اعتدالي جاهز للاستخدام يسهل البدء فيه، ولكنها تتطلب أيضًا التخصيص لإدارة السياسات المتنوعة. يعد الكمون والتكلفة أيضًا من العوامل الحاسمة التي يجب أخذها في الاعتبار. من خلال تنظيم تصنيف السمية باستخدام نماذج اللغة الكبيرة (LLMs) باستخدام الذكاء الاصطناعي التوليدي، فإننا نقدم حلاً يوازن بين البساطة وزمن الوصول والتكلفة والمرونة لتلبية المتطلبات المختلفة.
نموذج التعليمات البرمجية لهذا المنشور متاح في مستودع جيثب.
سير عمل الإشراف على الدردشة الصوتية
يمكن بدء سير عمل الإشراف على الدردشة الصوتية من خلال قيام مستخدم بالإبلاغ عن مستخدمين آخرين على منصة الألعاب بسبب انتهاكات السياسة مثل الألفاظ النابية أو خطاب الكراهية أو المضايقة. وهذا يمثل نهجا سلبيا للإشراف على الصوت. يقوم النظام بتسجيل كافة المحادثات الصوتية دون تحليل فوري. عند تلقي تقرير، يقوم سير العمل باسترداد الملفات الصوتية ذات الصلة ويبدأ عملية التحليل. يقوم بعد ذلك مشرف بشري بمراجعة المحادثة التي تم الإبلاغ عنها، والتحقيق في محتواها لتحديد ما إذا كانت تنتهك سياسة النظام الأساسي.
وبدلاً من ذلك، يمكن تشغيل سير العمل بشكل استباقي. على سبيل المثال، في غرفة الدردشة الصوتية الاجتماعية، يمكن للنظام تسجيل جميع المحادثات وتطبيق التحليل.
يمكن لكل من الأساليب السلبية والاستباقية تشغيل المسار التالي للتحليل الصوتي.
يتضمن سير عمل الإشراف الصوتي الخطوات التالية:
- يبدأ سير العمل باستلام الملف الصوتي وتخزينه على ملف خدمة تخزين أمازون البسيطة (Amazon S3) لـ Amazon Transcribe للوصول إليها.
- نسخة الأمازون
StartTranscriptionJob
يتم استدعاء API مع كشف السمية ممكّن. تقوم Amazon Transcribe بتحويل الصوت إلى نص، مما يوفر معلومات إضافية حول تحليل السمية. لمزيد من المعلومات حول تحليل السمية، راجع قم بوضع علامة على اللغة الضارة في المحادثات المنطوقة باستخدام Amazon Transcribe Toxicity Detection. - إذا أظهر تحليل السمية درجة سمية تتجاوز حدًا معينًا (على سبيل المثال، 50%)، فيمكننا استخدامها قواعد المعرفة لأمازون بيدروك لتقييم الرسالة مقابل السياسات المخصصة باستخدام LLMs.
- يتلقى المشرف البشري تقريرًا تفصيليًا للإشراف الصوتي يسلط الضوء على أجزاء المحادثة التي تعتبر سامة وتنتهك السياسة، مما يسمح له باتخاذ قرار مستنير.
تعرض لقطة الشاشة التالية نموذج تطبيق يعرض تحليل السمية لمقطع صوتي. ويتضمن النسخة الأصلية، ونتائج تحليل السمية في Amazon Transcribe، والتحليل الذي تم إجراؤه باستخدام قاعدة معارف Amazon Bedrock من خلال نموذج Amazon Bedrock Anthropic Claude V2.
يوفر تحليل LLM نتيجة انتهاك (Y أو N) ويشرح الأساس المنطقي وراء قرار النموذج فيما يتعلق بانتهاك السياسة. علاوة على ذلك، تتضمن قاعدة المعرفة وثائق السياسات المرجعية التي يستخدمها التقييم، مما يوفر للمشرفين سياقًا إضافيًا.
Amazon Transcribe كشف السمية
Amazon Transcribe هي خدمة التعرف التلقائي على الكلام (ASR) التي تسهل على المطورين إضافة إمكانية تحويل الكلام إلى نص إلى تطبيقاتهم. يستخدم سير عمل الإشراف الصوتي Amazon Transcribe Toxicity Detection، وهي قدرة مدعومة بالتعلم الآلي (ML) تستخدم الإشارات الصوتية والنصية لتحديد وتصنيف المحتوى السام القائم على الصوت عبر سبع فئات، بما في ذلك التحرش الجنسي وخطاب الكراهية والتهديدات. والإساءة والألفاظ النابية والشتائم واللغة الرسومية. بالإضافة إلى تحليل النص، يستخدم اكتشاف السمية إشارات الكلام مثل النغمات وطبقة الصوت لتحديد النية السامة في الكلام.
يقوم سير عمل الإشراف الصوتي بتنشيط تقييم سياسة LLM فقط عندما يتجاوز تحليل السمية عتبة محددة. يعمل هذا النهج على تقليل زمن الوصول وتحسين التكاليف من خلال تطبيق LLMs بشكل انتقائي، وتصفية جزء كبير من حركة المرور.
استخدم هندسة LLM السريعة لاستيعاب السياسات المخصصة
توفر نماذج اكتشاف السمية المدربة مسبقًا من Amazon Transcribe وAmazon Comprehend تصنيفًا واسعًا للسموم، والذي تستخدمه عادةً المنصات الاجتماعية لإدارة المحتوى الذي ينشئه المستخدم بتنسيقات صوتية ونصية. على الرغم من أن هذه النماذج المدربة مسبقًا تكتشف المشكلات ذات زمن الاستجابة المنخفض بكفاءة، فقد تحتاج إلى حل لاكتشاف الانتهاكات ضد سياسات شركتك أو مجال عملك المحدد، وهو ما لا تستطيع النماذج المدربة مسبقًا تحقيقه بمفردها.
بالإضافة إلى ذلك، اكتشاف الانتهاكات في المحادثات السياقية، مثل تحديد الهوية الاستمالة الجنسية للطفل تتطلب المحادثات حلاً قابلاً للتخصيص يتضمن مراعاة رسائل الدردشة والسياق خارجها، مثل عمر المستخدم وجنسه وسجل المحادثة. هذا هو المكان الذي يمكن أن توفر فيه LLMs المرونة اللازمة لتوسيع هذه المتطلبات.
Amazon Bedrock هي خدمة مُدارة بالكامل توفر مجموعة مختارة من نماذج الأساس عالية الأداء (FMs) من شركات الذكاء الاصطناعي الرائدة. تستخدم هذه الحلول Anthropic Claude v2 من Amazon Bedrock للإشراف على النسخ الصوتية ورسائل الدردشة النصية باستخدام قالب مطالبة مرن، كما هو موضح في التعليمة البرمجية التالية:
يحتوي القالب على عناصر نائبة لوصف السياسة ورسالة الدردشة والقواعد الإضافية التي تتطلب الإشراف. يقدم نموذج Anthropic Claude V2 استجابات بالتنسيق الموجه (Y أو N)، إلى جانب تحليل يوضح سبب اعتقاده بأن الرسالة تنتهك السياسة. يتيح لك هذا الأسلوب تحديد فئات الإشراف المرنة وتوضيح سياساتك باللغة البشرية.
تتضمن الطريقة التقليدية لتدريب نموذج التصنيف الداخلي عمليات مرهقة مثل شرح البيانات والتدريب والاختبار ونشر النموذج، مما يتطلب خبرة علماء البيانات ومهندسي تعلم الآلة. وعلى النقيض من ذلك، توفر LLMs درجة عالية من المرونة. يمكن لمستخدمي الأعمال تعديل المطالبات باللغة البشرية، مما يؤدي إلى تعزيز الكفاءة وتقليل دورات التكرار في التدريب على نموذج تعلم الآلة.
قواعد المعرفة الخاصة بأمازون بيدروك
على الرغم من أن الهندسة السريعة فعالة لتخصيص السياسات، إلا أن إدخال سياسات وقواعد مطولة مباشرة في مطالبات LLM لكل رسالة قد يؤدي إلى زمن الوصول وزيادة التكلفة. ولمعالجة هذه المشكلة، نستخدم قواعد معارف Amazon Bedrock كنظام مُدار للاسترجاع المعزز (RAG). يمكّنك هذا من إدارة مستند السياسة بمرونة، مما يسمح لسير العمل باسترداد أجزاء السياسة ذات الصلة فقط لكل رسالة إدخال. وهذا يقلل من عدد الرموز المميزة المرسلة إلى LLMs للتحليل.
يمكنك استخدام وحدة تحكم إدارة AWS لتحميل مستندات السياسة إلى حاوية S3 ثم فهرسة المستندات إلى قاعدة بيانات متجهة لاسترجاعها بكفاءة. ما يلي هو سير عمل مفاهيمي تديره قاعدة معارف Amazon Bedrock التي تسترد المستندات من Amazon S3، وتقسم النص إلى أجزاء، وتستدعي نموذج تضمين النص Amazon Bedrock Titan لتحويل أجزاء النص إلى ناقلات، والتي يتم بعد ذلك تخزينها في قاعدة بيانات المتجهات.
في هذا الحل نستخدم خدمة Amazon OpenSearch كمخزن ناقلات. أوبن سيرش عبارة عن مجموعة برامج مفتوحة المصدر قابلة للتطوير ومرنة وقابلة للتوسيع للبحث والتحليلات ومراقبة الأمان وتطبيقات المراقبة، مرخصة بموجب ترخيص Apache 2.0. خدمة OpenSearch هي خدمة مُدارة بالكامل تجعل من السهل نشر OpenSearch وتوسيع نطاقه وتشغيله في سحابة AWS.
بعد فهرسة المستند في خدمة OpenSearch، يرسل سير عمل الإشراف على الصوت والنص رسائل محادثة، مما يؤدي إلى تشغيل تدفق الاستعلام التالي لتقييم السياسة المخصصة.
تشبه العملية سير عمل البدء. أولاً، يتم تحويل الرسالة النصية إلى تضمينات نصية باستخدام Amazon Bedrock Titan Text Embedding API. ثم يتم استخدام هذه التضمينات لإجراء ناقلات البحث مقابل قاعدة بيانات خدمة OpenSearch، التي تم ملؤها بالفعل بتضمين المستندات. تقوم قاعدة البيانات بإرجاع قطع السياسة ذات أعلى درجات المطابقة، ذات الصلة بالرسالة النصية المدخلة. نقوم بعد ذلك بتكوين مطالبات تحتوي على كل من رسالة الدردشة المدخلة وجزء السياسة، والتي يتم إرسالها إلى Anthropic Claude V2 للتقييم. يقوم نموذج LLM بإرجاع نتيجة تحليل بناءً على التعليمات السريعة.
للحصول على تعليمات تفصيلية حول كيفية إنشاء مثيل جديد باستخدام وثيقة السياسة الخاصة بك في قاعدة معارف Amazon Bedrock، راجع تقدم قواعد المعرفة الآن تجربة RAG مُدارة بالكامل في Amazon Bedrock.
سير عمل الإشراف على الدردشة النصية
يتبع سير عمل الإشراف على الدردشة النصية نمطًا مشابهًا للإشراف الصوتي، ولكنه يستخدم تحليل السمية من Amazon Comprehend، المصمم خصيصًا للإشراف على النص. يدعم نموذج التطبيق واجهة لتحميل الملفات النصية المجمعة بتنسيق CSV أو TXT ويوفر واجهة رسالة واحدة للاختبار السريع. ويوضح الرسم البياني التالي سير العمل.
يتضمن سير عمل الإشراف على النص الخطوات التالية:
- يقوم المستخدم بتحميل ملف نصي إلى حاوية S3.
- يتم تطبيق تحليل السمية من Amazon Comprehend على الرسالة النصية.
- إذا أظهر تحليل السمية درجة سمية تتجاوز حدًا معينًا (على سبيل المثال، 50%)، فإننا نستخدم قاعدة معارف Amazon Bedrock لتقييم الرسالة مقابل السياسات المخصصة باستخدام Anthropic Claude V2 LLM.
- يتم إرسال تقرير تقييم السياسة إلى الوسيط البشري.
أمازون فهم تحليل السمية
في سير عمل الإشراف على النص، نستخدم تحليل السمية الخاص بـ Amazon Comprehend لتقييم مستوى السمية للرسائل النصية. Amazon Comprehend هي خدمة معالجة لغة طبيعية (NLP) تستخدم التعلم الآلي للكشف عن رؤى واتصالات قيمة في النص. تقوم واجهة برمجة تطبيقات اكتشاف السمية في Amazon Comprehend بتعيين درجة سمية إجمالية لمحتوى النص، تتراوح من 0 إلى 1، مما يشير إلى احتمالية كونه سامًا. كما أنه يصنف النص إلى الفئات التالية ويوفر درجة الثقة لكل منها: hate_speech
، رسم ، harrassement_or_abuse
جنسي, violence_or_threat
، والإهانة، والألفاظ النابية.
في سير عمل الإشراف على النص هذا، يلعب تحليل السمية في Amazon Comprehend دورًا حاسمًا في تحديد ما إذا كانت الرسالة النصية الواردة تحتوي على محتوى سام أم لا. وكما هو الحال مع سير عمل الإشراف الصوتي، فإنه يتضمن شرطًا لتنشيط تقييم سياسة LLM النهائية فقط عندما يُرجع تحليل السمية درجة تتجاوز الحد المحدد مسبقًا. يساعد هذا التحسين على تقليل زمن الوصول الإجمالي والتكلفة المرتبطة بتحليل LLM.
نبذة عامة
في هذا المنشور، قدمنا حلولاً للإشراف على الدردشة الصوتية والنصية باستخدام خدمات AWS، بما في ذلك Amazon Transcribe وAmazon Comprehend وAmazon Bedrock وOpenSearch Service. تستخدم هذه الحلول نماذج مدربة مسبقًا لتحليل السمية ويتم تنسيقها مع LLMs المولدة للذكاء الاصطناعي لتحقيق التوازن الأمثل في الدقة وزمن الوصول والتكلفة. كما أنها تمكّنك من تحديد سياساتك الخاصة بمرونة.
يمكنك تجربة نموذج التطبيق باتباع الإرشادات الموجودة في ملف جيثب ريبو.
عن المؤلف
لانا تشانغ هو مهندس حلول أول في فريق AWS WWSO AI Services، وهو متخصص في الذكاء الاصطناعي والتعلم الآلي للإشراف على المحتوى ورؤية الكمبيوتر ومعالجة اللغات الطبيعية والذكاء الاصطناعي التوليدي. بفضل خبرتها، تكرس جهودها للترويج لحلول AWS AI/ML ومساعدة العملاء في تحويل حلول أعمالهم عبر الصناعات المتنوعة، بما في ذلك وسائل التواصل الاجتماعي والألعاب والتجارة الإلكترونية والإعلام والإعلان والتسويق.
- محتوى مدعوم من تحسين محركات البحث وتوزيع العلاقات العامة. تضخيم اليوم.
- PlatoData.Network Vertical Generative Ai. تمكين نفسك. الوصول هنا.
- أفلاطونايستريم. ذكاء Web3. تضخيم المعرفة. الوصول هنا.
- أفلاطون كربون، كلينتك ، الطاقة، بيئة، شمسي، إدارة المخلفات. الوصول هنا.
- أفلاطون هيلث. التكنولوجيا الحيوية وذكاء التجارب السريرية. الوصول هنا.
- المصدر https://aws.amazon.com/blogs/machine-learning/moderate-audio-and-text-chats-using-aws-ai-services-and-llms/
- :لديها
- :يكون
- :ليس
- :أين
- 100
- 118
- 14
- 7
- a
- من نحن
- سوء المعاملة
- الوصول
- استيعاب
- حسابي
- دقة
- التأهيل
- في
- تفعيل
- تضيف
- إضافة
- إضافي
- معلومات اضافية
- العنوان
- دعاية
- ضد
- السن
- AI
- خدمات الذكاء الاصطناعي
- AI / ML
- الكل
- السماح
- يسمح
- وحده
- على طول
- سابقا
- أيضا
- بالرغم ان
- أمازون
- فهم الأمازون
- الأمازون النسخ
- أمازون ويب سيرفيسز
- an
- تحليل
- تحليلات
- تحليل
- و
- أنثروبي
- أباتشي
- API
- التطبيق
- تطبيق
- التطبيقات
- تطبيقي
- التقديم
- تطبيق
- نهج
- اقتراب
- هي
- AS
- تقييم
- مساعدة
- المساعد
- مساعدة
- أسوشيتد
- At
- سمعي
- المعزز
- المؤلفة
- أوتوماتيك
- متاح
- AWS
- الرصيد
- أرصدة
- قاعدة
- على أساس
- BE
- كان
- يبدأ
- وراء
- يجري
- على حد سواء
- كسر
- واسع
- الأعمال
- لكن
- by
- CAN
- قدرة
- الفئات
- معين
- تحدي
- الدردشة
- القطط
- خيار
- تصنيف
- صنف
- سحابة
- الكود
- عادة
- التواصل
- المجتمعات
- الشركات
- حول الشركة
- فهم
- الكمبيوتر
- رؤية الكمبيوتر
- المفاهيمي
- حالة
- أجرت
- الثقة
- التواصل
- نظر
- نظرت
- النظر
- يحتوي
- محتوى
- سياق الكلام
- قريني
- تباين
- محادثة
- المحادثات
- تحول
- تحويلها
- التكلفة
- التكاليف
- استطاع
- خلق
- حرج
- حاسم
- مرهقة
- العملاء
- للتخصيص
- التخصيص
- حسب الطلب
- دورات
- البيانات
- قاعدة البيانات
- تقرر
- القرار
- مخصصة
- حدد
- الدرجة العلمية
- يسلم
- نشر
- نشر
- وصف
- مفصلة
- بكشف أو
- كشف
- حدد
- المطورين
- رسم بياني
- مباشرة
- عرض
- عدة
- وثيقة
- وثائق
- هل
- نطاق
- إلى أسفل
- التجارة الإلكترونية
- كل
- كفاءة
- فعال
- بكفاءة
- إما
- تضمين
- تمكين
- تمكين
- تمكين
- تمكن
- الهندسة
- المهندسين
- تعزيز
- تقييم
- تقييم
- مثال
- تجاوز
- يتجاوز
- الخبره في مجال الغطس
- خبير
- خبرة
- شرح
- ويوضح
- مد
- العوامل
- قم بتقديم
- ملفات
- تصفية
- الاسم الأول
- مرونة
- مرن
- بمرونة
- تدفق
- متابعيك
- متابعات
- في حالة
- شكل
- دورة تأسيسية
- ودود
- تبدأ من
- تماما
- وظيفة
- علاوة على ذلك
- الألعاب
- منصة الألعاب
- الجنس
- جيل
- توليدي
- الذكاء الاصطناعي التوليدي
- Graphic
- الضارة
- كراهية
- يساعد
- لها
- مرتفع
- عالية الأداء
- أعلى
- تسليط الضوء
- تاريخ
- كيفية
- كيفية
- لكن
- HTML
- HTTP
- HTTPS
- الانسان
- تحديد
- تحديد
- if
- يوضح
- فوري
- in
- يشمل
- بما فيه
- الوارد
- القيمة الاسمية
- مؤشر
- مفهرس
- يشير
- مبينا
- الصناعات
- معلومات
- وأبلغ
- بدء
- بدأت
- يبادر
- استهلال
- إدخال
- رؤى
- مثل
- تعليمات
- إهانة
- نية
- السطح البيني
- إلى
- تقديم
- أدخلت
- التحقيق
- التذرع
- يتضرع
- ينطوي
- مسائل
- IT
- تكرير
- انها
- وظيفة
- JPG
- احتفظ
- المعرفة
- لغة
- كبير
- كمون
- قيادة
- قيادة
- تعلم
- مستوى
- حقوق الملكية الفكرية
- مرخص
- أرجحية
- LLM
- منخفض
- آلة
- آلة التعلم
- جعل
- يصنع
- إدارة
- تمكن
- إدارة
- إدارة
- كثير
- التسويق
- مطابقة
- مايو..
- يعني
- الوسائط
- الرسالة
- رسائل
- طريقة
- يقلل
- ML
- نموذج
- عارضات ازياء
- الاعتدال
- الاعتدال
- الاعتدال
- تعديل
- مراقبة
- الأكثر من ذلك
- يجب
- طبيعي
- معالجة اللغات الطبيعية
- حاجة
- بحاجة
- جديد
- البرمجة اللغوية العصبية
- الآن
- عدد
- of
- عرض
- عروض
- غالبا
- on
- فقط
- جاكيت
- المصدر المفتوح
- طريقة التوسع
- الأمثل
- التحسين
- المثلى
- or
- مدبرة
- بتدبير
- أصلي
- أخرى
- خارج
- أوجز
- في الخارج
- الكلي
- الخاصة
- سلبي
- نمط
- نفذ
- خط أنابيب
- رمية
- المنصة
- منصات التداول
- أفلاطون
- الذكاء افلاطون البيانات
- أفلاطون داتا
- يلعب
- من فضلك
- سياسات الخصوصية والبيع
- سياسة
- مأهول
- جزء
- منشور
- معرفة مسبقا
- استباقية
- مشاكل
- عملية المعالجة
- العمليات
- معالجة
- شتم
- تعزيز
- مطالبات
- تزود
- ويوفر
- توفير
- سؤال
- سريع
- خرقة
- تتراوح
- المنطق
- تلقى
- يتلقى
- يستلم
- اعتراف
- سجل
- تسجيل
- تخفيض
- عقار مخفض
- يقلل
- الرجوع
- المشار إليه
- بخصوص
- ذات صلة
- ذات الصلة
- اعتمد
- تقرير
- وذكرت
- التقارير
- يمثل
- تطلب
- المتطلبات الأساسية
- يتطلب
- الرد
- ردود
- نتيجة
- النتائج
- استرجاع
- عائدات
- مراجعة
- التعليقات
- النوع
- غرفة
- قاعدة
- القواعد
- خزنة
- السلامة
- عينة
- تلبية
- تحجيم
- حجم
- الحيل
- العلماء
- أحرز هدفاً
- بحث
- القسم
- أمن
- طلب
- قطعة
- شرائح
- يرسل
- كبير
- أرسلت
- الخدمة
- خدماتنا
- طقم
- سبعة
- جنسي
- هي
- يظهر
- هام
- مماثل
- الاشارات
- بساطة
- العدالة
- وسائل التواصل الاجتماعي
- المنصات الاجتماعية
- تطبيقات الكمبيوتر
- فقط
- حل
- الحلول
- مصدر
- متخصصة
- محدد
- خطاب
- التعرف على الكلام
- الكلام إلى نص
- الإنشقاقات
- تحدث
- خطوات
- تخزين
- متجر
- تخزين
- تخزين
- صريح
- هذه
- جناح
- الدعم
- الدعم
- نظام
- TAG
- تناسب
- اتخذت
- التصنيف
- فريق
- قالب
- الاختبار
- نص
- أن
- •
- من مشاركة
- منهم
- then
- تشبه
- هم
- يعتقد
- التهديدات
- عتبة
- عبر
- استهلاك الوقت
- عملاق
- إلى
- اليوم
- الرموز
- تقليدي
- حركة المرور
- قادة الإيمان
- تحويل
- يثير
- أثار
- اثار
- الثقة
- كشف
- مع
- تحميل
- تستخدم
- مستعمل
- مستخدم
- المستخدمين
- يستخدم
- استخدام
- القيمة
- مختلف
- التحقق
- عنيف
- انتهاكات
- رؤيتنا
- صوت
- we
- الويب
- خدمات ويب
- متى
- سواء
- التي
- في حين
- لماذا
- ويكيبيديا
- سوف
- مع
- في غضون
- بدون
- كلمات
- سير العمل
- أنت
- حل متجر العقارات الشامل الخاص بك في جورجيا
- زفيرنت