التعرف تلقائيًا على اللغات في الصوت متعدد اللغات باستخدام Amazon Transcribe PlatoBlockchain Data Intelligence. البحث العمودي. منظمة العفو الدولية.

تحديد اللغات تلقائيًا بصوت متعدد اللغات باستخدام Amazon Transcribe

إذا كنت تعمل في بلد به لغات رسمية متعددة أو عبر مناطق متعددة ، يمكن أن تحتوي ملفاتك الصوتية على لغات مختلفة. قد يتحدث المشاركون لغات مختلفة تمامًا أو يمكنهم التبديل بين اللغات. ضع في اعتبارك مكالمة خدمة العملاء للإبلاغ عن مشكلة في منطقة بها عدد كبير من السكان متعددي اللغات. على الرغم من أن المحادثة يمكن أن تبدأ بلغة واحدة ، فمن الممكن أن يتغير العميل إلى لغة أخرى لوصف المشكلة ، اعتمادًا على مستوى الراحة أو تفضيلات الاستخدام مع اللغات الأخرى. على نفس المنوال ، قد ينتقل ممثل خدمة العملاء بين اللغات أثناء نقل تعليمات التشغيل أو استكشاف الأخطاء وإصلاحها.

مع ما لا يقل عن 3 ثوانٍ من الصوت ، الأمازون النسخ يمكنه تحديد النصوص تلقائيًا وإنشاؤها بكفاءة باللغات المنطوقة في الصوت دون الحاجة إلى تحديد البشر للغات. ينطبق هذا على حالات الاستخدام المختلفة مثل تحويل مكالمات العملاء أو تحويل رسائل البريد الصوتي إلى نص أو التقاط تفاعلات الاجتماع أو تتبع اتصالات منتدى المستخدم أو مراقبة إنتاج محتوى الوسائط وسير عمل الترجمة.

يستعرض هذا المنشور خطوات نسخ ملف صوتي متعدد اللغات باستخدام Amazon Transcribe. نناقش كيفية إتاحة الملفات الصوتية لـ Amazon Transcribe وتمكين نسخ الملفات الصوتية متعددة اللغات عند استدعاء Amazon Transcribe APIs.

حل نظرة عامة

Amazon Transcribe هي خدمة AWS تسهل عليك تحويل الكلام إلى نص. تعد إضافة الكلام إلى وظائف النص إلى أي تطبيق أمرًا بسيطًا بمساعدة Amazon Transcribe ، وهي خدمة التعرف التلقائي على الكلام (ASR). يمكنك استيعاب إدخال الصوت باستخدام Amazon Transcribe ، وإنشاء نصوص واضحة يسهل قراءتها ومراجعتها ، وزيادة الدقة مع التخصيص ، وتصفية المعلومات لحماية خصوصية العميل.

الحل يستخدم أيضا خدمة تخزين أمازون البسيطة (Amazon S3) ، خدمة تخزين كائنات مصممة لتخزين واسترداد أي كمية من البيانات من أي مكان. إنها خدمة تخزين بسيطة توفر المتانة والتوافر والأداء والأمان الرائدين في الصناعة وقابلية التوسع غير المحدودة تقريبًا بتكلفة منخفضة للغاية. عندما تقوم بتخزين البيانات في Amazon S3 ، فإنك تعمل مع الموارد المعروفة باسم دلاء و الأجسام. الدلو هو حاوية للأشياء. الكائن هو ملف وأي بيانات وصفية تصف الملف.

في هذا المنشور ، نوجهك عبر الخطوات التالية لتنفيذ حل نسخ صوتي متعدد اللغات:

  1. قم بإنشاء حاوية S3.
  2. تحميل ملف الصوت الخاص بك إلى دلو.
  3. قم بإنشاء وظيفة النسخ.
  4. راجع إخراج الوظيفة.

المتطلبات الأساسية المسبقة

في هذا الدليل ، يجب أن يكون لديك المتطلبات الأساسية التالية:

توفر Amazon Transcribe خيار تخزين المخرجات المكتوبة إما في حاوية S3 مُدارة بواسطة الخدمة أو بواسطة العميل. بالنسبة لهذا المنشور ، لدينا Amazon Transcribe لكتابة النتائج إلى حاوية S3 مُدارة للخدمة.

لاحظ أن Amazon Transcribe هي خدمة إقليمية وأن نقاط نهاية Amazon Transcribe API التي يتم استدعاؤها يجب أن تكون في نفس المنطقة مثل حاويات S3.

قم بإنشاء حاوية S3 لتخزين ملفات إدخال الصوت الخاصة بك

لإنشاء حاوية S3 ، أكمل الخطوات التالية:

  1. في وحدة تحكم Amazon S3 ، اختر إنشاء دلو.
  2. في حالة اسم الدلو، أدخل اسمًا فريدًا عالميًا للحاوية.
  3. في حالة منطقة AWS، اختر نفس المنطقة مثل نقاط نهاية Amazon Transcribe API الخاصة بك.
    التعرف تلقائيًا على اللغات في الصوت متعدد اللغات باستخدام Amazon Transcribe PlatoBlockchain Data Intelligence. البحث العمودي. منظمة العفو الدولية.
  4. اترك كل الافتراضيات كما هي.
  5. اختار إنشاء دلو.
    التعرف تلقائيًا على اللغات في الصوت متعدد اللغات باستخدام Amazon Transcribe PlatoBlockchain Data Intelligence. البحث العمودي. منظمة العفو الدولية.

قم بتحميل ملف الصوت الخاص بك إلى حاوية S3

قم بتحميل ملف الصوت متعدد اللغات إلى حاوية S3 في حساب AWS الخاص بك. لغرض هذا التمرين ، نستخدم العينة التالية ملف صوتي متعدد اللغات. إنه يلتقط مكالمة دعم العملاء التي تتضمن اللغتين الإنجليزية والإسبانية.

  1. في وحدة تحكم Amazon S3 ، اختر الدلاء في جزء التنقل.
  2. اختر الحاوية التي قمت بإنشائها مسبقًا لتخزين ملفات الصوت المدخلة.
  3. اختار تحميل.
    التعرف تلقائيًا على اللغات في الصوت متعدد اللغات باستخدام Amazon Transcribe PlatoBlockchain Data Intelligence. البحث العمودي. منظمة العفو الدولية.
  4. اختار إضافة ملفات.
    التعرف تلقائيًا على اللغات في الصوت متعدد اللغات باستخدام Amazon Transcribe PlatoBlockchain Data Intelligence. البحث العمودي. منظمة العفو الدولية.
  5. اختر ملف الصوت الذي تريد نسخه من جهاز الكمبيوتر المحلي الخاص بك.
    التعرف تلقائيًا على اللغات في الصوت متعدد اللغات باستخدام Amazon Transcribe PlatoBlockchain Data Intelligence. البحث العمودي. منظمة العفو الدولية.
  6. اختار تحميل.
    التعرف تلقائيًا على اللغات في الصوت متعدد اللغات باستخدام Amazon Transcribe PlatoBlockchain Data Intelligence. البحث العمودي. منظمة العفو الدولية.

سيكون ملفك الصوتي متاحًا قريبًا في حاوية S3.

قم بإنشاء وظيفة النسخ

مع تحميل الملف الصوتي ، نقوم الآن بإنشاء وظيفة نسخ.

  1. في وحدة تحكم Amazon Transcribe ، اختر وظائف النسخ في جزء التنقل.
  2. اختار خلق وظيفة.
    التعرف تلقائيًا على اللغات في الصوت متعدد اللغات باستخدام Amazon Transcribe PlatoBlockchain Data Intelligence. البحث العمودي. منظمة العفو الدولية.
  3. في حالة الاسم، أدخل اسمًا فريدًا للوظيفة.
    سيكون هذا أيضًا اسم ملف نص الإخراج.
  4. في حالة اعدادات اللغة، حدد تحديد تلقائي متعدد اللغات.
    تمكّن هذه الميزة Amazon Transcribe من تحديد جميع اللغات المنطوقة في الملف الصوتي ونسخها تلقائيًا.
    التعرف تلقائيًا على اللغات في الصوت متعدد اللغات باستخدام Amazon Transcribe PlatoBlockchain Data Intelligence. البحث العمودي. منظمة العفو الدولية.
  5. في حالة خيارات اللغة للتعرف التلقائي على اللغة، اتركه غير محدد.
    يقوم Amazon Transcribe تلقائيًا بتحديد وتسجيل جميع اللغات المنطوقة في الصوت. لتحسين دقة النسخ ، يمكنك اختياريًا تحديد لغتين أو أكثر تعرف أنه تم التحدث بها في الصوت.
    التعرف تلقائيًا على اللغات في الصوت متعدد اللغات باستخدام Amazon Transcribe PlatoBlockchain Data Intelligence. البحث العمودي. منظمة العفو الدولية.
  6. في حالة نوع النموذج، فقط النموذج العام الخيار متاح في وقت كتابة هذا المنشور.
  7. في حالة ادخال البيانات، اختر تصفح S3.
  8. اختر ملف مصدر الصوت الذي قمنا بتحميله مسبقًا.
    التعرف تلقائيًا على اللغات في الصوت متعدد اللغات باستخدام Amazon Transcribe PlatoBlockchain Data Intelligence. البحث العمودي. منظمة العفو الدولية.
  9. في حالة بيانات الناتج، يمكنك تحديد أي منهما حاوية S3 المُدارة بواسطة الخدمة or حدد العميل دلو S3. لهذه الوظيفة ، حدد حاوية S3 المُدارة بواسطة الخدمة.
    التعرف تلقائيًا على اللغات في الصوت متعدد اللغات باستخدام Amazon Transcribe PlatoBlockchain Data Intelligence. البحث العمودي. منظمة العفو الدولية.
  10. اختار التالى.
  11. اختار خلق وظيفة.

راجع إخراج الوظيفة

عند اكتمال مهمة النسخ ، افتح وظيفة النسخ.
التعرف تلقائيًا على اللغات في الصوت متعدد اللغات باستخدام Amazon Transcribe PlatoBlockchain Data Intelligence. البحث العمودي. منظمة العفو الدولية.

انتقل لأسفل إلى معاينة النسخ الجزء. يتم عرض النسخ الصوتي على ملف نص التبويب. يتضمن النسخ كلا الجزأين الإنجليزية والإسبانية من المحادثة.
التعرف تلقائيًا على اللغات في الصوت متعدد اللغات باستخدام Amazon Transcribe PlatoBlockchain Data Intelligence. البحث العمودي. منظمة العفو الدولية.

يمكنك اختياريًا تنزيل نسخة من النص كملف JSON ، والذي يمكنك استخدامه لمزيد من المعلومات تحليلات ما بعد المكالمة.

تنظيف

لتجنب تكبد رسوم في المستقبل ، قم بإفراغ وحذف حاوية S3 التي قمت بإنشائها لتخزين ملف مصدر صوت الإدخال. تأكد من تخزين الملفات في مكان آخر لأن هذا سيؤدي إلى إزالة جميع الكائنات الموجودة داخل الحاوية بشكل دائم. في وحدة تحكم Amazon Transcribe ، حدد وحذف الوظيفة التي تم إنشاؤها مسبقًا للنسخ.

وفي الختام

في هذا المنشور ، أنشأنا سير عمل شامل لأتمتة تحديد ونسخ ملفات الصوت متعددة اللغات ، دون كتابة أي رمز. استخدمنا الوظيفة الجديدة في Amazon Transcribe لتحديد اللغات المختلفة تلقائيًا في ملف صوتي ونسخ كل لغة بشكل صحيح.

لمزيد من المعلومات ، راجع تحديد اللغة مع وظائف النسخ الدفعي.


حول المؤلف

التعرف تلقائيًا على اللغات في الصوت متعدد اللغات باستخدام Amazon Transcribe PlatoBlockchain Data Intelligence. البحث العمودي. منظمة العفو الدولية.مورتوزا بوتوالا هو كبير مهندسي الحلول في AWS وله اهتمام بتقنيات الذكاء الاصطناعي / تعلم الآلة. إنه يستمتع بالعمل مع العملاء لمساعدتهم على تحقيق نتائج أعمالهم. خارج العمل ، يستمتع بالأنشطة في الهواء الطلق وقضاء الوقت مع العائلة.

التعرف تلقائيًا على اللغات في الصوت متعدد اللغات باستخدام Amazon Transcribe PlatoBlockchain Data Intelligence. البحث العمودي. منظمة العفو الدولية.فيكتور روجو شغوف بالذكاء الاصطناعي / تعلم الآلة وتطوير البرمجيات. ساعد في إنشاء Amazon Alexa وتشغيله في الولايات المتحدة والمكسيك. كما أنه أحضر Amazon Textract إلى شركاء AWS وأطلق AWS Contact Center Intelligence (CCI) بعيدًا. وهو حاليًا القائد التقني العالمي لشركاء الذكاء الاصطناعي للمحادثة.

التعرف تلقائيًا على اللغات في الصوت متعدد اللغات باستخدام Amazon Transcribe PlatoBlockchain Data Intelligence. البحث العمودي. منظمة العفو الدولية.بابو سرينيفاسان متخصص في AWS Sr. SA (خدمات الذكاء الاصطناعي اللغوي) ومقره شيكاغو. يركز على Amazon Transcribe (تحويل الكلام إلى نص) ، لمساعدة عملائنا على استخدام خدمات الذكاء الاصطناعي لحل مشاكل العمل. خارج العمل ، يستمتع بالأعمال الخشبية وأداء العروض السحرية.

الطابع الزمني:

اكثر من التعلم الآلي من AWS