الأمازون النسخ هي خدمة التعرف التلقائي على الكلام (ASR) المُدارة بالكامل والتي تسهل عليك إضافة إمكانات تحويل الكلام إلى نص إلى تطبيقاتك. اليوم، يسعدنا أن نعلن عن الجيل التالي من النظام المستند إلى نموذج أساس الكلام والذي يتضمن عدة مليارات من المعلمات والذي يعمل على توسيع نطاق التعرف التلقائي على الكلام ليشمل أكثر من ۱٦ لغة. نناقش في هذا المنشور بعض فوائد هذا النظام وكيفية استخدام الشركات له وكيفية البدء. نقدم أيضًا مثالاً على إخراج النسخ أدناه.
يتم تدريب نموذج تأسيس الكلام الخاص بـ Transcribe باستخدام أفضل الخوارزميات ذاتية الإشراف في فئتها لتعلم الأنماط العالمية المتأصلة للكلام البشري عبر اللغات واللهجات. وقد تم تدريبه على ملايين الساعات من البيانات الصوتية غير المسماة من أكثر من 100 لغة. تم تحسين وصفات التدريب من خلال أخذ عينات البيانات الذكية لموازنة بيانات التدريب بين اللغات، مما يضمن وصول اللغات الممثلة تمثيلاً ناقصًا تقليديًا أيضًا إلى مستويات دقة عالية.
Carbyne هي شركة برمجيات تعمل على تطوير حلول مركز الاتصال المستندة إلى السحابة والمهام الحرجة للمستجيبين لمكالمات الطوارئ. تتمثل مهمة Carbyne في مساعدة المستجيبين للطوارئ على إنقاذ الأرواح، ولا يمكن للغة أن تقف في طريق تحقيق أهدافهم. إليك كيفية استخدام Amazon Transcribe لمتابعة مهمتهم:
"تهدف الترجمة الصوتية المباشرة لـ Carbyne المدعومة بالذكاء الاصطناعي بشكل مباشر إلى المساعدة في تحسين الاستجابة لحالات الطوارئ لـ 68 مليون أمريكي يتحدثون لغة أخرى غير الإنجليزية في المنزل، بالإضافة إلى ما يصل إلى 79 مليون زائر أجنبي للبلاد سنويًا. من خلال الاستفادة من النموذج الأساسي الجديد متعدد اللغات الخاص بـ Amazon Transcribe والذي يدعم ASR، سيكون Carbyne مجهزًا بشكل أفضل لإضفاء الطابع الديمقراطي على خدمات الطوارئ المنقذة للحياة، لأن كل. شخص. العد."
- أليكس ديزنغوف، المؤسس المشارك والرئيس التنفيذي للتكنولوجيا في Carbyne.
من خلال الاستفادة من نموذج أساس الكلام، توفر Amazon Transcribe تحسينًا كبيرًا في الدقة بنسبة تتراوح بين 20% و50% عبر معظم اللغات. في مجال الكلام الهاتفي، وهو مجال مليء بالتحديات وندرة البيانات، يتراوح تحسين الدقة بين 30% و70%. بالإضافة إلى التحسين الكبير في الدقة، يقدم نموذج ASR الكبير هذا أيضًا تحسينات في إمكانية القراءة من خلال علامات الترقيم والأحرف الكبيرة الأكثر دقة. مع ظهور الذكاء الاصطناعي التوليدي، تستخدم آلاف المؤسسات Amazon Transcribe لفتح رؤى غنية من محتواها الصوتي. بفضل الدقة المحسنة بشكل كبير والدعم لأكثر من 100 لغة، ستؤثر Amazon Transcribe بشكل إيجابي على جميع حالات الاستخدام هذه. يمكن لجميع العملاء الحاليين والجدد الذين يستخدمون Amazon Transcribe في الوضع الدفعي الوصول إلى التعرف على الكلام المستند إلى نموذج أساس الكلام دون الحاجة إلى أي تغيير في نقطة نهاية واجهة برمجة التطبيقات أو معلمات الإدخال.
يوفر نظام ASR الجديد العديد من الميزات الرئيسية عبر أكثر من 100 لغة تتعلق بسهولة الاستخدام والتخصيص وسلامة المستخدم والخصوصية. يتضمن ذلك ميزات مثل علامات الترقيم التلقائية، والمفردات المخصصة، والتعرف التلقائي على اللغة، وتدوين المتحدث، ودرجات الثقة على مستوى الكلمات، ومرشح المفردات المخصص. يمكّنك الدعم الموسع للنظام لللكنات المختلفة وبيئات الضوضاء والظروف الصوتية من إنتاج مخرجات أكثر دقة وبالتالي يساعدك على تضمين تقنيات الصوت بشكل فعال في تطبيقاتك.
بفضل الدقة العالية التي يتمتع بها Amazon Transcribe عبر اللهجات وظروف الضوضاء المختلفة، ودعمه لعدد كبير من اللغات، واتساع مجموعات الميزات ذات القيمة المضافة، سيتم تمكين آلاف المؤسسات من فتح رؤى غنية من المحتوى الصوتي الخاص بهم، بالإضافة إلى زيادة إمكانية الوصول إلى محتوى الصوت والفيديو الخاص بهم وإمكانية اكتشافه عبر المجالات المختلفة. على سبيل المثال، تقوم مراكز الاتصال بنسخ وتحليل مكالمات العملاء لتحديد الرؤى ومن ثم تحسين تجربة العملاء وإنتاجية الوكيل. يقوم منتجو المحتوى وموزعو الوسائط تلقائيًا بإنشاء ترجمات باستخدام Amazon Transcribe لتحسين إمكانية الوصول إلى المحتوى.
ابدأ مع Amazon Transcribe
يمكنك استخدام واجهة سطر الأوامر AWS (AWS CLI) ، وحدة تحكم إدارة AWSومختلف مجموعات AWS SDK للنسخ المجمعة والاستمرار في استخدام نفسه StartTranscriptionJob
واجهة برمجة التطبيقات (API) للحصول على فوائد الأداء من نموذج ASR المحسّن دون الحاجة إلى إجراء أي تغييرات في التعليمات البرمجية أو المعلمات من جانبك. لمزيد من المعلومات حول استخدام AWS CLI ووحدة التحكم، راجع النسخ باستخدام AWS CLI و النسخ باستخدام وحدة الإدارة في AWS، على التوالي.
الخطوة الأولى هي تحميل ملفات الوسائط الخاصة بك إلى ملف خدمة تخزين أمازون البسيطة دلو (Amazon S3)، عبارة عن خدمة تخزين كائنات مصممة لتخزين واسترجاع أي كمية من البيانات من أي مكان. يوفر Amazon S3 المتانة والتوافر والأداء والأمان الرائدة في الصناعة وقابلية التوسع غير المحدودة تقريبًا بتكلفة منخفضة جدًا. يمكنك اختيار حفظ النص الخاص بك في حاوية S3 الخاصة بك، أو جعل Amazon Transcribe يستخدم حاوية افتراضية آمنة. لمعرفة المزيد حول استخدام مجموعات S3، راجع إنشاء مجموعات Amazon S3 وتكوينها والعمل معها.
إخراج النسخ
يستخدم Amazon Transcribe تمثيل JSON لمخرجاته. يوفر نتيجة النسخ بتنسيقين مختلفين: تنسيق النص والتنسيق المفصل. لا شيء يتغير فيما يتعلق بنقطة نهاية API أو معلمات الإدخال.
يوفر تنسيق النص النص ككتلة نصية، في حين يوفر التنسيق المفصل النص في شكل عناصر مكتوبة مرتبة في الوقت المناسب، إلى جانب بيانات التعريف الإضافية لكل عنصر. كلا التنسيقين موجودان بالتوازي في ملف الإخراج.
اعتمادًا على الميزات التي تحددها عند إنشاء مهمة النسخ، تقوم Amazon Transcribe بإنشاء طرق عرض إضافية ومُثرية لنتيجة النسخ. راجع رمز المثال التالي:
وجهات النظر هي كما يلي:
- كتابة و تفريغ النصوص – ممثلة ب
transcripts
العنصر، فهو يحتوي فقط على تنسيق نص النص. في السيناريوهات متعددة المتحدثين والقنوات، يتم توفير تسلسل جميع النصوص ككتلة واحدة. - متحدثاً – ممثلة ب
speaker_labels
العنصر، فهو يحتوي على النص والتنسيقات المفصلة للنص المجمعة حسب المتحدث. إنه متاح فقط عند تمكين ميزة السماعات المتعددة. - القنوات – ممثلة ب
channel_labels
العنصر، فهو يحتوي على النص والتنسيقات المفصلة للنص، مجمعة حسب القناة. إنه متاح فقط عند تمكين ميزة القنوات المتعددة. - المنتجات – ممثلة ب
items
العنصر، فهو يحتوي فقط على التنسيق المفصل للنص. في السيناريوهات متعددة المتحدثين والقنوات، يتم إثراء العناصر بخصائص إضافية، تشير إلى مكبر الصوت والقناة. - شرائح – ممثلة ب
segments
العنصر، فهو يحتوي على النص والتنسيقات المفصلة للنص، مجمعة حسب النسخ البديل. إنه متاح فقط عند تمكين ميزة النتائج البديلة.
وفي الختام
في AWS، نحن نبتكر باستمرار نيابة عن عملائنا. من خلال توسيع دعم اللغة في Amazon Transcribe إلى أكثر من 100 لغة، فإننا نمكن عملائنا من خدمة المستخدمين من خلفيات لغوية متنوعة. وهذا لا يعزز إمكانية الوصول فحسب، بل يفتح أيضًا طرقًا جديدة للاتصالات وتبادل المعلومات على نطاق عالمي. لمعرفة المزيد حول الميزات التي تمت مناقشتها في هذا المنشور، راجع ذلك صفحة الميزات و ما هو آخر جديد.
عن المؤلفين
سوميت كومار هو مدير المنتج الرئيسي، الفني في فريق خدمات اللغة AWS AI. يتمتع بخبرة 10 سنوات في إدارة المنتجات عبر مجموعة متنوعة من المجالات وهو شغوف بالذكاء الاصطناعي/التعلم الآلي. خارج العمل، يحب سوميت السفر ويستمتع بلعب الكريكيت والتنس.
فيفيك سينغ هو مدير أول لإدارة المنتجات في فريق خدمات اللغة AWS AI. يقود فريق منتج Amazon Transcribe. قبل انضمامه إلى AWS، شغل مناصب في إدارة المنتجات عبر العديد من مؤسسات Amazon الأخرى مثل مدفوعات المستهلكين والبيع بالتجزئة. يعيش فيفيك في سياتل، واشنطن ويستمتع بالجري والمشي لمسافات طويلة.
- محتوى مدعوم من تحسين محركات البحث وتوزيع العلاقات العامة. تضخيم اليوم.
- PlatoData.Network Vertical Generative Ai. تمكين نفسك. الوصول هنا.
- أفلاطونايستريم. ذكاء Web3. تضخيم المعرفة. الوصول هنا.
- أفلاطون كربون، كلينتك ، الطاقة، بيئة، شمسي، إدارة المخلفات. الوصول هنا.
- أفلاطون هيلث. التكنولوجيا الحيوية وذكاء التجارب السريرية. الوصول هنا.
- المصدر https://aws.amazon.com/blogs/machine-learning/amazon-transcribe-announces-a-new-speech-foundation-model-powered-asr-system-that-expands-support-to-over-100-languages/
- :لديها
- :يكون
- :ليس
- $ UP
- 10
- 100
- 14
- 24
- 7
- a
- من نحن
- الوصول
- إمكانية الوصول
- دقة
- دقيق
- في
- تضيف
- إضافة
- إضافي
- مجيء
- الوكيل
- AI
- AI / ML
- تهدف
- اليكس
- خوارزميات
- الكل
- على طول
- أيضا
- البديل
- أمازون
- الأمازون النسخ
- أمازون ويب سيرفيسز
- الأميركيين
- كمية
- an
- تحليل
- و
- أعلن
- تعلن
- سنوياً
- أي وقت
- في أى مكان
- API
- التطبيقات
- هي
- AS
- At
- سمعي
- أوتوماتيك
- تلقائيا
- توفر
- متاح
- السبل
- AWS
- خلفيات
- الرصيد
- BE
- لان
- باسمى او لاجلى
- أقل من
- الفوائد
- أفضل
- ما بين
- حظر
- على حد سواء
- سعة
- بنيت
- لكن
- by
- دعوة
- دعوات
- CAN
- قدرات
- رسملة
- الحالات
- مركز
- مراكز
- تحدي
- تغيير
- التغييرات
- قناة
- قنوات
- التحقق
- اختار
- المؤسس المشارك
- الكود
- Communication
- الشركات
- حول الشركة
- الطلب مكتمل
- الشروط
- الثقة
- تكوين
- كنسولات
- باستمرار
- مستهلك
- التواصل
- مركز الاتصال
- يحتوي
- محتوى
- استمر
- التكلفة
- البلد
- يخلق
- خلق
- كريكيت
- CTO
- على
- زبون
- تجربة العملاء
- العملاء
- التخصيص
- البيانات
- الترتيب
- يسلم
- دمقرطة
- يطور
- مختلف
- مباشرة
- بحث
- ناقش
- الموزعين
- عدة
- نطاق
- المجالات
- متانة
- سهولة
- سهولة الاستخدام
- على نحو فعال
- إما
- العنصر
- تضمين
- حالة طوارئ
- تمكين
- تمكين
- تمكين
- تمكن
- النهاية
- نقطة النهاية
- انجليزي
- تعزيز
- يعزز
- المخصب
- ضمان
- الشركات
- البيئات
- مسلح
- حتى
- كل
- مثال
- تبادل
- يوجد
- القائمة
- موسع
- توسع
- الخبره في مجال الغطس
- إطالة
- الميزات
- المميزات
- قم بتقديم
- ملفات
- تصفية
- الاسم الأول
- متابعيك
- متابعات
- في حالة
- أجنبي
- النموذج المرفق
- شكل
- دورة تأسيسية
- تبدأ من
- تماما
- توليد
- توليدي
- الذكاء الاصطناعي التوليدي
- دولار فقط واحصل على خصم XNUMX% على جميع
- العالمية
- نطاق عالمي
- الأهداف
- سعيد
- يملك
- he
- عقد
- مساعدة
- مساعدة
- يساعد
- هنا
- hi
- مرتفع
- الصفحة الرئيسية
- ساعات العمل
- كيفية
- كيفية
- HTML
- HTTP
- HTTPS
- الانسان
- هوية
- تحديد
- التأثير
- تحسن
- تحسن
- تحسين
- تحسينات
- in
- تتضمن
- القيمة الاسمية
- الرائدة في صناعة
- معلومات
- متأصل
- ابتكار
- إدخال
- رؤى
- مثل
- إلى
- IT
- العناصر
- انها
- وظيفة
- انضمام
- JPG
- جسون
- القفل
- لغة
- اللغات
- كبير
- يؤدي
- تعلم
- ومستوياتها
- الاستفادة من
- خط
- حي
- حياة
- يحب
- منخفض
- جعل
- يصنع
- تمكن
- إدارة
- مدير
- الوسائط
- البيانات الوصفية
- مليون
- ملايين
- الرسالة
- موضة
- نموذج
- الأكثر من ذلك
- أكثر
- الحاجة
- جديد
- الجيل القادم
- ضجيج
- لا شى
- عدد
- موضوع
- of
- عروض
- on
- فقط
- يفتح
- الأمثل
- or
- المنظمات
- أخرى
- لنا
- خارج
- الناتج
- النتائج
- في الخارج
- على مدى
- الخاصة
- موازية
- المعلمة
- المعلمات
- عاطفي
- أنماط
- المدفوعات
- إلى
- أداء
- شخص
- أفلاطون
- الذكاء افلاطون البيانات
- أفلاطون داتا
- لعب
- بصورة إيجابية
- منشور
- مدعوم
- رئيسي
- قبل
- خصوصية
- إنتاج
- المنتجين
- المنتج
- ادارة المنتج
- مدير المنتج
- إنتاجية
- HAS
- تزود
- المقدمة
- ويوفر
- لاحق
- الوصول
- اعتراف
- الرجوع
- ذات صلة
- التمثيل
- ممثلة
- احترام
- على التوالي
- استجابة
- نتيجة
- النتائج
- بيع بالتجزئة
- النوادي الثرية
- الأدوار
- تشغيل
- السلامة
- نفسه
- حفظ
- التدرجية
- حجم
- سيناريوهات
- سياتل
- تأمين
- أمن
- انظر تعريف
- شرائح
- حدد
- كبير
- خدمة
- الخدمة
- خدماتنا
- باكجات
- عدة
- هام
- بشكل ملحوظ
- الاشارات
- عزباء
- سمارت
- تطبيقات الكمبيوتر
- الحلول
- بعض
- تحدث
- مكبرات الصوت
- مكبرات الصوت
- خطاب
- التعرف على الكلام
- الكلام إلى نص
- بدأت
- الحالة
- خطوة
- تخزين
- متجر
- صريح
- بعد ذلك
- جوهري
- عناوين فرعية
- هذه
- الدعم
- نظام
- فريق
- تقني
- التكنولوجيا
- نص
- من
- أن
- •
- من مشاركة
- وبالتالي
- تشبه
- هم
- الآلاف
- عبر
- في حينه
- إلى
- اليوم
- تقليديا
- متدرب
- قادة الإيمان
- النص الكامل
- خدمات ترجمة
- سفر
- اثنان
- عالمي
- غير محدود
- فتح
- تستخدم
- مستخدم
- المستخدمين
- يستخدم
- استخدام
- تشكيلة
- مختلف
- جدا
- فيديو
- الرؤى
- عمليا
- الزوار
- صوت
- طريق..
- we
- الويب
- خدمات ويب
- ترحيب
- حسن
- متى
- في حين
- التي
- من الذى
- سوف
- مع
- بدون
- للعمل
- عامل
- سنوات
- أنت
- حل متجر العقارات الشامل الخاص بك في جورجيا
- زفيرنت