Amazon Polly PlatoBlockchain Data Intelligence میں ایک ہی TTS صوتی شخصیت کے ساتھ متعدد زبانوں میں مواد کے لیے آڈیو بنائیں۔ عمودی تلاش۔ عی

Amazon Polly میں ایک ہی TTS صوتی شخصیت کے ساتھ متعدد زبانوں میں مواد کے لیے آڈیو بنائیں

ایمیزون پولی ایک معروف کلاؤڈ بیسڈ سروس ہے جو متن کو زندگی بھر کی تقریر میں تبدیل کرتی ہے۔ نیورل ٹیکسٹ ٹو اسپیچ (NTTS) کو اپنانے کے بعد، ہم نے معاون زبانوں میں مختلف بولنے والوں کا وسیع انتخاب فراہم کرنے کے لیے دستیاب آوازوں کے اپنے پورٹ فولیو کو مسلسل بڑھایا ہے۔ آج، ہمیں چار نئے اضافے کا اعلان کرتے ہوئے خوشی ہو رہی ہے: پیڈرو یو ایس ہسپانوی بول رہا ہے، ڈینیئل جرمن بول رہا ہے، لیام کینیڈین فرانسیسی بول رہا ہے، اور آرتھر برطانوی انگریزی بول رہا ہے۔ جیسا کہ ہمارے پورٹ فولیو میں موجود تمام اعصابی آوازوں کی طرح، یہ آوازیں اپنی ہدف کی زبانوں میں روانی، مقامی تلفظ پیش کرتی ہیں۔ تاہم، ان چار آوازوں کے بارے میں منفرد بات یہ ہے کہ یہ سب ایک ہی آواز کی شخصیت پر مبنی ہیں۔

پیڈرو، ڈینیئل، لیام اور آرتھر کو موجودہ امریکی انگریزی میتھیو آواز پر ماڈل بنایا گیا تھا۔ اگرچہ صارفین میتھیو کی فطری اور پیشہ ورانہ آواز کے معیار کی تعریف کرتے رہتے ہیں، آواز نے اب تک انگریزی بولنے والے ٹریفک کو خصوصی طور پر پیش کیا ہے۔ اب، گہری سیکھنے کے طریقوں کا استعمال کرتے ہوئے، ہم نے زبان اور بولنے والے کی شناخت کو جوڑ دیا، جس سے ہمیں ایک ہی اسپیکر سے کثیر لسانی ڈیٹا حاصل کیے بغیر کئی زبانوں میں مقامی زبان کی روانی کو برقرار رکھنے کی اجازت ملی۔ عملی طور پر، اس کا مطلب یہ ہے کہ ہم نے یو ایس انگلش میتھیو آواز کی آواز کی خصوصیات کو یو ایس ہسپانوی، جرمن، کینیڈین فرانسیسی، اور برطانوی انگریزی میں منتقل کر دیا، جس سے ایمیزون پولی کے صارفین کے لیے نئے مواقع کھلے ہیں۔

پانچ جگہوں میں ایک جیسی آواز کا دستیاب ہونا کاروبار کی ترقی کی بڑی صلاحیت کو کھولتا ہے۔ سب سے پہلے، عالمی اثرات کے حامل صارفین زبانوں اور خطوں میں ایک مستقل صارف کا تجربہ بنا سکتے ہیں۔ مثال کے طور پر، ایک انٹرایکٹو وائس رسپانس (IVR) سسٹم جو متعدد زبانوں کو سپورٹ کرتا ہے اب برانڈ کے احساس کو تبدیل کیے بغیر مختلف کسٹمر سیگمنٹس کو خدمات فراہم کر سکتا ہے۔ ٹی ٹی ایس کے استعمال کے دیگر تمام معاملات، جیسے کہ خبروں کے مضامین، تعلیمی مواد، یا پوڈ کاسٹ کے لیے بھی یہی ہے۔

دوم، آوازیں Amazon Polly کے صارفین کے لیے موزوں ہیں جو پانچ معاون زبانوں میں سے کسی میں بھی غیر ملکی فقروں کا مقامی تلفظ تلاش کر رہے ہیں۔

تیسرا، پیڈرو، ڈینیئل، لیام، اور آرتھر کو جاری کرنا ہمارے صارفین کی خدمت کرتا ہے جو امریکی ہسپانوی، جرمن، کینیڈین فرانسیسی، اور برطانوی انگریزی میں Amazon Polly NTTS کو پسند کرتے ہیں لیکن وہ ایک اعلیٰ معیار کی مردانہ آواز کی تلاش میں ہیں—وہ ان آوازوں کو آڈیو بنانے کے لیے استعمال کر سکتے ہیں۔ یک لسانی مواد کے لیے اور اعلیٰ معیار کی توقع کریں جو ان زبانوں میں دیگر NTTS آوازوں کے برابر ہو۔

آخر میں، نئی مردانہ NTTS آوازیں بنانے کے لیے جو ٹیکنالوجی ہم نے تیار کی ہے اس کے لیے بھی استعمال کیا جا سکتا ہے۔ برانڈ کی آوازیں. اس کی بدولت، برانڈ وائس کے صارفین نہ صرف ایک منفرد NTTS آواز سے لطف اندوز ہو سکتے ہیں جو ان کے برانڈ کے مطابق ہے، بلکہ بین الاقوامی سامعین کی خدمت کے دوران ایک مستقل تجربہ بھی رکھ سکتے ہیں۔

مثال استعمال کیس

آئیے یہ ظاہر کرنے کے لیے کہ عملی طور پر اس کا کیا مطلب ہے۔ میتھیو سے واقف ایمیزون پولی صارفین اب بھی اس آواز کو معمول کے مطابق استعمال کر سکتے ہیں میتھیو ایمیزون پولی کنسول پر اور کسی بھی متن کو داخل کرنا جو وہ امریکی انگریزی میں بولی ہوئی سننا چاہتے ہیں۔ درج ذیل منظر نامے میں، ہم IVR سسٹم کے لیے آڈیو نمونے تیار کرتے ہیں ("انگریزی کے لیے، براہ کرم ایک دبائیں"):

اس ریلیز کی بدولت، اب آپ مختلف زبانوں میں مستقل آڈیو تجربہ فراہم کرنے کے لیے استعمال کے معاملے کو بڑھا سکتے ہیں۔ تمام نئی آوازیں قدرتی آواز والی ہیں اور مقامی جیسا لہجہ برقرار رکھتی ہیں۔

  • برطانوی انگریزی میں تقریر پیدا کرنے کے لیے، آرتھر کا انتخاب کریں ("انگریزی کے لیے، براہ کرم ایک دبائیں"):
  • امریکی ہسپانوی اسپیکر استعمال کرنے کے لیے، پیڈرو کا انتخاب کریں ("Para español, por favour marque dos"):
  • ڈینیئل جرمن میں مدد کی پیشکش کرتا ہے ("Für Deutsch drücken Sie bitte die Drei"):
  • آپ Liam ("Pour le français, veuillez appuyer sur le quatre") کو منتخب کرکے کینیڈین فرانسیسی میں متن کی ترکیب کرسکتے ہیں:

نوٹ کریں کہ مختلف لہجے کے ساتھ بات کرنے کے علاوہ، یوکے انگلش آرتھر وائس ان پٹ ٹیکسٹ کو یو ایس انگلش میتھیو وائس سے مختلف طریقے سے لوکلائز کرے گی۔ مثال کے طور پر، "1/2/22" کو آرتھر "1 فروری 2022" کے طور پر پڑھے گا جبکہ میتھیو اسے "2 جنوری 2022" کے طور پر پڑھے گا۔

اب آئیے ان اشارے کو یکجا کرتے ہیں:

نتیجہ

پیڈرو، ڈینیئل، لیام، اور آرتھر صرف نیورل ٹی ٹی ایس آوازوں کے طور پر دستیاب ہیں، لہذا ان سے لطف اندوز ہونے کے لیے، آپ کو ان میں سے کسی ایک میں نیورل انجن استعمال کرنے کی ضرورت ہے۔ NTTS کو سپورٹ کرنے والے AWS ریجنز. یہ اعلیٰ معیار کے ہیں۔ یک زبانی آوازیں ان کی ہدف زبانوں میں۔ حقیقت یہ ہے کہ ان کی شخصیتیں تمام زبانوں میں یکساں ہیں ایک اضافی فائدہ ہے، جس سے ہمیں امید ہے کہ متعدد زبانوں میں مواد کے ساتھ کام کرنے والے صارفین کو خوشی ہوگی۔ مزید تفصیلات کے لیے، Amazon Polly کی ہماری مکمل فہرست کا جائزہ لیں۔ متن سے تقریر کی آوازیں , نیورل TTS قیمتوں کا تعین, سروس کی حدود، اور اکثر پوچھے گئے سوالات، اور ہمارے وزٹ کریں۔ قیمتوں کا تعین کا صفحہ.


مصنفین کے بارے میں

Amazon Polly PlatoBlockchain Data Intelligence میں ایک ہی TTS صوتی شخصیت کے ساتھ متعدد زبانوں میں مواد کے لیے آڈیو بنائیں۔ عمودی تلاش۔ عیپیٹرک وائنینا ایک لینگویج انجینئر ہے جو انگریزی، جرمن اور ہسپانوی کے لیے ٹیکسٹ ٹو اسپیچ پر کام کر رہا ہے۔ اسپیچ اور لینگویج پروسیسنگ میں پس منظر کے ساتھ، اس کی دلچسپی مشین لرننگ میں ہے جیسا کہ TTS فرنٹ اینڈ سلوشنز پر لاگو ہوتا ہے، خاص طور پر کم وسائل کی ترتیبات میں۔ اپنے فارغ وقت میں، وہ الیکٹرانک موسیقی سننے اور نئی زبانیں سیکھنے سے لطف اندوز ہوتا ہے۔

Amazon Polly PlatoBlockchain Data Intelligence میں ایک ہی TTS صوتی شخصیت کے ساتھ متعدد زبانوں میں مواد کے لیے آڈیو بنائیں۔ عمودی تلاش۔ عیمارٹا سمولریک ایمیزون ٹیکسٹ ٹو اسپیچ ٹیم میں ایک سینئر پروگرام مینیجر ہے، جہاں وہ رابطہ مرکز TTS استعمال کیس پر توجہ مرکوز کرتی ہے۔ وہ گو ٹو مارکیٹ اقدامات کی وضاحت کرتی ہے، پروڈکٹ کا روڈ میپ بنانے کے لیے کسٹمر کے تاثرات کا استعمال کرتی ہے اور TTS وائس لانچز کو مربوط کرتی ہے۔ کام سے باہر، وہ اپنے خاندان کے ساتھ کیمپنگ جانا پسند کرتی ہے۔

ٹائم اسٹیمپ:

سے زیادہ AWS مشین لرننگ