ایمیزون پولی ہے ایک متن سے تقریر ایسی خدمت جو قدرتی آواز دینے والی انسانی تقریر کی ترکیب کے لیے جدید گہری سیکھنے والی ٹیکنالوجیز کا استعمال کرتی ہے۔ اس کا استعمال مختلف قسم کے استعمال کے معاملات میں کیا جاتا ہے، جیسے کہ رابطہ مرکز کے نظام، خودکار ریئل ٹائم اسٹیٹس چیک، خودکار اکاؤنٹ اور بلنگ انکوائریوں، اور واشنگٹن پوسٹ جیسی خبر رساں ایجنسیوں کے ذریعے انسانوں جیسی آوازوں کے ساتھ گفتگو کے صارف کے تجربات فراہم کرنا۔ قارئین کو خبروں کے مضامین سننے کی اجازت دینے کے لیے.
آج تک، ایمیزون پولی فراہم کرتا ہے۔ 60+ زبان کی مختلف حالتوں میں 30 سے زیادہ آوازیں۔. Amazon Polly فعل تناؤ اور دیگر متعلقہ معلومات کی بنیاد پر کچھ الفاظ کو مختلف طریقے سے تلفظ کرنے کے لیے بھی سیاق و سباق کا استعمال کرتا ہے۔ مثال کے طور پر، "میں ایک کتاب پڑھتا ہوں" (موجودہ دور) میں "پڑھیں" اور "میں ایک کتاب پڑھوں گا" (مستقبل کا دور) مختلف طریقے سے تلفظ کیا جاتا ہے۔
تاہم، کچھ حالات میں آپ Amazon Polly کے کسی لفظ کے تلفظ کے طریقے کو اپنی مرضی کے مطابق بنانا چاہتے ہیں۔ مثال کے طور پر، آپ کو مقامی بولی یا مقامی زبان کے ساتھ تلفظ ملانے کی ضرورت پڑ سکتی ہے۔ چیزوں کے نام (مثال کے طور پر، ٹماٹر کا تلفظ کیا جا سکتا ہے tom-ah-to or tom-ay-to)، لوگوں، گلیوں، یا مقامات کو اکثر مختلف طریقوں سے تلفظ کیا جاتا ہے۔
اس پوسٹ میں، ہم یہ ظاہر کرتے ہیں کہ آپ کس طرح اپنی مرضی کے مطابق تلفظ بنانے کے لیے لغت کا فائدہ اٹھا سکتے ہیں۔ آپ استعمال کے معاملات جیسے اشاعت، تعلیم، یا کال سینٹرز کے لیے لغت کا اطلاق کر سکتے ہیں۔
SSML ٹیگ کا استعمال کرتے ہوئے تلفظ کو حسب ضرورت بنائیں
فرض کریں کہ آپ آسٹریلیا سے ایک مشہور پوڈ کاسٹ کو اسٹریم کرتے ہیں اور آپ اپنے اسکرپٹ کو انسان جیسی تقریر میں تبدیل کرنے کے لیے ایمیزون پولی آسٹریلین انگلش (اولیویا) کی آواز کا استعمال کرتے ہیں۔ آپ کے اسکرپٹ میں سے ایک میں، آپ ایسے الفاظ استعمال کرنا چاہتے ہیں جو ایمیزون پولی آواز کے لیے نامعلوم ہیں۔ مثال کے طور پر، آپ اپنے نیوزی لینڈ کے سامعین کو Mātariki (Māori New Year) کی مبارکباد بھیجنا چاہتے ہیں۔ اس طرح کے منظرناموں کے لیے، Amazon Polly صوتی تلفظ کو سپورٹ کرتا ہے، جسے آپ غیر ملکی زبان میں درست تلفظ کے قریب ہونے کے لیے استعمال کر سکتے ہیں۔
آپ استعمال کر سکتے ہیں۔ اسپیچ سنتھیسس مارک اپ لینگویج (ایس ایس ایم ایل) ph وصف میں صوتیاتی تلفظ تجویز کرنے کے لیے ٹیگ کریں۔ میں آپ کو دکھاتا ہوں کہ آپ کس طرح استعمال کرسکتے ہیں۔ SSML ٹیگ۔
سب سے پہلے، اپنے میں لاگ ان کریں۔ AWS کنسول اور سب سے اوپر سرچ بار میں ایمیزون پولی تلاش کریں۔ ایمیزون پولی کو منتخب کریں اور پھر پولی بٹن کو آزمائیں کو منتخب کریں۔
ایمیزون پولی کنسول میں، لینگویج ڈراپ ڈاؤن سے آسٹریلین انگلش کو منتخب کریں اور ان پٹ ٹیکسٹ باکس میں درج ذیل متن درج کریں اور پھر تلفظ کو جانچنے کے لیے سننے پر کلک کریں۔
میں آپ سب کو میٹرکی کی بہت بہت مبارکباد پیش کرتا ہوں۔
صوتی تلفظ کا اطلاق کیے بغیر تقریر کا نمونہ:
اگر آپ مندرجہ بالا نمونہ تقریر سنتے ہیں، تو آپ محسوس کر سکتے ہیں کہ کا تلفظ میٹرکی - ایک ایسا لفظ جو آسٹریلوی انگریزی کا حصہ نہیں ہے - بالکل سپاٹ آن نہیں ہے۔ اب، آئیے دیکھتے ہیں کہ ایسے حالات میں ہم صوتی تلفظ کو کس طرح استعمال کر سکتے ہیں۔ ایمیزون پولی کی طرف سے تیار کردہ تقریر کو اپنی مرضی کے مطابق کرنے کے لیے SSML ٹیگ۔
ایس ایس ایم ایل ٹیگز استعمال کرنے کے لیے، ایمیزون پولی کنسول میں ایس ایس ایم ایل آپشن کو آن کریں۔ پھر مندرجہ ذیل SSML اسکرپٹ کو کاپی اور پیسٹ کریں جس میں صوتی تلفظ موجود ہو۔ میٹرکی کے ph وصف کے اندر بیان کیا گیا ہے۔ ٹیگ
کے ساتہ ٹیگ، Amazon Polly منتخب آواز کے ذریعہ استعمال ہونے والی زبان کے ساتھ بطور ڈیفالٹ وابستہ معیاری تلفظ کی بجائے ph وصف کے ذریعہ متعین کردہ تلفظ کا استعمال کرتا ہے۔
صوتی تلفظ کو لاگو کرنے کے بعد نمونہ تقریر:
اگر آپ نمونہ کی آواز سنتے ہیں، تو آپ دیکھیں گے کہ ہم نے کچھ سروں کے لیے مختلف تلفظ کا انتخاب کیا ہے (مثال کے طور پر، ā) تاکہ Amazon Polly کو درست تلفظ کے قریب تر آوازوں کی ترکیب سازی کی جا سکے۔ اب آپ کے ذہن میں یہ سوال ہو سکتا ہے کہ میں فونیٹک ٹرانسکرپشن کیسے تیار کروں؟mA:.tA:.ri.ki" لفظ کے لیے میٹرکی?
آپ کا حوالہ دے کر صوتیاتی نقلیں تشکیل دے سکتے ہیں۔ معاون زبانوں کے لیے Phoneme اور Viseme ٹیبلز. اوپر کی مثال میں ہم نے استعمال کیا ہے۔ آسٹریلوی انگریزی کے لیے فونیمز.
Amazon Polly دو صوتیاتی حروف تہجی میں تعاون پیش کرتا ہے: IPA اور X-Sampa۔ X-Sampa کا فائدہ یہ ہے کہ وہ معیاری ASCII حروف ہیں، لہذا عام کی بورڈ کے ساتھ فونیٹک ٹرانسکرپشن ٹائپ کرنا آسان ہے۔ آپ اپنی نقلیں تیار کرنے کے لیے IPA یا X-Sampa میں سے کسی ایک کا استعمال کر سکتے ہیں، لیکن اپنی پسند کے مطابق رہنا یقینی بنائیں، خاص طور پر جب آپ ایک لغت فائل استعمال کرتے ہیں جس کا احاطہ ہم اگلے حصے میں کریں گے۔
فونیم ٹیبل میں ہر فونیم تقریر کی آواز کی نمائندگی کرتا ہے۔ میں جلی حروف "مثال" اوپر لنک کردہ آسٹریلوی انگریزی صفحہ میں Phoneme/Viseme ٹیبل کا کالم لفظ کے اس حصے کی نمائندگی کرتا ہے جس سے "فونیم" مماثل ہے۔ مثال کے طور پر، فونیم /j/ اس آواز کی نمائندگی کرتا ہے جو ایک آسٹریلوی انگریزی بولنے والا "y" میں حرف "y" کا تلفظ کرتے وقت کرتا ہے۔
لغت کا استعمال کرتے ہوئے تلفظ کو حسب ضرورت بنائیں
فونیم ٹیگز الگ تھلگ کیسز کو اپنی مرضی کے مطابق بنانے کے لیے یک طرفہ حالات کے لیے موزوں ہیں، لیکن یہ قابل توسیع نہیں ہیں۔ اگر آپ متن کے بہت بڑے حجم پر کارروائی کرتے ہیں، جس کا نظم مختلف ایڈیٹرز اور مبصرین کرتے ہیں، تو ہم لغت استعمال کرنے کی تجویز کرتے ہیں۔ لغت کا استعمال کرتے ہوئے، آپ حسب ضرورت تلفظ کو شامل کرنے میں مستقل مزاجی حاصل کر سکتے ہیں اور ساتھ ہی اسکرپٹ میں فونیم ٹیگز داخل کرنے کی دستی کوشش کو کم کر سکتے ہیں۔
ایک اچھی پریکٹس یہ ہے کہ آپ ایمیزون پولی کنسول پر اپنی مرضی کے مطابق تلفظ کی جانچ کرنے کے بعد ٹیگ کا استعمال کرتے ہوئے آپ اپنی مرضی کے مطابق تلفظ کی ایک لائبریری بناتے ہیں۔ لغت. ایک بار lexicons فائل اپ لوڈ ہوجانے کے بعد، Amazon Polly خودکار طور پر lexicons فائل میں متعین صوتیاتی تلفظ کا اطلاق کرے گا اور دستی طور پر فراہم کرنے کی ضرورت کو ختم کردے گا۔ ٹیگ
ایک لغت فائل بنائیں
ایک لغت فائل میں الفاظ اور ان کے صوتی تلفظ کے درمیان نقشہ سازی ہوتی ہے۔ تلفظ لغت کی تفصیلات (PLS) انٹرآپریبل تلفظ کی معلومات کی وضاحت کے لیے ایک W3C تجویز ہے۔ ذیل میں ایک مثال PLS دستاویز ہے:
اس بات کو یقینی بنائیں کہ آپ کے لئے صحیح قدر استعمال کریں۔ xml:lang
میدان استعمال کریں۔ en-AU
اگر آپ ایمیزون پولی آسٹریلین انگریزی آواز کے ساتھ استعمال کرنے کے لیے لغت فائل اپ لوڈ کر رہے ہیں۔ معاون زبانوں کی مکمل فہرست کے لیے، رجوع کریں۔ ایمیزون پولی کے ذریعہ تعاون یافتہ زبانیں۔.
حسب ضرورت تلفظ کی وضاحت کرنے کے لیے، آپ کو a شامل کرنا ہوگا۔ عنصر جو ایک یا زیادہ کے ساتھ لغوی اندراج کے لیے کنٹینر ہے۔ <grapheme>
عنصر اور اندر فراہم کردہ ایک یا زیادہ تلفظ کی معلومات <phoneme>
عنصر
۔ <grapheme>
عنصر متن پر مشتمل ہے جو بیان کرتا ہے۔ آرتھوگرافی کی عنصر آپ استعمال کر سکتے ہیں a <grapheme>
عنصر اس لفظ کی وضاحت کرنے کے لیے جس کا تلفظ آپ اپنی مرضی کے مطابق بنانا چاہتے ہیں۔ آپ متعدد شامل کر سکتے ہیں۔ <grapheme>
تمام لفظی تغیرات کی وضاحت کرنے کے لیے عناصر، مثال کے طور پر میکرون کے ساتھ یا اس کے بغیر۔ دی <grapheme>
عنصر کیس حساس ہے، اور تقریر کی ترکیب کے دوران ایمیزون پولی سٹرنگ آپ کے اسکرپٹ کے اندر موجود الفاظ سے میل کھاتی ہے جنہیں آپ تقریر میں تبدیل کر رہے ہیں۔ اگر کوئی مماثلت پائی جاتی ہے، تو یہ استعمال کرتا ہے۔ عنصر، جو بیان کرتا ہے کہ کس طرح صوتی نقل تیار کرنے کے لیے تلفظ کیا جاتا ہے۔
آپ بھی استعمال کر سکتے ہیں <alias>
عام طور پر استعمال ہونے والے مخففات کے لیے۔ ایک لغت فائل کی پچھلی مثال میں، NZ کے لیے بطور عرف استعمال ہوتا ہے۔ نیوزی لینڈ. اس کا مطلب ہے کہ جب بھی ایمیزون پولی ٹیکسٹ کے باڈی میں "NZ" (مماثل کیس کے ساتھ) آئے گا، تو وہ ان دو حروف کو "نیوزی لینڈ" کے طور پر پڑھے گا۔
لغت فائل فارمیٹ کے بارے میں مزید معلومات کے لیے، دیکھیں تلفظ Lexicon Specification (PLS) ورژن 1.0 W3C ویب سائٹ پر۔
آپ ایک لغت فائل کو ایمیزون پولی پر اپ لوڈ کرنے سے پہلے اسے .pls یا .xml فائل کے طور پر محفوظ کر سکتے ہیں۔
لغت کی فائل اپ لوڈ اور لاگو کریں۔
درج ذیل ہدایات کا استعمال کرتے ہوئے اپنی لغت فائل کو Amazon Polly پر اپ لوڈ کریں:
- ایمیزون پولی کنسول پر، منتخب کریں۔ لغت نیوی گیشن پین میں.
- میں سے انتخاب کریں لغت اپ لوڈ کریں۔.
- لغت کے لیے ایک نام درج کریں اور پھر منتخب کریں۔ ایک لغت فائل.
- اپ لوڈ کرنے کے لیے فائل کا انتخاب کریں۔
- میں سے انتخاب کریں لغت اپ لوڈ کریں۔.
اگر اسی نام کا ایک لغت (چاہے .pls یا .xml فائل ہو) پہلے سے موجود ہے، تو لغت کو اپ لوڈ کرنے سے موجودہ لغت کو اوور رائٹ کر دیا جاتا ہے۔
اب آپ تلفظ کو حسب ضرورت بنانے کے لیے لغت کا اطلاق کر سکتے ہیں۔
- میں سے انتخاب کریں متن سے تقریر۔ نیوی گیشن پین میں.
- توسیع اضافی ترتیبات.
- آن کریں تلفظ کو حسب ضرورت بنائیں.
- ڈراپ ڈاؤن مینو میں لغت کا انتخاب کریں۔
آپ بھی منتخب کرسکتے ہیں لغت اپ لوڈ کریں۔ ایک نئی لغت فائل (یا نیا ورژن) اپ لوڈ کرنے کے لیے۔
سورس کوڈ کے ذخیرے میں لغت کی فائل کو ورژن کنٹرول کرنا ایک اچھا عمل ہے۔ اپنی مرضی کے مطابق تلفظ کو لغت کی فائل میں رکھنا یقینی بناتا ہے کہ آپ پوری تنظیم میں مخصوص الفاظ کے لیے صوتی تلفظ کا مسلسل حوالہ دے سکتے ہیں۔ اس کے علاوہ، تلفظ لغت کی حدود کو بھی ذہن میں رکھیں جن کا ذکر کیا گیا ہے۔ ایمیزون پولی میں کوٹے۔ صفحہ.
لغت لگانے کے بعد تلفظ کی جانچ کریں۔
آئیے ان پٹ ٹیکسٹ کے طور پر "Wishing my all listeners in NZ, a very Happy Matariki" کا استعمال کرتے ہوئے فوری ٹیسٹ کریں۔
ہم لغت کو لاگو کرنے سے پہلے اور بعد میں آڈیو فائلوں کا موازنہ کر سکتے ہیں۔
لغت کا اطلاق کرنے سے پہلے:
لغت کا اطلاق کرنے کے بعد:
نتیجہ
اس پوسٹ میں، ہم نے بحث کی کہ آپ عام طور پر استعمال ہونے والے مخففات یا Amazon Polly میں منتخب زبان میں نہ پائے جانے والے الفاظ کے تلفظ کو کس طرح اپنی مرضی کے مطابق بنا سکتے ہیں۔ آپ استعمال کر سکتے ہیں SSML ٹیگ جو یک طرفہ تخصیصات یا جانچ کے مقاصد کے لیے بہترین ہے۔ ہم آپ کی تنظیم میں کثرت سے استعمال ہونے والے الفاظ کے تلفظ کا ایک مستقل مجموعہ بنانے کے لیے Lexicon استعمال کرنے کی تجویز کرتے ہیں۔ یہ آپ کے مواد کے مصنفین کو اسکرپٹ میں صوتی تلفظ کو بار بار شامل کرنے کے تکلیف دہ کام کی بجائے لکھنے میں وقت گزارنے کے قابل بناتا ہے۔ آپ اسے Amazon Polly کنسول پر اپنے AWS اکاؤنٹ میں آزما سکتے ہیں۔
وسائل کا خلاصہ
مصنفین کے بارے میں
رتن کمار آکلینڈ، نیوزی لینڈ سے تعلق رکھنے والے ایک حل آرکیٹیکٹ ہیں۔ وہ بڑے انٹرپرائز صارفین کے ساتھ کام کرتا ہے جو AWS کلاؤڈ کا استعمال کرتے ہوئے محفوظ، کم لاگت، اور قابل اعتماد انٹرنیٹ اسکیل ایپلی کیشنز کو ڈیزائن اور بنانے میں ان کی مدد کرتا ہے۔ وہ ٹیکنالوجی کے بارے میں پرجوش ہے اور بلاگ پوسٹس اور ٹوئچ سیشنز کے ذریعے علم بانٹنا پسند کرتا ہے۔
میکیک ٹیگی پولی برانڈ وائسز کے لیے پرنسپل آڈیو ڈیزائنر اور پروڈکٹ مینیجر ہیں۔ اس نے ٹیک انڈسٹری، فلموں، اشتہارات اور گیم لوکلائزیشن میں پیشہ ورانہ صلاحیت کے ساتھ کام کیا ہے۔ 2013 میں، وہ پہلا آڈیو انجینئر تھا جسے الیکسا ٹیکسٹ ٹو اسپیچ ٹیم میں رکھا گیا تھا۔ میکیک مختلف ممالک میں 12 Alexa TTS آوازیں، 20 سے زیادہ پولی آوازیں، اور 4 Alexa مشہور شخصیات کی آوازیں جاری کرنے میں ملوث تھے۔ میکیک ایک ٹرائیتھلیٹ، اور ایک شوقین صوتی گٹار پلیئر ہے۔
- "
- 100
- 116
- ہمارے بارے میں
- اکاؤنٹ
- حاصل
- کے پار
- اعلی درجے کی
- Alexaکی بنیاد پر IQ Option ، بائنومو سے اوپری پوزیشن پر ہے۔
- تمام
- پہلے ہی
- ایمیزون
- ایپلی کیشنز
- درخواست دینا
- آڈیو
- آسٹریلیا
- آٹو
- آٹومیٹڈ
- AWS
- اس سے پہلے
- فائدہ
- بلنگ
- بلاگ
- بلاگ مراسلات
- جسم
- سرحد
- باکس
- برانڈ
- تعمیر
- فون
- اہلیت
- مقدمات
- مشہور شخصیت
- کچھ
- میں سے انتخاب کریں
- قریب
- بادل
- کوڈ
- کالم
- کنسول
- رابطہ کریں
- کنٹینر
- پر مشتمل ہے
- مواد
- کنٹرول
- سرمایہ کاری مؤثر
- ممالک
- احاطہ
- تخلیق
- تخلیق
- اپنی مرضی کے
- گاہکوں
- ترسیل
- مظاہرہ
- ڈیزائن
- ڈیولپر
- مختلف
- کے دوران
- تعلیم
- کوشش
- عناصر
- کا خاتمہ
- انجینئر
- انگریزی
- درج
- انٹرپرائز
- خاص طور پر
- مثال کے طور پر
- موجودہ
- تجربات
- پہلا
- کے بعد
- غیر ملکی
- فارمیٹ
- ملا
- مستقبل
- کھیل ہی کھیل میں
- پیدا
- اچھا
- عظیم
- خوش
- مدد
- کس طرح
- HTTPS
- بھاری
- انسانی
- صنعت
- معلومات
- ان پٹ
- انٹرنیٹ
- انٹرپرائز
- ملوث
- IT
- رکھتے ہوئے
- علم
- زبان
- زبانیں
- بڑے
- سیکھنے
- لیوریج
- لائبریری
- لسٹ
- مقامی
- بناتا ہے
- میں کامیاب
- مینیجر
- دستی
- دستی طور پر
- تعریفیں
- میچ
- کے ملاپ
- کا مطلب ہے کہ
- ذکر کیا
- شاید
- برا
- زیادہ
- فلم
- ایک سے زیادہ
- نام
- سمت شناسی
- نئے سال
- نیوزی لینڈ
- خبر
- عام
- تجویز
- اختیار
- تنظیم
- دیگر
- حصہ
- جذباتی
- لوگ
- کھلاڑی
- podcast
- مقبول
- مراسلات
- پریکٹس
- حال (-)
- پرنسپل
- عمل
- تیار
- مصنوعات
- پیشہ ورانہ
- فراہم
- فراہم کرتا ہے
- پبلشنگ
- مقاصد
- سوال
- فوری
- قارئین
- اصل وقت
- سفارش
- کو کم
- قابل اعتماد
- ذخیرہ
- کی نمائندگی
- کی نمائندگی کرتا ہے
- توسیع پذیر
- پیمانے
- تلاش کریں
- محفوظ بنانے
- منتخب
- سروس
- سیشن
- مقرر
- اشتراک
- So
- ٹھوس
- حل
- کچھ
- ماخذ کوڈ
- اسپیکر
- تصریح
- خرچ
- معیار
- درجہ
- رہنا
- سٹریم
- حمایت
- تائید
- کی حمایت کرتا ہے
- سسٹمز
- ٹیم
- ٹیک
- ٹیک انڈسٹری
- ٹیکنالوجی
- ٹیکنالوجی
- ٹیسٹ
- ٹیسٹنگ
- واشنگٹن پوسٹ
- کے ذریعے
- وقت
- آج
- سب سے اوپر
- مروڑ
- استعمال کی شرائط
- قیمت
- مختلف اقسام کے
- ورژن
- وائس
- آوازیں
- حجم
- W3
- واشنگٹن
- ویب سائٹ
- چاہے
- وکیپیڈیا
- بغیر
- الفاظ
- کام کیا
- کام کرتا ہے
- تحریری طور پر
- XML
- سال