अमेज़ॅन पोली एक लिखे हुए को बोलने में बदलना सेवा जो प्राकृतिक ध्वनि वाले मानव भाषण को संश्लेषित करने के लिए उन्नत गहन शिक्षण तकनीकों का उपयोग करती है। इसका उपयोग विभिन्न प्रकार के उपयोग के मामलों में किया जाता है, जैसे संपर्क केंद्र सिस्टम, स्वचालित रीयल-टाइम स्थिति जांच, स्वचालित खाता और बिलिंग पूछताछ के लिए मानव जैसी आवाज़ों के साथ संवादात्मक उपयोगकर्ता अनुभव प्रदान करना, और वाशिंगटन पोस्ट जैसी समाचार एजेंसियों द्वारा पाठकों को समाचार लेख सुनने की अनुमति देने के लिए.
आज तक, अमेज़न पोली प्रदान करता है 60+ भाषा रूपों में 30 से अधिक आवाजें. अमेज़ॅन पोली क्रिया काल और अन्य प्रासंगिक जानकारी के आधार पर कुछ शब्दों का अलग-अलग उच्चारण करने के लिए संदर्भ का भी उपयोग करता है। उदाहरण के लिए, "मैं एक किताब पढ़ता हूं" (वर्तमान काल) और "मैं एक किताब पढ़ूंगा" (भविष्य काल) में अलग-अलग उच्चारण किया जाता है।
हालाँकि, कुछ स्थितियों में आप Amazon Poly किसी शब्द के उच्चारण के तरीके को अनुकूलित करना चाह सकते हैं। उदाहरण के लिए, आपको उच्चारण को स्थानीय बोली या स्थानीय भाषा से मिलाना पड़ सकता है। चीजों के नाम (जैसे, टमाटर का उच्चारण के रूप में किया जा सकता है) टॉम-आह-तो or टॉम-ए-टू), लोगों, सड़कों या स्थानों का उच्चारण अक्सर कई अलग-अलग तरीकों से किया जाता है।
इस पोस्ट में, हम प्रदर्शित करते हैं कि आप कस्टम उच्चारण बनाने के लिए शब्दावली का लाभ कैसे उठा सकते हैं। आप प्रकाशन, शिक्षा, या कॉल सेंटर जैसे उपयोग के मामलों के लिए शब्दकोष लागू कर सकते हैं।
SSML टैग का उपयोग करके उच्चारण अनुकूलित करें
मान लें कि आप ऑस्ट्रेलिया से एक लोकप्रिय पॉडकास्ट स्ट्रीम करते हैं और आप अपनी स्क्रिप्ट को मानव-समान भाषण में बदलने के लिए अमेज़ॅन पॉली ऑस्ट्रेलियाई अंग्रेजी (ओलिविया) आवाज का उपयोग करते हैं। अपनी एक स्क्रिप्ट में, आप ऐसे शब्दों का उपयोग करना चाहते हैं जो Amazon Poly की आवाज़ के लिए अज्ञात हैं। उदाहरण के लिए, आप अपने न्यूज़ीलैंड के श्रोताओं को मातरिकी (माओरी नव वर्ष) की शुभकामनाएँ भेजना चाहते हैं। ऐसे परिदृश्यों के लिए, अमेज़ॅन पोली ध्वन्यात्मक उच्चारण का समर्थन करता है, जिसका उपयोग आप एक ऐसे उच्चारण को प्राप्त करने के लिए कर सकते हैं जो विदेशी भाषा में सही उच्चारण के करीब हो।
आप का उपयोग कर सकते हैं वाक् संश्लेषण मार्कअप भाषा (एसएसएमएल) ph विशेषता में ध्वन्यात्मक उच्चारण का सुझाव देने के लिए टैग। मैं आपको दिखाता हूं कि आप इसका उपयोग कैसे कर सकते हैं एसएसएमएल टैग।
सबसे पहले, अपने में लॉगिन करें एडब्ल्यूएस कंसोल और सबसे ऊपर सर्च बार में Amazon Poly को सर्च करें। अमेज़न पोली चुनें और फिर ट्राई पॉली बटन चुनें।
अमेज़ॅन पोली कंसोल में, भाषा ड्रॉपडाउन से ऑस्ट्रेलियाई अंग्रेजी का चयन करें और इनपुट टेक्स्ट बॉक्स में निम्नलिखित टेक्स्ट दर्ज करें और फिर उच्चारण का परीक्षण करने के लिए सुनें पर क्लिक करें।
मैं आप सभी को मातरिकी की बहुत-बहुत शुभकामनाएं देता हूं।
ध्वन्यात्मक उच्चारण लागू किए बिना नमूना भाषण:
यदि आप ऊपर दिए गए नमूना भाषण को सुनते हैं, तो आप देख सकते हैं कि का उच्चारण मातरिकी - एक शब्द जो ऑस्ट्रेलियाई अंग्रेजी का हिस्सा नहीं है - बिल्कुल हाजिर नहीं है। अब, आइए देखें कि ऐसे परिदृश्यों में हम किस प्रकार ध्वन्यात्मक उच्चारण का उपयोग कर सकते हैं अमेज़ॅन पोली द्वारा निर्मित भाषण को अनुकूलित करने के लिए एसएसएमएल टैग।
एसएसएमएल टैग का उपयोग करने के लिए, अमेज़ॅन पोली कंसोल में एसएसएमएल विकल्प चालू करें। फिर निम्नलिखित SSML स्क्रिप्ट को कॉपी और पेस्ट करें जिसमें ध्वन्यात्मक उच्चारण है मातरिकी के ph विशेषता के अंदर निर्दिष्ट टैग।
उसके साथ टैग, अमेज़ॅन पोली चयनित आवाज द्वारा उपयोग की जाने वाली भाषा के साथ डिफ़ॉल्ट रूप से जुड़े मानक उच्चारण के बजाय ph विशेषता द्वारा निर्दिष्ट उच्चारण का उपयोग करता है।
ध्वन्यात्मक उच्चारण लागू करने के बाद नमूना भाषण:
यदि आप नमूना ध्वनि सुनते हैं, तो आप देखेंगे कि हमने कुछ स्वरों (जैसे, ā) के लिए एक अलग उच्चारण का विकल्प चुना है ताकि Amazon Poly उन ध्वनियों को संश्लेषित कर सके जो सही उच्चारण के करीब हैं। अब आपके मन में यह सवाल हो सकता है कि मैं ध्वन्यात्मक प्रतिलेखन कैसे उत्पन्न करूं?एमए: टीए: .ri.ki" शब्द के लिए मातरिकी?
आप का संदर्भ देकर ध्वन्यात्मक प्रतिलेखन बना सकते हैं समर्थित भाषाओं के लिए फोनीमे और विसेम टेबल. ऊपर के उदाहरण में हमने इस्तेमाल किया है ऑस्ट्रेलियाई अंग्रेजी के लिए ध्वन्यात्मकता.
अमेज़ॅन पोली दो ध्वन्यात्मक अक्षरों में समर्थन प्रदान करता है: आईपीए और एक्स-सम्पा। X-Sampa का लाभ यह है कि वे मानक ASCII वर्ण हैं, इसलिए सामान्य कीबोर्ड के साथ ध्वन्यात्मक प्रतिलेखन टाइप करना आसान है। आप अपने ट्रांसक्रिप्शन उत्पन्न करने के लिए आईपीए या एक्स-सम्पा में से किसी एक का उपयोग कर सकते हैं, लेकिन अपनी पसंद के अनुरूप रहना सुनिश्चित करें, खासकर जब आप एक लेक्सिकॉन फ़ाइल का उपयोग करते हैं जिसे हम अगले भाग में कवर करेंगे।
फोनेम टेबल में प्रत्येक फोनेम एक वाक् ध्वनि का प्रतिनिधित्व करता है। में बोल्ड अक्षर "उदाहरण" ऊपर लिंक किए गए ऑस्ट्रेलियाई अंग्रेजी पृष्ठ में फोनमे/विसेमे तालिका का कॉलम "फोनमे" शब्द के उस हिस्से का प्रतिनिधित्व करता है जिससे मेल खाता है। उदाहरण के लिए, ध्वन्यात्मकता /j/ उस ध्वनि का प्रतिनिधित्व करती है जो एक ऑस्ट्रेलियाई अंग्रेजी वक्ता "हां" में "y" अक्षर का उच्चारण करते समय करता है।
शब्दकोशों का उपयोग करके उच्चारण को अनुकूलित करें
अलग-अलग मामलों को अनुकूलित करने के लिए फोनीमे टैग एकबारगी स्थितियों के लिए उपयुक्त हैं, लेकिन ये स्केलेबल नहीं हैं। यदि आप विभिन्न संपादकों और समीक्षकों द्वारा प्रबंधित बड़ी मात्रा में पाठ संसाधित करते हैं, तो हम शब्दावली का उपयोग करने की सलाह देते हैं। शब्दावली का उपयोग करके, आप कस्टम उच्चारण जोड़ने में स्थिरता प्राप्त कर सकते हैं और साथ ही साथ स्क्रिप्ट में फोनेम टैग डालने के मैन्युअल प्रयास को कम कर सकते हैं।
एक अच्छा अभ्यास यह है कि आप अमेज़ॅन पोली कंसोल पर कस्टम उच्चारण का परीक्षण करने के बाद का उपयोग कर सकते हैं टैग, आप उपयोग करके अनुकूलित उच्चारणों की एक लाइब्रेरी बनाते हैं शब्दकोशों. एक बार लेक्सिकॉन फ़ाइल अपलोड हो जाने के बाद, अमेज़ॅन पोली स्वचालित रूप से लेक्सिकॉन फ़ाइल में निर्दिष्ट ध्वन्यात्मक उच्चारण लागू करेगा और मैन्युअल रूप से प्रदान करने की आवश्यकता को समाप्त कर देगा। टैग।
एक लेक्सिकॉन फ़ाइल बनाएँ
एक शब्दकोष फ़ाइल में शब्दों और उनके ध्वन्यात्मक उच्चारणों के बीच मानचित्रण होता है। उच्चारण शब्दकोश विशिष्टता (PLS) इंटरऑपरेबल उच्चारण जानकारी निर्दिष्ट करने के लिए W3C अनुशंसा है। निम्नलिखित एक उदाहरण PLS दस्तावेज़ है:
सुनिश्चित करें कि आप के लिए सही मान का उपयोग करते हैं xml:lang
खेत। उपयोग en-AU
यदि आप अमेज़ॅन पोली ऑस्ट्रेलियन इंग्लिश वॉइस के साथ उपयोग करने के लिए लेक्सिकॉन फ़ाइल अपलोड कर रहे हैं। समर्थित भाषाओं की पूरी सूची के लिए, देखें अमेज़ॅन पोली द्वारा समर्थित भाषाएँ.
एक कस्टम उच्चारण निर्दिष्ट करने के लिए, आपको a . जोड़ना होगा तत्व जो एक या अधिक के साथ एक शाब्दिक प्रविष्टि के लिए एक कंटेनर है <grapheme>
तत्व और एक या अधिक उच्चारण जानकारी अंदर प्रदान की गई <phoneme>
तत्व।
RSI <grapheme>
तत्व में का वर्णन करने वाला पाठ शामिल है इमला का तत्व। आप एक का उपयोग कर सकते हैं <grapheme>
उस शब्द को निर्दिष्ट करने के लिए तत्व जिसका उच्चारण आप अनुकूलित करना चाहते हैं। आप कई जोड़ सकते हैं <grapheme>
सभी शब्द विविधताओं को निर्दिष्ट करने के लिए तत्व, उदाहरण के लिए मैक्रोन के साथ या बिना। <grapheme>
एलिमेंट केस-संवेदी होता है, और वाक् संश्लेषण के दौरान Amazon पोली स्ट्रिंग आपकी स्क्रिप्ट के अंदर उन शब्दों से मेल खाती है जिन्हें आप वाक् में परिवर्तित कर रहे हैं। यदि कोई मिलान मिलता है, तो वह इसका उपयोग करता है तत्व, जो वर्णन करता है कि कैसे ध्वन्यात्मक प्रतिलेखन उत्पन्न करने के लिए उच्चारित किया जाता है।
आप भी उपयोग कर सकते हैं <alias>
आमतौर पर इस्तेमाल किए जाने वाले संक्षिप्ताक्षरों के लिए। लेक्सिकॉन फ़ाइल के पिछले उदाहरण में, NZ के लिए उपनाम के रूप में प्रयोग किया जाता है न्यूजीलैंड. इसका मतलब यह है कि जब भी अमेज़ॅन पोली टेक्स्ट के मुख्य भाग में "एनजेड" (मिलान मामले के साथ) आता है, तो वह उन दो अक्षरों को "न्यूजीलैंड" के रूप में पढ़ेगा।
शब्दकोश फ़ाइल स्वरूप के बारे में अधिक जानकारी के लिए, देखें उच्चारण शब्दकोश विशिष्टता (पीएलएस) संस्करण 1.0 W3C वेबसाइट पर।
Amazon Poly पर अपलोड करने से पहले आप किसी शब्दकोष फ़ाइल को .pls या .xml फ़ाइल के रूप में सहेज सकते हैं।
शब्दकोश फ़ाइल अपलोड और लागू करें
निम्नलिखित निर्देशों का उपयोग करके अपनी शब्दावली फ़ाइल Amazon Poly पर अपलोड करें:
- अमेज़न पोली कंसोल पर, चुनें शब्दकोशों नेविगेशन फलक में
- चुनें शब्दकोश अपलोड करें.
- शब्दकोष के लिए एक नाम दर्ज करें और फिर चुनें एक शब्दकोश फ़ाइल.
- अपलोड करने के लिए फ़ाइल चुनें।
- चुनें शब्दकोश अपलोड करें.
यदि समान नाम का कोई शब्दकोष (चाहे .pls या .xml फ़ाइल) पहले से मौजूद हो, तो शब्दकोष को अपलोड करने से मौजूदा शब्दकोष अधिलेखित हो जाता है।
अब आप उच्चारण को अनुकूलित करने के लिए शब्दकोष लागू कर सकते हैं।
- चुनें पाठ से भाषण नेविगेशन फलक में
- विस्तार अतिरिक्त सेटिंग्स.
- पर बारी उच्चारण अनुकूलित करें.
- ड्रॉप-डाउन मेनू पर शब्दकोष चुनें।
आप भी चुन सकते हैं शब्दकोश अपलोड करें एक नई शब्दावली फ़ाइल (या एक नया संस्करण) अपलोड करने के लिए।
स्रोत कोड भंडार में लेक्सिकॉन फ़ाइल को संस्करण नियंत्रित करना एक अच्छा अभ्यास है। कस्टम उच्चारण को लेक्सिकॉन फ़ाइल में रखना सुनिश्चित करता है कि आप संगठन में कुछ शब्दों के लिए ध्वन्यात्मक उच्चारणों का लगातार उल्लेख कर सकते हैं। इसके अलावा, पर उल्लिखित उच्चारण शब्दावली सीमाओं को भी ध्यान में रखें अमेज़न पोली में कोटा इस पृष्ठ पर ज़ूम कई वीडियो ट्यूटोरियल और अन्य साहायक साधन प्रदान करता है।
शब्दकोश लागू करने के बाद उच्चारण का परीक्षण करें
आइए इनपुट टेक्स्ट के रूप में "NZ में मेरे सभी श्रोताओं को शुभकामनाएं, एक बहुत ही मुबारक मातरिकी" का उपयोग करके त्वरित परीक्षण करें।
हम शब्दकोश को लागू करने से पहले और बाद में ऑडियो फाइलों की तुलना कर सकते हैं।
शब्दकोष लागू करने से पहले:
शब्दावली लागू करने के बाद:
निष्कर्ष
इस पोस्ट में, हमने चर्चा की कि आप आम तौर पर उपयोग किए जाने वाले शब्दकोष या अमेज़ॅन पोली में चयनित भाषा में नहीं मिले शब्दों के उच्चारण को कैसे अनुकूलित कर सकते हैं। आप उपयोग कर सकते हैं SSML टैग जो एकबारगी अनुकूलन या परीक्षण उद्देश्यों को सम्मिलित करने के लिए बहुत अच्छा है। हम अनुशंसा करते हैं कि आपके संगठन में अक्सर उपयोग किए जाने वाले शब्दों के उच्चारण का एक सुसंगत सेट बनाने के लिए लेक्सिकॉन का उपयोग करें। यह आपके सामग्री लेखकों को स्क्रिप्ट में ध्वन्यात्मक उच्चारणों को बार-बार जोड़ने के थकाऊ काम के बजाय लेखन पर समय बिताने में सक्षम बनाता है। आप इसे Amazon पोली कंसोल पर अपने AWS खाते में आज़मा सकते हैं।
संसाधनों का सारांश
लेखक के बारे में
रतन कुमार ऑकलैंड, न्यूजीलैंड में स्थित एक समाधान वास्तुकार है। वह बड़े उद्यम ग्राहकों के साथ काम करता है जो उन्हें एडब्ल्यूएस क्लाउड का उपयोग करके सुरक्षित, लागत प्रभावी और विश्वसनीय इंटरनेट स्केल एप्लिकेशन डिजाइन और निर्माण करने में मदद करता है। उन्हें तकनीक का शौक है और उन्हें ब्लॉग पोस्ट और ट्विच सेशन के माध्यम से ज्ञान साझा करना पसंद है।
मासीक तेगिक एक प्रमुख ऑडियो डिजाइनर और पोली ब्रांड वॉयस के लिए एक उत्पाद प्रबंधक है। उन्होंने टेक उद्योग, फिल्मों, विज्ञापनों और खेल स्थानीयकरण में पेशेवर क्षमता में काम किया है। 2013 में, वह एलेक्सा टेक्स्ट-टू-स्पीच टीम में काम पर रखने वाले पहले ऑडियो इंजीनियर थे। मैसीक विभिन्न देशों में 12 एलेक्सा टीटीएस आवाज, 20 से अधिक पोली आवाज, और 4 एलेक्सा सेलिब्रिटी आवाज जारी करने में शामिल था। Maciek एक ट्रायथलीट है, और एक शौकीन चावला ध्वनिक गिटार वादक है।
- "
- 100
- 116
- About
- लेखा
- पाना
- के पार
- उन्नत
- एलेक्सा
- सब
- पहले ही
- वीरांगना
- अनुप्रयोगों
- लागू
- ऑडियो
- ऑस्ट्रेलिया
- स्वत:
- स्वचालित
- एडब्ल्यूएस
- से पहले
- लाभ
- बिलिंग
- ब्लॉग
- वेबदैनिकी डाक
- परिवर्तन
- सीमा
- मुक्केबाज़ी
- ब्रांड
- निर्माण
- कॉल
- क्षमता
- मामलों
- सेलिब्रिटी
- कुछ
- चुनें
- करीब
- बादल
- कोड
- स्तंभ
- कंसोल
- संपर्क करें
- कंटेनर
- शामिल हैं
- सामग्री
- नियंत्रण
- प्रभावी लागत
- देशों
- आवरण
- बनाना
- बनाना
- रिवाज
- ग्राहक
- पहुंचाने
- दिखाना
- डिज़ाइन
- डेवलपर
- विभिन्न
- दौरान
- शिक्षा
- प्रयास
- तत्व
- को खत्म करने
- इंजीनियर
- अंग्रेज़ी
- दर्ज
- उद्यम
- विशेष रूप से
- उदाहरण
- मौजूदा
- अनुभव
- प्रथम
- निम्नलिखित
- विदेशी
- प्रारूप
- पाया
- भविष्य
- खेल
- उत्पन्न
- अच्छा
- महान
- खुश
- मदद
- कैसे
- HTTPS
- विशाल
- मानव
- उद्योग
- करें-
- निवेश
- इंटरनेट
- अंतर-संचालित
- शामिल
- IT
- रखना
- ज्ञान
- भाषा
- भाषाऐं
- बड़ा
- सीख रहा हूँ
- लीवरेज
- पुस्तकालय
- सूची
- स्थानीय
- बनाता है
- कामयाब
- प्रबंधक
- गाइड
- मैन्युअल
- मानचित्रण
- मैच
- मिलान
- साधन
- उल्लेख किया
- हो सकता है
- मन
- अधिक
- चलचित्र
- विभिन्न
- नामों
- पथ प्रदर्शन
- नया साल
- न्यूजीलैंड
- समाचार
- साधारण
- ऑफर
- विकल्प
- संगठन
- अन्य
- भाग
- आवेशपूर्ण
- स्टाफ़
- खिलाड़ी
- पॉडकास्ट
- लोकप्रिय
- पोस्ट
- अभ्यास
- वर्तमान
- प्रिंसिपल
- प्रक्रिया
- प्रस्तुत
- एस्ट्रो मॉल
- पेशेवर
- प्रदान करना
- प्रदान करता है
- प्रकाशन
- प्रयोजनों
- प्रश्न
- त्वरित
- पाठकों
- वास्तविक समय
- की सिफारिश
- को कम करने
- विश्वसनीय
- कोष
- प्रतिनिधित्व
- का प्रतिनिधित्व करता है
- स्केलेबल
- स्केल
- Search
- सुरक्षित
- चयनित
- सेवा
- सत्र
- सेट
- बांटने
- So
- ठोस
- समाधान ढूंढे
- कुछ
- स्रोत कोड
- वक्ता
- विनिर्देश
- बिताना
- मानक
- स्थिति
- रहना
- धारा
- समर्थन
- समर्थित
- समर्थन करता है
- सिस्टम
- टीम
- तकनीक
- तकनीक उद्योग
- टेक्नोलॉजीज
- टेक्नोलॉजी
- परीक्षण
- परीक्षण
- वाशिंगटन पोस्ट
- यहाँ
- पहर
- आज
- ऊपर का
- चिकोटी
- उपयोग
- मूल्य
- विविधता
- संस्करण
- आवाज़
- आवाज
- आयतन
- W3
- वाशिंगटन
- वेबसाइट
- या
- विकिपीडिया
- बिना
- शब्द
- काम किया
- कार्य
- लिख रहे हैं
- एक्सएमएल
- वर्ष