আইটেম ভিউতে, আইটেমগুলি একটি সময়মত অর্ডার করা তালিকার আকারে প্রদান করা হয়, প্রতিটি আইটেমে অতিরিক্ত মেটাডেটা তথ্য থাকে:
{ "results": { "items": [ { "channel_label": "ch_0", "start_time": "1.509", "speaker_label": "spk_0", "end_time": "2.21", "alternatives": [ { "confidence": "0.999", "content": "Hi" } ], "type": "pronunciation" }, { "channel_label": "ch_0", "speaker_label": "spk_0", "alternatives": [ { "confidence": "0.0", "content": "," } ], "type": "punctuation" }, { "channel_label": "ch_0", "start_time": "2.22", "speaker_label": "spk_0", "end_time": "2.9", "alternatives": [ { "confidence": "0.999", "content": "welcome" } ], "type": "pronunciation" }, { "channel_label": "ch_0", "speaker_label": "spk_0", "alternatives": [ { "confidence": "0.0", "content": "." } ], "type": "punctuation" } ] }
}
মেটাডেটা নিম্নরূপ:
- আদর্শ - টাইপ মান নির্দেশ করে যদি নির্দিষ্ট আইটেমটি একটি বিরাম চিহ্ন বা উচ্চারণ হয়। সমর্থিত বিরাম চিহ্নের উদাহরণ হল কমা, ফুল স্টপ এবং প্রশ্ন চিহ্ন।
- বিকল্প - আত্মবিশ্বাসের স্তর সহ, প্রকৃত ট্রান্সক্রিপশন ধারণকারী বস্তুর একটি বিন্যাস, আত্মবিশ্বাসের স্তর দ্বারা আদেশ করা। যখন বিকল্প ফলাফল বৈশিষ্ট্য সক্রিয় করা হয় না, এই তালিকায় সবসময় শুধুমাত্র একটি আইটেম থাকে।
- বিশ্বাস - প্রতিলিপির সঠিকতা সম্পর্কে Amazon Transcribe কতটা আত্মবিশ্বাসী তার একটি ইঙ্গিত৷ এটি 0-1 থেকে মান ব্যবহার করে, 1 100% আত্মবিশ্বাস নির্দেশ করে।
- সন্তুষ্ট - প্রতিলিপিকৃত শব্দ।
- সময় শুরু - অডিও বা ভিডিও ফাইলের একটি টাইম পয়েন্টার যা ss.SSS ফরম্যাটে আইটেমটির শুরু নির্দেশ করে।
- শেষ সময় - অডিও বা ভিডিও ফাইলের একটি টাইম পয়েন্টার যা ss.SSS ফরম্যাটে আইটেমের শেষ নির্দেশ করে।
- চ্যানেল লেবেল - চ্যানেল শনাক্তকারী, যেটি আইটেমে উপস্থিত থাকে যখন চ্যানেল সনাক্তকরণ বৈশিষ্ট্যটি কাজের কনফিগারেশনে সক্রিয় করা হয়।
- স্পিকার লেবেল – স্পিকার শনাক্তকারী, যেটি আইটেমে উপস্থিত থাকে যখন স্পিকার পার্টিশন বৈশিষ্ট্যটি কাজের কনফিগারেশনে সক্রিয় করা হয়।
অনুচ্ছেদ সনাক্তকরণ
অনুচ্ছেদের সনাক্তকরণ আইটেম ভিউতে মেটাডেটা তথ্যের উপর নির্ভর করে। বিশেষ করে, আমরা বাক্য শনাক্ত করতে ট্রান্সক্রিপশনের ধরন এবং বিষয়বস্তু সহ শুরু এবং শেষ সময়ের তথ্য ব্যবহার করি এবং তারপর সিদ্ধান্ত নিই কোন বাক্যগুলি অনুচ্ছেদ এন্ট্রি পয়েন্টের জন্য সেরা প্রার্থী।
একটি বাক্যকে ট্রান্সক্রিপশন আইটেমগুলির একটি তালিকা হিসাবে বিবেচনা করা হয় যা বিরাম চিহ্নের আইটেমগুলির মধ্যে বিদ্যমান যা সম্পূর্ণ স্টপ নির্দেশ করে। এর ব্যতিক্রম হল প্রতিলিপির শুরু এবং শেষ, যা ডিফল্ট বাক্যের সীমানা। নিম্নলিখিত চিত্রটি এই আইটেমগুলির একটি উদাহরণ দেখায়।
Amazon Transcribe-এর সাথে বাক্য শনাক্তকরণ সহজবোধ্য কারণ বিরাম চিহ্ন হল কমা, ফুল স্টপ, প্রশ্নবোধক চিহ্ন সহ বিরাম চিহ্ন একটি বহির্ভূত বৈশিষ্ট্য। এই ধারণায়, আমরা বাক্যের সীমানা হিসাবে একটি পূর্ণ স্টপ ব্যবহার করি।
প্রতিটি বাক্য একটি অনুচ্ছেদ পয়েন্ট হওয়া উচিত নয়। অনুচ্ছেদ শনাক্ত করার জন্য, আমরা বাক্য স্তরে একটি নতুন অন্তর্দৃষ্টি প্রবর্তন করি যাকে শুরু বিলম্ব বলা হয়, যেমনটি নিম্নলিখিত চিত্রে দেখানো হয়েছে। স্পিকার পূর্ববর্তী বাক্যটির তুলনায় বর্তমান বাক্যটির উচ্চারণে যে সময় বিলম্বের পরিচয় দেয় তা নির্ধারণ করতে আমরা একটি শুরু বিলম্ব ব্যবহার করি।
সূচনা বিলম্বের গণনার জন্য বর্তমান বাক্যের শুরুর সময় এবং স্পিকার প্রতি পূর্ববর্তী বাক্যটির শেষ সময় প্রয়োজন। যেহেতু Amazon Transcribe আইটেম প্রতি শুরু এবং শেষ সময় প্রদান করে, গণনার জন্য যথাক্রমে বর্তমান এবং পূর্ববর্তী বাক্যগুলির প্রথম এবং শেষ আইটেমগুলির ব্যবহার প্রয়োজন৷
প্রতিটি বাক্যের শুরুতে বিলম্ব জেনে, আমরা পরিসংখ্যানগত বিশ্লেষণ প্রয়োগ করতে পারি এবং বিলম্বের মোট জনসংখ্যার তুলনায় প্রতিটি বিলম্বের তাৎপর্য বের করতে পারি। আমাদের প্রেক্ষাপটে, উল্লেখযোগ্য বিলম্বগুলি হল যেগুলি জনসংখ্যার সাধারণ সময়কালের বেশি। নিম্নলিখিত গ্রাফ একটি উদাহরণ দেখায়.
এই ধারণার জন্য, আমরা গড় মানের চেয়ে বেশি সূচনা বিলম্ব সহ বাক্যগুলিকে তাৎপর্যপূর্ণ হিসাবে গ্রহণ করার সিদ্ধান্ত নিয়েছি এবং এই জাতীয় প্রতিটি বাক্যের শুরুতে একটি অনুচ্ছেদ পয়েন্ট প্রবর্তন করি। গড় মান ছাড়াও, অন্যান্য বিকল্প রয়েছে, যেমন মধ্যম থেকে বড় সমস্ত সূচনা বিলম্ব গ্রহণ করা, বা জনসংখ্যার তৃতীয় কোয়ান্টাইল বা উপরের বেড়া মান।
আমরা অনুচ্ছেদ সনাক্তকরণ প্রক্রিয়ায় আরও একটি অতিরিক্ত পদক্ষেপ যোগ করি, প্রতিটি অনুচ্ছেদে থাকা শব্দের সংখ্যা বিবেচনায় নিয়ে। যখন অনুচ্ছেদে উল্লেখযোগ্য সংখ্যক শব্দ থাকে, তখন আমরা একটি বিভক্ত অপারেশন চালাই, যার ফলে চূড়ান্ত ফলাফলে আরও একটি অনুচ্ছেদ যোগ করা হয়।
শব্দ গণনার প্রেক্ষাপটে, আমরা শব্দ সংখ্যাগুলিকে তাৎপর্যপূর্ণ হিসাবে সংজ্ঞায়িত করি যা উপরের বেড়ার মানকে অতিক্রম করে৷ আমরা এই সিদ্ধান্তটি ইচ্ছাকৃতভাবে নিই, যাতে আমরা বিভক্ত ক্রিয়াকলাপগুলিকে সেই অনুচ্ছেদে সীমাবদ্ধ রাখি যা সত্যিই আমাদের ফলাফলে বহিরাগত হিসাবে আচরণ করে৷ নিম্নলিখিত গ্রাফ একটি উদাহরণ দেখায়.
বিভক্ত অপারেশন সর্বাধিক বাক্য শুরু বিলম্ব অন্তর্দৃষ্টি বিবেচনা করে নতুন অনুচ্ছেদ এন্ট্রি পয়েন্ট নির্বাচন করে। এইভাবে, নতুন অনুচ্ছেদটি বাক্যটিতে প্রবর্তিত হয় যা বর্তমান অনুচ্ছেদের ভিতরে সর্বাধিক শুরু বিলম্ব প্রদর্শন করে। বিভক্ত পুনরাবৃত্তি করা যেতে পারে যতক্ষণ না কোনো শব্দ সংখ্যা নির্বাচিত সীমানা অতিক্রম করে, আমাদের ক্ষেত্রে উপরের বেড়া মান। নিম্নলিখিত চিত্র একটি উদাহরণ দেখায়.
উপসংহার
এই পোস্টে, আমরা ম্যানুয়াল হস্তক্ষেপ ছাড়াই আপনার ট্রান্সক্রিপ্টগুলিতে স্বয়ংক্রিয়ভাবে অনুচ্ছেদগুলি প্রবর্তন করার জন্য একটি ধারণা উপস্থাপন করেছি, অ্যামাজন ট্রান্সক্রাইব প্রকৃত প্রতিলিপির সাথে মেটাডেটা প্রদান করে।
এই ধারণাটি ভাষা বা উচ্চারণ নির্দিষ্ট নয়, কারণ এটি অনুচ্ছেদ এন্ট্রি পয়েন্টের পরামর্শ দেওয়ার জন্য অ-ভাষাগত মেটাডেটার উপর নির্ভর করে। ভবিষ্যত বৈচিত্র্যগুলি প্রতি-ভাষার ক্ষেত্রে ব্যাকরণগত বা শব্দার্থগত তথ্য অন্তর্ভুক্ত করতে পারে, অনুচ্ছেদ সনাক্তকরণ যুক্তিকে আরও উন্নত করে।
এই পোস্ট সম্পর্কে আপনার মতামত থাকলে, মন্তব্য বিভাগে আপনার মন্তব্য জমা দিন. আমরা আপনার কাছ থেকে শ্রবণ করার জন্য উন্মুখ। চেক আউট অ্যামাজন ট্রান্সক্রাইব বৈশিষ্ট্য অতিরিক্ত বৈশিষ্ট্যগুলির জন্য যা আপনাকে আপনার প্রতিলিপিগুলি থেকে সর্বাধিক মূল্য পেতে সহায়তা করবে৷
লেখক সম্পর্কে
কোস্টাস জুভানাস আমাজন ওয়েব সার্ভিসের একজন এন্টারপ্রাইজ সলিউশন আর্কিটেক্ট। তিনি গ্রাহকদের তাদের ব্যবসায়িক সম্ভাবনা অর্জন করতে ক্লাউড-ভিত্তিক সমাধান আর্কিটেক্ট করতে সাহায্য করেন। তার প্রধান ফোকাস ট্রেডিং প্ল্যাটফর্ম এবং উচ্চ কর্মক্ষমতা কম্পিউটিং সিস্টেম. তিনি জিনোমিক্স এবং বায়োইনফরমেটিক্স সম্পর্কে উত্সাহী।
পাভলোস কাইমাকিস একজন এন্টারপ্রাইজ সলিউশন আর্কিটেক্ট যিনি GR/CY/MT এ এন্টারপ্রাইজ গ্রাহকদের দেখাশোনা করছেন এবং তাদের কাছে মূল্যবান সমাধানগুলি ডিজাইন ও বাস্তবায়ন করার অভিজ্ঞতা দিয়ে তাদের সমর্থন করছেন। পাভলোস তার কর্মজীবনে সবচেয়ে বেশি সময় ব্যয় করেছেন পণ্য এবং গ্রাহক সহায়তা খাতে – উভয়ই একটি প্রকৌশল এবং ব্যবস্থাপনার দৃষ্টিকোণ থেকে। পাভলোস ভ্রমণ পছন্দ করেন এবং তিনি সর্বদা বিশ্বের নতুন জায়গাগুলি অন্বেষণের জন্য প্রস্তুত থাকেন।
- এসইও চালিত বিষয়বস্তু এবং পিআর বিতরণ। আজই পরিবর্ধিত পান।
- প্লেটোএআইস্ট্রিম। Web3 ডেটা ইন্টেলিজেন্স। জ্ঞান প্রসারিত. এখানে প্রবেশ করুন.
- অ্যাড্রিয়েন অ্যাশলির সাথে ভবিষ্যত মিন্টিং। এখানে প্রবেশ করুন.
- PREIPO® এর সাথে PRE-IPO কোম্পানিতে শেয়ার কিনুন এবং বিক্রি করুন। এখানে প্রবেশ করুন.
- উত্স: https://aws.amazon.com/blogs/machine-learning/arrange-your-transcripts-into-paragraphs-with-amazon-transcribe/
- : আছে
- : হয়
- :না
- $ ইউপি
- 1
- 100
- 22
- 7
- 9
- a
- সম্পর্কে
- সমর্থন দিন
- গ্রহণ
- অর্জন করা
- আসল
- যোগ
- যোগ
- অতিরিক্ত
- পর
- সব
- বরাবর
- এছাড়াও
- বিকল্প
- বিকল্প
- সর্বদা
- মর্দানী স্ত্রীলোক
- আমাজন ট্রান্সক্রাইব
- অ্যামাজন ওয়েব সার্ভিসেস
- পরিমাণ
- an
- বিশ্লেষণ
- এবং
- পৃথক্
- প্রয়োগ করা
- রয়েছি
- বিন্যাস
- AS
- At
- অডিও
- স্বয়ংক্রিয়ভাবে
- ভিত্তি
- BE
- কারণ
- শুরু
- সর্বোত্তম
- মধ্যে
- বৃহত্তম
- উভয়
- সীমানা
- সীমানা
- বক্স
- ব্যবসায়
- by
- নামক
- CAN
- প্রার্থী
- পেশা
- কেস
- চ্যানেল
- চেক
- মন্তব্য
- তুলনা
- কম্পিউটিং
- ধারণা
- বিশ্বাস
- সুনিশ্চিত
- কনফিগারেশন
- বিবেচনা
- বিবেচিত
- বিবেচনা করা
- ধারণ করা
- অন্তর্ভুক্ত
- বিষয়বস্তু
- প্রসঙ্গ
- বর্তমান
- ক্রেতা
- গ্রাহক সমর্থন
- গ্রাহকদের
- সিদ্ধান্ত নেন
- রায়
- ডিফল্ট
- বিলম্ব
- বিলম্ব
- নকশা
- দলিল
- ড্রাইভ
- স্থিতিকাল
- প্রতি
- সক্ষম করা
- শেষ
- প্রকৌশল
- বর্ধনশীল
- উদ্যোগ
- প্রবেশ
- প্রতি
- উদাহরণ
- উদাহরণ
- অতিক্রম করা
- অতিক্রম করে
- চিত্র প্রদর্শনীতেও
- বিদ্যমান
- অভিজ্ঞতা
- এক্সপ্লোরিং
- বৈশিষ্ট্য
- বৈশিষ্ট্য
- প্রতিক্রিয়া
- ব্যক্তিত্ব
- ফাইল
- চূড়ান্ত
- প্রথম
- কেন্দ্রবিন্দু
- অনুসরণ
- অনুসরণ
- জন্য
- ফর্ম
- বিন্যাস
- অগ্রবর্তী
- থেকে
- সম্পূর্ণ
- অধিকতর
- ভবিষ্যৎ
- জিনোমিক্স
- পাওয়া
- চিত্রলেখ
- বৃহত্তর
- আছে
- he
- শ্রবণ
- সাহায্য
- সাহায্য
- hi
- উচ্চ
- তার
- কিভাবে
- HTTPS দ্বারা
- শনাক্ত
- আইডেন্টিফায়ার
- সনাক্ত করা
- if
- বাস্তবায়ন
- in
- অন্তর্ভুক্ত করা
- ইঙ্গিত
- ইঙ্গিত
- ইঙ্গিত
- তথ্য
- সূক্ষ্মদৃষ্টি
- হস্তক্ষেপ
- মধ্যে
- প্রবর্তন করা
- উপস্থাপিত
- পরিচয় করিয়ে দেয়
- IT
- আইটেম
- কাজ
- JPG
- ভাষা
- গত
- উচ্চতা
- মত
- তালিকা
- যুক্তিবিদ্যা
- দেখুন
- খুঁজছি
- ভালবাসে
- প্রধান
- করা
- ব্যবস্থাপনা
- ম্যানুয়াল
- ছাপ
- সর্বোচ্চ
- সর্বাধিক
- গড়
- মেটাডাটা
- অধিক
- সেতু
- নতুন
- না।
- সংখ্যা
- বস্তু
- of
- on
- ONE
- কেবল
- অপারেশন
- অপারেশনস
- অপশন সমূহ
- or
- অন্যান্য
- আমাদের
- বাইরে
- শেষ
- বিশেষ
- কামুক
- কর্মক্ষমতা
- পরিপ্রেক্ষিত
- জায়গা
- প্ল্যাটফর্ম
- Plato
- প্লেটো ডেটা ইন্টেলিজেন্স
- প্লেটোডাটা
- বিন্দু
- পয়েন্ট
- জনসংখ্যা
- পোস্ট
- সম্ভাব্য
- বর্তমান
- উপস্থাপন
- আগে
- প্রক্রিয়া
- পণ্য
- প্রদত্ত
- উপলব্ধ
- প্রশ্ন
- পুনরাবৃত্ত
- প্রয়োজন
- যথাক্রমে
- সীমাবদ্ধ করা
- ফল
- ফলাফল
- চালান
- অধ্যায়
- সেক্টর
- নির্বাচিত
- বাক্য
- সেবা
- উচিত
- শো
- তাত্পর্য
- গুরুত্বপূর্ণ
- So
- সমাধান
- সলিউশন
- বক্তা
- নির্দিষ্ট
- অতিবাহিত
- বিভক্ত করা
- টুকরা
- শুরু
- পরিসংখ্যানসংক্রান্ত
- ধাপ
- থামুন
- অকপট
- জমা
- এমন
- সুপারিশ
- সমর্থন
- সমর্থিত
- সমর্থক
- সিস্টেম
- গ্রহণ
- চেয়ে
- যে
- সার্জারির
- বিশ্ব
- তাদের
- তাহাদিগকে
- তারপর
- সেখানে।
- যার ফলে
- এইগুলো
- তৃতীয়
- এই
- সেগুলো
- সময়
- বার
- থেকে
- মোট
- লেনদেন
- ট্রেডিং প্ল্যাটফর্মগুলি
- প্রতিলিপি
- প্রকৃতপক্ষে
- আদর্শ
- ধরনের
- টিপিক্যাল
- পর্যন্ত
- ব্যবহার
- ব্যবহার
- ব্যবহারসমূহ
- সদ্ব্যবহার করা
- মূল্য
- মানগুলি
- ভিডিও
- চেক
- ছিল
- উপায়..
- we
- ওয়েব
- ওয়েব সার্ভিস
- স্বাগত
- কখন
- যে
- ইচ্ছা
- সঙ্গে
- ছাড়া
- শব্দ
- শব্দ
- বিশ্ব
- আপনি
- আপনার
- zephyrnet