ในมุมมองรายการ รายการจะถูกจัดเตรียมในรูปแบบของรายการที่สั่งซื้อตามเวลา โดยทุกรายการจะมีข้อมูลเมตาเพิ่มเติม:
{ "results": { "items": [ { "channel_label": "ch_0", "start_time": "1.509", "speaker_label": "spk_0", "end_time": "2.21", "alternatives": [ { "confidence": "0.999", "content": "Hi" } ], "type": "pronunciation" }, { "channel_label": "ch_0", "speaker_label": "spk_0", "alternatives": [ { "confidence": "0.0", "content": "," } ], "type": "punctuation" }, { "channel_label": "ch_0", "start_time": "2.22", "speaker_label": "spk_0", "end_time": "2.9", "alternatives": [ { "confidence": "0.999", "content": "welcome" } ], "type": "pronunciation" }, { "channel_label": "ch_0", "speaker_label": "spk_0", "alternatives": [ { "confidence": "0.0", "content": "." } ], "type": "punctuation" } ] }
}
ข้อมูลเมตามีดังนี้:
- ชนิดภาพเขียน – ค่าประเภทระบุว่ารายการเฉพาะเป็นเครื่องหมายวรรคตอนหรือการออกเสียง ตัวอย่างของเครื่องหมายวรรคตอนที่รองรับ ได้แก่ เครื่องหมายจุลภาค จุดเต็ม และเครื่องหมายคำถาม
- ทางเลือก – อาร์เรย์ของออบเจกต์ที่มีการถอดความตามจริง พร้อมด้วยระดับความเชื่อมั่น เรียงลำดับตามระดับความเชื่อมั่น เมื่อไม่ได้เปิดใช้คุณลักษณะผลลัพธ์ทางเลือก รายการนี้จะมีเพียงรายการเดียวเท่านั้น
- ความมั่นใจ – การบ่งชี้ว่า Amazon Transcribe มีความมั่นใจเพียงใดเกี่ยวกับความถูกต้องของการถอดความ ใช้ค่าตั้งแต่ 0–1 โดย 1 หมายถึงความมั่นใจ 100%
- คอนเทนต์ - คำที่ถอดความ
- เวลาเริ่มต้น – ตัวชี้เวลาของไฟล์เสียงหรือวิดีโอที่ระบุจุดเริ่มต้นของรายการในรูปแบบ ss.SSS
- เวลาสิ้นสุด – ตัวชี้เวลาของไฟล์เสียงหรือวิดีโอที่ระบุจุดสิ้นสุดของรายการในรูปแบบ ss.SSS
- ป้ายช่อง – ตัวระบุช่องซึ่งมีอยู่ในรายการเฉพาะเมื่อเปิดใช้งานคุณสมบัติการระบุช่องในการกำหนดค่างาน
- ป้ายลำโพง – ตัวระบุลำโพง ซึ่งมีอยู่ในรายการเฉพาะเมื่อเปิดใช้งานคุณสมบัติการแบ่งพาร์ติชั่นลำโพงในการกำหนดค่างาน
การระบุย่อหน้า
การระบุย่อหน้าขึ้นอยู่กับข้อมูลเมตาในมุมมองรายการ โดยเฉพาะอย่างยิ่ง เราใช้ข้อมูลเวลาเริ่มต้นและเวลาสิ้นสุดพร้อมกับประเภทการถอดความและเนื้อหาเพื่อระบุประโยค จากนั้นตัดสินใจว่าประโยคใดเหมาะสมที่สุดสำหรับจุดเข้าย่อหน้า
ประโยคถือเป็นรายการของการถอดความที่มีอยู่ระหว่างรายการเครื่องหมายวรรคตอนที่ระบุเครื่องหมายหยุดเต็ม ข้อยกเว้นนี้คือจุดเริ่มต้นและจุดสิ้นสุดของการถอดเสียง ซึ่งเป็นขอบเขตของประโยคเริ่มต้น รูปภาพต่อไปนี้แสดงตัวอย่างของรายการเหล่านี้
การระบุประโยคนั้นตรงไปตรงมาด้วย Amazon Transcribe เนื่องจากเครื่องหมายวรรคตอนเป็นคุณลักษณะที่พร้อมใช้งานทันที พร้อมด้วยเครื่องหมายวรรคตอนประเภทเครื่องหมายจุลภาค จุดจบ เครื่องหมายคำถาม ในแนวคิดนี้ เราใช้จุดจบเป็นขอบเขตของประโยค
ไม่ใช่ทุกประโยคที่ควรเป็นจุดย่อหน้า ในการระบุย่อหน้า เราแนะนำข้อมูลเชิงลึกใหม่ในระดับประโยคที่เรียกว่าการหน่วงเวลาเริ่มต้น ดังแสดงในรูปต่อไปนี้ เราใช้การหน่วงเวลาเริ่มต้นเพื่อกำหนดการหน่วงเวลาที่ผู้พูดแนะนำการออกเสียงของประโยคปัจจุบันเมื่อเปรียบเทียบกับประโยคก่อนหน้า
การคำนวณการหน่วงเวลาเริ่มต้นต้องใช้เวลาเริ่มต้นของประโยคปัจจุบันและเวลาสิ้นสุดของประโยคก่อนหน้าต่อผู้พูด เนื่องจาก Amazon Transcribe มีเวลาเริ่มต้นและเวลาสิ้นสุดสำหรับแต่ละรายการ การคำนวณจึงต้องใช้รายการแรกและรายการสุดท้ายของประโยคปัจจุบันและก่อนหน้าตามลำดับ
เมื่อทราบการหน่วงเวลาเริ่มต้นของทุกประโยค เราสามารถใช้การวิเคราะห์ทางสถิติและหาความสำคัญของการหน่วงเวลาทุกครั้งเมื่อเปรียบเทียบกับจำนวนประชากรทั้งหมดของความล่าช้า ในบริบทของเรา ความล่าช้าที่สำคัญคือความล่าช้าที่เกินระยะเวลาปกติของประชากร กราฟต่อไปนี้แสดงตัวอย่าง
สำหรับแนวคิดนี้ เราตัดสินใจที่จะยอมรับประโยคที่มีความล่าช้าในการเริ่มต้นมากกว่าค่าเฉลี่ยเป็นนัยสำคัญ และแนะนำจุดย่อหน้าที่จุดเริ่มต้นของทุกประโยคดังกล่าว นอกเหนือจากค่าเฉลี่ยแล้ว ยังมีตัวเลือกอื่นๆ เช่น ยอมรับการหน่วงเวลาเริ่มต้นทั้งหมดที่มากกว่าค่ามัธยฐาน หรือค่าควอไทล์ที่สามหรือค่ารั้วบนของประชากร
เราเพิ่มขั้นตอนเพิ่มเติมอีกหนึ่งขั้นตอนในขั้นตอนการระบุย่อหน้า โดยคำนึงถึงจำนวนคำที่มีอยู่ในแต่ละย่อหน้า เมื่อย่อหน้าประกอบด้วยคำจำนวนมาก เราจะดำเนินการแยก ดังนั้น จึงเพิ่มอีกหนึ่งย่อหน้าในผลลัพธ์สุดท้าย
ในบริบทของการนับจำนวนคำ เรากำหนดให้จำนวนคำที่เกินค่ารั้วด้านบนมีความสำคัญ เราทำการตัดสินใจนี้โดยเจตนา เพื่อให้เราจำกัดการดำเนินการแยกไว้เฉพาะย่อหน้าที่มีลักษณะผิดปกติอย่างแท้จริงในผลลัพธ์ของเรา กราฟต่อไปนี้แสดงตัวอย่าง
การดำเนินการแยกเลือกจุดเริ่มต้นย่อหน้าใหม่โดยพิจารณาจากข้อมูลเชิงลึกของการหน่วงเวลาการเริ่มต้นประโยคสูงสุด ด้วยวิธีนี้ ย่อหน้าใหม่จะถูกนำมาใช้ในประโยคที่แสดงการหน่วงเวลาเริ่มต้นสูงสุดภายในย่อหน้าปัจจุบัน การแบ่งสามารถทำซ้ำได้จนกว่าจะไม่มีการนับจำนวนคำเกินขอบเขตที่เลือก ในกรณีของเราคือค่ารั้วด้านบน รูปต่อไปนี้แสดงตัวอย่าง
สรุป
ในโพสต์นี้ เรานำเสนอแนวคิดในการแนะนำย่อหน้าให้กับการถอดเสียงของคุณโดยอัตโนมัติ โดยไม่ต้องดำเนินการด้วยตนเอง โดยยึดตามข้อมูลเมตาที่ Amazon Transcribe จัดเตรียมให้พร้อมกับการถอดเสียงจริง
แนวคิดนี้ไม่ใช่ภาษาหรือสำเนียงเฉพาะ เนื่องจากอาศัยข้อมูลเมตาที่ไม่ใช่ภาษาศาสตร์เพื่อแนะนำจุดเข้าย่อหน้า รูปแบบต่างๆ ในอนาคตอาจรวมถึงข้อมูลทางไวยากรณ์หรือความหมายในกรณีของภาษานั้นๆ ซึ่งจะช่วยเพิ่มตรรกะในการระบุย่อหน้า
หากคุณมีข้อเสนอแนะเกี่ยวกับโพสต์นี้ โปรดส่งความคิดเห็นของคุณในส่วนความคิดเห็น เราหวังว่าจะได้ยินจากคุณ. เช็คเอาท์ คุณลักษณะของ Amazon Transcribe สำหรับคุณสมบัติเพิ่มเติมที่จะช่วยให้คุณได้รับประโยชน์สูงสุดจากทรานสคริปต์ของคุณ
เกี่ยวกับผู้เขียน
คอสตาส ซูวานาส เป็น Enterprise Solution Architect ที่ Amazon Web Services เขาช่วยลูกค้าออกแบบโซลูชันบนคลาวด์เพื่อให้บรรลุศักยภาพทางธุรกิจ เป้าหมายหลักของเขาคือแพลตฟอร์มการซื้อขายและระบบคอมพิวเตอร์ประสิทธิภาพสูง เขายังหลงใหลเกี่ยวกับจีโนมิกส์และชีวสารสนเทศ
พาฟลอส ไคมาคิส เป็น Enterprise Solutions Architect ที่ดูแลลูกค้าระดับ Enterprise ใน GR/CY/MT โดยสนับสนุนพวกเขาด้วยประสบการณ์ในการออกแบบและปรับใช้โซลูชันที่เพิ่มคุณค่าให้กับพวกเขา Pavlos ใช้เวลาส่วนใหญ่ในอาชีพของเขาในภาคผลิตภัณฑ์และการสนับสนุนลูกค้า - ทั้งจากมุมมองด้านวิศวกรรมและการจัดการ Pavlos รักการเดินทางและเขาพร้อมที่จะสำรวจสถานที่ใหม่ๆ ในโลกอยู่เสมอ
- เนื้อหาที่ขับเคลื่อนด้วย SEO และการเผยแพร่ประชาสัมพันธ์ รับการขยายวันนี้
- เพลโตไอสตรีม. ข้อมูลอัจฉริยะ Web3 ขยายความรู้ เข้าถึงได้ที่นี่.
- การสร้างอนาคตโดย Adryenn Ashley เข้าถึงได้ที่นี่.
- ซื้อและขายหุ้นในบริษัท PRE-IPO ด้วย PREIPO® เข้าถึงได้ที่นี่.
- ที่มา: https://aws.amazon.com/blogs/machine-learning/arrange-your-transcripts-into-paragraphs-with-amazon-transcribe/
- :มี
- :เป็น
- :ไม่
- $ ขึ้น
- 1
- 100
- 22
- 7
- 9
- a
- เกี่ยวกับเรา
- ยอมรับ
- ยอมรับ
- บรรลุ
- ที่เกิดขึ้นจริง
- เพิ่ม
- เพิ่ม
- เพิ่มเติม
- หลังจาก
- ทั้งหมด
- ตาม
- ด้วย
- ทางเลือก
- ทางเลือก
- เสมอ
- อเมซอน
- ถอดความจากอเมซอน
- Amazon Web Services
- จำนวน
- an
- การวิเคราะห์
- และ
- นอกเหนือ
- ใช้
- เป็น
- แถว
- AS
- At
- เสียง
- อัตโนมัติ
- ตาม
- BE
- เพราะ
- การเริ่มต้น
- ที่ดีที่สุด
- ระหว่าง
- ที่ใหญ่ที่สุด
- ทั้งสอง
- เขตแดน
- เขตแดน
- กล่อง
- ธุรกิจ
- by
- ที่เรียกว่า
- CAN
- ผู้สมัคร
- ความก้าวหน้า
- กรณี
- ช่อง
- ตรวจสอบ
- ความคิดเห็น
- การเปรียบเทียบ
- การคำนวณ
- แนวคิด
- ความมั่นใจ
- มั่นใจ
- องค์ประกอบ
- การพิจารณา
- ถือว่า
- พิจารณา
- บรรจุ
- ที่มีอยู่
- เนื้อหา
- สิ่งแวดล้อม
- ปัจจุบัน
- ลูกค้า
- Customer Support
- ลูกค้า
- ตัดสินใจ
- การตัดสินใจ
- ค่าเริ่มต้น
- ความล่าช้า
- ความล่าช้า
- ออกแบบ
- เอกสาร
- ขับรถ
- ระยะเวลา
- แต่ละ
- เปิดการใช้งาน
- ปลาย
- ชั้นเยี่ยม
- การเสริมสร้าง
- Enterprise
- การเข้า
- ทุกๆ
- ตัวอย่าง
- ตัวอย่าง
- เกินกว่า
- เกินกว่า
- การจัดแสดงนิทรรศการ
- ที่มีอยู่
- ประสบการณ์
- สำรวจ
- ลักษณะ
- คุณสมบัติ
- ข้อเสนอแนะ
- รูป
- เนื้อไม่มีมัน
- สุดท้าย
- ชื่อจริง
- โฟกัส
- ดังต่อไปนี้
- ดังต่อไปนี้
- สำหรับ
- ฟอร์ม
- รูป
- ข้างหน้า
- ราคาเริ่มต้นที่
- เต็ม
- ต่อไป
- อนาคต
- ฟังก์ชั่น
- ได้รับ
- กราฟ
- มากขึ้น
- มี
- he
- การได้ยิน
- ช่วย
- จะช่วยให้
- hi
- จุดสูง
- ของเขา
- สรุป ความน่าเชื่อถือของ Olymp Trade?
- HTTPS
- ประจำตัว
- ระบุ
- แยกแยะ
- if
- การดำเนินการ
- in
- ประกอบด้วย
- แสดง
- บ่งชี้ว่า
- การแสดง
- ข้อมูล
- ความเข้าใจ
- การแทรกแซง
- เข้าไป
- แนะนำ
- แนะนำ
- เปิดตัว
- IT
- รายการ
- การสัมภาษณ์
- jpg
- ภาษา
- ชื่อสกุล
- ชั้น
- กดไลก์
- รายการ
- ตรรกะ
- ดู
- ที่ต้องการหา
- รัก
- หลัก
- ทำ
- การจัดการ
- คู่มือ
- เครื่องหมาย
- แม็กซ์
- สูงสุด
- หมายความ
- เมตาดาต้า
- ข้อมูลเพิ่มเติม
- มากที่สุด
- ใหม่
- ไม่
- จำนวน
- วัตถุ
- of
- on
- ONE
- เพียง
- การดำเนินการ
- การดำเนินการ
- Options
- or
- อื่นๆ
- ของเรา
- ออก
- เกิน
- ในสิ่งที่สนใจ
- หลงใหล
- การปฏิบัติ
- มุมมอง
- สถานที่
- แพลตฟอร์ม
- เพลโต
- เพลโตดาต้าอินเทลลิเจนซ์
- เพลโตดาต้า
- จุด
- จุด
- ประชากร
- โพสต์
- ที่มีศักยภาพ
- นำเสนอ
- นำเสนอ
- ก่อน
- กระบวนการ
- ผลิตภัณฑ์
- ให้
- ให้
- คำถาม
- ซ้ำแล้วซ้ำอีก
- ต้อง
- ตามลำดับ
- จำกัด
- ผล
- ผลสอบ
- วิ่ง
- Section
- ภาค
- เลือก
- ประโยค
- บริการ
- น่า
- แสดงให้เห็นว่า
- ความสำคัญ
- สำคัญ
- So
- ทางออก
- โซลูชัน
- ลำโพง
- โดยเฉพาะ
- การใช้จ่าย
- แยก
- แยก
- เริ่มต้น
- ทางสถิติ
- ขั้นตอน
- หยุด
- ซื่อตรง
- ส่ง
- อย่างเช่น
- แนะนำ
- สนับสนุน
- ที่สนับสนุน
- ที่สนับสนุน
- ระบบ
- การ
- กว่า
- ที่
- พื้นที่
- โลก
- ของพวกเขา
- พวกเขา
- แล้วก็
- ที่นั่น
- ดังนั้น
- ล้อยางขัดเหล่านี้ติดตั้งบนแกน XNUMX (มม.) ผลิตภัณฑ์นี้ถูกผลิตในหลายรูปทรง และหลากหลายเบอร์ความแน่นหนาของปริมาณอนุภาคขัดของมัน จะทำให้ท่านได้รับประสิทธิภาพสูงในการขัดและการใช้งานที่ยาวนาน
- ที่สาม
- นี้
- เหล่านั้น
- เวลา
- ครั้ง
- ไปยัง
- รวม
- เทรด
- แพลตฟอร์มการซื้อขาย
- สำเนา
- อย่างแท้จริง
- ชนิด
- ชนิด
- ตามแบบฉบับ
- จนกระทั่ง
- การใช้
- ใช้
- ใช้
- นำไปใช้
- ความคุ้มค่า
- ความคุ้มค่า
- วีดีโอ
- รายละเอียด
- คือ
- ทาง..
- we
- เว็บ
- บริการเว็บ
- ยินดีต้อนรับ
- เมื่อ
- ที่
- จะ
- กับ
- ไม่มี
- คำ
- คำ
- โลก
- คุณ
- ของคุณ
- ลมทะเล