在项目视图中,项目以及时排序列表的形式提供,每个项目都包含额外的元数据信息:
{ "results": { "items": [ { "channel_label": "ch_0", "start_time": "1.509", "speaker_label": "spk_0", "end_time": "2.21", "alternatives": [ { "confidence": "0.999", "content": "Hi" } ], "type": "pronunciation" }, { "channel_label": "ch_0", "speaker_label": "spk_0", "alternatives": [ { "confidence": "0.0", "content": "," } ], "type": "punctuation" }, { "channel_label": "ch_0", "start_time": "2.22", "speaker_label": "spk_0", "end_time": "2.9", "alternatives": [ { "confidence": "0.999", "content": "welcome" } ], "type": "pronunciation" }, { "channel_label": "ch_0", "speaker_label": "spk_0", "alternatives": [ { "confidence": "0.0", "content": "." } ], "type": "punctuation" } ] }
}
元数据如下:
- Type – 类型值指示特定项目是标点符号还是发音。 支持的标点符号示例包括逗号、句号和问号。
- 备择方案 – 包含实际转录的对象数组,以及按置信度排序的置信度。 当未启用替代结果功能时,此列表始终只有一项。
- 置信度 – 表明 Amazon Transcribe 对转录正确性的信心程度。 它使用 0–1 之间的值,1 表示 100% 置信度。
- 内容 – 转录的词。
- 开始时间 – 音频或视频文件的时间指针,以 ss.SSS 格式指示项目的开始。
- 结束时间 – 音频或视频文件的时间指针,指示 ss.SSS 格式的项目结束。
- 频道标签 – 通道标识符,仅当在作业配置中启用通道标识功能时才会出现在项目中。
- 扬声器标签 – 演讲者标识符,仅当在作业配置中启用演讲者分区功能时才会出现在项目中。
识别段落
段落的识别依赖于项目视图中的元数据信息。 特别是,我们利用开始和结束时间信息以及转录类型和内容来识别句子,然后决定哪些句子是段落入口点的最佳候选者。
句子被认为是存在于表示句号的标点符号项之间的转录项列表。 例外情况是转录的开始和结束,默认情况下它们是句子边界。 下图显示了这些项目的示例。
使用 Amazon Transcribe 可以直接识别句子,因为标点符号是开箱即用的功能,标点符号类型包括逗号、句号、问号。 在这个概念中,我们使用句号作为句子边界。
不是每个句子都应该是段落点。 为了识别段落,我们在句子级别引入了一种称为开始延迟的新见解,如下图所示。 我们使用开始延迟来定义说话者相对于前一个句子引入当前句子发音的时间延迟。
开始延迟的计算需要每个说话人当前句子的开始时间和前一个句子的结束时间。 由于 Amazon Transcribe 提供每个项目的开始和结束时间,因此计算需要分别使用当前和上一个句子的第一个和最后一个项目。
了解每个句子的开始延迟,我们可以应用统计分析并计算出每个延迟相对于总延迟的重要性。 在我们的背景下,重大延迟是指那些超过人口典型持续时间的延迟。 下图显示了一个示例。
对于这个概念,我们决定接受开始延迟大于平均值的句子是重要的,并在每个这样的句子的开头引入一个段落点。 除了平均值之外,还有其他选项,例如接受所有大于中位数、第三分位数或上限值的开始延迟。
我们在段落识别过程中增加了一个额外的步骤,考虑到每个段落包含的单词数。 当段落包含大量单词时,我们会运行拆分操作,从而在最终结果中再添加一个段落。
在字数统计的上下文中,我们将超过上限值的字数定义为显着。 我们故意做出这个决定,以便我们将拆分操作限制在我们的结果中真正表现为异常值的段落。 下图显示了一个示例。
拆分操作通过考虑最大句子开始延迟洞察来选择新的段落入口点。 这样,新段落将在当前段落内显示最大开始延迟的句子处引入。 可以重复拆分,直到没有字数超过所选边界,在我们的例子中是上限值。 下图显示了一个示例。
结论
在这篇文章中,我们提出了一个概念,可以根据 Amazon Transcribe 提供的元数据以及实际的成绩单自动将段落引入您的成绩单,而无需人工干预。
这个概念不是特定于语言或口音的,因为它依赖于非语言元数据来建议段落入口点。 未来的变体可以包括每种语言案例的语法或语义信息,进一步增强段落识别逻辑。
如果您对这篇文章有任何反馈,请在评论部分提交您的评论。 我们期待您的回音。 查看 亚马逊转录功能 了解可帮助您从成绩单中获得最大价值的其他功能。
作者简介
科斯塔斯·祖瓦纳斯 是 Amazon Web Services 的企业解决方案架构师。 他帮助客户构建基于云的解决方案以实现其业务潜力。 他的主要工作重点是交易平台和高性能计算系统。 他还热衷于基因组学和生物信息学。
帕夫洛斯凯马基斯 是一名企业解决方案架构师,负责 GR/CY/MT 中的企业客户,以他的经验支持他们设计和实施可为他们带来价值的解决方案。 Pavlos 在他的职业生涯中花费最多的时间在产品和客户支持部门——无论是从工程还是管理的角度。 Pavlos 热爱旅行,他总是乐于探索世界上的新地方。
- SEO 支持的内容和 PR 分发。 今天得到放大。
- 柏拉图爱流。 Web3 数据智能。 知识放大。 访问这里。
- 与 Adryenn Ashley 一起铸造未来。 访问这里。
- 使用 PREIPO® 买卖 PRE-IPO 公司的股票。 访问这里。
- Sumber: https://aws.amazon.com/blogs/machine-learning/arrange-your-transcripts-into-paragraphs-with-amazon-transcribe/
- :具有
- :是
- :不是
- $UP
- 1
- 100
- 22
- 7
- 9
- a
- 关于
- 接受
- 接受
- 实际
- 加
- 添加
- 额外
- 后
- 所有类型
- 沿
- 还
- 替代
- 替代品
- 时刻
- Amazon
- 亚马逊转录
- 亚马逊网络服务
- 量
- an
- 分析
- 和
- 除了
- 使用
- 保健
- 排列
- AS
- At
- 音频
- 自动
- 基于
- BE
- 因为
- 开始
- 最佳
- 之间
- 最大
- 都
- 边界
- 边界
- 盒子
- 商业
- by
- 被称为
- CAN
- 候选人
- 寻找工作
- 案件
- 渠道
- 查
- 注释
- 对照
- 计算
- 概念
- 信心
- 信心
- 配置
- 考虑
- 考虑
- 考虑
- 包含
- 包含
- 内容
- 上下文
- 电流
- 顾客
- 客户支持
- 合作伙伴
- 决定
- 决定
- 默认
- 延迟
- 延误
- 设计
- 文件
- 驾驶
- 为期
- 每
- 启用
- 结束
- 工程师
- 加强
- 企业
- 条目
- 所有的
- 例子
- 例子
- 超过
- 超过
- 展品
- 存在
- 体验
- 探索
- 专栏
- 特征
- 反馈
- 数字
- 文件
- 最后
- 姓氏:
- 专注焦点
- 以下
- 如下
- 针对
- 申请
- 格式
- 向前
- 止
- ,
- 进一步
- 未来
- 基因组学
- 得到
- 图形
- 更大的
- 有
- he
- 听力
- 帮助
- 帮助
- hi
- 高
- 他的
- 创新中心
- HTTPS
- 鉴定
- 识别码
- 鉴定
- if
- 实施
- in
- 包括
- 表明
- 表示
- 迹象
- 信息
- 洞察
- 介入
- 成
- 介绍
- 介绍
- 推出
- IT
- 项目
- 工作
- JPG
- 语言
- 名:
- Level
- 喜欢
- 清单
- 逻辑
- 看
- 寻找
- 爱
- 主要
- 使
- 颠覆性技术
- 手册
- 标记
- 最大
- 最多
- 意味着
- 元数据
- 更多
- 最先进的
- 全新
- 没有
- 数
- 对象
- of
- on
- 一
- 仅由
- 操作
- 运营
- 附加选项
- or
- 其他名称
- 我们的
- 输出
- 超过
- 特别
- 多情
- 性能
- 透视
- 地方
- 平台
- 柏拉图
- 柏拉图数据智能
- 柏拉图数据
- 点
- 点
- 人口
- 帖子
- 潜力
- 当下
- 呈现
- 以前
- 过程
- 产品
- 提供
- 提供
- 题
- 重复
- 需要
- 分别
- 限制
- 导致
- 成果
- 运行
- 部分
- 扇形
- 选
- 句子
- 特色服务
- 应该
- 作品
- 意义
- 显著
- So
- 方案,
- 解决方案
- 喇叭
- 具体的
- 花费
- 分裂
- 拆分
- 开始
- 统计
- 步
- Stop 停止
- 简单的
- 提交
- 这样
- 建议
- SUPPORT
- 支持
- 支持
- 产品
- 服用
- 比
- 这
- 世界
- 其
- 他们
- 然后
- 那里。
- 从而
- 博曼
- 第三
- Free Introduction
- 那些
- 次
- 时
- 至
- 合计
- 交易
- 交易平台
- 成绩单
- 真正
- 类型
- 类型
- 普遍
- 直到
- 用法
- 使用
- 使用
- 利用
- 折扣值
- 价值观
- 视频
- 查看
- 是
- 方法..
- we
- 卷筒纸
- Web服务
- 欢迎进入
- ,尤其是
- 这
- 将
- 也完全不需要
- Word
- 话
- 世界
- 完全
- 您一站式解决方案
- 和风网