항목 보기에서 항목은 적시에 정렬된 목록 형식으로 제공되며 모든 항목에는 추가 메타데이터 정보가 포함되어 있습니다.
{ "results": { "items": [ { "channel_label": "ch_0", "start_time": "1.509", "speaker_label": "spk_0", "end_time": "2.21", "alternatives": [ { "confidence": "0.999", "content": "Hi" } ], "type": "pronunciation" }, { "channel_label": "ch_0", "speaker_label": "spk_0", "alternatives": [ { "confidence": "0.0", "content": "," } ], "type": "punctuation" }, { "channel_label": "ch_0", "start_time": "2.22", "speaker_label": "spk_0", "end_time": "2.9", "alternatives": [ { "confidence": "0.999", "content": "welcome" } ], "type": "pronunciation" }, { "channel_label": "ch_0", "speaker_label": "spk_0", "alternatives": [ { "confidence": "0.0", "content": "." } ], "type": "punctuation" } ] }
}
메타데이터는 다음과 같습니다.
- 타입 – type 값은 특정 항목이 구두점인지 발음인지를 나타냅니다. 지원되는 문장 부호의 예로는 쉼표, 마침표 및 물음표가 있습니다.
- 대체 – 신뢰 수준에 따라 정렬된 신뢰 수준과 함께 실제 기록을 포함하는 개체 배열입니다. 대체 결과 기능이 활성화되지 않은 경우 이 목록에는 항상 하나의 항목만 있습니다.
- 자신감 – Amazon Transcribe가 트랜스크립션의 정확성에 대해 얼마나 확신하는지 나타냅니다. 0~1 사이의 값을 사용하며 1은 100% 신뢰도를 나타냅니다.
- 내용 – 전사된 단어.
- 시작 시간 – ss.SSS 형식으로 항목의 시작을 나타내는 오디오 또는 비디오 파일의 시간 포인터.
- 종료 시간 – ss.SSS 형식으로 항목의 끝을 나타내는 오디오 또는 비디오 파일의 시간 포인터.
- 채널 레이블 – 작업 구성에서 채널 식별 기능이 활성화된 경우에만 항목에 있는 채널 식별자입니다.
- 스피커 라벨 – 발언자 분할 기능이 작업 구성에서 활성화된 경우에만 항목에 있는 발언자 식별자.
단락 식별
단락 식별은 항목 보기의 메타데이터 정보에 의존합니다. 특히 시작 및 종료 시간 정보와 전사 유형 및 내용을 활용하여 문장을 식별한 다음 어떤 문장이 단락 진입점에 가장 적합한 후보인지 결정합니다.
문장은 마침표를 나타내는 구두점 항목 사이에 존재하는 표기 항목의 목록으로 간주됩니다. 이에 대한 예외는 기본적으로 문장 경계인 대본의 시작과 끝입니다. 다음 그림은 이러한 항목의 예를 보여줍니다.
구두점은 쉼표, 마침표, 물음표와 같은 구두점 유형과 함께 즉시 사용 가능한 기능이므로 Amazon Transcribe에서는 문장 식별이 간단합니다. 이 개념에서는 마침표를 문장 경계로 활용합니다.
모든 문장이 단락 포인트가 되어야 하는 것은 아닙니다. 단락을 식별하기 위해 다음 그림과 같이 문장 수준에서 시작 지연이라는 새로운 통찰력을 도입합니다. 시작 지연을 사용하여 화자가 이전 문장과 비교하여 현재 문장의 발음에 도입하는 시간 지연을 정의합니다.
시작 지연 계산에는 화자당 현재 문장의 시작 시간과 이전 문장의 종료 시간이 필요합니다. Amazon Transcribe는 항목당 시작 및 종료 시간을 제공하므로 계산 시 각각 현재 및 이전 문장의 첫 번째 항목과 마지막 항목을 사용해야 합니다.
모든 문장의 시작 지연을 알면 통계 분석을 적용하고 전체 지연 모집단과 비교하여 모든 지연의 중요성을 파악할 수 있습니다. 우리의 맥락에서 상당한 지연은 모집단의 일반적인 기간을 초과하는 지연입니다. 다음 그래프는 예를 보여줍니다.
이 개념을 위해 우리는 평균값보다 큰 시작 지연이 있는 문장을 중요한 것으로 받아들이고 그러한 모든 문장의 시작 부분에 단락 지점을 도입하기로 결정합니다. 평균값 외에도 중앙값보다 큰 모든 시작 지연을 수락하거나 모집단의 세 번째 분위수 또는 상위 펜스 값을 수락하는 것과 같은 다른 옵션이 있습니다.
각 단락에 포함된 단어 수를 고려하여 단락 식별 프로세스에 한 단계를 더 추가합니다. 단락에 상당한 수의 단어가 포함된 경우 분할 작업을 실행하여 최종 결과에 단락을 하나 더 추가합니다.
단어 수의 맥락에서 상위 펜스 값을 초과하는 단어 수를 중요한 것으로 정의합니다. 의도적으로 이 결정을 내리므로 분할 작업을 실제로 결과에서 이상치로 작동하는 단락으로 제한합니다. 다음 그래프는 예를 보여줍니다.
분할 작업은 최대 문장 시작 지연 통찰력을 고려하여 새 단락 진입점을 선택합니다. 이렇게 하면 현재 단락 내에서 최대 시작 지연을 나타내는 문장에 새 단락이 도입됩니다. 단어 수가 선택한 경계(이 경우에는 상단 펜스 값)를 초과하지 않을 때까지 분할을 반복할 수 있습니다. 다음 그림은 예를 보여줍니다.
결론
이 게시물에서는 Amazon Transcribe가 실제 트랜스크립트와 함께 제공하는 메타데이터를 기반으로 수동 개입 없이 트랜스크립트에 단락을 자동으로 도입하는 개념을 제시했습니다.
이 개념은 문단 진입점을 제안하기 위해 비언어적 메타데이터에 의존하기 때문에 특정 언어나 악센트에 국한되지 않습니다. 향후 변형에는 언어별 사례에 대한 문법적 또는 의미론적 정보가 포함될 수 있으므로 단락 식별 논리가 더욱 향상됩니다.
이 게시물에 대한 피드백이 있는 경우 댓글 섹션에 의견을 제출하십시오. 여러분의 의견을 기다리겠습니다. 체크아웃 Amazon Transcribe 기능 성적표에서 최대한의 가치를 얻는 데 도움이 되는 추가 기능에 대해 알아보십시오.
저자에 관하여
코스타스 추바나스 Amazon Web Services의 엔터프라이즈 솔루션 아키텍트입니다. 그는 고객이 비즈니스 잠재력을 달성할 수 있도록 클라우드 기반 솔루션을 설계하도록 돕습니다. 그의 주요 초점은 거래 플랫폼과 고성능 컴퓨팅 시스템입니다. 그는 또한 유전체학과 생물 정보학에 열정적입니다.
파블로스 카이마키스 GR/CY/MT의 엔터프라이즈 고객을 돌보는 엔터프라이즈 솔루션 아키텍트로서 가치를 창출하는 솔루션을 설계하고 구현하는 경험을 바탕으로 고객을 지원합니다. Pavlos는 엔지니어링 및 관리 측면 모두에서 제품 및 고객 지원 부문에서 가장 많은 시간을 보냈습니다. Pavlos는 여행을 좋아하고 항상 세계의 새로운 장소를 탐험합니다.
- SEO 기반 콘텐츠 및 PR 배포. 오늘 증폭하십시오.
- PlatoAiStream. Web3 데이터 인텔리전스. 지식 증폭. 여기에서 액세스하십시오.
- 미래 만들기 w Adryenn Ashley. 여기에서 액세스하십시오.
- PREIPO®로 PRE-IPO 회사의 주식을 사고 팔 수 있습니다. 여기에서 액세스하십시오.
- 출처: https://aws.amazon.com/blogs/machine-learning/arrange-your-transcripts-into-paragraphs-with-amazon-transcribe/
- :있다
- :이다
- :아니
- $UP
- 1
- 100
- 22
- 7
- 9
- a
- 소개
- 수락
- 수락
- 달성
- 실제
- 더하다
- 첨가
- 추가
- 후
- All
- 따라
- 또한
- 대안
- 대안
- 항상
- 아마존
- 아마존 전사
- Amazon Web Services
- 양
- an
- 분석
- 및
- 분리
- 신청
- 있군요
- 배열
- AS
- At
- 오디오
- 자동적으로
- 기반으로
- BE
- 때문에
- 처음
- BEST
- 사이에
- 가장 큰
- 두
- 경계
- 경계
- 보물상자
- 사업
- by
- 라는
- CAN
- 후보자
- 채용
- 케이스
- 채널
- 검사
- 댓글
- 비교
- 컴퓨팅
- 개념
- 자신
- 자신감
- 구성
- 고려
- 고려
- 치고는
- 포함하는
- 포함
- 함유량
- 문맥
- Current
- 고객
- 고객센터
- 고객
- 결정하다
- 결정
- 태만
- 지연
- 지연
- 디자인
- 문서
- 드라이브
- 지속
- 마다
- 사용 가능
- end
- 엔지니어링
- 강화
- Enterprise
- 항목
- 모든
- 예
- 예
- 넘다
- 초과
- 전시
- 존재
- 경험
- 탐색
- 특색
- 특징
- 피드백
- 그림
- 입양 부모로서의 귀하의 적합성을 결정하기 위해 미국 이민국에
- 최후의
- 먼저,
- 초점
- 수행원
- 다음
- 럭셔리
- 형태
- 체재
- 앞으로
- 에
- 가득 찬
- 추가
- 미래
- 유전체학
- 얻을
- 그래프
- 큰
- 있다
- he
- 듣기
- 도움
- 도움이
- hi
- 높은
- 그의
- 방법
- HTTPS
- 식별
- 식별자
- 확인
- if
- 구현
- in
- 포함
- 표시
- 표시
- 표시
- 정보
- 통찰력
- 개입
- 으로
- 소개
- 소개
- 소개합니다
- IT
- 항목
- 일
- JPG
- 언어
- 성
- 레벨
- 처럼
- 명부
- 논리
- 보기
- 찾고
- loves
- 본관
- 확인
- 구축
- 조작
- 표
- 최대
- 최고
- 평균
- 메타 데이터
- 배우기
- 가장
- 신제품
- 아니
- 번호
- 사물
- of
- on
- ONE
- 만
- 조작
- 행정부
- 옵션
- or
- 기타
- 우리의
- 아웃
- 위에
- 특별한
- 열렬한
- 성능
- 관점
- 장소
- 플랫폼
- 플라톤
- 플라톤 데이터 인텔리전스
- 플라토데이터
- 포인트 적립
- 전철기
- 인구
- 게시하다
- 가능성
- 제시
- 제시
- 너무 이른
- 방법
- 프로덕트
- 제공
- 제공
- 문제
- 반복
- 필요
- 각기
- 얽매다
- 결과
- 결과
- 달리기
- 섹션
- 부문
- 선택된
- 문장
- 서비스
- 영상을
- 쇼
- 의미
- 상당한
- So
- 해결책
- 솔루션
- Speaker
- 구체적인
- 지출
- 분열
- 스플릿
- 스타트
- 통계적인
- 단계
- 중지
- 똑 바른
- 제출
- 이러한
- 제안
- SUPPORT
- 지원
- 지원
- 시스템은
- 복용
- 보다
- 그
- XNUMXD덴탈의
- 세계
- 그들의
- 그들
- 그때
- 그곳에.
- 그것에 의하여
- Bowman의
- 제삼
- 이
- 그
- 시간
- 시대
- 에
- 금액
- 트레이딩
- 거래 플랫폼
- 성적 증명서
- 진정으로
- 유형
- 유형
- 전형적인
- 까지
- 용법
- 사용
- 사용
- 활용
- 가치
- 마케팅은:
- Video
- 관측
- 였다
- 방법..
- we
- 웹
- 웹 서비스
- 환영
- 언제
- 어느
- 의지
- 과
- 없이
- 워드
- 말
- 세계
- 자신의
- 너의
- 제퍼 넷