아마존 폴리 하는 텍스트 음성 변환 고급 딥 러닝 기술을 사용하여 자연스러운 사람의 음성을 합성하는 서비스입니다. 컨택 센터 시스템, 자동화된 실시간 상태 확인, 자동 계정 및 청구 조회를 위해 인간과 유사한 음성으로 대화형 사용자 경험을 제공하고, Washington Post와 같은 뉴스 에이전시와 같은 다양한 사용 사례에서 사용됩니다. 독자들이 뉴스 기사를 들을 수 있도록.
오늘부터 Amazon Polly는 60개 이상의 언어 변형에서 30개 이상의 음성. Amazon Polly는 또한 문맥을 사용하여 동사 시제 및 기타 문맥 정보에 따라 특정 단어를 다르게 발음합니다. 예를 들어, “I read book”(현재 시제)와 “I will read book”(미래 시제)의 “read”는 다르게 발음됩니다.
그러나 일부 상황에서는 Amazon Polly가 단어를 발음하는 방식을 사용자 지정해야 할 수 있습니다. 예를 들어 발음을 현지 방언이나 모국어와 일치시켜야 할 수 있습니다. 사물의 이름(예: 토마토는 다음과 같이 발음될 수 있습니다. 톰아투 or 톰에이투), 사람, 거리 또는 장소는 종종 다양한 방식으로 발음됩니다.
이 게시물에서는 어휘를 활용하여 맞춤 발음을 만드는 방법을 보여줍니다. 출판, 교육 또는 콜 센터와 같은 사용 사례에 어휘를 적용할 수 있습니다.
SSML 태그를 사용하여 발음 사용자 지정
호주에서 인기 있는 팟캐스트를 스트리밍하고 Amazon Polly Australian English(Olivia) 음성을 사용하여 스크립트를 사람과 같은 음성으로 변환한다고 가정해 보겠습니다. 스크립트 중 하나에서 Amazon Polly 음성에 알려지지 않은 단어를 사용하려고 합니다. 예를 들어, 뉴질랜드 청취자에게 Mātariki(마오리 새해) 인사말을 보내고 싶습니다. 이러한 시나리오의 경우 Amazon Polly는 음성 발음을 지원하며, 이를 사용하여 외국어의 정확한 발음에 가까운 발음을 얻을 수 있습니다.
당신은 사용할 수 있습니다 음성 합성 마크업 언어(SSML) 태그를 사용하여 ph 속성에서 음성 발음을 제안합니다. 사용할 수 있는 방법을 알려드리겠습니다 SSML 태그.
먼저, 귀하의 AWS 콘솔 상단의 검색창에서 Amazon Polly를 검색하세요. Amazon Polly를 선택한 다음 Try Polly 버튼을 선택합니다.
Amazon Polly 콘솔의 언어 드롭다운에서 호주 영어를 선택하고 입력 텍스트 상자에 다음 텍스트를 입력한 다음 듣기를 클릭하여 발음을 테스트합니다.
나는 당신 모두에게 매우 행복한 Mātariki를 기원합니다.
음성 발음을 적용하지 않은 샘플 음성:
위의 샘플 연설을 들으면 마타리키 – 호주 영어의 일부가 아닌 단어 – 이 단어는 정확하지 않습니다. 이제 이러한 시나리오에서 다음을 사용하여 음성 발음을 사용할 수 있는 방법을 살펴보겠습니다. Amazon Polly에서 생성된 음성을 사용자 지정하기 위한 SSML 태그.
SSML 태그를 사용하려면 Amazon Polly 콘솔에서 SSML 옵션을 켜십시오. 그런 다음 다음의 발음을 포함하는 SSML 스크립트를 복사하여 붙여넣습니다. 마타리키 의 ph 속성 내부에 지정 꼬리표.
와 더불어 꼬리표, Amazon Polly는 기본적으로 선택한 음성에서 사용하는 언어와 연결된 표준 발음 대신 ph 속성으로 지정된 발음을 사용합니다.
음성 발음을 적용한 후의 샘플 연설:
샘플 사운드를 들으면 Amazon Polly가 올바른 발음에 더 가까운 소리를 합성하도록 일부 모음(예: ā)에 대해 다른 발음을 선택했음을 알 수 있습니다. 이제 다음과 같은 질문이 있을 수 있습니다. 음성 표기를 어떻게 생성합니까?mA:.tA:.ri.ki” 단어 마타리키?
다음을 참조하여 음성 표기를 작성할 수 있습니다. 지원되는 언어의 음소 및 Viseme 표. 위의 예에서 우리는 호주 영어의 음소.
Amazon Polly는 IPA 및 X-Sampa의 두 가지 음성 알파벳을 지원합니다. X-Sampa의 이점은 표준 ASCII 문자이므로 일반 키보드로 음성 표기를 더 쉽게 입력할 수 있다는 것입니다. IPA 또는 X-Sampa를 사용하여 필사본을 생성할 수 있지만 특히 다음 섹션에서 다룰 사전 파일을 사용할 때 선택한 내용과 일관성을 유지해야 합니다.
음소 테이블의 각 음소는 음성을 나타냅니다. 굵게 표시된 글자는 "예시" 위에 링크된 호주 영어 페이지의 Phoneme/Viseme 표의 열은 "Phoneme"이라는 단어가 해당하는 부분을 나타냅니다. 예를 들어, 음소 /j/는 호주 영어 사용자가 "yes"에서 문자 "y"를 발음할 때 내는 소리를 나타냅니다.
사전을 사용하여 발음 사용자 지정
음소 태그는 격리된 경우를 사용자 지정하기 위한 일회성 상황에 적합하지만 확장할 수 없습니다. 다른 편집자와 검토자가 관리하는 방대한 양의 텍스트를 처리하는 경우 사전을 사용하는 것이 좋습니다. 어휘를 사용하면 사용자 정의 발음을 추가할 때 일관성을 얻을 수 있으며 동시에 스크립트에 음소 태그를 삽입하는 수작업을 줄일 수 있습니다.
좋은 방법은 다음을 사용하여 Amazon Polly 콘솔에서 사용자 지정 발음을 테스트한 후 태그를 사용하여 사용자 정의 발음 라이브러리를 만듭니다. 사전. 사전 파일이 업로드되면 Amazon Polly는 사전 파일에 지정된 음성 발음을 자동으로 적용하므로 수동으로 제공할 필요가 없습니다. 꼬리표.
사전 파일 만들기
사전 파일에는 단어와 음성 발음 간의 매핑이 포함되어 있습니다. 발음 사전 사양(PLS) 상호 운용 가능한 발음 정보를 지정하기 위한 W3C 권장 사항입니다. 다음은 PLS 문서의 예입니다.
올바른 값을 사용했는지 확인하십시오. xml:lang
들. 사용하다 en-AU
Amazon Polly 호주 영어 음성과 함께 사용할 어휘 파일을 업로드하는 경우. 지원되는 언어의 전체 목록은 다음을 참조하십시오. Amazon Polly에서 지원하는 언어.
사용자 정의 발음을 지정하려면 하나 이상의 어휘 항목을 위한 컨테이너인 요소 <grapheme>
요소 및 내부에 제공된 하나 이상의 발음 정보 <phoneme>
요소입니다.
XNUMXD덴탈의 <grapheme>
요소는 설명하는 텍스트를 포함합니다. 정자법 의 요소. 당신은 사용할 수 있습니다 <grapheme>
발음을 사용자 정의하려는 단어를 지정하는 요소입니다. 여러 개를 추가할 수 있습니다. <grapheme>
예를 들어 매크로가 있거나 없는 모든 단어 변형을 지정하는 요소. 그만큼 <grapheme>
요소는 대소문자를 구분하며 음성 합성 중에 Amazon Polly 문자열은 음성으로 변환하는 스크립트 내의 단어와 일치합니다. 일치하는 항목이 발견되면 다음을 사용합니다. 방법을 설명하는 요소 음성 전사를 생성하기 위해 발음됩니다.
VOUS pouvez의 aussi 사용 <alias>
일반적으로 사용되는 약어. 사전 파일의 이전 예에서, NZ 의 별칭으로 사용됩니다. 뉴질랜드. 즉, Amazon Polly가 텍스트 본문에서 "NZ"(대소문자 일치)를 찾을 때마다 이 두 글자를 "New Zealand"로 읽습니다.
어휘 파일 형식에 대한 자세한 내용은 다음을 참조하십시오. 발음 사전 사양(PLS) 버전 1.0 W3C 웹사이트에서
Amazon Polly에 업로드하기 전에 .pls 또는 .xml 파일로 사전 파일을 저장할 수 있습니다.
어휘 파일 업로드 및 적용
다음 지침에 따라 사전 파일을 Amazon Polly에 업로드합니다.
- Amazon Polly 콘솔에서 다음을 선택합니다. 사전 탐색 창에서
- 왼쪽 메뉴에서 사전 업로드.
- 사전의 이름을 입력한 다음 사전 파일.
- 업로드할 파일을 선택합니다.
- 왼쪽 메뉴에서 사전 업로드.
동일한 이름의 사전(.pls 또는 .xml 파일)이 이미 있는 경우 사전을 업로드하면 기존 사전을 덮어씁니다.
이제 어휘를 적용하여 발음을 사용자 정의할 수 있습니다.
- 왼쪽 메뉴에서 텍스트 음성 변환 탐색 창에서
- 펼치기 추가 세팅.
- 전원을 켜십시오 발음 사용자 지정.
- 드롭다운 메뉴에서 사전을 선택합니다.
당신은 또한 선택할 수 있습니다 사전 업로드 새 사전 파일(또는 새 버전)을 업로드합니다.
소스 코드 리포지토리에서 어휘 파일의 버전을 관리하는 것이 좋습니다. 사전 파일에 사용자 정의 발음을 유지하면 조직 전체에서 특정 단어의 발음 발음을 일관되게 참조할 수 있습니다. 또한 에 언급된 발음 어휘 제한을 염두에 두십시오. Amazon Polly의 할당량 페이지.
어휘 적용 후 발음 테스트
입력 텍스트로 "뉴질랜드의 모든 청취자, 매우 행복한 마타리키"를 사용하여 빠른 테스트를 수행해 보겠습니다.
사전 적용 전과 후의 오디오 파일을 비교할 수 있습니다.
사전을 적용하기 전에:
어휘를 적용한 후:
결론
이 게시물에서는 Amazon Polly에서 선택한 언어에서 찾을 수 없는 일반적으로 사용되는 두문자어 또는 단어의 발음을 사용자 지정하는 방법에 대해 논의했습니다. 당신이 사용할 수있는 일회성 사용자 지정 또는 테스트 목적을 삽입하는 데 유용한 SSML 태그입니다. Lexicon을 사용하여 조직 전체에서 자주 사용하는 단어에 대한 일관된 발음 세트를 만드는 것이 좋습니다. 이를 통해 콘텐츠 작성자는 스크립트에 음성 발음을 반복적으로 추가하는 지루한 작업 대신 글쓰기에 시간을 할애할 수 있습니다. Amazon Polly 콘솔의 AWS 계정에서 이를 시도할 수 있습니다.
리소스 요약
저자에 관하여
라탄 쿠마르 뉴질랜드 오클랜드에 거주하는 솔루션 아키텍트입니다. 그는 대기업 고객과 협력하여 AWS 클라우드를 사용하여 안전하고 비용 효율적이며 안정적인 인터넷 규모 애플리케이션을 설계하고 구축할 수 있도록 지원합니다. 그는 기술에 열정적이며 블로그 게시물과 트위치 세션을 통해 지식을 공유하는 것을 좋아합니다.
마시엑 테기 Polly Brand Voices의 수석 오디오 디자이너이자 제품 관리자입니다. 그는 기술 산업, 영화, 광고 및 게임 현지화 분야에서 전문적인 역량을 발휘했습니다. 2013년에 그는 Alexa Text-To-Speech 팀에 고용된 첫 번째 오디오 엔지니어였습니다. Maciek은 여러 국가에서 12개의 Alexa TTS 음성, 20개 이상의 Polly 음성 및 4개의 Alexa 유명인 음성을 발표하는 데 참여했습니다. Maciek은 철인 XNUMX종 경기 선수이자 열렬한 어쿠스틱 기타 연주자입니다.
- "
- 100
- 116
- 소개
- 계정
- 달성
- 가로질러
- 많은
- 알렉사
- All
- 이미
- 아마존
- 어플리케이션
- 적용
- 오디오
- 호주
- 자동
- 자동화
- AWS
- 전에
- 이익
- 청구
- 블로그
- 블로그 게시물
- 몸
- 경계
- 보물상자
- 상표
- 빌드
- 전화
- 생산 능력
- 가지 경우
- 명성
- 어떤
- 왼쪽 메뉴에서
- 자세히
- 클라우드
- 암호
- 단
- 콘솔에서
- CONTACT
- 컨테이너
- 이 포함되어 있습니다
- 함유량
- 제어
- 비용 효율적인
- 국가
- 엄호
- 만들
- 만들기
- 관습
- 고객
- 배달
- 보여
- 디자인
- 개발자
- 다른
- ...동안
- 교육
- 노력
- 요소
- 제거
- 기사
- 영어
- 엔터 버튼
- Enterprise
- 특히
- 예
- 현존하는
- 체험
- 먼저,
- 수행원
- 외국의
- 체재
- 발견
- 미래
- 경기
- 생성
- 좋은
- 큰
- 행복한
- 도움이
- 방법
- HTTPS
- 거대한
- 사람의
- 산업
- 정보
- 입력
- 인터넷
- 상호 운용 가능한
- 참여
- IT
- 유지
- 지식
- 언어
- 언어
- 넓은
- 배우기
- 이점
- 도서관
- 명부
- 지방의
- 제작
- 관리
- 매니저
- 조작
- 수동으로
- 매핑
- 경기
- 어울리는
- 방법
- 말하는
- 수도
- 신경
- 배우기
- 영화 산업
- 여러
- 이름
- 카테고리
- 새해
- 뉴질랜드
- news
- 표준
- 제공
- 선택권
- 조직
- 기타
- 부품
- 열렬한
- 사람들
- 플레이어
- 팟 캐스트
- 인기 문서
- 게시물
- 연습
- 제시
- 교장
- 방법
- 생산
- 프로덕트
- 링크를
- 제공
- 제공
- 출판
- 목적
- 문제
- 빠른
- 독자들
- 실시간
- 권하다
- 감소
- 신뢰할 수있는
- 저장소
- 대표
- 대표
- 확장성
- 규모
- 검색
- 안전해야합니다.
- 선택된
- 서비스
- 세션
- 세트
- 공유
- So
- 고체
- 솔루션
- 일부
- 소스 코드
- Speaker
- 명세서
- 지출
- 표준
- Status
- 유지
- 흐름
- SUPPORT
- 지원
- 지원
- 시스템은
- 팀
- 기술
- 첨단 산업
- 기술
- Technology
- test
- 지원
- 워싱턴 포스트
- 을 통하여
- 시간
- 오늘
- 상단
- 씰룩 씰룩 움직이다
- 사용
- 가치
- 종류
- 버전
- 목소리
- 음성
- 음량
- W3
- 워싱턴
- 웹 사이트
- 여부
- 위키 백과
- 없이
- 말
- 일
- 일
- 쓰기
- XML
- year