Amazon Polly PlatoBlockchain Data Intelligence에서 동일한 TTS 음성 페르소나를 사용하여 여러 언어로 된 콘텐츠에 대한 오디오를 생성합니다. 수직 검색. 일체 포함.

Amazon Polly에서 동일한 TTS 음성 페르소나로 여러 언어로 콘텐츠에 대한 오디오 생성

아마존 폴리 텍스트를 생생한 음성으로 변환하는 선도적인 클라우드 기반 서비스입니다. NTTS(Neural Text-to-Speech)를 채택한 후 지원되는 언어로 다양한 고유 화자를 제공하기 위해 사용 가능한 음성 포트폴리오를 지속적으로 확장했습니다. 오늘 우리는 네 가지 새로운 추가 사항을 발표하게 된 것을 기쁘게 생각합니다. Pedro는 미국 스페인어, Daniel은 독일어, Liam은 캐나다 프랑스어, Arthur는 영국 영어를 사용합니다. 당사 포트폴리오의 모든 신경망 음성과 마찬가지로 이 음성은 대상 언어로 유창하고 원어민 발음을 제공합니다. 그러나 이 XNUMX가지 목소리의 독특한 점은 모두 같은 목소리 페르소나를 기반으로 한다는 것입니다.

Pedro, Daniel, Liam 및 Arthur는 기존 미국 영어 Matthew 음성을 모델로 했습니다. 고객들은 매튜의 자연스러움과 전문적인 음질에 대해 계속해서 높이 평가하고 있지만, 그 목소리는 지금까지 영어를 사용하는 트래픽에만 사용되었습니다. 이제 딥 러닝 방법을 사용하여 언어와 화자 정체성을 분리하여 동일한 화자로부터 다국어 데이터를 얻을 필요 없이 여러 언어에서 원어민과 같은 유창성을 유지할 수 있었습니다. 실제로 이것은 미국 영어 Matthew 음성의 보컬 특성을 미국 스페인어, 독일어, 캐나다 프랑스어 및 영국 영어로 이전하여 Amazon Polly 고객에게 새로운 기회를 열어 주었다는 것을 의미합니다.

XNUMX개 로케일에서 유사한 음성을 사용할 수 있다는 것은 비즈니스 성장에 대한 큰 잠재력을 열어줍니다. 우선, 글로벌 입지를 가진 고객은 언어와 지역에 걸쳐 일관된 사용자 경험을 만들 수 있습니다. 예를 들어, 여러 언어를 지원하는 대화형 음성 응답(IVR) 시스템은 이제 브랜드의 느낌을 바꾸지 않고도 다양한 고객 세그먼트에 서비스를 제공할 수 있습니다. 뉴스 기사, 교육 자료 또는 팟캐스트를 음성으로 전달하는 것과 같은 다른 모든 TTS 사용 사례도 마찬가지입니다.

둘째, 음성은 지원되는 XNUMX개 언어 중 하나로 외국어 구의 원어민 발음을 원하는 Amazon Polly 고객에게 적합합니다.

세 번째로 Pedro, Daniel, Liam 및 Arthur를 출시함으로써 미국 스페인어, 독일어, 캐나다 프랑스어 및 영국 영어로 된 Amazon Polly NTTS를 좋아하지만 고품질 남성 음성을 찾고 있는 고객에게 서비스를 제공합니다. 이러한 음성을 사용하여 오디오를 생성할 수 있습니다. 단일 언어 콘텐츠의 경우 이러한 언어의 다른 NTTS 음성과 동등한 최고 품질을 기대합니다.

마지막으로, 새로운 남성 NTTS 목소리를 만들기 위해 개발한 기술은 다음에도 사용할 수 있습니다. 브랜드 보이스. 덕분에 Brand Voice 고객은 자신의 브랜드에 맞는 고유한 NTTS 음성을 즐길 수 있을 뿐만 아니라 전 세계 청중에게 서비스를 제공하면서 일관된 경험을 유지할 수 있습니다.

사용 사례 예시

이것이 실제로 무엇을 의미하는지 보여주기 위해 예제 사용 사례를 살펴보겠습니다. Matthew에 익숙한 Amazon Polly 고객은 다음을 선택하여 평소와 같이 이 음성을 계속 사용할 수 있습니다. 마태 복음 Amazon Polly 콘솔에서 미국 영어로 듣고 싶은 텍스트를 입력합니다. 다음 시나리오에서는 IVR 시스템에 대한 오디오 샘플을 생성합니다("영어의 경우 하나를 누르십시오").

이 릴리스 덕분에 이제 사용 사례를 확장하여 다양한 언어로 일관된 오디오 경험을 제공할 수 있습니다. 모든 새로운 목소리는 자연스럽고 원어민과 같은 억양을 유지합니다.

  • 영국식 영어로 음성을 생성하려면 Arthur를 선택하십시오(“영어의 경우 하나를 누르십시오”):
  • 미국 스페인어 사용자를 사용하려면 Pedro("Para español, por favor marque dos")를 선택하십시오.
  • Daniel은 독일어로 지원을 제공합니다("Für Deutsch drücken Sie bitte die Drei"):
  • Liam("Pour le français, veuillez appuyer sur le quatre")을 선택하여 캐나다 프랑스어 텍스트를 합성할 수 있습니다.

다른 억양으로 말하는 것 외에도 영국 영어 Arthur 음성은 미국 영어 Matthew 음성과 다르게 입력 텍스트를 현지화합니다. 예를 들어, "1/2/22"는 Arthur가 "1년 2022월 2일"로 읽지만 Matthew는 "2022년 XNUMX월 XNUMX일"로 읽습니다.

이제 다음 프롬프트를 결합해 보겠습니다.

결론

Pedro, Daniel, Liam, Arthur는 Neural TTS 음성으로만 제공되므로 이를 즐기기 위해서는 하나의 Neural 엔진을 사용해야 합니다. NTTS를 지원하는 AWS 리전. 이들은 고품질 단일 언어 음성 그들의 목표 언어로. 그들의 페르소나가 여러 언어에 걸쳐 일관된다는 사실은 추가적인 이점이며, 우리는 이것이 여러 언어로 된 콘텐츠로 작업하는 고객을 기쁘게 할 것입니다. 자세한 내용은 Amazon Polly의 전체 목록을 검토하십시오. 텍스트 음성 변환 , 신경 TTS 가격 책정, 서비스 제한자주 묻는 질문, 그리고 우리를 방문하십시오 가격 결정 페이지.


저자에 관하여

Amazon Polly PlatoBlockchain Data Intelligence에서 동일한 TTS 음성 페르소나를 사용하여 여러 언어로 된 콘텐츠에 대한 오디오를 생성합니다. 수직 검색. 일체 포함.패트릭 와이나이나 영어, 독일어 및 스페인어를 위한 텍스트 음성 변환 작업을 하는 언어 엔지니어입니다. 음성 및 언어 처리에 대한 배경 지식이 있는 그의 관심은 TTS 프론트 엔드 솔루션, 특히 리소스가 부족한 환경에 적용되는 머신 러닝에 있습니다. 여가 시간에는 전자 음악을 듣고 새로운 언어를 배우는 것을 즐깁니다.

Amazon Polly PlatoBlockchain Data Intelligence에서 동일한 TTS 음성 페르소나를 사용하여 여러 언어로 된 콘텐츠에 대한 오디오를 생성합니다. 수직 검색. 일체 포함.마르타 스몰라렉 Amazon Text-to-Speech 팀의 수석 프로그램 관리자로 Contact Center TTS 사용 사례에 중점을 두고 있습니다. 그녀는 시장 진출 이니셔티브를 정의하고 고객 피드백을 사용하여 제품 로드맵을 구축하고 TTS 음성 출시를 조정합니다. 일 외에는 가족과 함께 캠핑을 가는 것을 좋아합니다.

타임 스탬프 :

더보기 AWS 기계 학습