Süddeutsche Zeitung, Amazon Polly PlatoBlockchain Data Intelligence ile sesli anlatım sürecini nasıl optimize etti? Dikey Arama. Ai.

Süddeutsche Zeitung, Amazon Polly ile sesli anlatım sürecini nasıl optimize etti?

Bu, Süddeutsche Zeitung'da Yazılım Geliştiricisi olan Jakob Kohl'un konuk yazısıdır. Süddeutsche Zeitung, ücretli abonelikler ve benzersiz kullanıcılar söz konusu olduğunda Almanya'nın önde gelen kaliteli gazetelerinden biridir. kendi web sitesi, SZ.de, Ekim 15 itibariyle aylık 2021 milyondan fazla benzersiz kullanıcıya ulaşıyor.

Akıllı hoparlörler ve podcast'ler sayesinde ses endüstrisi son yıllarda gerçek bir patlama yaşadı. saat Süddeutsche Zeitung, çeşitli gazeteciliğimizi daha da erişilebilir kılmak için sürekli yeni yollar arıyoruz. Dijital gazeteciliğin öncüleri olarak daha fazla fırsat yaratmak istiyoruz. Süddeutsche Zeitung okuyucuların makaleleri tüketmesi. Makalelerimiz için yüksek kaliteli sesli anlatım sağlayabilecek çözümler aramaya başladık. Nihai hedefimiz “makaleyi dinle” özelliğini başlatmaktı.

Bu gönderide, sesli anlatım sürecimizi dönüşen bir hizmet olan Amazon Polly ile nasıl optimize ettiğimizi paylaşıyoruz. gerçeğe yakın konuşmaya metin gelişmiş derin öğrenme teknolojilerini kullanarak.

Neden Amazon Polly?

Alman sinir sistemi Vicki'nin Amazon Polly sesi, şu anda piyasadaki en iyi Alman sesidir. Amazon Polly şu etkileyici özelliği sunuyor: diller arasında geçiş yap, örneğin İngilizce film başlıklarını ve farklı dillerdeki kişisel adları doğru bir şekilde telaffuz etmek (örneğin, makaleyi dinleyin) Schall ve Wahn Web sitemizde).

Altyapımızın büyük bir kısmı zaten AWS'de çalışıyor, bu nedenle Amazon Polly'yi kullanma mükemmel bir uyumdu. Amazon Polly'yi aşağıdaki bileşenlerle birleştirebiliriz:

  • An Amazon Basit Bildirim Servisi (Amazon SNS) makaleler için abone olabileceğimiz konu. Makaleler, bir editör tarafından kaydedildiğinde CMS tarafından bu konuya gönderilir.
  • An Amazon CloudFront ile dağıtım Lambda @ Kenar makalelerin sesli sürümleri için yeniden kullanabileceğimiz premium makaleleri ödeme duvarına.

The Amazon Polly API'si kullanımı kolaydır ve iyi belgelenmiştir. Kavram kanıtımızın işe yaraması bir haftadan az sürdü.

Meydan okuma

SZ.de'de her gün yüzlerce yeni makale yayınlanıyor. İlk yayınlandıktan sonra, çeşitli nedenlerle birkaç kez güncellenebilirler; haber odaklı makalelere yeni paragraflar eklenir, yazım hataları düzeltilir, kısa bilgiler değiştirilir veya meta veriler arama motorları için optimize edilir.

Bir makalenin ilk yayını için konuşma oluşturmak basittir, çünkü tüm metnin sentezlenmesi gerekir. Ancak, aynı içerik için iki kez ödeme yapmadan makalelerin güncellenmiş sürümleri için sesi nasıl hızlı bir şekilde oluşturabiliriz? En büyük zorluğumuz, her bir güncelleme için metnin tamamını Amazon Polly'ye tekrar tekrar göndermeyi önlemekti.

Teknik çözümümüz

Bir editör bir makaleyi her kaydettiğinde, makalenin yeni versiyonu bir SNS konusuna yayınlanır. Bir AWS Lambda işlevi bu konuya abonedir ve bir makalenin her yeni sürümü için çağrılır. Bu işlev aşağıdaki adımları çalıştırır:

  1. Makalenin yeni sürümünün zaten tamamen sentezlenip sentezlenmediğini kontrol edin. Bu durumda, işlev hemen durur (bu, yalnızca sesi etkilemeyen meta veriler değiştirildiğinde olabilir).
  2. Makaleyi birden çok şekle dönüştürün SSML belgeleri, her metin paragrafı için kabaca bir tane.
  3. Her SSML belgesi için işlev, hesaplanan karmalar kullanılarak sese önceden sentezlenip sentezlenmediğini kontrol eder. Örneğin:
    1. Bir makale ilk kez kaydediliyorsa, tüm SSML belgeleri sentezlenmelidir.
    2. Tek bir paragrafta bir yazım hatası düzeltildiyse, yalnızca bu paragraf için SSML belgesi yeniden sentezlenmelidir.
    3. Makaleye yeni bir paragraf eklenirse, yalnızca bu yeni paragraf için SSML belgesi sentezlenmelidir.
  4. Henüz sentezlenmemiş tüm SSML belgelerini Amazon Polly'ye ayrı olarak gönderin.

Bu kontroller, bir makalenin tamamının birden çok kez sentezlenmesini önleyerek performansı optimize etmeye ve maliyeti düşürmeye yardımcı olur. SEO nedenleriyle başlık düzenlemesi veya meta veri düzenlemeleri gibi küçük değişiklikler nedeniyle ek ücret ödemekten kaçınıyoruz.

Aşağıdaki şemada çözüm iş akışı gösterilmektedir.

Süddeutsche Zeitung, Amazon Polly PlatoBlockchain Data Intelligence ile sesli anlatım sürecini nasıl optimize etti? Dikey Arama. Ai.

Amazon Polly, SSML belgelerini sentezledikten sonra, ses dosyaları içindeki bir çıkış kovasına gönderilir. Amazon Basit Depolama Hizmeti (Amazon S3). İkinci bir Lambda işlevi, o kova üzerinde nesne oluşturma için dinliyor, bir makalenin tüm ses parçalarının tamamlanmasını bekliyor ve bunları kullanarak bunları son bir ses dosyasında birleştiriyor. Lambda katmanından FFmpeg. Bu son ses, CloudFront dağıtımımızda kaynak olarak kullanılan başka bir S3 klasörüne gönderilir. CloudFront'ta, ilgili ses sürümü için premium makaleler için mevcut bir ödeme duvarını yeniden kullanıyoruz.

Freemium modelimize dayanarak, premium makalelerin kısaltılmış bir sesli sürümünü sunuyoruz. Abone olmayanlar ilk paragrafı ücretsiz olarak dinleyebilir, ancak makalenin tamamına erişmek için bir abonelik satın almaları gerekir.

Sonuç

Amazon Polly'nin mevcut altyapımıza entegrasyonu çok basitti. Yalnızca paragraflar ve bazı ek aralar eklediğimiz için içeriğimiz minimum düzeyde özelleştirme gerektiriyor. En zorlu kısım, makaleyi paragraflara karşılık gelen birden çok SSML belgesine bölerek, her SSML belgesindeki değişiklikleri kontrol ederek ve parçaları birleştirerek tüm ses dosyasını oluşturarak elde ettiğimiz performans ve maliyet optimizasyonuydu. Bu optimizasyonlarla aşağıdakileri elde edebiliyoruz:

  • Yalnızca gerçek değişiklikleri sentezleyerek sentezlenen karakter miktarını en az %50 azaltın.
  • Sentezlenecek daha az ses olduğundan, makale metnindeki bir değişikliğin seste görünmesi için gereken süreyi azaltın.
  • Tüm makaleyi yeniden sentezlemeden paragraflar arasına isteğe bağlı ses dosyaları ekleyin. Örneğin, birinci paragrafı, tam sürümü dinlemek için bir abonelik gerektiğine dair sonraki nottan ayırmak için premium makalelerin kısaltılmış sesli sürümüne bir ses dosyası ekleyebiliriz.

SZ.de makalelerimizde “makaleyi dinle” özelliğinin kullanıma sunulmasından sonraki ilk ayda, çok sayıda olumlu kullanıcı geri bildirimi aldık. Lansmandan sonraki ilk 30,000 ayda yaklaşık 2 kullanıcıya ulaştık. Bu kullanıcılardan yaklaşık 200'ü, yalnızca ödeme duvarımızın arkasındaki bir makalenin tanıtımını dinleyerek ücretli aboneliğe dönüştü. "Makaleyi dinle" özelliği ödeme duvarımızın arkasında değil, ancak kullanıcılar yalnızca abonelikleri varsa premium makaleleri tam olarak dinleyebilir. Web sitemiz ayrıca ödeme duvarı olmayan ücretsiz makaleler sunmaktadır. Gelecekte, özellikle mobil haber uygulamalarımız olmak üzere diğer SZ platformlarına özelliği genişleteceğiz.


Yazar Hakkında

Süddeutsche Zeitung, Amazon Polly PlatoBlockchain Data Intelligence ile sesli anlatım sürecini nasıl optimize etti? Dikey Arama. Ai.Jakob Kohl Çevik bir web sitesi ekibinde modern teknolojilerle çalışmaktan keyif aldığı Süddeutsche Zeitung'da Yazılım Geliştiricisidir. “Bir SZ makalesini dinle” özelliğinin ana geliştiricilerinden biridir. Boş zamanlarında, web geliştirmede olduğu kadar teknik ve görsel tasarımın da önemli olduğu ahşap mobilyalar yapmayı seviyor.

Zaman Damgası:

Den fazla AWS Makine Öğrenimi