Öğeler görünümünde, öğeler, her öğe ek meta veri bilgisi içeren, zamanında sıralanmış bir liste biçiminde sağlanır:
{ "results": { "items": [ { "channel_label": "ch_0", "start_time": "1.509", "speaker_label": "spk_0", "end_time": "2.21", "alternatives": [ { "confidence": "0.999", "content": "Hi" } ], "type": "pronunciation" }, { "channel_label": "ch_0", "speaker_label": "spk_0", "alternatives": [ { "confidence": "0.0", "content": "," } ], "type": "punctuation" }, { "channel_label": "ch_0", "start_time": "2.22", "speaker_label": "spk_0", "end_time": "2.9", "alternatives": [ { "confidence": "0.999", "content": "welcome" } ], "type": "pronunciation" }, { "channel_label": "ch_0", "speaker_label": "spk_0", "alternatives": [ { "confidence": "0.0", "content": "." } ], "type": "punctuation" } ] }
}
Meta veriler aşağıdaki gibidir:
- Tip – Tür değeri, belirli öğenin noktalama mı yoksa telaffuz mu olduğunu gösterir. Desteklenen noktalama işaretlerine örnek olarak virgül, nokta ve soru işareti verilebilir.
- alternatifler – Güven düzeyine göre sıralanmış, gerçek transkripsiyonu ve güven düzeyini içeren bir dizi nesne. Alternatif sonuçlar özelliği etkinleştirilmediğinde, bu listede her zaman yalnızca bir öğe bulunur.
- Güven – Amazon Transcribe'ın deşifrenin doğruluğundan ne kadar emin olduğunun bir göstergesi. 0-1 arasındaki değerleri kullanır, 1 %100 güveni gösterir.
- içerik – Kopyalanan kelime.
- Başlangıç saati – Ses veya video dosyasının, öğenin ss.SSS formatında başladığını gösteren bir zaman işaretçisi.
- Bitiş zamanı – Ses veya video dosyasının, öğenin sonunu ss.SSS biçiminde gösteren bir zaman işaretçisi.
- Kanal etiketi – Yalnızca iş yapılandırmasında kanal tanımlama özelliği etkinleştirildiğinde öğede bulunan kanal tanımlayıcı.
- Hoparlör etiketi – Yalnızca iş yapılandırmasında hoparlör bölümleme özelliği etkinleştirildiğinde öğede bulunan hoparlör tanımlayıcısı.
Paragrafları belirleme
Paragrafların tanımlanması, öğeler görünümündeki meta veri bilgilerine dayanır. Cümleleri belirlemek için özellikle başlangıç ve bitiş zamanı bilgilerinin yanı sıra deşifre türü ve içeriğini kullanırız ve ardından hangi cümlelerin paragraf giriş noktaları için en iyi aday olduğuna karar veririz.
Cümle, noktayı gösteren noktalama işaretleri arasında bulunan transkripsiyon öğelerinin bir listesi olarak kabul edilir. Bunun istisnaları, varsayılan olarak cümle sınırları olan dökümün başlangıcı ve bitişidir. Aşağıdaki şekil bu öğelerin bir örneğini göstermektedir.
Noktalama işaretleri virgül, nokta, soru işareti noktalama türleri ile birlikte kullanıma hazır bir özellik olduğundan, Amazon Transcribe ile cümle tanımlama kolaydır. Bu kavramda, cümle sınırı olarak nokta kullanıyoruz.
Her cümle bir paragraf noktası olmamalıdır. Paragrafları tanımlamak için, aşağıdaki şekilde gösterildiği gibi, başlangıç gecikmesi adı verilen cümle düzeyinde yeni bir içgörü sunuyoruz. Konuşmacının mevcut cümlenin telaffuzuna bir öncekine kıyasla getirdiği zaman gecikmesini tanımlamak için bir başlangıç gecikmesi kullanıyoruz.
Başlangıç gecikmesinin hesaplanması, konuşmacı başına mevcut cümlenin başlangıç zamanı ve bir öncekinin bitiş zamanı gerektirir. Amazon Transcribe, öğe başına başlangıç ve bitiş zamanları sağladığından, hesaplama sırasıyla geçerli ve önceki cümlelerin ilk ve son öğelerinin kullanılmasını gerektirir.
Her cümlenin başlangıç gecikmelerini bilerek, istatistiksel analiz uygulayabilir ve toplam gecikme popülasyonuna kıyasla her gecikmenin önemini anlayabiliriz. Bizim bağlamımızda, önemli gecikmeler, popülasyonun tipik süresini aşan gecikmelerdir. Aşağıdaki grafik bir örnek göstermektedir.
Bu kavram için, ortalama değerden daha büyük gecikmeli cümleleri anlamlı kabul etmeye ve bu tür her cümlenin başına bir paragraf noktası koymaya karar veriyoruz. Ortalama değerin yanı sıra, tüm başlangıç gecikmelerinin medyandan veya üçüncü dilim veya popülasyonun üst sınır değerinden daha büyük olduğunu kabul etmek gibi başka seçenekler de vardır.
Her paragrafın içerdiği kelime sayısını dikkate alarak paragraf tanımlama sürecine bir adım daha ekliyoruz. Paragraflar önemli sayıda kelime içerdiğinde, bir bölme işlemi yürütür ve böylece nihai sonuca bir paragraf daha ekleriz.
Kelime sayıları bağlamında, üst çit değerini aşan kelime sayılarını anlamlı olarak tanımlarız. Bu kararı kasıtlı olarak veririz, böylece bölme işlemlerini sonuçlarımızda gerçekten aykırı değerler olarak davranan paragraflarla sınırlandırırız. Aşağıdaki grafik bir örnek göstermektedir.
Bölme işlemi, maksimum cümle başlama gecikmesi içgörüsünü dikkate alarak yeni paragraf giriş noktasını seçer. Bu şekilde, yeni paragraf, mevcut paragraf içindeki maksimum başlama gecikmesini gösteren cümlede tanıtılır. Bölmeler, hiçbir kelime sayısı seçilen sınırı, bizim durumumuzda üst sınır değerini aşmayana kadar tekrarlanabilir. Aşağıdaki şekil bir örnek göstermektedir.
Sonuç
Bu gönderide, Amazon Transcribe'ın asıl transkript ile birlikte sağladığı meta verileri temel alarak, manüel müdahale olmaksızın transkriptlerinize otomatik olarak paragraflar eklemek için bir konsept sunduk.
Bu kavram, dile veya aksana özgü değildir, çünkü paragraf giriş noktalarını önermek için dilsel olmayan meta verilere dayanır. Gelecekteki varyasyonlar, paragraf tanımlama mantığını daha da geliştirerek dil başına bir durumla ilgili gramer veya anlam bilgisi içerebilir.
Bu gönderi hakkında geri bildiriminiz varsa, yorumlarınızı yorumlar bölümünde belirtin. Sizden haber almak için sabırsızlanıyoruz. Çıkış yapmak Amazon Transcript Özellikleri transkriptlerinizden en iyi şekilde yararlanmanıza yardımcı olacak ek özellikler için.
Yazarlar Hakkında
Kostas Tzouvanas Amazon Web Services'ta Kurumsal Çözüm Mimarıdır. Müşterilerin iş potansiyellerine ulaşmaları için bulut tabanlı çözümler tasarlamalarına yardımcı olur. Ana odak noktası ticaret platformları ve yüksek performanslı bilgi işlem sistemleridir. Ayrıca genomik ve biyoinformatik konusunda tutkulu.
Pavlos Kaymakis GR/CY/MT'deki Kurumsal müşterilere bakan ve onlara değer katan çözümler tasarlama ve uygulama deneyimiyle onları destekleyen bir Kurumsal Çözümler Mimarıdır. Pavlos, hem mühendislik hem de yönetim açısından kariyerinin en büyük zamanını ürün ve müşteri destek sektöründe geçirdi. Pavlos seyahat etmeyi sever ve her zaman dünyadaki yeni yerleri keşfetmeye hazırdır.
- SEO Destekli İçerik ve Halkla İlişkiler Dağıtımı. Bugün Gücünüzü Artırın.
- PlatoAiStream. Web3 Veri Zekası. Bilgi Genişletildi. Buradan Erişin.
- Adryenn Ashley ile Geleceği Basmak. Buradan Erişin.
- PREIPO® ile PRE-IPO Şirketlerinde Hisse Al ve Sat. Buradan Erişin.
- Kaynak: https://aws.amazon.com/blogs/machine-learning/arrange-your-transcripts-into-paragraphs-with-amazon-transcribe/
- :vardır
- :dır-dir
- :olumsuzluk
- $UP
- 1
- 100
- 22
- 7
- 9
- a
- Hakkımızda
- Kabul et
- kabul
- Başarmak
- gerçek
- eklemek
- ekleme
- Ek
- Sonra
- Türkiye
- boyunca
- Ayrıca
- alternatif
- alternatifleri
- her zaman
- Amazon
- Amazon Yazısı
- Amazon Web Servisleri
- miktar
- an
- analiz
- ve
- ayrı
- Tamam
- ARE
- Dizi
- AS
- At
- ses
- otomatik olarak
- merkezli
- BE
- Çünkü
- Başlangıç
- İYİ
- arasında
- Biggest
- her ikisi de
- sınırları
- sınır
- kutu
- iş
- by
- denilen
- CAN
- adaylar
- Kariyer
- dava
- Telegram Kanal
- Kontrol
- yorumlar
- karşılaştırma
- bilgisayar
- kavram
- güven
- emin
- yapılandırma
- dikkate
- kabul
- düşünen
- içermek
- içerdiği
- içerik
- bağlam
- akım
- müşteri
- Kullanıcı Desteği
- Müşteriler
- karar vermek
- karar
- Varsayılan
- geciktirmek
- gecikmeleri
- Dizayn
- belge
- sürücü
- süre
- her
- etkin
- son
- Mühendislik
- artırılması
- kuruluş
- giriş
- Her
- örnek
- örnekler
- aşmak
- aşıyor
- sergileyen
- var
- deneyim
- Keşfetmek
- Özellikler(Hazırlık aşamasında)
- Özellikler
- geribesleme
- şekil
- fileto
- son
- Ad
- odak
- takip etme
- şu
- İçin
- Airdrop Formu
- biçim
- ileri
- itibaren
- tam
- daha fazla
- gelecek
- genomik
- almak
- grafik
- büyük
- Var
- he
- işitme
- yardım et
- yardımcı olur
- hi
- Yüksek
- onun
- Ne kadar
- HTTPS
- Kimlik
- tanımlayıcı
- belirlemek
- if
- uygulamak
- in
- dahil
- belirtmek
- gösterir
- belirti
- bilgi
- kavrama
- müdahale
- içine
- tanıtmak
- tanıttı
- Tanıtımlar
- IT
- ürün
- İş
- jpg
- dil
- Soyad
- seviye
- sevmek
- Liste
- mantık
- Bakın
- bakıyor
- seviyor
- Ana
- yapmak
- yönetim
- Manuel
- işaret
- maksimum
- maksimum
- ortalama
- Metadata
- Daha
- çoğu
- yeni
- yok hayır
- numara
- nesneler
- of
- on
- ONE
- bir tek
- operasyon
- Operasyon
- Opsiyonlar
- or
- Diğer
- bizim
- dışarı
- tekrar
- belirli
- tutkulu
- performans
- perspektif
- Yerler
- Platformlar
- Platon
- Plato Veri Zekası
- PlatoVeri
- Nokta
- noktaları
- nüfus
- Çivi
- potansiyel
- mevcut
- sundu
- önceki
- süreç
- PLATFORM
- sağlanan
- sağlar
- soru
- tekrarlanan
- gerektirir
- sırasıyla
- kısıtlamak
- sonuç
- Sonuçlar
- koşmak
- Bölüm
- sektör
- seçilmiş
- cümle
- Hizmetler
- meli
- Gösteriler
- önem
- önemli
- So
- çözüm
- Çözümler
- konuşmacı
- özel
- harcanmış
- bölmek
- Splits
- başlama
- istatistiksel
- adım
- dur
- basit
- sunmak
- böyle
- önermek
- destek
- destekli
- Destek
- Sistemler
- alma
- göre
- o
- The
- Dünya
- ve bazı Asya
- Onları
- sonra
- Orada.
- böylece
- Bunlar
- Üçüncü
- Re-Tweet
- Bu
- zaman
- zamanlar
- için
- Toplam
- Trading
- İşlem Platformları
- Transkript
- gerçekten
- tip
- türleri
- tipik
- kadar
- kullanım
- kullanım
- kullanım
- kullanmak
- değer
- Değerler
- Video
- Görüntüle
- oldu
- Yol..
- we
- ağ
- web hizmetleri
- karşılama
- ne zaman
- hangi
- irade
- ile
- olmadan
- Word
- sözler
- Dünya
- Sen
- zefirnet