Amazon Transcribe is een volledig beheerde automatische spraakherkenningsservice (ASR) waarmee u eenvoudig spraak-naar-tekstmogelijkheden aan uw toepassingen kunt toevoegen. Vandaag zijn we verheugd een spraakbasismodel van de volgende generatie met meerdere miljarden parameters aan te kondigen dat de automatische spraakherkenning uitbreidt naar meer dan 100 talen. In dit bericht bespreken we enkele voordelen van dit systeem, hoe bedrijven het gebruiken en hoe u aan de slag kunt gaan. We geven hieronder ook een voorbeeld van de transcriptie-uitvoer.
Het spraakbasismodel van Transcribe is getraind met behulp van de beste, zelfgecontroleerde algoritmen in zijn klasse om de inherente universele patronen van menselijke spraak in verschillende talen en accenten te leren. Het is getraind op miljoenen uren aan ongelabelde audiogegevens uit meer dan 100 talen. De trainingsrecepten worden geoptimaliseerd door middel van slimme gegevensbemonstering om de trainingsgegevens tussen talen in evenwicht te brengen, waardoor ervoor wordt gezorgd dat traditioneel ondervertegenwoordigde talen ook een hoog nauwkeurigheidsniveau bereiken.
Carbyne is een softwarebedrijf dat cloudgebaseerde, missiekritieke contactcenteroplossingen ontwikkelt voor noodoproephulpverleners. Carbyne's missie is om hulpverleners te helpen levens te redden, en taal mag hun doelen niet in de weg staan. Hier ziet u hoe ze Amazon Transcribe gebruiken om hun missie na te streven:
“AI-aangedreven Carbyne Live Audio Translation is rechtstreeks gericht op het helpen verbeteren van de noodhulp voor de 68 miljoen Amerikanen die thuis een andere taal dan Engels spreken, naast de tot 79 miljoen buitenlandse bezoekers die het land jaarlijks bezoeken. Door gebruik te maken van Amazon Transcribe's nieuwe meertalige basismodel, aangedreven door ASR, zal Carbyne nog beter toegerust zijn om levensreddende hulpdiensten te democratiseren, omdat Every. Persoon. Telt.”
– Alex Dizengof, medeoprichter en CTO van Carbyne.
Door gebruik te maken van het spraakbasismodel levert Amazon Transcribe een aanzienlijke nauwkeurigheidsverbetering tussen 20% en 50% in de meeste talen. Op het gebied van telefonie, een uitdagend en gegevensschaars domein, ligt de nauwkeurigheidsverbetering tussen de 30% en 70%. Naast een substantiële verbetering van de nauwkeurigheid levert dit grote ASR-model ook verbeteringen op in de leesbaarheid met nauwkeurigere interpunctie en hoofdlettergebruik. Met de komst van generatieve AI gebruiken duizenden bedrijven Amazon Transcribe om rijke inzichten uit hun audiocontent te ontsluiten. Met aanzienlijk verbeterde nauwkeurigheid en ondersteuning voor meer dan 100 talen zal Amazon Transcribe een positieve invloed hebben op al dergelijke gebruiksscenario's. Alle bestaande en nieuwe klanten die Amazon Transcribe in batchmodus gebruiken, hebben toegang tot spraakherkenning op basis van een spraakfundament, zonder dat er enige wijziging aan het API-eindpunt of de invoerparameters nodig is.
Het nieuwe ASR-systeem biedt verschillende belangrijke functies in alle meer dan 100 talen met betrekking tot gebruiksgemak, maatwerk, gebruikersveiligheid en privacy. Deze omvatten functies zoals automatische interpunctie, aangepaste woordenschat, automatische taalidentificatie, dagboekregistratie van sprekers, betrouwbaarheidsscores op woordniveau en een aangepast woordenschatfilter. De uitgebreide ondersteuning van het systeem voor verschillende accenten, geluidsomgevingen en akoestische omstandigheden stelt u in staat nauwkeurigere uitvoer te produceren en helpt u daardoor stemtechnologieën effectief in uw toepassingen te integreren.
Mogelijk gemaakt door de hoge nauwkeurigheid van Amazon Transcribe bij verschillende accenten en ruisomstandigheden, de ondersteuning voor een groot aantal talen en de breedte van functiesets met toegevoegde waarde, zullen duizenden ondernemingen in staat worden gesteld om ontsluiten rijke inzichten uit hun audiocontent, en vergroten de toegankelijkheid en vindbaarheid van hun audio- en videocontent in verschillende domeinen. Contactcenters transcriberen en analyseren bijvoorbeeld klantgesprekken om inzichten te identificeren en vervolgens de klantervaring en de productiviteit van agenten te verbeteren. Contentproducenten en mediadistributeurs genereren automatisch ondertitels met Amazon Transcribe om de toegankelijkheid van de content te verbeteren.
Ga aan de slag met Amazon Transcribe
U kunt gebruik maken van de AWS-opdrachtregelinterface (AWS-CLI), AWS-beheerconsoleen verschillende AWS SDK's voor batchtranscripties en blijf hetzelfde gebruiken StartTranscriptionJob
API om prestatievoordelen te behalen uit het verbeterde ASR-model zonder dat u aan uw kant code- of parameterwijzigingen hoeft aan te brengen. Voor meer informatie over het gebruik van de AWS CLI en de console raadpleegt u Transcriberen met de AWS CLI en Transcriberen met de AWS Management Console, Respectievelijk.
De eerste stap is het uploaden van uw mediabestanden naar een Amazon eenvoudige opslagservice (Amazon S3) bucket, een objectopslagservice die is gebouwd om elke hoeveelheid gegevens overal op te slaan en op te halen. Amazon S3 biedt toonaangevende duurzaamheid, beschikbaarheid, prestaties, beveiliging en vrijwel onbeperkte schaalbaarheid tegen zeer lage kosten. Je kunt ervoor kiezen om je transcript op te slaan in je eigen S3-bucket, of Amazon Transcribe een veilige standaardbucket te laten gebruiken. Zie voor meer informatie over het gebruik van S3-buckets Amazon S3-buckets maken, configureren en ermee werken.
Transcriptie-uitvoer
Amazon Transcribe gebruikt JSON-representatie voor de uitvoer. Het biedt het transcriptieresultaat in twee verschillende formaten: tekstformaat en gespecificeerd formaat. Er verandert niets met betrekking tot het API-eindpunt of de invoerparameters.
Het tekstformaat biedt het transcript als een tekstblok, terwijl het gespecificeerde formaat het transcript levert in de vorm van tijdig geordende getranscribeerde items, samen met aanvullende metagegevens per item. Beide formaten bestaan parallel in het uitvoerbestand.
Afhankelijk van de functies die je selecteert bij het maken van de transcriptietaak, creëert Amazon Transcribe aanvullende en verrijkte weergaven van het transcriptieresultaat. Zie de volgende voorbeeldcode:
De weergaven zijn als volgt:
- Afschriften – Vertegenwoordigd door de
transcripts
element, het bevat alleen het tekstformaat van het transcript. In scenario's met meerdere sprekers en meerdere kanalen wordt de aaneenschakeling van alle transcripties als één blok aangeboden. - Sprekers – Vertegenwoordigd door de
speaker_labels
element, het bevat de tekst en gespecificeerde formaten van het transcript, gegroepeerd op spreker. Deze functie is alleen beschikbaar als de functie voor meerdere luidsprekers is ingeschakeld. - Kanalen – Vertegenwoordigd door de
channel_labels
element, het bevat de tekst en gespecificeerde formaten van het transcript, gegroepeerd per kanaal. Het is alleen beschikbaar als de functie voor meerdere kanalen is ingeschakeld. - Item – Vertegenwoordigd door de
items
element, het bevat alleen het gespecificeerde formaat van het transcript. In scenario's met meerdere sprekers en meerdere kanalen worden items verrijkt met extra eigenschappen, die spreker en kanaal aangeven. - Segmenten – Vertegenwoordigd door de
segments
element, het bevat de tekst en gespecificeerde formaten van het transcript, gegroepeerd op alternatieve transcriptie. Het is alleen beschikbaar als de functie voor alternatieve resultaten is ingeschakeld.
Conclusie
Bij AWS innoveren we voortdurend namens onze klanten. Door de taalondersteuning in Amazon Transcribe uit te breiden naar meer dan 100 talen, stellen we onze klanten in staat gebruikers met verschillende taalkundige achtergronden te bedienen. Dit verbetert niet alleen de toegankelijkheid, maar opent ook nieuwe wegen voor communicatie en informatie-uitwisseling op mondiale schaal. Voor meer informatie over de functies die in dit bericht worden besproken, ga je naar functies pagina en wat is een nieuw bericht.
Over de auteurs
Sumit Kumar is een Principal Product Manager, technisch bij het AWS AI Language Services-team. Hij heeft 10 jaar productmanagementervaring in verschillende domeinen en heeft een passie voor AI/ML. Buiten het werk houdt Sumit van reizen en speelt hij graag cricket en gazontennis.
Vivek Singh is Senior Manager Product Management bij het AWS AI Language Services-team. Hij leidt het Amazon Transcribe-productteam. Voordat hij bij AWS kwam, bekleedde hij productmanagementfuncties bij verschillende andere Amazon-organisaties, zoals consumentenbetalingen en detailhandel. Vivek woont in Seattle, WA en houdt van hardlopen en wandelen.
- Door SEO aangedreven content en PR-distributie. Word vandaag nog versterkt.
- PlatoData.Network Verticale generatieve AI. Versterk jezelf. Toegang hier.
- PlatoAiStream. Web3-intelligentie. Kennis versterkt. Toegang hier.
- PlatoESG. carbon, CleanTech, Energie, Milieu, Zonne, Afvalbeheer. Toegang hier.
- Plato Gezondheid. Intelligentie op het gebied van biotech en klinische proeven. Toegang hier.
- Bron: https://aws.amazon.com/blogs/machine-learning/amazon-transcribe-announces-a-new-speech-foundation-model-powered-asr-system-that-expands-support-to-over-100-languages/
- : heeft
- :is
- :niet
- $UP
- 10
- 100
- 14
- 24
- 7
- a
- Over
- toegang
- de toegankelijkheid
- nauwkeurigheid
- accuraat
- over
- toevoegen
- toevoeging
- Extra
- komst
- Agent
- AI
- AI / ML
- Gericht
- alex
- algoritmen
- Alles
- langs
- ook
- alternatief
- Amazone
- Amazon Transcribe
- Amazon Web Services
- Amerikanen
- bedragen
- an
- analyseren
- en
- aankondigen
- kondigt
- Jaarlijks
- elke
- overal
- api
- toepassingen
- ZIJN
- AS
- At
- audio
- Automatisch
- webmaster.
- beschikbaarheid
- Beschikbaar
- wegen
- AWS
- achtergronden
- Balance
- BE
- omdat
- namens
- onder
- betekent
- Betere
- tussen
- Blok
- zowel
- breedte
- bebouwd
- maar
- by
- Bellen
- oproepen
- CAN
- mogelijkheden
- kapitalisatie
- gevallen
- Centreren
- Centra
- uitdagend
- verandering
- Wijzigingen
- Kanaal
- kanalen
- controle
- Kies
- Mede-oprichter
- code
- Communicatie
- Bedrijven
- afstand
- Voltooid
- voorwaarden
- vertrouwen
- configureren
- troosten
- permanent
- consument
- contact
- contactcentrum
- bevat
- content
- voortzetten
- Kosten
- Land
- creëert
- Wij creëren
- krekel
- CTO
- gewoonte
- klant
- klantervaring
- Klanten
- maatwerk
- gegevens
- Standaard
- levert
- democratiseren
- ontwikkelt
- anders
- direct
- bespreken
- besproken
- distributeurs
- diversen
- domein
- domeinen
- duurzaamheid
- gemak
- makkelijk te gebruiken
- effectief
- beide
- element
- insluiten
- noodgeval
- gemachtigd
- in staat stellen
- ingeschakeld
- maakt
- einde
- Endpoint
- Engels
- verbeterde
- Verbetert
- verrijkt
- zorgen
- bedrijven
- omgevingen
- uitgerust
- Zelfs
- Alle
- voorbeeld
- uitwisseling
- bestaan
- bestaand
- uitgebreid
- breidt uit
- ervaring
- verlenging
- Kenmerk
- Voordelen
- Dien in
- Bestanden
- filter
- Voornaam*
- volgend
- volgt
- Voor
- vreemd
- formulier
- formaat
- Foundation
- oppompen van
- geheel
- voortbrengen
- generatief
- generatieve AI
- krijgen
- Globaal
- wereldwijde schaal
- Doelen
- gelukkig
- Hebben
- he
- Held
- hulp
- het helpen van
- helpt
- hier
- hi
- Hoge
- Home
- HOURS
- Hoe
- How To
- HTML
- http
- HTTPS
- menselijk
- Identificatie
- identificeren
- Impact
- verbeteren
- verbeterd
- verbetering
- verbeteringen
- in
- omvatten
- Laat uw omzet
- toonaangevende
- informatie
- inherent
- innoveren
- invoer
- inzichten
- instantie
- in
- IT
- artikelen
- HAAR
- Jobomschrijving:
- aansluiting
- jpg
- json
- sleutel
- taal
- Talen
- Groot
- Leads
- LEARN
- niveaus
- leveraging
- Lijn
- leven
- Lives
- houdt
- Laag
- maken
- MERKEN
- beheerd
- management
- manager
- Media
- Metadata
- miljoen
- miljoenen
- Missie
- Mode
- model
- meer
- meest
- nodig
- New
- volgende generatie
- Geluid
- niets
- aantal
- object
- of
- Aanbod
- on
- Slechts
- opent
- geoptimaliseerde
- or
- organisaties
- Overige
- onze
- uit
- uitgang
- uitgangen
- buiten
- over
- het te bezitten.
- Parallel
- parameter
- parameters
- hartstochtelijk
- patronen
- betalingen
- voor
- prestatie
- persoon
- Plato
- Plato gegevensintelligentie
- PlatoData
- spelen
- positief
- Post
- aangedreven
- Principal
- Voorafgaand
- privacy
- produceren
- Producenten
- Product
- product management
- product manager
- produktiviteit
- vastgoed
- zorgen voor
- mits
- biedt
- na te streven
- bereiken
- erkenning
- verwijzen
- verwant
- vertegenwoordiging
- vertegenwoordigd
- culturele wortels
- respectievelijk
- antwoord
- resultaat
- Resultaten
- <HR>Retail
- Rijk
- rollen
- lopend
- Veiligheid
- dezelfde
- Bespaar
- Schaalbaarheid
- Scale
- scenario's
- Seattle
- beveiligen
- veiligheid
- zien
- segmenten
- kiezen
- senior
- dienen
- service
- Diensten
- Sets
- verscheidene
- aanzienlijke
- aanzienlijk
- Eenvoudig
- single
- slim
- Software
- Oplossingen
- sommige
- spreken
- Spreker
- speakers
- toespraak
- Spraakherkenning
- spraak-naar-tekst
- gestart
- Status
- Stap voor
- mediaopslag
- shop
- eenvoudig
- Hierop volgend
- wezenlijk
- ondertitels
- dergelijk
- ondersteuning
- system
- team
- Technisch
- Technologies
- tekst
- neem contact
- dat
- De
- hun
- daarbij
- Deze
- ze
- dit
- duizenden kosten
- Door
- actuele
- naar
- vandaag
- traditioneel
- getraind
- Trainingen
- Afschrift
- Vertaling
- reizen
- twee
- Universeel
- onbeperkt
- openen
- .
- Gebruiker
- gebruikers
- toepassingen
- gebruik
- variëteit
- divers
- zeer
- Video
- .
- virtueel
- bezoekers
- Stem
- Manier..
- we
- web
- webservices
- welkom
- GOED
- wanneer
- terwijl
- welke
- WIE
- wil
- Met
- zonder
- Mijn werk
- werkzaam
- jaar
- You
- Your
- zephyrnet