Diarizacija govorca, ki je bistven postopek pri analizi zvoka, segmentira zvočno datoteko na podlagi identitete govorca. Ta objava obravnava integracijo PyAnnote Hugging Face za diarizacijo govorcev z Amazon SageMaker asinhrone končne točke.
Ponujamo izčrpen vodnik o tem, kako uvesti rešitve za segmentacijo zvočnikov in gruče z uporabo SageMaker v oblaku AWS. To rešitev lahko uporabite za aplikacije, ki se ukvarjajo z zvočnimi posnetki z več zvočniki (več kot 100).
Pregled rešitev
Amazonski prepis je najboljša storitev za diarizacijo govorcev v AWS. Vendar pa lahko za nepodprte jezike uporabite druge modele (v našem primeru PyAnnote), ki bodo uvedeni v SageMaker za sklepanje. Za kratke zvočne datoteke, kjer sklepanje traja do 60 sekund, lahko uporabite sklepanje v realnem času. Za več kot 60 sekund, asinhrono je treba uporabiti sklepanje. Dodatna prednost asinhronega sklepanja je prihranek pri stroških s samodejnim skaliranjem števila primerkov na nič, ko ni nobenih zahtev za obdelavo.
Objemni obraz je priljubljeno odprtokodno središče za modele strojnega učenja (ML). AWS in Hugging Face imata a Partnerstvo ki omogoča brezhibno integracijo prek SageMakerja z nizom AWS Deep Learning Containers (DLC) za usposabljanje in sklepanje v PyTorch ali TensorFlow ter ocenjevalcev in napovedovalcev Hugging Face za SDK SageMaker Python. Funkcije in zmogljivosti SageMaker pomagajo razvijalcem in podatkovnim znanstvenikom, da z lahkoto začnejo z obdelavo naravnega jezika (NLP) na AWS.
Integracija za to rešitev vključuje uporabo predhodno usposobljenega modela diarizacije zvočnika Hugging Face z uporabo Knjižnica PyAnnote. PyAnnote je odprtokodni komplet orodij, napisan v Pythonu za diarizacijo govorcev. Ta model, usposobljen na vzorčnem naboru zvočnih podatkov, omogoča učinkovito razdelitev zvočnikov v zvočne datoteke. Model je nameščen na SageMakerju kot nastavitev asinhrone končne točke, ki zagotavlja učinkovito in razširljivo obdelavo nalog diarizacije.
Naslednji diagram prikazuje arhitekturo rešitev.
Za to objavo uporabljamo naslednjo zvočno datoteko.
Stereo ali večkanalne zvočne datoteke se samodejno spremenijo v mono z povprečenjem kanalov. Zvočne datoteke, vzorčene z drugačno hitrostjo, se ob nalaganju samodejno znova vzorčijo na 16 kHz.
Predpogoji
Izpolnite naslednje predpogoje:
- Ustvarite domeno SageMaker.
- Poskrbite za svoje AWS upravljanje identitete in dostopa (IAM) ima potrebna dovoljenja za dostop za ustvarjanje a Vloga SageMaker.
- Prepričajte se, da ima račun AWS kvoto storitve za gostovanje končne točke SageMaker za primerek ml.g5.2xlarge.
Ustvarite modelno funkcijo za dostop do diarizacije zvočnika PyAnnote iz Hugging Face
Hugging Face Hub lahko uporabite za dostop do želenega predhodno usposobljenega Model diarizacije zvočnika PyAnnote. Pri ustvarjanju končne točke SageMaker uporabite isti skript za prenos datoteke modela.
Glej naslednjo kodo:
Zapakirajte kodo modela
Pripravite bistvene datoteke, kot je inference.py, ki vsebuje sklepno kodo:
Pripravite a requirements.txt
datoteka, ki vsebuje zahtevane knjižnice Python, potrebne za izvajanje sklepanja:
Na koncu stisnite inference.py
in requirements.txt in jo shranite kot model.tar.gz
:
Konfigurirajte model SageMaker
Definirajte vir modela SageMaker tako, da navedete URI slike, lokacijo podatkov modela Preprosta storitev shranjevanja Amazon (S3) in vloga SageMaker:
Naložite model v Amazon S3
Naložite stisnjeno datoteko modela objemajočega obraza PyAnnote v vedro S3:
Ustvarite asinhrono končno točko SageMaker
Konfigurirajte asinhrono končno točko za uvajanje modela v SageMaker z uporabo ponujene konfiguracije asinhronega sklepanja:
Preizkusite končno točko
Ocenite funkcionalnost končne točke tako, da pošljete zvočno datoteko za diarizacijo in pridobite izhod JSON, shranjen na določeni izhodni poti S3:
Za uvedbo te rešitve v velikem obsegu predlagamo uporabo AWS Lambda, Amazon Simple notification Service (Amazon SNS), oz Storitev Amazon Simple Queue Service (Amazon SQS). Te storitve so zasnovane za razširljivost, arhitekturo, ki temelji na dogodkih, in učinkovito uporabo virov. Pomagajo lahko ločiti proces asinhronega sklepanja od obdelave rezultatov, kar vam omogoča, da vsako komponento neodvisno prilagodite in učinkoviteje obravnavate nize zahtev za sklepanje.
Rezultati
Izhod modela je shranjen na s3://sagemaker-xxxx /async_inference/output/.
Izhod kaže, da je bil zvočni posnetek segmentiran v tri stolpce:
- Začetek (čas začetka v sekundah)
- Konec (končni čas v sekundah)
- Zvočnik (oznaka zvočnika)
Naslednja koda prikazuje primer naših rezultatov:
Čiščenje
Politiko skaliranja lahko nastavite na nič, tako da MinCapacity nastavite na 0; asinhrono sklepanje vam omogoča samodejno prilagajanje na nič brez zahtev. Ni vam treba izbrisati končne točke luske od nič, ko je ponovno potreben, kar zmanjša stroške, ko ni v uporabi. Oglejte si naslednjo kodo:
- Distribucija vsebine in PR s pomočjo SEO. Okrepite se še danes.
- PlatoData.Network Vertical Generative Ai. Opolnomočite se. Dostopite tukaj.
- PlatoAiStream. Web3 Intelligence. Razširjeno znanje. Dostopite tukaj.
- PlatoESG. Ogljik, CleanTech, Energija, Okolje, sončna energija, Ravnanje z odpadki. Dostopite tukaj.
- PlatoHealth. Obveščanje o biotehnologiji in kliničnih preskušanjih. Dostopite tukaj.
- vir: https://aws.amazon.com/blogs/machine-learning/deploy-a-hugging-face-pyannote-speaker-diarization-model-on-amazon-sagemaker-as-an-asynchronous-endpoint/
- :ima
- : je
- :ne
- :kje
- $GOR
- 1
- 10
- 100
- 11
- 118
- 12
- 13
- 14
- 16
- 17
- 23
- 25
- 26%
- 27
- 28
- 31
- 60
- 7
- 8
- 9
- a
- O meni
- dostop
- Dostop
- ustrežljiv
- Račun
- čez
- dodajte
- dodano
- prilagaja
- napredno
- spet
- AI
- Storitve AI
- AI / ML
- Dovoli
- omogoča
- Prav tako
- Amazon
- Amazon SageMaker
- Amazon Web Services
- an
- Analiza
- analitika
- in
- kaj
- uporaba
- aplikacije
- pristop
- Arhitektura
- arhitekture
- SE
- okoli
- AS
- At
- Poskusi
- audio
- avto
- samodejno
- povprečenje
- AWS
- temeljijo
- BE
- bilo
- koristi
- Prednosti
- med
- poslovni
- podjetja
- by
- CAN
- Zmogljivosti
- primeru
- primeri
- Spremembe
- kanali
- razred
- stranke
- Cloud
- grozdenje
- Koda
- Stolpci
- komentarji
- Skupno
- komponenta
- celovito
- Koncept
- sočasno
- konfiguracija
- Zabojniki
- Vsebuje
- Nadzor
- strošek
- prihranki pri stroških
- stroški
- štetje
- ustvarjajo
- Ustvarjanje
- Stranke, ki so
- datum
- deliti
- globoko
- globoko učenje
- opredeliti
- poda
- poglablja
- predstavitev
- razporedi
- razporejeni
- uvajanja
- Oblikovanje
- zasnovan
- želeno
- razvili
- Razvojni
- Razvijalci
- Razvoj
- diagram
- drugačen
- digitalni
- Digitalni Transformation
- imenik
- Dokumenti
- dont
- nalaganje
- dinamično
- vsak
- enostavnost
- Učinkovito
- učinkovito
- učinkovite
- učinkovito
- omogoča
- konec
- Končna točka
- Napaka
- bistvena
- Primer
- Razen
- izkušnje
- raziskuje
- Obraz
- Lastnosti
- file
- datoteke
- po
- za
- format
- iz
- funkcija
- funkcionalnost
- generativno
- dobili
- pridobivanje
- GitHub
- vodi
- ročaj
- Imajo
- he
- pomoč
- pomagal
- Pomaga
- njegov
- gostovanje
- Kako
- Kako
- Vendar
- HTML
- http
- HTTPS
- Hub
- HuggingFace
- Stotine
- identiteta
- if
- ponazarja
- slika
- izvajali
- uvoz
- in
- neodvisno
- india
- primer
- Povezovanje
- integracija
- v
- vključuje
- IT
- Potovanje
- jpg
- json
- Ključne
- label
- jezik
- jeziki
- velika
- kosilo
- učenje
- Lets
- knjižnice
- kot
- obremenitev
- nalaganje
- kraj aktivnosti
- več
- stroj
- strojno učenje
- pomeni
- ML
- Model
- modeli
- več
- več
- naravna
- Obdelava Natural Language
- potrebno
- Nimate
- potrebna
- nlp
- št
- Noben
- Obvestilo
- Številka
- predmet
- of
- Ponudbe
- on
- odprite
- open source
- Optimizira
- or
- OS
- Ostalo
- naši
- ven
- izhod
- več
- Splošni
- lastne
- pand
- del
- pot
- Dovoljenja
- plinovod
- platforma
- platon
- Platonova podatkovna inteligenca
- PlatoData
- politika
- Popular
- Prispevek
- poganja
- Napovedi
- predpogoji
- Postopek
- obravnavati
- projekti
- dokazov
- zagotavljajo
- če
- zagotavlja
- zagotavljanje
- javnega
- dal
- Python
- pitorha
- vprašanja
- Oceniti
- dosežejo
- v realnem času
- Snemanje
- zmanjšuje
- zmanjšanje
- reference
- okolica
- Registracija
- zanesljiv
- zamenjajte
- predstavlja
- zahteva
- obvezna
- Zahteve
- vir
- viri
- Odgovor
- povzroči
- Rezultati
- vrnitev
- vloga
- Run
- tek
- sagemaker
- prodaja
- Enako
- Vzorec
- Shrani
- Prihranki
- Prilagodljivost
- razširljive
- Lestvica
- skaliranje
- Znanstveniki
- script
- skripte
- SDK
- brezšivne
- brez težav
- sekund
- sektor
- glej
- segmentacija
- segmentih
- pošiljanja
- ločitev
- Storitev
- Storitve
- Zasedanje
- sej
- nastavite
- nastavitev
- nastavitev
- več
- Oblikujte
- Kratke Hlače
- shouldnt
- Razstave
- Enostavno
- sam
- Software
- Razvoj programske opreme
- Rešitev
- rešitve
- vir
- Zvočniki
- specialist
- specifična
- določeno
- določanje
- troši
- po delih
- Začetek
- začel
- shranjevanje
- shranjeni
- naravnost
- Strateško
- uspeh
- predlagajte
- Preverite
- sistem
- meni
- Naloge
- tech
- tensorflo
- kot
- da
- O
- Tukaj.
- te
- jih
- ta
- tisoče
- 3
- skozi
- čas
- do
- danes
- Orodje
- temo
- baklo
- usposobljeni
- usposabljanje
- Preoblikovanje
- transformatorji
- poskusite
- OBRAT
- naprej
- uporaba
- Rabljeni
- uporabnik
- uporablja
- uporabo
- Variant
- različica
- Video posnetki
- W
- Počakaj
- želeli
- we
- web
- spletne storitve
- kdaj
- ki
- WHO
- bo
- z
- deluje
- pisni
- let
- Vi
- Vaša rutina za
- zefirnet
- nič