Mõõdukad heli- ja tekstivestlused, kasutades AWS AI teenuseid ja LLM-e

Taasavaldanud Platon

järgijaid: 0

Veebimängu- ja sotsiaalsed kogukonnad pakuvad kasutajatele suhtlemiseks hääl- ja tekstivestluse funktsioone. Kuigi hääl- ja tekstivestlus toetavad sageli sõbralikku nalja, võib see põhjustada ka selliseid probleeme nagu vihakõne, küberkiusamine, ahistamine ja pettused. Tänapäeval usaldavad paljud ettevõtted mürgise sisalduse ülevaatamisel ainult inimmoderaatoritele. Rikkumiste kontrollimine vestluses on aga aeganõudev, veaohtlik ja mastaapne.

Selles postituses tutvustame lahendusi, mis võimaldavad heli- ja tekstivestluse modereerimist kasutades erinevaid AWS-teenuseid, sh Amazoni transkribeerimine, Amazoni mõistmine, Amazonase aluspõhija Amazon OpenSearchi teenus.

Sotsiaalsed platvormid otsivad valmis modereerimislahendust, mida on lihtne käivitada, kuid need nõuavad ka kohandamist erinevate poliitikate haldamiseks. Latentsus ja maksumus on samuti kriitilised tegurid, mida tuleb arvesse võtta. Korraldades toksilisuse klassifikatsiooni suurte keelemudelitega (LLM), kasutades generatiivset AI-d, pakume lahendust, mis tasakaalustab lihtsuse, latentsuse, kulude ja paindlikkuse, et rahuldada erinevaid nõudeid.

Selle postituse näidiskood on saadaval aadressil GitHubi hoidla.

Helivestluse modereerimise töövoog

Helivestluse modereerimise töövoo võib algatada kasutaja, kes teatab teistest mänguplatvormi kasutajatelt eeskirjade rikkumistest, nagu roppused, vihakõne või ahistamine. See kujutab endast passiivset lähenemist heli modereerimisele. Süsteem salvestab kõik helivestlused ilma kohese analüüsita. Kui aruanne on vastu võetud, hangib töövoog seotud helifailid ja käivitab analüüsiprotsessi. Seejärel vaatab inimmoderaator teatatud vestluse üle ja uurib selle sisu, et teha kindlaks, kas see rikub platvormi eeskirju.

Teise võimalusena võib töövoo käivitada ennetavalt. Näiteks sotsiaalses helivestlusruumis saab süsteem salvestada kõik vestlused ja rakendada analüüsi.

Nii passiivne kui ka ennetav lähenemisviis võib käivitada helianalüüsi jaoks järgmise torujuhtme.

Heli modereerimise töövoog hõlmab järgmisi samme.

Töövoog algab helifaili vastuvõtmisega ja selle salvestamisega a Amazoni lihtne salvestusteenus (Amazon S3) ämber Amazon Transcribe'i jaoks.
Amazoni transkriptsioon StartTranscriptionJob API käivitatakse koos Toksilisuse tuvastamine lubatud. Amazon Transcribe teisendab heli tekstiks, pakkudes lisateavet toksilisuse analüüsi kohta. Lisateavet toksilisuse analüüsi kohta leiate aadressilt Märgistage häälvestlustes kahjulik keel rakendusega Amazon Transscribe Toxicity Detection.
Kui toksilisuse analüüs annab toksilisuse skoori, mis ületab teatud läve (näiteks 50%), võime kasutada Amazon Bedrocki teadmistebaasid et hinnata sõnumit kohandatud poliitikate suhtes, kasutades LLM-e.
Inimmoderaator saab üksikasjaliku helimodereerimise aruande, mis tõstab esile vestlussegmendid, mida peetakse mürgiseks ja rikuvad eeskirju, võimaldades neil teha teadlikke otsuseid.

Järgmisel ekraanipildil on näidisrakendus, mis kuvab helisegmendi toksilisuse analüüsi. See sisaldab originaalset transkriptsiooni, Amazon Transcribe'i toksilisuse analüüsi tulemusi ja Amazon Bedrocki teadmistebaasi kasutades Amazon Bedrock Anthropic Claude V2 mudeli kaudu läbi viidud analüüsi.

LLM-i analüüs annab rikkumise tulemuse (Y või N) ja selgitab mudeli poliitikarikkumise kohta tehtud otsuse põhjendusi. Lisaks sisaldab teadmistebaas viidatud poliitikadokumente, mida hindamisel kasutatakse, pakkudes moderaatoritele täiendavat konteksti.

Amazoni transkribeerimise toksilisuse tuvastamine

Amazon Transcribe on automaatne kõnetuvastuse (ASR) teenus, mis muudab arendajatel oma rakendustele kõne tekstiks võime lisamise lihtsaks. Heli modereerimise töövoog kasutab Amazon Transcribe Toxicity Detectionit, mis on masinõppe (ML) toega võimekus, mis kasutab heli- ja tekstipõhiseid vihjeid häälepõhise mürgise sisu tuvastamiseks ja klassifitseerimiseks seitsmes kategoorias, sealhulgas seksuaalne ahistamine, vihakõne ja ähvardused. , kuritarvitamine, roppused, solvangud ja graafiline keel. Lisaks teksti analüüsimisele kasutab toksilisuse tuvastamine kõnes toksilise kavatsuse tuvastamiseks kõne näpunäiteid, nagu toonid ja helikõrgus.

Heli modereerimise töövoog aktiveerib LLM-i poliitika hindamise ainult siis, kui toksilisuse analüüs ületab määratud läve. See lähenemisviis vähendab latentsust ja optimeerib kulusid, rakendades valikuliselt LLM-e, filtreerides välja olulise osa liiklusest.

Kasutage kohandatud poliitikate kohandamiseks LLM-i kiiret inseneritööd

Amazon Transcribe'i ja Amazon Comprehendi eelkoolitatud toksilisuse tuvastamise mudelid pakuvad laia toksilisuse taksonoomiat, mida tavaliselt kasutavad sotsiaalsed platvormid kasutajate loodud sisu modereerimiseks heli- ja tekstivormingus. Kuigi need eelkoolitatud mudelid tuvastavad tõhusalt probleeme madala latentsusajaga, võite vajada lahendust teie konkreetse ettevõtte või ärivaldkonna eeskirjade rikkumiste tuvastamiseks, mida eelkoolitatud mudelid üksi ei suuda saavutada.

Lisaks rikkumiste tuvastamine kontekstuaalsetes vestlustes, näiteks tuvastamine laste seksuaalne peibutamine vestluste jaoks, nõuab kohandatavat lahendust, mis hõlmab vestlussõnumite ja väljaspool seda konteksti, nagu kasutaja vanus, sugu ja vestluste ajalugu. Siin saavad LLM-id pakkuda nende nõuete laiendamiseks vajalikku paindlikkust.

Amazon Bedrock on täielikult hallatav teenus, mis pakub valikut juhtivate AI-ettevõtete suure jõudlusega alusmudeleid (FM-e). Need lahendused kasutavad Amazon Bedrocki Anthropic Claude v2, et modereerida heli transkriptsioone ja tekstivestlussõnumeid paindliku viipamalli abil, nagu on kirjeldatud järgmises koodis:

Human: You are a Trust & Safety expert. Your job is to review user chat message and decide if it violate the policy.
You will find the chat message in <message> tag, and find the policy in the <policy> tag. You can find additional rules in the <rule> tag to assist your decision. 

<policy>{policy}</policy>
<message>{message}</message>
<rule>{rule}</rule>

Does the chat message violate the policy? Please consider and provide your analysis in the <analysis> tag, breaking down each rule in the rule section, and keep and analysis within 100 words. Respond in the <answer> tag with either 'Y' or 'N'. 'Y' indicates that the message violates the policy, while 'N' means the content is safe and does not violate the policy. 

Assistant:

Mall sisaldab kohahoidjaid eeskirja kirjelduse, vestlussõnumi ja lisareeglite jaoks, mis nõuavad modereerimist. Anthropic Claude V2 mudel annab vastused juhiste vormingus (Y või N) koos analüüsiga, mis selgitab, miks sõnum tema arvates rikub eeskirju. See lähenemisviis võimaldab teil määratleda paindlikud modereerimiskategooriad ja sõnastada oma poliitikad inimkeeles.

Traditsiooniline ettevõttesisese klassifitseerimismudeli koolitamise meetod hõlmab tülikaid protsesse, nagu andmete märkimine, koolitus, testimine ja mudeli juurutamine, mis nõuavad andmeteadlaste ja ML-inseneride teadmisi. LLM-id seevastu pakuvad suurt paindlikkust. Ärikasutajad saavad muuta inimkeeles viipasid, mis suurendavad tõhusust ja vähendavad iteratsioonitsükleid ML-mudeli koolitusel.

Amazon Bedrocki teadmistebaasid

Kuigi kiire projekteerimine on tõhus poliitika kohandamiseks, võib pikkade poliitikate ja reeglite sisestamine otse iga sõnumi LLM-i viipadesse lisada latentsust ja suurendada kulusid. Selle probleemi lahendamiseks kasutame Amazon Bedrocki teadmistebaase hallatava taastamise laiendatud genereerimise (RAG) süsteemina. See võimaldab teil poliitikadokumenti paindlikult hallata, võimaldades töövool tuua iga sisendsõnumi jaoks ainult asjakohased poliitikasegmendid. See minimeerib LLM-idele analüüsimiseks saadetavate žetoonide arvu.

Võite kasutada AWS-i juhtimiskonsool et poliitikadokumendid üles laadida S3 ämbrisse ja seejärel indekseerida dokumendid vektorandmebaasi tõhusaks otsimiseks. Järgnev on kontseptuaalne töövoog, mida haldab Amazon Bedrocki teadmistebaas, mis hangib Amazon S3-st dokumendid, jagab teksti tükkideks ja kutsub esile Amazon Bedrock Titan teksti manustamise mudel tekstitükkide teisendamiseks vektoriteks, mis seejärel salvestatakse vektorite andmebaasi.

Selles lahenduses kasutame Amazon OpenSearchi teenus kui vektorite pood. OpenSearch on skaleeritav, paindlik ja laiendatav avatud lähtekoodiga tarkvarakomplekt otsingu-, analüütika-, turvaseire- ja vaatlemisrakenduste jaoks, mis on litsentsitud Apache 2.0 litsentsi alusel. OpenSearch Service on täielikult hallatav teenus, mis muudab OpenSearchi juurutamise, skaleerimise ja haldamise AWS-i pilves lihtsaks.

Pärast dokumendi indekseerimist OpenSearch Service'is saadab heli- ja tekstimodereerimise töövoog vestlussõnumeid, käivitades kohandatud poliitika hindamiseks järgmise päringuvoo.

Protsess sarnaneb käivitamise töövooga. Esiteks teisendatakse tekstsõnum Amazon Bedrock Titan Text Embedding API abil teksti manustamiseks. Neid manuseid kasutatakse seejärel a vektorotsing OpenSearch Service'i andmebaasi vastu, mis on juba dokumentide manustega täidetud. Andmebaas tagastab sisendtekstisõnumile vastavad kõrgeima vastavusskooriga poliitikatükid. Seejärel koostame viibad, mis sisaldavad nii sisendvestlussõnumit kui ka poliitikasegmenti, mis saadetakse hindamiseks Anthropic Claude V2-le. LLM-mudel tagastab viipade juhiste alusel analüüsitulemuse.

Üksikasjalikud juhised selle kohta, kuidas luua uus eksemplar oma poliitikadokumendiga Amazon Bedrocki teadmistebaasis, leiate aadressilt Teabebaasid pakuvad nüüd täielikult hallatud RAG-kogemust Amazon Bedrockis.

Tekstvestluse modereerimise töövoog

Tekstivestluse modereerimise töövoog järgib heli modereerimisega sarnast mustrit, kuid see kasutab Amazon Comprehendi toksilisuse analüüsi, mis on kohandatud teksti modereerimiseks. Näidisrakendus toetab CSV- või TXT-vormingus hulgitekstifailide üleslaadimise liidest ja pakub kiireks testimiseks ühe sõnumiga liidest. Järgmine diagramm illustreerib töövoogu.

Teksti modereerimise töövoog hõlmab järgmisi samme.

Kasutaja laadib tekstifaili üles S3 ämbrisse.
Tekstisõnumile rakendatakse Amazon Comprehendi toksilisuse analüüsi.
Kui toksilisuse analüüs tagastab toksilisuse skoori, mis ületab teatud läve (näiteks 50%), kasutame Amazon Bedrocki teadmistebaasi, et hinnata sõnumit kohandatud poliitikaga, kasutades Anthropic Claude V2 LLM-i.
Poliitika hindamise aruanne saadetakse inimmoderaatorile.

Amazon Comprehend toksilisuse analüüs

Teksti modereerimise töövoos kasutame tekstisõnumite toksilisuse taseme hindamiseks Amazon Comprehendi toksilisuse analüüsi. Amazon Comprehend on loomuliku keele töötlemise (NLP) teenus, mis kasutab tekstis väärtuslike arusaamade ja seoste avastamiseks ML-i. Amazon Comprehend toksilisuse tuvastamise API määrab tekstisisule üldise toksilisuse skoori, mis jääb vahemikku 0–1, mis näitab selle mürgisuse tõenäosust. Samuti liigitab see teksti järgmistesse kategooriatesse ja annab igaühele usaldusskoori: hate_speech, graafika, harrassement_or_abuse, seksuaalne, violence_or_threat, solvang ja roppused.

Selles teksti modereerimise töövoos mängib Amazon Comprehend toksilisuse analüüs otsustavat rolli, et teha kindlaks, kas sissetulev tekstsõnum sisaldab mürgist sisu. Sarnaselt heli modereerimise töövooga sisaldab see tingimust, et allavoolu LLM-poliitika hindamine aktiveeritakse ainult siis, kui toksilisuse analüüs tagastab eelnevalt määratletud läve ületava skoori. See optimeerimine aitab vähendada üldist latentsust ja LLM-analüüsiga seotud kulusid.

kokkuvõte

Selles postituses tutvustasime lahendusi heli- ja tekstivestluse modereerimiseks, kasutades AWS-i teenuseid, sealhulgas Amazon Transcribe, Amazon Comprehend, Amazon Bedrock ja OpenSearch Service. Need lahendused kasutavad toksilisuse analüüsiks eelkoolitatud mudeleid ja neid juhitakse generatiivsete AI LLM-idega, et saavutada täpsuse, latentsusaja ja kulude optimaalne tasakaal. Samuti annavad need teile võimaluse oma poliitikaid paindlikult määratleda.

Saate kogeda näidisrakendust, järgides juhiseid GitHub repo.

Andmeid autor

Lana Zhang on AWS WWSO AI Services meeskonna vanemlahenduste arhitekt, kes on spetsialiseerunud AI-le ja ML-le sisu modereerimise, arvutinägemise, loomuliku keele töötlemise ja generatiivse AI jaoks. Oma teadmistega on ta pühendunud AWS-i AI/ML-lahenduste reklaamimisele ja klientide abistamisele nende ärilahenduste muutmisel erinevates tööstusharudes, sealhulgas sotsiaalmeedia, mängud, e-kaubandus, meedia, reklaam ja turundus.

SEO-põhise sisu ja PR-levi. Võimenduge juba täna.
PlatoData.Network Vertikaalne generatiivne Ai. Jõustage ennast. Juurdepääs siia.
PlatoAiStream. Web3 luure. Täiustatud teadmised. Juurdepääs siia.
PlatoESG. Süsinik, CleanTech, Energia, Keskkond päikeseenergia, Jäätmekäitluse. Juurdepääs siia.
PlatoTervis. Biotehnoloogia ja kliiniliste uuringute luureandmed. Juurdepääs siia.
Allikas: https://aws.amazon.com/blogs/machine-learning/moderate-audio-and-text-chats-using-aws-ai-services-and-llms/

Ajatempel: Märtsil 13, 2024

Ajatempel: Mar 7, 2023

Taasavaldanud Platon

Otsige nutikalt Alfresco sisu Amazon Kendra abil

Kiirustage ML-i arendust, kasutades SageMaker Feature Store'i ja Apache Icebergi võrguühenduseta poe tihendamist

Meta Llama 3 mudelid on nüüd saadaval Amazon SageMaker JumpStart | Amazoni veebiteenused

Isikupärastage oma otsingutulemusi Amazon Personalize'i ja Amazon OpenSearch Service'i integreerimisega | Amazoni veebiteenused

Lubage intelligentne otsuste tegemine Amazon SageMaker Canvase ja Amazon QuickSightiga

Toitesoovitused ja otsing IMDb teadmiste graafiku abil – 2. osa

Meist

Vertikaalne otsing ja Ai

Platvorm

Püsi ühenduses

konto