Hvordan redigere PII-data i samtaletranskripsjoner PlatoBlockchain Data Intelligence. Vertikalt søk. Ai.

Hvordan redigere PII-data i samtaleutskrifter

Kundeserviceinteraksjoner inneholder ofte personlig identifiserbar informasjon (PII) som navn, telefonnumre og fødselsdato. Ettersom organisasjoner inkorporerer maskinlæring (ML) og analyser i applikasjonene sine, kan bruk av disse dataene gi innsikt i hvordan man kan skape mer sømløse kundeopplevelser. Tilstedeværelsen av PII-informasjon begrenser imidlertid ofte bruken av disse dataene. I dette blogginnlegget vil vi gjennomgå en løsning for automatisk å redigere PII-data fra en kundeservice-samtaleutskrift.

La oss ta et eksempel på en samtale mellom en kunde og en kundesenteragent.

Agent: Hei, takk for at du ringte oss i dag. Hvem har jeg gleden av å snakke med i dag?

Innringer: Hei, jeg heter John Stiles.

Agent: Hei John, hvordan kan jeg hjelpe deg?

Innringer: Jeg har ikke mottatt min W2-utskrift ennå og ønsket å sjekke statusen.

Agent: Jada, jeg kan hjelpe deg med det. Kan du bekrefte de fire siste sifrene i personnummeret ditt?

Innringer: Ja, det er 1111.

Agent: Ok. Jeg trekker opp statusen nå. Jeg ser at den ble sendt ut i går, og estimert ankomst er tidlig i neste uke. Vil du at jeg skal slå på automatiske varsler slik at du kan bli varslet om eventuelle forsinkelser?

Innringer: Ja, takk.

Agent: Nummeret vi har registrert for deg er 555-456-7890. Er det fortsatt riktig?

Innringer: Ja, det er det.

Agent: Flott. Jeg har slått på automatiserte varsler. Er det noe annet jeg kan hjelpe deg med John?

Innringer: Nei, det er alt. Takk skal du ha.

Agent: Takk, John. Ha en flott dag.

I denne korte interaksjonen er det flere databiter som generelt vil bli ansett som PII, inkludert oppringerens navn, de fire siste sifrene i personnummeret og telefonnummeret. La oss se på hvordan vi kan redigere disse PII-dataene i transkripsjonen.

Løsningsoversikt

Vi vil lage en AWS trinnfunksjoner statsmaskin, som orkestrerer en Amazon Comprehend PII-redigeringsjobb. Amazon Comprehend er en NLP-tjeneste (natural-language processing) som bruker maskinlæring for å avdekke verdifull innsikt og sammenhenger i tekst, inkludert muligheten til å oppdage og redigere PII-data.

Du vil gi utskriftene i innspillet Amazon S3 bøtte. Transkripsjonene er i formatet som brukes av Kontaktlinser for Amazon Connect. Du vil også spesifisere en utdata S3-bøtte, som lagrer redaksjonsutdataene samt mellomliggende data. Mellomdataene er mikrobatchede versjoner av inngangsdataene. For eksempel, hvis det er 10,000 10 samtaler som skal redigeres, vil arbeidsflyten dele dem opp i 1000 grupper med XNUMX samtaler hver. Hver batch lagres ved hjelp av et unikt prefiks, som deretter brukes som inputkilde for Comprehend. Step Functions-karttilstanden brukes til å utføre disse redigeringsjobbene parallelt ved å kalle StartPIIEntitiesDetectionJob API. Denne tilnærmingen lar deg kjøre flere jobber parallelt i stedet for individuelle jobber i rekkefølge. Siden jobben er implementert som en Step Functions-tilstandsmaskin, kan den trigges til å kjøre manuelt eller automatisk som en del av en daglig prosess.

Du kan lære mer om hvordan Comprehend oppdager og redigerer PII-data i dette blogginnlegget.

Distribuer prøveløsningen

Først logger du på AWS-administrasjonskonsoll i AWS-kontoen din.

Du trenger en S3-bøtte med noen eksempler på transkripsjonsdata for å redigere og en annen bøtte for utdata. Hvis du ikke har eksisterende eksempler på transkripsjonsdata, følger du disse trinnene:

  1. Naviger til Amazon S3-konsollen.
  2. Velg Lag bøtte.
  3. Skriv inn et bøttenavn, for eksempel text-redaction-data-.
  4. Godta standardinnstillingene, og velg Lag bøtte.
  5. Åpne bøtta du opprettet, og velg Opprett mappe.
  6. Skriv inn et mappenavn, for eksempel "sample-data" og velg Opprett mappe.
  7. Klikk på det nye mappenavnet for å åpne den.
  8. Last ned SampleData.zip filen.
  9. Åpne .zip-filen på din lokale datamaskin og dra deretter mappen til S3-bøtta du opprettet.
  10. Velg Last opp.

Klikk nå på følgende kobling for å distribuere prøveløsningen til US East (N. Virginia):

Hvordan redigere PII-data i samtaletranskripsjoner PlatoBlockchain Data Intelligence. Vertikalt søk. Ai.

Dette vil opprette en ny AWS skyformasjon stable.

Hvordan redigere PII-data i samtaletranskripsjoner PlatoBlockchain Data Intelligence. Vertikalt søk. Ai.

Angi Stabelnavn (F.eks pii-redaction-workflow), navnet på S3-inndatabøtten som inneholder inndatatranskripsjonsdataene, og navnet på S3-utdatabøtten. Velge neste og legg til eventuelle tagger du vil ha for stabelen din (valgfritt). Velge neste igjen og se gjennom stabeldetaljene. Merk av i avmerkingsboksen for å bekrefte det AWS Identity and Access Management (IAM) ressurser vil bli opprettet, og deretter velge Lag stabel.

CloudFormation-stakken vil lage en IAM-rolle med muligheten til å liste og lese objektene fra bøtta. Du kan tilpasse rollen ytterligere etter dine krav. Det vil også lage en Step Functions-tilstandsmaskin, flere AWS Lambda funksjoner som brukes av statsmaskinen, og en S3-bøtte for lagring av de redigerte utdataversjonene av transkripsjonene.

Etter noen minutter vil stabelen din være fullført, og deretter kan du undersøke tilstandsmaskinen Step Functions som ble opprettet som en del av CloudFormation-malen.

Kjør en redigeringsjobb

For å kjøre en jobb, naviger til Step Functions i AWS-konsollen, velg tilstandsmaskinen og velg Start utførelse.

Hvordan redigere PII-data i samtaletranskripsjoner PlatoBlockchain Data Intelligence. Vertikalt søk. Ai.

Angi deretter input-argumentene for å kjøre jobben. For jobbinndata vil du oppgi navnet på input S3-bøtten som S3InputDataBucket verdi, mappenavnet som S3InputDataPrefix verdi, navnet på utgangs S3-bøtten som S3OutputDataBucket verdi, og mappen du vil lagre resultatene som S3OutputDataPrefix verdi og klikk deretter Start utførelse.

{
  "S3InputDataBucket": "",
  "S3InputDataPrefix": "",
  "S3OutputDataBucket": "", 
  "S3OutputDataPrefix": "" }

Hvordan redigere PII-data i samtaletranskripsjoner PlatoBlockchain Data Intelligence. Vertikalt søk. Ai.

Mens jobben utføres, kan du overvåke statusen i trinnfunksjonene grafvisning. Det vil ta noen minutter å kjøre jobben. Når jobben er fullført, vil du se utdataene for hver av jobbene i Utførelsesinngang og utgang delen av konsollen. Du kan bruke utdata-URI for å hente utdata fra en jobb. Hvis flere jobber ble utført, kan du kopiere resultatene av alle jobber til en destinasjonsbøtte for videre analyse.

aws s3 cp s3:////-output/ s3://// --recursive --exclude "*/*" --include "*.out"

La oss ta en titt på den redigerte versjonen av samtalen som vi startet med.

Agent: Hei, takk for at du ringte oss i dag. Hvem har jeg gleden av å snakke med i dag?

Innringer: Hei, jeg heter [NAME].

Agent: Hei [NAME], hvordan kan jeg hjelpe deg?

Innringer: Jeg har ikke mottatt min W2-utskrift ennå og ønsket å sjekke statusen.

Agent: Jada, jeg kan hjelpe deg med det. Kan du bekrefte de fire siste sifrene i personnummeret ditt?

Innringer: Ja, det er [SSN].

Agent: Ok. Jeg trekker opp statusen nå. Jeg ser at den ble sendt ut i går, og estimert ankomst er tidlig i neste uke. Vil du at jeg skal slå på automatiske varsler slik at du kan bli varslet om eventuelle forsinkelser?

Innringer: Ja, takk.

Agent: Nummeret vi har registrert for deg er [PHONE]. Er det fortsatt riktig?

Innringer: Ja, det er det.

Agent: Flott. Jeg har slått på automatiserte varsler. Er det noe annet jeg kan hjelpe deg med, [NAME]?

Innringer: Nei, det er alt. Takk skal du ha.

Agent: Takk, [NAME]. Ha en flott dag.

Rydd opp

Det kan være lurt å rydde opp i ressursene som er opprettet som en del av CloudFormation-malen etter at du er ferdig for å unngå pågående kostnader. For å gjøre det, slett den utplasserte CloudFormation-stakken og slett S3-bøtten med eksempeltranskripsjonsdataene hvis en ble opprettet.

konklusjonen

Med kunder som krever sømløse opplevelser på tvers av kanaler og forventer også at sikkerhet skal være innebygd på hvert punkt, er bruken av Step Functions og Amazon Comprehend for å redigere PII-data i tekstsamtaletranskripsjoner et kraftig verktøy til din disposisjon. Organisasjoner kan fremskynde tid til verdi ved å bruke de redigerte transkripsjonene til å analysere kundeserviceinteraksjoner og få innsikt for å forbedre kundeopplevelsen.

Prøv å bruke denne arbeidsflyten til å redigere dataene dine og legg igjen en kommentar!


Om forfatteren

Hvordan redigere PII-data i samtaletranskripsjoner PlatoBlockchain Data Intelligence. Vertikalt søk. Ai.Alex Emilcar er Senior Solutions Architect i Amazon Machine Learning Solutions Lab, hvor han hjelper kunder med å bygge digitale opplevelser med AWS AI-teknologier. Alex har over 10 års teknologierfaring i forskjellige kapasiteter fra utvikler, infrastrukturingeniør og Solutions Architecture. På fritiden liker Alex å bruke tid på å lese og gjøre hagearbeid.

Tidstempel:

Mer fra AWS maskinlæring