Sådan redigeres PII-data i samtaleudskrifter PlatoBlockchain Data Intelligence. Lodret søgning. Ai.

Sådan redigeres PII-data i samtaleudskrifter

Kundeserviceinteraktioner indeholder ofte personligt identificerbare oplysninger (PII) såsom navne, telefonnumre og fødselsdatoer. Efterhånden som organisationer inkorporerer maskinlæring (ML) og analyser i deres applikationer, kan brugen af ​​disse data give indsigt i, hvordan man skaber mere problemfri kundeoplevelser. Tilstedeværelsen af ​​PII-oplysninger begrænser dog ofte brugen af ​​disse data. I dette blogindlæg vil vi gennemgå en løsning til automatisk at fjerne PII-data fra en kundeservicesamtaleudskrift.

Lad os tage et eksempel på en samtale mellem en kunde og en callcenteragent.

Agent: Hej, tak fordi du ringede til os i dag. Hvem har jeg fornøjelsen af ​​at tale med i dag?

Ringer: Hej, mit navn er John Stiles.

Agent: Hej John, hvordan kan jeg hjælpe dig?

Ringer op: Jeg har ikke modtaget min W2-erklæring endnu og ville tjekke status.

Agent: Selvfølgelig kan jeg hjælpe dig med det. Kan du bekræfte de sidste fire cifre i dit CPR-nummer?

Ringer: Ja, det er 1111.

Agent: Okay. Jeg trækker status nu op. Jeg kan se, at den blev sendt ud i går, og den forventede ankomst er først i næste uge. Vil du have, at jeg slår automatiske underretninger til, så du kan få besked om eventuelle forsinkelser?

Ringer: Ja tak.

Agent: Det nummer, vi har registreret til dig, er 555-456-7890. Er det stadig korrekt?

Ringeren: Ja, det er det.

Agent: Fantastisk. Jeg har slået automatiske notifikationer til. Er der andet, jeg kan hjælpe dig med John?

Ringeren: Nej, det er alt. Tak skal du have.

Agent: Tak, John. Hav en god dag.

I denne korte interaktion er der adskillige stykker data, der generelt vil blive betragtet som PII, inklusive den, der ringer op, de sidste fire cifre i deres CPR-nummer og telefonnummeret. Lad os gennemgå, hvordan vi kan redigere disse PII-data i transskriptionen.

Løsningsoversigt

Vi vil skabe en AWS-trinfunktioner statsmaskine, som orkestrerer en Amazon Comprehend PII-redaktionsjob. Amazon Comprehend er en NLP-tjeneste (natural-language processing), der bruger maskinlæring til at afdække værdifuld indsigt og forbindelser i tekst, herunder evnen til at detektere og redigere PII-data.

Du vil give udskrifterne i inputtet Amazon S3 spand. Udskrifterne er i det format, der anvendes af Kontaktlinse til Amazon Connect. Du vil også specificere en output S3 bucket, som gemmer redaktionsoutput samt mellemliggende data. De mellemliggende data er mikro-batchede versioner af inputdataene. For eksempel, hvis der er 10,000 samtaler, der skal redigeres, vil arbejdsgangen opdele dem i 10 batches af hver 1000 samtaler. Hver batch gemmes ved hjælp af et unikt præfiks, som derefter bruges som inputkilde til Comprehend. Trinfunktioner-korttilstanden bruges til at udføre disse redigeringsjob parallelt ved at kalde StartPIIEntitiesDetectionJob API. Denne tilgang giver dig mulighed for at køre flere job parallelt i stedet for individuelle job i rækkefølge. Da jobbet er implementeret som en Step Functions-tilstandsmaskine, kan det udløses til at køre manuelt eller automatisk som en del af en daglig proces.

Du kan lære mere om, hvordan Comprehend registrerer og redigerer PII-data i dette blogindlæg.

Implementer prøveopløsningen

Først skal du logge ind på AWS Management Console på din AWS-konto.

Du skal bruge en S3-bøtte med nogle eksempler på transskriptionsdata for at redigere og en anden bøtte til output. Hvis du ikke har eksisterende eksempeltransskriptionsdata, skal du følge disse trin:

  1. Naviger til Amazon S3-konsollen.
  2. Vælg Opret spand.
  3. Indtast et spandnavn, f.eks text-redaction-data-.
  4. Accepter standardindstillingerne, og vælg Opret spand.
  5. Åbn den bøtte, du har oprettet, og vælg oprette mappe.
  6. Indtast et mappenavn, såsom "sample-data", og vælg oprette mappe.
  7. Klik på dit nye mappenavn for at åbne det.
  8. Download SampleData.zip fil.
  9. Åbn .zip-filen på din lokale computer, og træk derefter mappen til den S3-bøtte, du oprettede.
  10. Vælg Upload.

Klik nu på følgende link for at implementere prøveløsningen til US East (N. Virginia):

Sådan redigeres PII-data i samtaleudskrifter PlatoBlockchain Data Intelligence. Lodret søgning. Ai.

Dette vil skabe en ny AWS CloudFormation stak.

Sådan redigeres PII-data i samtaleudskrifter PlatoBlockchain Data Intelligence. Lodret søgning. Ai.

Indtast Staknavn (f.eks, pii-redaction-workflow), navnet på S3-input-bøtten, der indeholder input-transskriptionsdataene, og navnet på S3-output-bøtten. Vælge Næste og tilføj de tags, du ønsker til din stak (valgfrit). Vælge Næste igen og gennemgå stakdetaljerne. Marker afkrydsningsfeltet for at bekræfte det AWS Identity and Access Management (IAM) ressourcer oprettes, og vælg derefter Opret stak.

CloudFormation-stakken vil skabe en IAM-rolle med mulighed for at liste og læse objekterne fra bøtten. Du kan yderligere tilpasse rollen efter dine krav. Det vil også skabe en Step Functions-statemaskine, flere AWS Lambda funktioner, der bruges af statsmaskinen, og en S3-bøtte til lagring af de redigerede outputversioner af transskriptionerne.

Efter et par minutter vil din stak være færdig, og derefter kan du undersøge tilstandsmaskinen Step Functions, der blev oprettet som en del af CloudFormation-skabelonen.

Kør et redigeringsjob

For at køre et job skal du navigere til Trinfunktioner i AWS-konsollen, vælge tilstandsmaskinen og vælge Start udførelse.

Sådan redigeres PII-data i samtaleudskrifter PlatoBlockchain Data Intelligence. Lodret søgning. Ai.

Angiv derefter input-argumenterne for at køre jobbet. Til jobinput skal du angive navnet på din input S3-spand som S3InputDataBucket værdi, mappenavnet som S3InputDataPrefix værdi, navnet på din output S3-bøtte som S3OutputDataBucket værdi og mappen, som resultaterne skal gemmes som S3OutputDataPrefix værdi og klik derefter Start udførelse.

{
  "S3InputDataBucket": "",
  "S3InputDataPrefix": "",
  "S3OutputDataBucket": "", 
  "S3OutputDataPrefix": "" }

Sådan redigeres PII-data i samtaleudskrifter PlatoBlockchain Data Intelligence. Lodret søgning. Ai.

Efterhånden som jobbet udføres, kan du overvåge dets status i trinfunktionerne grafvisning. Det vil tage et par minutter at køre jobbet. Når jobbet er fuldført, vil du se output for hvert af jobs i Udførelse input og output sektion af konsollen. Du kan bruge output-URI'en til at hente output fra et job. Hvis der blev udført flere job, kan du kopiere resultaterne af alle job til en destinationsbøtte for yderligere analyse.

aws s3 cp s3:////-output/ s3://// --recursive --exclude "*/*" --include "*.out"

Lad os tage et kig på den redigerede version af samtalen, som vi startede med.

Agent: Hej, tak fordi du ringede til os i dag. Hvem har jeg fornøjelsen af ​​at tale med i dag?

Ringer op: Hej, mit navn er [NAVN].

Agent: Hej [NAVN], hvordan kan jeg hjælpe dig?

Ringer op: Jeg har ikke modtaget min W2-erklæring endnu og ville tjekke status.

Agent: Selvfølgelig kan jeg hjælpe dig med det. Kan du bekræfte de sidste fire cifre i dit CPR-nummer?

Ringer op: Ja, det er [SSN].

Agent: Okay. Jeg trækker status nu op. Jeg kan se, at den blev sendt ud i går, og den forventede ankomst er først i næste uge. Vil du have, at jeg slår automatiske underretninger til, så du kan få besked om eventuelle forsinkelser?

Ringer: Ja tak.

Agent: Det nummer, vi har registreret til dig, er [PHONE]. Er det stadig korrekt?

Ringeren: Ja, det er det.

Agent: Fantastisk. Jeg har slået automatiske notifikationer til. Er der andet, jeg kan hjælpe dig med, [NAVN]?

Ringeren: Nej, det er alt. Tak skal du have.

Agent: Tak, [NAVN]. Hav en god dag.

Ryd op

Du ønsker måske at rydde op i de ressourcer, der er oprettet som en del af CloudFormation-skabelonen, efter du er færdig for at undgå løbende gebyrer. For at gøre det skal du slette den implementerede CloudFormation-stak og slette S3-bøtten med prøveudskriftsdataene, hvis en sådan blev oprettet.

Konklusion

Med kunder, der kræver sømløse oplevelser på tværs af kanaler og forventer også, at sikkerheden er indlejret på ethvert punkt, er brugen af ​​Step Functions og Amazon Comprehend til at redigere PII-data i tekstsamtaletransskriptioner et kraftfuldt værktøj til din rådighed. Organisationer kan fremskynde tid til værdi ved at bruge de redigerede transskriptioner til at analysere kundeserviceinteraktioner og få indsigt for at forbedre kundeoplevelsen.

Prøv at bruge denne arbejdsgang til at redigere dine data og efterlad os en kommentar!


Om forfatteren

Sådan redigeres PII-data i samtaleudskrifter PlatoBlockchain Data Intelligence. Lodret søgning. Ai.Alex Emilcar er Senior Solutions Architect i Amazon Machine Learning Solutions Lab, hvor han hjælper kunder med at opbygge digitale oplevelser med AWS AI-teknologier. Alex har over 10 års teknologierfaring med at arbejde i forskellige kapaciteter fra udvikler, infrastrukturingeniør og Solutions Architecture. I sin fritid kan Alex godt lide at bruge tid på at læse og lave havearbejde.

Tidsstempel:

Mere fra AWS maskinindlæring