PII-tietojen poistaminen keskustelutranskripteistä PlatoBlockchain Data Intelligence. Pystysuuntainen haku. Ai.

PII-tietojen poistaminen keskustelujen transkriptioista

Asiakaspalvelun vuorovaikutus sisältää usein henkilökohtaisia ​​tunnistetietoja (PII), kuten nimiä, puhelinnumeroita ja syntymäaikoja. Kun organisaatiot sisällyttävät koneoppimisen (ML) ja analytiikan sovelluksiinsa, näiden tietojen käyttäminen voi tarjota oivalluksia saumattomien asiakaskokemusten luomiseen. Henkilökohtaisten tunnistetietojen olemassaolo rajoittaa kuitenkin usein näiden tietojen käyttöä. Tässä blogipostauksessa tarkastelemme ratkaisua henkilökohtaisten tunnistetietojen automaattiseen poistamiseen asiakaspalvelukeskustelun kopiosta.

Otetaan esimerkki keskustelusta asiakkaan ja puhelinkeskuksen edustajan välillä.

Agentti: Hei, kiitos, että soitit meille tänään. Kenen kanssa minulla on ilo puhua tänään?

Soittaja: Hei, nimeni on John Stiles.

Agentti: Hei John, kuinka voin auttaa sinua?

Soittaja: En ole vielä saanut W2-lausuntoa ja halusin tarkistaa sen tilan.

Agentti: Toki, voin auttaa sinua siinä. Voitko vahvistaa sosiaaliturvatunnuksesi neljä viimeistä numeroa?

Soittaja: Kyllä, se on 1111.

Agentti: Ok. Nostan statusta nyt. Näen, että se lähetettiin eilen, ja arvioitu saapuminen on ensi viikon alussa. Haluatko, että laitan automaattiset hälytykset päälle, jotta saat ilmoituksen mahdollisista viivästyksistä?

Soittaja: Kyllä, kiitos.

Agentti: Tiedoissamme oleva numero on 555-456-7890. Onko se vielä oikein?

Soittaja: Kyllä, on.

Agentti: Hienoa. Olen ottanut automaattiset ilmoitukset käyttöön. Voinko auttaa sinua Johnin kanssa jotain muuta?

Soittaja: Ei, siinä kaikki. Kiitos.

Agentti: Kiitos, John. Hyvää päivän jatkoa.

Tässä lyhyessä vuorovaikutuksessa on useita tietoja, joita yleensä pidetään henkilökohtaisina tunnistetietoina, mukaan lukien soittajan nimi, sosiaaliturvatunnuksen neljä viimeistä numeroa ja puhelinnumero. Katsotaanpa, kuinka voimme poistaa nämä henkilökohtaiset tunnistetiedot transkriptiosta.

Ratkaisun yleiskatsaus

Luomme an AWS-vaihetoiminnot tilakone, joka orkestroi an Amazonin käsitys PII:n editointityö. Amazon Comprehend on luonnollisen kielen käsittelypalvelu (NLP), joka käyttää koneoppimista löytääkseen arvokkaita oivalluksia ja yhteyksiä tekstistä, mukaan lukien kyky havaita ja muokata henkilökohtaisia ​​tunnistetietoja.

Annat tekstitykset syötteessä Amazon S3 ämpäri. Tekstitykset ovat käyttämässä muodossa Ota yhteys Amazon Connectin linssiin. Määrität myös ulostulon S3-ämpäri, joka tallentaa editointitulosteen sekä välitiedot. Välitiedot ovat syöttötiedon mikroeräversioita. Jos esimerkiksi muokattavia keskusteluja on 10,000 10, työnkulku jakaa ne 1000 XNUMX keskustelun eräksi. Jokainen erä tallennetaan käyttämällä ainutlaatuista etuliitettä, jota käytetään sitten Comprehendin syöttölähteenä. Step Functions -karttatilaa käytetään näiden muokkaustöiden suorittamiseen rinnakkain kutsumalla AloitaPIIEtitiesDetectionJob API. Tämän lähestymistavan avulla voit suorittaa useita töitä rinnakkain yksittäisten töiden peräkkäin sijasta. Koska työ on toteutettu Step Functions -tilakoneena, se voidaan käynnistää suorittamaan manuaalisesti tai automaattisesti osana päivittäistä prosessia.

Saat lisätietoja siitä, kuinka Comprehend havaitsee ja poistaa henkilökohtaisia ​​tunnistetietoja tämä blogikirja.

Ota näyteratkaisu käyttöön

Kirjaudu ensin sisään AWS-hallintakonsoli AWS-tililläsi.

Tarvitset S3-säihön, jossa on näytetranskriptiodataa, redusointia varten ja toisen säilon tulostamista varten. Jos sinulla ei ole olemassa näytetranskriptiotietoja, noudata näitä ohjeita:

  1. Siirry Amazon S3 -konsoliin.
  2. Valita Luo ämpäri.
  3. Anna ryhmän nimi, esim text-redaction-data-.
  4. Hyväksy oletusasetukset ja valitse Luo ämpäri.
  5. Avaa luomasi ämpäri ja valitse luo kansio.
  6. Anna kansion nimi, kuten "sample-data" ja valitse luo kansio.
  7. Napsauta uuden kansion nimeä avataksesi sen.
  8. Lataa SampleData.zip tiedosto.
  9. Avaa .zip-tiedosto paikallisella tietokoneellasi ja vedä kansio sitten luomaasi S3-säilöön.
  10. Valita Lataa.

Napsauta nyt seuraavaa linkkiä ottaaksesi malliratkaisun käyttöön US Eastissa (N. Virginia):

PII-tietojen poistaminen keskustelutranskripteistä PlatoBlockchain Data Intelligence. Pystysuuntainen haku. Ai.

Tämä luo uuden AWS-pilven muodostuminen pino.

PII-tietojen poistaminen keskustelutranskripteistä PlatoBlockchain Data Intelligence. Pystysuuntainen haku. Ai.

Anna Pino nimi (esim, pii-redaction-workflow), sen S3-syötealueen nimi, joka sisältää syöttötranskriptiotiedot, ja S3-tulostusalueen nimi. Valita seuraava ja lisää pinoon haluamasi tunnisteet (valinnainen). Valita seuraava uudelleen ja tarkista pinon tiedot. Vahvista se valitsemalla valintaruutu AWS-identiteetin ja käyttöoikeuksien hallinta (IAM) resurssit luodaan ja valitse sitten Luo pino.

CloudFormation-pino luo IAM-roolin, joka pystyy luettelemaan ja lukemaan kohteet sängystä. Voit muokata roolia edelleen tarpeidesi mukaan. Se luo myös askelfunktioiden tilakoneen, useita AWS Lambda tilakoneen käyttämät toiminnot ja S3-ämpäri transkriptien redaktoitujen tulosversioiden tallentamiseen.

Muutaman minuutin kuluttua pino on valmis, ja sitten voit tutkia Step Functions -tilakonetta, joka luotiin osana CloudFormation-mallia.

Suorita muokkaustyö

Suorittaaksesi työn siirry AWS-konsolin Step Functions -kohtaan, valitse tilakone ja valitse Aloita suoritus.

PII-tietojen poistaminen keskustelutranskripteistä PlatoBlockchain Data Intelligence. Pystysuuntainen haku. Ai.

Anna seuraavaksi syöttöargumentit työn suorittamista varten. Työsyötteeksi haluat antaa syötteesi S3-ryhmän nimen S3InputDataBucket arvo, kansion nimi muodossa S3InputDataPrefix arvo, lähtö S3-säihön nimi S3OutputDataBucket arvo ja kansio, johon tulokset tallennetaan S3OutputDataPrefix arvo ja napsauta sitten Aloita suoritus.

{
  "S3InputDataBucket": "",
  "S3InputDataPrefix": "",
  "S3OutputDataBucket": "", 
  "S3OutputDataPrefix": "" }

PII-tietojen poistaminen keskustelutranskripteistä PlatoBlockchain Data Intelligence. Pystysuuntainen haku. Ai.

Kun työ suoritetaan, voit seurata sen tilaa Step Functions -toiminnossa kaavionäkymä. Työn suorittaminen kestää muutaman minuutin. Kun työ on valmis, näet tulosteen jokaiselle työlle Suorituksen tulo ja tulos konsolin osio. Tulostus-URI:n avulla voit noutaa työn tulosteen. Jos suoritettiin useita töitä, voit kopioida kaikkien töiden tulokset kohderyhmään lisäanalyysiä varten.

aws s3 cp s3:////-output/ s3://// --recursive --exclude "*/*" --include "*.out"

Katsotaanpa aloitetun keskustelun muokattua versiota.

Agentti: Hei, kiitos, että soitit meille tänään. Kenen kanssa minulla on ilo puhua tänään?

Soittaja: Hei, nimeni on [NAME].

Agentti: Hei [NAME], kuinka voin auttaa sinua?

Soittaja: En ole vielä saanut W2-lausuntoa ja halusin tarkistaa sen tilan.

Agentti: Toki, voin auttaa sinua siinä. Voitko vahvistaa sosiaaliturvatunnuksesi neljä viimeistä numeroa?

Soittaja: Kyllä, se on [SSN].

Agentti: Ok. Nostan statusta nyt. Näen, että se lähetettiin eilen, ja arvioitu saapuminen on ensi viikon alussa. Haluatko, että laitan automaattiset hälytykset päälle, jotta saat ilmoituksen mahdollisista viivästyksistä?

Soittaja: Kyllä, kiitos.

Agentti: Tiedoissamme oleva numero on [PHONE]. Onko se vielä oikein?

Soittaja: Kyllä, on.

Agentti: Hienoa. Olen ottanut automaattiset ilmoitukset käyttöön. Voinko auttaa sinua muussa asiassa, [NAME]?

Soittaja: Ei, siinä kaikki. Kiitos.

Agentti: Kiitos, [NAME]. Hyvää päivän jatkoa.

Puhdistaa

Voit halutessasi puhdistaa osana CloudFormation-mallia luodut resurssit, kun olet valmis, välttääksesi jatkuvia maksuja. Voit tehdä tämän poistamalla käyttöönotetun CloudFormation-pinon ja poistamalla S3-säihön, jossa on esimerkkitranskriptiotiedot, jos sellainen on luotu.

Yhteenveto

Koska asiakkaat vaativat saumattomia kokemuksia eri kanavien välillä ja odottavat myös turvallisuuden upotetun joka pisteessä, Step Functionsin ja Amazon Comprehendin käyttö henkilökohtaisten tunnistetietojen poistamiseen tekstikeskustelujen transkriptioissa on tehokas työkalu käytettävissäsi. Organisaatiot voivat nopeuttaa arvon saavuttamista käyttämällä redusoituja transkriptioita analysoimaan asiakaspalvelun vuorovaikutusta ja keräämään oivalluksia asiakaskokemuksen parantamiseksi.

Yritä käyttää tätä työnkulkua tietojen poistamiseen ja jätä meille kommentti!


Kirjailijasta

PII-tietojen poistaminen keskustelutranskripteistä PlatoBlockchain Data Intelligence. Pystysuuntainen haku. Ai.Alex Emilcar on vanhempi ratkaisuarkkitehti Amazon Machine Learning Solutions Labissa, jossa hän auttaa asiakkaita rakentamaan digitaalisia kokemuksia AWS AI -tekniikoilla. Alexilla on yli 10 vuoden kokemus teknologiasta eri tehtävissä kehittäjästä, infrastruktuuri-insinööristä ja ratkaisuarkkitehtuurista. Vapaa-ajallaan Alex viettää aikaa lukemiseen ja pihatöihin.

Aikaleima:

Lisää aiheesta AWS-koneoppiminen