대화 기록에서 PII 데이터를 수정하는 방법 PlatoBlockchain Data Intelligence. 수직 검색. 일체 포함.

대화 기록에서 PII 데이터를 수정하는 방법

고객 서비스 상호작용에는 종종 이름, 전화번호, 생년월일과 같은 개인 식별 정보(PII)가 포함됩니다. 조직이 기계 학습(ML) 및 분석을 애플리케이션에 통합함에 따라 이 데이터를 사용하면 보다 원활한 고객 경험을 생성하는 방법에 대한 통찰력을 얻을 수 있습니다. 그러나 PII 정보의 존재는 종종 이 데이터의 사용을 제한합니다. 이 블로그 게시물에서는 고객 서비스 대화 기록에서 PII 데이터를 자동으로 수정하는 솔루션을 검토합니다.

고객과 콜 센터 상담원 간의 대화 예를 들어 보겠습니다.

상담원: 안녕하세요, 오늘 전화주셔서 감사합니다. 오늘 나는 누구와 대화하는 것이 즐겁습니까?

발신자: 안녕하세요, 제 이름은 John Stiles입니다.

상담원: 안녕하세요 John, 무엇을 도와드릴까요?

발신자: W2 명세서를 아직 받지 못했는데 상태를 확인하고 싶습니다.

상담원: 물론입니다. 도와드릴 수 있습니다. 사회 보장 번호의 마지막 XNUMX자리를 확인해 주시겠습니까?

발신자: 네, 1111입니다.

상담원: 알겠습니다. 지금 상태를 끌어올리고 있습니다. 어제 발송된걸 보니 도착예정은 다음주 초입니다. 지연에 대한 알림을 받을 수 있도록 자동 알림을 켜시겠습니까?

발신자: 네, 주세요.

상담원: 등록된 전화번호는 555-456-7890입니다. 여전히 맞습니까?

발신자: 네, 그렇습니다.

에이전트: 좋습니다. 자동 알림을 켰습니다. John과 관련하여 제가 도와드릴 수 있는 다른 사항이 있습니까?

발신자: 아니요, 그게 다입니다. 감사합니다.

상담원: 고맙습니다, 존. 좋은 하루 되세요.

이 간단한 상호 작용에는 발신자 이름, 주민등록번호의 마지막 XNUMX자리 및 전화번호를 포함하여 일반적으로 PII로 간주되는 몇 가지 데이터가 있습니다. 기록에서 이 PII 데이터를 편집할 수 있는 방법을 검토해 보겠습니다.

솔루션 개요

우리는 만들 것입니다 AWS 단계 함수 상태 머신은 아마존 이해 PII 편집 작업. Amazon Comprehend는 기계 학습을 사용하여 PII 데이터를 감지하고 수정하는 기능을 포함하여 텍스트에서 귀중한 통찰력과 연결을 발견하는 자연어 처리(NLP) 서비스입니다.

입력란에 성적 증명서를 제공합니다. 아마존 S3 버킷. 성적표는 다음에서 사용하는 형식입니다. Amazon Connect 용 콘택트 렌즈. 교정 출력과 중간 데이터를 저장하는 출력 S3 버킷도 지정합니다. 중간 데이터는 입력 데이터의 마이크로 배치 버전입니다. 예를 들어 편집할 대화가 10,000개 있는 경우 워크플로는 대화를 각각 10개의 대화로 구성된 1000개의 배치로 분할합니다. 각 배치는 고유한 접두사를 사용하여 저장되며 Comprehend의 입력 소스로 사용됩니다. Step Functions 맵 상태는 다음을 호출하여 이러한 수정 작업을 병렬로 실행하는 데 사용됩니다. StartPIIEntitiesDetectionJob API. 이 접근 방식을 사용하면 개별 작업을 순서대로 실행하는 대신 여러 작업을 병렬로 실행할 수 있습니다. 작업은 Step Functions 상태 시스템으로 구현되므로 일일 프로세스의 일부로 수동 또는 자동으로 실행되도록 트리거할 수 있습니다.

Comprehend가 PII 데이터를 탐지하고 수정하는 방법에 대해 자세히 알아볼 수 있습니다. 이 블로그 게시물.

샘플 솔루션 배포

먼저 로그인 AWS 관리 콘솔 귀하의 AWS 계정에서.

편집할 일부 샘플 성적표 데이터가 있는 S3 버킷과 출력을 위한 또 다른 버킷이 필요합니다. 기존 샘플 성적표 데이터가 없는 경우 다음 단계를 따르세요.

  1. Amazon S3 콘솔로 이동합니다.
  2. 왼쪽 메뉴에서 버킷 만들기.
  3. 다음과 같은 버킷 이름을 입력합니다. text-redaction-data-.
  4. 기본값을 수락하고 다음을 선택합니다. 버킷 만들기.
  5. 생성한 버킷을 열고 다음을 선택합니다. 폴더 만들기.
  6. "sample-data"와 같은 폴더 이름을 입력하고 선택 폴더 만들기.
  7. 새 폴더 이름을 클릭하여 엽니다.
  8. 를 다운로드 샘플데이터.zip 파일.
  9. 로컬 컴퓨터에서 .zip 파일을 연 다음 폴더를 생성한 S3 버킷으로 드래그합니다.
  10. 왼쪽 메뉴에서 가이드라가.

이제 다음 링크를 클릭하여 미국 동부(버지니아 북부)에 샘플 솔루션을 배포합니다.

대화 기록에서 PII 데이터를 수정하는 방법 PlatoBlockchain Data Intelligence. 수직 검색. 일체 포함.

이것은 새로운 AWS 클라우드 포메이션 스택.

대화 기록에서 PII 데이터를 수정하는 방법 PlatoBlockchain Data Intelligence. 수직 검색. 일체 포함.

입력 스택 이름 (예 : pii-redaction-workflow), 입력 기록 데이터가 포함된 S3 입력 버킷의 이름 및 S3 출력 버킷의 이름. 선택하다 다음 보기 스택에 원하는 태그를 추가합니다(선택 사항). 선택하다 다음 보기 다시 스택 세부 정보를 검토합니다. 확인하려면 확인란을 선택합니다. AWS 자격 증명 및 액세스 관리 (IAM) 리소스가 생성된 다음 선택합니다. 스택 생성.

CloudFormation 스택은 버킷에서 객체를 나열하고 읽을 수 있는 기능이 있는 IAM 역할을 생성합니다. 요구 사항에 따라 역할을 추가로 사용자 정의할 수 있습니다. 또한 Step Functions 상태 머신을 생성합니다. AWS 람다 상태 시스템에서 사용하는 함수 및 성적표의 수정된 출력 버전을 저장하기 위한 S3 버킷.

몇 분 후 스택이 완성되고 CloudFormation 템플릿의 일부로 생성된 Step Functions 상태 시스템을 검사할 수 있습니다.

교정 작업 실행

작업을 실행하려면 AWS 콘솔에서 Step Functions로 이동하고 상태 머신을 선택한 다음 실행 시작.

대화 기록에서 PII 데이터를 수정하는 방법 PlatoBlockchain Data Intelligence. 수직 검색. 일체 포함.

다음으로 작업을 실행할 입력 인수를 제공합니다. 작업 입력의 경우 입력 S3 버킷의 이름을 S3입력데이터버킷 값, 폴더 이름을 S3InputDataPrefix 값, 출력 S3 버킷의 이름 S3OutputDataBucket 값 및 결과를 저장할 폴더 S3OutputDataPrefix 값을 입력한 다음 클릭 실행 시작.

{
  "S3InputDataBucket": "",
  "S3InputDataPrefix": "",
  "S3OutputDataBucket": "", 
  "S3OutputDataPrefix": "" }

대화 기록에서 PII 데이터를 수정하는 방법 PlatoBlockchain Data Intelligence. 수직 검색. 일체 포함.

작업이 실행되면 Step Functions에서 상태를 모니터링할 수 있습니다. 그래프 보기. 작업을 실행하는 데 몇 분 정도 걸립니다. 작업이 완료되면 각 작업에 대한 출력이 실행 입출력 콘솔 섹션. 출력 URI를 사용하여 작업의 출력을 검색할 수 있습니다. 여러 작업이 실행된 경우 추가 분석을 위해 모든 작업의 ​​결과를 대상 버킷에 복사할 수 있습니다.

aws s3 cp s3:////-output/ s3://// --recursive --exclude "*/*" --include "*.out"

우리가 시작한 대화의 편집된 버전을 살펴보겠습니다.

상담원: 안녕하세요, 오늘 전화주셔서 감사합니다. 오늘 나는 누구와 대화하는 것이 즐겁습니까?

발신자: 안녕하세요, 제 이름은 [NAME]입니다.

상담원: 안녕하세요 [NAME]님, 무엇을 도와드릴까요?

발신자: W2 명세서를 아직 받지 못했는데 상태를 확인하고 싶습니다.

상담원: 물론입니다. 도와드릴 수 있습니다. 사회 보장 번호의 마지막 XNUMX자리를 확인해 주시겠습니까?

발신자: 네, [SSN]입니다.

상담원: 알겠습니다. 지금 상태를 끌어올리고 있습니다. 어제 발송된걸 보니 도착예정은 다음주 초입니다. 지연에 대한 알림을 받을 수 있도록 자동 알림을 켜시겠습니까?

발신자: 네, 주세요.

상담원: 등록된 번호는 [PHONE]입니다. 여전히 맞습니까?

발신자: 네, 그렇습니다.

에이전트: 좋습니다. 자동 알림을 켰습니다. [NAME]님, 도와드릴 일이 더 있나요?

발신자: 아니요, 그게 다입니다. 감사합니다.

상담원: 감사합니다, [NAME]님. 좋은 하루 되세요.

정리

진행 중인 요금을 피하기 위해 완료된 후 CloudFormation 템플릿의 일부로 생성된 리소스를 정리할 수 있습니다. 이렇게 하려면 배포된 CloudFormation 스택을 삭제하고 샘플 성적표 데이터가 생성된 경우 S3 버킷을 삭제합니다.

결론

고객이 채널 전반에서 원활한 경험을 요구하고 모든 지점에 보안이 내장되기를 기대하는 상황에서 Step Functions 및 Amazon Comprehend를 사용하여 텍스트 대화 기록에서 PII 데이터를 수정하는 것은 마음대로 사용할 수 있는 강력한 도구입니다. 조직은 수정된 기록을 사용하여 고객 서비스 상호 작용을 분석하고 통찰력을 얻어 고객 경험을 개선함으로써 가치 실현 시간을 단축할 수 있습니다.

이 워크플로를 사용하여 데이터를 수정하고 의견을 남겨주세요!


저자,

대화 기록에서 PII 데이터를 수정하는 방법 PlatoBlockchain Data Intelligence. 수직 검색. 일체 포함.알렉스 에밀카 Amazon Machine Learning Solutions Lab의 선임 솔루션 아키텍트로서 고객이 AWS AI 기술로 디지털 경험을 구축할 수 있도록 지원합니다. Alex는 개발자, 인프라 엔지니어 및 솔루션 아키텍처에서 다양한 역량으로 일하면서 10년 이상의 기술 경험을 보유하고 있습니다. 여가 시간에 Alex는 책을 읽고 정원 일을 하며 시간을 보내는 것을 좋아합니다.

타임 스탬프 :

더보기 AWS 기계 학습