Cách biên tập lại dữ liệu PII trong bản ghi cuộc hội thoại PlatoBlockchain Data Intelligence. Tìm kiếm dọc. Ái.

Cách sắp xếp lại dữ liệu PII trong bản chép lại cuộc hội thoại

Các tương tác dịch vụ khách hàng thường chứa thông tin nhận dạng cá nhân (PII) chẳng hạn như tên, số điện thoại và ngày sinh. Khi các tổ chức kết hợp học máy (ML) và phân tích vào ứng dụng của họ, việc sử dụng dữ liệu này có thể cung cấp thông tin chi tiết về cách tạo trải nghiệm khách hàng liền mạch hơn. Tuy nhiên, sự hiện diện của thông tin PII thường hạn chế việc sử dụng dữ liệu này. Trong bài đăng trên blog này, chúng tôi sẽ xem xét một giải pháp để tự động biên tập lại dữ liệu PII từ bản ghi cuộc hội thoại dịch vụ khách hàng.

Hãy lấy một cuộc trò chuyện ví dụ giữa khách hàng và nhân viên tổng đài.

Đặc vụ: Xin chào, cảm ơn bạn đã gọi cho chúng tôi hôm nay. Hôm nay tôi hân hạnh nói chuyện với ai?

Người gọi: Xin chào, tên tôi là John Stiles.

Đặc vụ: Xin chào John, tôi có thể giúp gì cho bạn?

Người gọi: Tôi chưa nhận được bảng sao kê W2 của mình và muốn kiểm tra trạng thái của nó.

Đại lý: Chắc chắn, tôi có thể giúp bạn với điều đó. Bạn có thể vui lòng xác nhận bốn chữ số cuối trong số An sinh xã hội của mình không?

Người gọi: Vâng, là 1111.

Đặc vụ: Được rồi. Tôi đang kéo trạng thái lên ngay bây giờ. Tôi thấy rằng nó đã được gửi đi ngày hôm qua, và ước tính hàng sẽ đến vào đầu tuần sau. Bạn có muốn tôi bật cảnh báo tự động để bạn có thể được thông báo về bất kỳ sự chậm trễ nào không?

Người gọi: Vâng, làm ơn.

Đặc vụ: Số chúng tôi có trong hồ sơ của bạn là 555-456-7890. Điều đó vẫn đúng chứ?

Người gọi: Vâng, đúng vậy.

Đặc vụ: Tuyệt vời. Tôi đã bật thông báo tự động. Có bất cứ điều gì khác tôi có thể giúp bạn với John?

Người gọi: Không, thế thôi. Cảm ơn bạn.

Đặc vụ: Cảm ơn, John. Có một ngày tuyệt vời.

Trong tương tác ngắn này, có một số phần dữ liệu thường được coi là PII, bao gồm tên của người gọi, bốn chữ số cuối của số An sinh xã hội của họ và số điện thoại. Hãy xem lại cách chúng tôi có thể sắp xếp lại dữ liệu PII này trong bản ghi.

Tổng quan về giải pháp

Chúng tôi sẽ tạo ra một Chức năng bước AWS máy trạng thái, điều phối một Amazon hiểu Công việc chỉnh sửa PII. Amazon Comprehend là một dịch vụ xử lý ngôn ngữ tự nhiên (NLP) sử dụng máy học để khám phá những thông tin chi tiết và kết nối có giá trị trong văn bản, bao gồm khả năng phát hiện và biên tập lại dữ liệu PII.

Bạn sẽ cung cấp bảng điểm trong đầu vào Amazon S3 Gầu múc. Bảng điểm ở định dạng được sử dụng bởi Kính áp tròng cho Amazon Connect. Bạn cũng sẽ chỉ định một bộ chứa S3 đầu ra, lưu trữ đầu ra biên tập cũng như dữ liệu trung gian. Dữ liệu trung gian là các phiên bản vi mô của dữ liệu đầu vào. Ví dụ: nếu có 10,000 cuộc hội thoại cần được biên tập lại, quy trình làm việc sẽ chia chúng thành 10 nhóm, mỗi nhóm 1000 cuộc hội thoại. Mỗi lô được lưu trữ bằng cách sử dụng một tiền tố duy nhất, sau đó được sử dụng làm nguồn đầu vào cho Hiểu. Trạng thái bản đồ Step Functions được sử dụng để thực hiện song song các công việc biên tập này bằng cách gọi Bắt đầuPIIEtitiesDetectionJob API. Cách tiếp cận này cho phép bạn chạy nhiều công việc song song thay vì các công việc riêng lẻ theo trình tự. Vì công việc được triển khai dưới dạng máy trạng thái Step Functions nên nó có thể được kích hoạt để chạy thủ công hoặc tự động như một phần của quy trình hàng ngày.

Bạn có thể tìm hiểu thêm về cách Comprehend phát hiện và xử lý lại dữ liệu PII trong bài viết trên blog này.

Triển khai giải pháp mẫu

Đầu tiên, đăng nhập vào Bảng điều khiển quản lý AWS trong tài khoản AWS của bạn.

Bạn sẽ cần một bộ chứa S3 với một số dữ liệu bản chép lời mẫu để biên tập lại và một bộ chứa khác để xuất. Nếu bạn không có sẵn dữ liệu bảng điểm mẫu, hãy làm theo các bước sau:

  1. Điều hướng đến bảng điều khiển Amazon S3.
  2. Chọn Tạo xô.
  3. Nhập tên bộ chứa, chẳng hạn như text-redaction-data-.
  4. Chấp nhận các giá trị mặc định và chọn Tạo xô.
  5. Mở thùng bạn đã tạo và chọn Tạo thư mục.
  6. Nhập tên thư mục, chẳng hạn như “sample-data” và chọn Tạo thư mục.
  7. Nhấp vào tên thư mục mới của bạn để mở nó.
  8. Tải về SampleData.zip tập tin.
  9. Mở tệp .zip trên máy tính cục bộ của bạn rồi kéo thư mục vào bộ chứa S3 mà bạn đã tạo.
  10. Chọn Tải lên.

Giờ hãy nhấp vào liên kết sau để triển khai giải pháp mẫu cho Miền Đông Hoa Kỳ (Bắc Virginia):

Cách biên tập lại dữ liệu PII trong bản ghi cuộc hội thoại PlatoBlockchain Data Intelligence. Tìm kiếm dọc. Ái.

Điều này sẽ tạo ra một Hình thành đám mây AWS cây rơm.

Cách biên tập lại dữ liệu PII trong bản ghi cuộc hội thoại PlatoBlockchain Data Intelligence. Tìm kiếm dọc. Ái.

Nhập Tên ngăn xếp (ví dụ, pii-redaction-workflow), tên của bộ chứa đầu vào S3 chứa dữ liệu bản sao đầu vào và tên của bộ chứa đầu ra S3. Chọn Sau và thêm bất kỳ thẻ nào bạn muốn cho ngăn xếp của mình (tùy chọn). Chọn Sau một lần nữa và xem lại chi tiết ngăn xếp. Chọn hộp kiểm để xác nhận rằng Quản lý truy cập và nhận dạng AWS (IAM) tài nguyên sẽ được tạo, sau đó chọn Tạo ngăn xếp.

Ngăn xếp CloudFormation sẽ tạo vai trò IAM với khả năng liệt kê và đọc các đối tượng từ bộ chứa. Bạn có thể tùy chỉnh thêm vai trò theo yêu cầu của mình. Nó cũng sẽ tạo ra một máy trạng thái Step Functions, một số AWS Lambda các chức năng được sử dụng bởi máy trạng thái và bộ chứa S3 để lưu trữ các phiên bản đầu ra đã được biên tập lại của bản ghi.

Sau một vài phút, ngăn xếp của bạn sẽ hoàn tất và sau đó bạn có thể kiểm tra máy trạng thái Step Functions đã được tạo như một phần của mẫu CloudFormation.

Chạy một công việc chỉnh sửa

Để chạy một công việc, hãy điều hướng đến Step Functions trong bảng điều khiển AWS, chọn máy trạng thái rồi chọn Bắt đầu thực hiện.

Cách biên tập lại dữ liệu PII trong bản ghi cuộc hội thoại PlatoBlockchain Data Intelligence. Tìm kiếm dọc. Ái.

Tiếp theo cung cấp các đối số đầu vào để chạy công việc. Đối với đầu vào công việc, bạn muốn cung cấp tên của bộ chứa S3 đầu vào của mình làm S3InputData Xô giá trị, tên thư mục là Tiền tố dữ liệu đầu vào S3 giá trị, tên của bộ chứa S3 đầu ra của bạn là S3OutputDataBucket giá trị và thư mục để lưu trữ kết quả dưới dạng S3OutputDataPrefix giá trị sau đó nhấp vào Bắt đầu thực hiện.

{
  "S3InputDataBucket": "",
  "S3InputDataPrefix": "",
  "S3OutputDataBucket": "", 
  "S3OutputDataPrefix": "" }

Cách biên tập lại dữ liệu PII trong bản ghi cuộc hội thoại PlatoBlockchain Data Intelligence. Tìm kiếm dọc. Ái.

Khi công việc thực thi, bạn có thể theo dõi trạng thái của nó trong Step Functions xem đồ thị. Sẽ mất vài phút để chạy công việc. Khi công việc hoàn tất, bạn sẽ thấy đầu ra cho từng công việc trong Thực hiện đầu vào và đầu ra phần của bảng điều khiển. Bạn có thể sử dụng URI đầu ra để truy xuất đầu ra của một công việc. Nếu nhiều công việc đã được thực thi, bạn có thể sao chép kết quả của tất cả các công việc vào một bộ chứa đích để phân tích thêm.

aws s3 cp s3:////-output/ s3://// --recursive --exclude "*/*" --include "*.out"

Chúng ta hãy xem phiên bản đã được biên tập lại của cuộc trò chuyện mà chúng ta đã bắt đầu.

Đặc vụ: Xin chào, cảm ơn bạn đã gọi cho chúng tôi hôm nay. Hôm nay tôi hân hạnh nói chuyện với ai?

Người gọi: Xin chào, tên tôi là [TÊN].

Đại lý: Xin chào [TÊN], tôi có thể giúp gì cho bạn?

Người gọi: Tôi chưa nhận được bảng sao kê W2 của mình và muốn kiểm tra trạng thái của nó.

Đại lý: Chắc chắn, tôi có thể giúp bạn với điều đó. Bạn có thể vui lòng xác nhận bốn chữ số cuối trong số An sinh xã hội của mình không?

Người gọi: Vâng, đó là [SSN].

Đặc vụ: Được rồi. Tôi đang kéo trạng thái lên ngay bây giờ. Tôi thấy rằng nó đã được gửi đi ngày hôm qua, và ước tính hàng sẽ đến vào đầu tuần sau. Bạn có muốn tôi bật cảnh báo tự động để bạn có thể được thông báo về bất kỳ sự chậm trễ nào không?

Người gọi: Vâng, làm ơn.

Đại lý: Số chúng tôi có trong hồ sơ của bạn là [PHONE]. Điều đó vẫn đúng chứ?

Người gọi: Vâng, đúng vậy.

Đặc vụ: Tuyệt vời. Tôi đã bật thông báo tự động. Tôi có thể hỗ trợ điều gì khác cho bạn không, [TÊN]?

Người gọi: Không, thế thôi. Cảm ơn bạn.

Đặc vụ: Cảm ơn, [TÊN]. Có một ngày tuyệt vời.

Làm sạch

Bạn có thể muốn dọn sạch các tài nguyên được tạo như một phần của mẫu CloudFormation sau khi hoàn tất để tránh bị tính phí liên tục. Để làm như vậy, hãy xóa ngăn xếp CloudFormation đã triển khai và xóa bộ chứa S3 có dữ liệu bản ghi mẫu nếu đã tạo.

Kết luận

Với những khách hàng yêu cầu trải nghiệm liền mạch trên các kênh và cũng mong muốn bảo mật được tích hợp ở mọi điểm, việc sử dụng Step Functions và Amazon Comprehend để sắp xếp lại dữ liệu PII trong bản chép lại cuộc hội thoại văn bản là một công cụ mạnh mẽ mà bạn có thể tùy ý sử dụng. Các tổ chức có thể tăng tốc thời gian để định giá bằng cách sử dụng bảng điểm được biên tập lại để phân tích các tương tác với dịch vụ khách hàng và thu thập thông tin chuyên sâu để cải thiện trải nghiệm của khách hàng.

Hãy thử sử dụng quy trình công việc này để sắp xếp lại dữ liệu của bạn và để lại nhận xét cho chúng tôi!


Giới thiệu về tác giả

Cách biên tập lại dữ liệu PII trong bản ghi cuộc hội thoại PlatoBlockchain Data Intelligence. Tìm kiếm dọc. Ái.Alex Emilcar là Kiến trúc sư giải pháp cấp cao trong Phòng thí nghiệm giải pháp máy học của Amazon, nơi anh giúp khách hàng xây dựng trải nghiệm kỹ thuật số bằng công nghệ AI của AWS. Alex có hơn 10 năm kinh nghiệm làm việc trong lĩnh vực công nghệ với nhiều năng lực khác nhau từ nhà phát triển, kỹ sư cơ sở hạ tầng và Kiến trúc giải pháp. Khi rảnh rỗi, Alex thích dành thời gian đọc sách và làm vườn.

Dấu thời gian:

Thêm từ Học máy AWS