会話のトランスクリプトで PII データを秘匿化する方法

プラトン再発行

フォロワー： 0

カスタマーサービスのやり取りには、名前、電話番号、生年月日などの個人を特定できる情報 (PII) が含まれることがよくあります。組織が機械学習 (ML) と分析をアプリケーションに組み込むと、このデータを使用して、よりシームレスなカスタマーエクスペリエンスを作成する方法についての洞察を得ることができます。ただし、PII 情報の存在により、多くの場合、このデータの使用が制限されます。このブログ投稿では、カスタマーサービスの会話のトランスクリプトから PII データを自動的に編集するソリューションを確認します。

顧客とコールセンターエージェントの間の会話の例を見てみましょう。

エージェント: こんにちは、本日はお電話ありがとうございます。今日は誰と話せますか?

発信者: こんにちは、ジョン・スタイルズです。

エージェント: やあ、ジョン。

発信者: W2 ステートメントをまだ受け取っていないので、ステータスを確認したいと思いました。

エージェント: 承知しました。お手伝いできます。社会保障番号の下 XNUMX 桁を確認していただけますか?

発信者：はい、1111です。

エージェント: わかりました。今、ステータスを上げています。昨日発送されたようで、到着予定は来週初めです。遅延が発生した場合に通知できるように、自動アラートをオンにしますか?

発信者: はい、どうぞ。

エージェント: 登録済みの電話番号は 555-456-7890 です。それはまだ正しいですか？

発信者：はい、そうです。

エージェント: いいですね。自動通知をオンにしました。ジョンの件で他にお手伝いできることはありますか?

発信者: いいえ、それだけです。ありがとうございました。

エージェント: ありがとう、ジョン。すてきな一日を。

この短いやり取りには、発信者の名前、社会保障番号の下 XNUMX 桁、電話番号など、一般に PII と見なされるデータがいくつか含まれています。トランスクリプトでこの PII データを編集する方法を確認しましょう。

ソリューションの概要

作成します AWSステップ関数オーケストレーションを行うステートマシン Amazon Comprehend PII リダクションジョブ。 Amazon Comprehend は自然言語処理 (NLP) サービスであり、機械学習を使用して、PII データを検出および編集する機能など、テキスト内の貴重な洞察とつながりを明らかにします。

入力でトランスクリプトを提供しますアマゾンS3 バケツ。トランスクリプトは、によって使用される形式です。アマゾンコネクトのコンタクトレンズ. リダクション出力と中間データを格納する出力 S3 バケットも指定します。中間データは、入力データのマイクロバッチバージョンです。たとえば、編集する会話が 10,000 件ある場合、ワークフローはそれらをそれぞれ 10 件の会話の 1000 バッチに分割します。各バッチは一意のプレフィックスを使用して保存され、Comprehend の入力ソースとして使用されます。 Step Functions マップ状態は、これらのリダクションジョブを並行して実行するために使用されます。 StartPIEntitiesDetectionJob API。このアプローチにより、個々のジョブを順番に実行するのではなく、複数のジョブを並行して実行できます。ジョブは Step Functions ステートマシンとして実装されるため、毎日のプロセスの一部として手動または自動で実行するようにトリガーできます。

Comprehend が PII データを検出して編集する方法について詳しくは、このブログ記事.

サンプルソリューションを展開する

まず、にサインインします AWSマネジメントコンソール AWS アカウントで。

編集するいくつかのサンプルトランスクリプトデータを含む S3 バケットと、出力用の別のバケットが必要になります。既存のサンプルトランスクリプトデータがない場合は、次の手順に従います。

Amazon S3 コンソールに移動します。
選択する バケットを作成する.
などのバケット名を入力します。 text-redaction-data-.
デフォルトを受け入れて、 バケットを作成する.
作成したバケットを開き、選択します フォルダを作成する.
「sample-data」などのフォルダー名を入力し、 フォルダを作成する.
新しいフォルダ名をクリックして開きます。
ダウンロードサンプルデータ.zip ファイルにソフトウェアを指定する必要があります。
ローカルコンピューターで .zip ファイルを開き、作成した S3 バケットにフォルダーをドラッグします。
選択する アップロード.

次のリンクをクリックして、サンプルソリューションを米国東部 (バージニア北部) にデプロイします。

これにより、新しい AWS CloudFormation スタック。

会話トランスクリプト内の PII データを編集する方法 PlatoBlockchain Data Intelligence。垂直検索。あい。

入力する スタック名 （例えば、 pii-redaction-workflow)、入力トランスクリプトデータを含む S3 入力バケットの名前、および S3 出力バケットの名前。選ぶ Next スタックに必要なタグを追加します (オプション)。選ぶ Next もう一度、スタックの詳細を確認します。チェックボックスを選択して、それを承認します AWS Identity and Access Management（IAM）リソースが作成され、次に選択します スタックを作成.

CloudFormation スタックは、バケットからオブジェクトを一覧表示して読み取る機能を持つ IAM ロールを作成します。要件に応じて役割をさらにカスタマイズできます。また、Step Functions ステートマシンをいくつか作成します。 AWSラムダステートマシンによって使用される関数、およびトランスクリプトの編集された出力バージョンを格納するための S3 バケット。

数分後、スタックが完成し、CloudFormation テンプレートの一部として作成された Step Functions ステートマシンを調べることができます。

編集ジョブを実行する

ジョブを実行するには、AWS コンソールで Step Functions に移動し、ステートマシンを選択して、 実行を開始します.

会話トランスクリプト内の PII データを編集する方法 PlatoBlockchain Data Intelligence。垂直検索。あい。

次に、ジョブを実行するための入力引数を指定します。ジョブ入力の場合、入力 S3 バケットの名前を S3InputDataBucket 値、フォルダー名として S3InputDataPrefix 値、出力 S3 バケットの名前を S3OutputDataBucket 値、および結果を保存するフォルダー S3OutputDataPrefix 値を入力してからクリック 実行を開始します.

{
  "S3InputDataBucket": "",
  "S3InputDataPrefix": "",
  "S3OutputDataBucket": "", 
  "S3OutputDataPrefix": "" }

会話トランスクリプト内の PII データを編集する方法 PlatoBlockchain Data Intelligence。垂直検索。あい。

ジョブが実行されると、Step Functions でそのステータスを監視できますグラフビュー. ジョブの実行には数分かかります。ジョブが完了すると、各ジョブの出力が 実行の入出力 コンソールのセクション。出力 URI を使用して、ジョブの出力を取得できます。複数のジョブが実行された場合は、さらに分析するために、すべてのジョブの結果を宛先バケットにコピーできます。

aws s3 cp s3:////-output/ s3://// --recursive --exclude "*/*" --include "*.out"

私たちが始めた会話の編集版を見てみましょう。

エージェント: こんにちは、本日はお電話ありがとうございます。今日は誰と話せますか?

発信者: こんにちは、[NAME] と申します。

エージェント: こんにちは [NAME] さん、どうすればよいでしょうか?

発信者: W2 ステートメントをまだ受け取っていないので、ステータスを確認したいと思いました。

エージェント: 承知しました。お手伝いできます。社会保障番号の下 XNUMX 桁を確認していただけますか?

発信者: はい、[SSN] です。

発信者: はい、どうぞ。

エージェント: 登録済みの電話番号は [PHONE] です。それはまだ正しいですか？

発信者：はい、そうです。

エージェント: いいですね。自動通知をオンにしました。 [NAME] さん、他に何かお手伝いできることはありますか?

発信者: いいえ、それだけです。ありがとうございました。

エージェント: ありがとう、[名前]。すてきな一日を。

クリーンアップ

進行中の課金を回避するために、完了後に CloudFormation テンプレートの一部として作成されたリソースをクリーンアップすることをお勧めします。これを行うには、デプロイされた CloudFormation スタックを削除し、サンプルのトランスクリプトデータを含む S3 バケットが作成されている場合は削除します。

まとめ

顧客がチャネル全体でシームレスなエクスペリエンスを要求し、すべてのポイントにセキュリティが組み込まれることを期待しているため、Step Functions と Amazon Comprehend を使用してテキスト会話のトランスクリプトの PII データを編集することは、自由に使用できる強力なツールです。組織は、秘匿化されたトランスクリプトを使用してカスタマーサービスのやり取りを分析し、インサイトを収集してカスタマーエクスペリエンスを向上させることで、価値実現までの時間を短縮できます。

このワークフローを使用してデータを編集し、コメントを残してください!

著者,

会話トランスクリプト内の PII データを編集する方法 PlatoBlockchain Data Intelligence。垂直検索。あい。 アレックス・エミルカー Amazon Machine Learning Solutions Lab のシニアソリューションアーキテクトであり、AWS AI テクノロジーを使用して顧客がデジタルエクスペリエンスを構築するのを支援しています。アレックスは、開発者、インフラストラクチャエンジニア、ソリューションアーキテクチャなど、さまざまな分野で 10 年以上のテクノロジ経験があります。余暇には、読書や庭仕事をするのが好きです。