Cómo redactar datos PII en transcripciones de conversaciones PlatoBlockchain Data Intelligence. Búsqueda vertical. Ai.

Cómo redactar datos PII en transcripciones de conversaciones

Las interacciones de servicio al cliente a menudo contienen información de identificación personal (PII), como nombres, números de teléfono y fechas de nacimiento. A medida que las organizaciones incorporan el aprendizaje automático (ML) y el análisis en sus aplicaciones, el uso de estos datos puede proporcionar información sobre cómo crear experiencias de cliente más fluidas. Sin embargo, la presencia de información PII a menudo restringe el uso de estos datos. En esta publicación de blog, revisaremos una solución para eliminar automáticamente los datos PII de una transcripción de conversación de servicio al cliente.

Tomemos una conversación de ejemplo entre un cliente y un agente del centro de llamadas.

Agente: Hola, gracias por llamarnos hoy. ¿Con quién tengo el placer de hablar hoy?

Persona que llama: Hola, mi nombre es John Stiles.

Agente: Hola John, ¿en qué puedo ayudarte?

Persona que llama: Aún no he recibido mi estado de cuenta W2 y quería verificar su estado.

Agente: Claro, puedo ayudarte con eso. ¿Puede confirmar los últimos cuatro dígitos de su número de Seguro Social?

Persona que llama: Sí, es 1111.

Agente: Está bien. Ahora subo el estado. Veo que se envió ayer, y la llegada estimada es a principios de la próxima semana. ¿Quieres que active las alertas automáticas para que puedas recibir notificaciones de cualquier retraso?

Persona que llama: Sí, por favor.

Agente: El número que tenemos registrado para usted es 555-456-7890. ¿Sigue siendo correcto?

Persona que llama: Sí, lo es.

Agente: Genial. He activado las notificaciones automáticas. ¿Hay algo más en lo que pueda ayudarte con John?

Persona que llama: No, eso es todo. Gracias.

Agente: Gracias, John. Qué tengas un lindo día.

En esta breve interacción, hay varios datos que generalmente se considerarían PII, incluido el nombre de la persona que llama, los últimos cuatro dígitos de su número de Seguro Social y el número de teléfono. Revisemos cómo podemos redactar estos datos PII en la transcripción.

Resumen de la solución

Crearemos un Funciones de paso de AWS máquina de estado, que orquesta una Amazon Comprehend Trabajo de redacción de PII. Amazon Comprehend es un servicio de procesamiento de lenguaje natural (NLP) que utiliza el aprendizaje automático para descubrir información valiosa y conexiones en el texto, incluida la capacidad de detectar y redactar datos PII.

Proporcionará las transcripciones en la entrada Amazon S3 Cubeta. Las transcripciones están en el formato utilizado por Lente de contacto para Amazon Connect. También especificará un depósito de S3 de salida, que almacena la salida de la redacción, así como los datos intermedios. Los datos intermedios son versiones en microlotes de los datos de entrada. Por ejemplo, si hay que redactar 10,000 10 conversaciones, el flujo de trabajo las dividirá en 1000 lotes de XNUMX conversaciones cada uno. Cada lote se almacena usando un prefijo único, que luego se usa como fuente de entrada para Comprehend. El estado del mapa de Step Functions se usa para ejecutar estos trabajos de redacción en paralelo llamando al IniciarPIIEntitiesDetectionJob API. Este enfoque le permite ejecutar varios trabajos en paralelo en lugar de trabajos individuales en secuencia. Dado que el trabajo se implementa como una máquina de estado de Step Functions, se puede activar para que se ejecute de forma manual o automática como parte de un proceso diario.

Puede obtener más información sobre cómo Comprehend detecta y elimina datos PII en esta entrada del blog.

Implementar la solución de muestra

Primero, inicie sesión en el Consola de administración de AWS en su cuenta de AWS.

Necesitará un depósito S3 con algunos datos de transcripción de muestra para redactar y otro depósito para la salida. Si no tiene datos de transcripciones de muestra existentes, siga estos pasos:

  1. Navegue a la consola de Amazon S3.
  2. Elige Crear cubeta.
  3. Ingrese un nombre de depósito, como text-redaction-data-.
  4. Acepte los valores predeterminados y elija Crear cubeta.
  5. Abre el cubo que creaste y elige crear una carpeta.
  6. Ingrese un nombre de carpeta, como "sample-data" y elija crear una carpeta.
  7. Haga clic en el nombre de su nueva carpeta para abrirla.
  8. Descargue nuestra Datos de muestra.zip archivo.
  9. Abra el archivo .zip en su computadora local y luego arrastre la carpeta al depósito S3 que creó.
  10. Elige Subir.

Ahora haga clic en el siguiente vínculo para implementar la solución de muestra en EE. UU. Este (Norte de Virginia):

Cómo redactar datos PII en transcripciones de conversaciones PlatoBlockchain Data Intelligence. Búsqueda vertical. Ai.

Esto creará un nuevo Formación en la nube de AWS asociación.

Cómo redactar datos PII en transcripciones de conversaciones PlatoBlockchain Data Intelligence. Búsqueda vertical. Ai.

Escriba la Nombre de pila (p.ej, pii-redaction-workflow), el nombre del depósito de entrada de S3 que contiene los datos de la transcripción de entrada y el nombre del depósito de salida de S3. Escoger Siguiente y agregue las etiquetas que desee para su pila (opcional). Escoger Siguiente de nuevo y revise los detalles de la pila. Seleccione la casilla de verificación para reconocer que Administración de acceso e identidad de AWS (IAM) se crearán los recursos y, a continuación, elija Crear pila.

La pila de CloudFormation creará un rol de IAM con la capacidad de enumerar y leer los objetos del depósito. Puede personalizar aún más el rol según sus requisitos. También creará una máquina de estado de Step Functions, varias AWS Lambda funciones utilizadas por la máquina de estado y un contenedor S3 para almacenar las versiones de salida redactadas de las transcripciones.

Después de unos minutos, su pila estará completa y luego podrá examinar la máquina de estado de Step Functions que se creó como parte de la plantilla de CloudFormation.

Ejecutar un trabajo de redacción

Para ejecutar un trabajo, vaya a Step Functions en la consola de AWS, seleccione la máquina de estado y elija Iniciar ejecución.

Cómo redactar datos PII en transcripciones de conversaciones PlatoBlockchain Data Intelligence. Búsqueda vertical. Ai.

A continuación, proporcione los argumentos de entrada para ejecutar el trabajo. Para la entrada del trabajo, desea proporcionar el nombre de su depósito S3 de entrada como el S3InputDataBucket valor, el nombre de la carpeta como el Prefijo de datos de entrada S3 valor, el nombre de su cubo S3 de salida como el S3OutputDataBucket valor, y la carpeta para almacenar los resultados como S3OutputDataPrefix valor y luego haga clic Iniciar ejecución.

{
  "S3InputDataBucket": "",
  "S3InputDataPrefix": "",
  "S3OutputDataBucket": "", 
  "S3OutputDataPrefix": "" }

Cómo redactar datos PII en transcripciones de conversaciones PlatoBlockchain Data Intelligence. Búsqueda vertical. Ai.

A medida que se ejecuta el trabajo, puede monitorear su estado en las funciones de paso vista de gráfico. Llevará unos minutos ejecutar el trabajo. Una vez que el trabajo esté completo, verá la salida de cada uno de los trabajos en el Entrada y salida de ejecución sección de la consola. Puede usar el URI de salida para recuperar la salida de un trabajo. Si se ejecutaron varios trabajos, puede copiar los resultados de todos los trabajos en un depósito de destino para un análisis más detallado.

aws s3 cp s3:////-output/ s3://// --recursive --exclude "*/*" --include "*.out"

Echemos un vistazo a la versión redactada de la conversación con la que comenzamos.

Agente: Hola, gracias por llamarnos hoy. ¿Con quién tengo el placer de hablar hoy?

Persona que llama: Hola, mi nombre es [NOMBRE].

Agente: Hola [NOMBRE], ¿cómo puedo ayudarlo?

Persona que llama: Aún no he recibido mi estado de cuenta W2 y quería verificar su estado.

Agente: Claro, puedo ayudarte con eso. ¿Puede confirmar los últimos cuatro dígitos de su número de Seguro Social?

Persona que llama: Sí, es [SSN].

Agente: Está bien. Ahora subo el estado. Veo que se envió ayer, y la llegada estimada es a principios de la próxima semana. ¿Quieres que active las alertas automáticas para que puedas recibir notificaciones de cualquier retraso?

Persona que llama: Sí, por favor.

Agente: El número que tenemos registrado para usted es [TELÉFONO]. ¿Sigue siendo correcto?

Persona que llama: Sí, lo es.

Agente: Genial. He activado las notificaciones automáticas. ¿Puedo ayudarte en algo más, [NOMBRE]?

Persona que llama: No, eso es todo. Gracias.

Agente: Gracias, [NOMBRE]. Qué tengas un lindo día.

Limpiar

Es posible que desee limpiar los recursos creados como parte de la plantilla de CloudFormation una vez que haya terminado para evitar cargos continuos. Para hacerlo, elimine la pila de CloudFormation implementada y elimine el depósito S3 con los datos de la transcripción de muestra, si se creó uno.

Conclusión

Dado que los clientes exigen experiencias fluidas en todos los canales y también esperan que la seguridad esté integrada en cada punto, el uso de Step Functions y Amazon Comprehend para redactar datos PII en transcripciones de conversaciones de texto es una poderosa herramienta a su disposición. Las organizaciones pueden acelerar el tiempo de obtención de valor mediante el uso de transcripciones redactadas para analizar las interacciones de servicio al cliente y obtener información para mejorar la experiencia del cliente.

¡Intenta usar este flujo de trabajo para redactar tus datos y déjanos un comentario!


Acerca del autor.

Cómo redactar datos PII en transcripciones de conversaciones PlatoBlockchain Data Intelligence. Búsqueda vertical. Ai.alex emilcar es arquitecto sénior de soluciones en el laboratorio de soluciones de aprendizaje automático de Amazon, donde ayuda a los clientes a crear experiencias digitales con las tecnologías de IA de AWS. Alex tiene más de 10 años de experiencia en tecnología trabajando en diferentes capacidades, desde desarrollador, ingeniero de infraestructura y arquitectura de soluciones. En su tiempo libre, a Alex le gusta pasar tiempo leyendo y trabajando en el jardín.

Sello de tiempo:

Mas de Aprendizaje automático de AWS