Resumen de texto con Amazon SageMaker y Hugging Face

Reeditado por Platón

seguidores: 0

En esta publicación, le mostramos cómo implementar uno de los modelos preentrenados Hugging Face más descargados que se utiliza para resumir texto, DestilarBART-CNN-12-6, dentro de un cuaderno Jupyter utilizando Amazon SageMaker y del Kit de herramientas de inferencia de cara abrazada de SageMaker. Según los pasos que se muestran en esta publicación, puede intentar resumir el texto del WikiTexto-2 datos administrado por fast.ai, disponible en el Registro de datos abiertos en AWS.

Los volúmenes de datos globales están creciendo a escala de zettabytes a medida que las empresas y los consumidores amplían su uso de productos digitales y servicios en línea. Para comprender mejor estos datos crecientes, las técnicas de procesamiento de lenguaje natural (NLP) de aprendizaje automático (ML) para el análisis de texto han evolucionado para abordar casos de uso que involucran resumen de texto, reconocimiento de entidades, clasificación, traducción y más. AWS ofrece capacitación previa Servicios de AI de AWS que se pueden integrar en aplicaciones mediante llamadas API y no requieren experiencia en ML. Por ejemplo, Amazon Comprehend puede realizar tareas de NLP, como el reconocimiento de entidades personalizadas, el análisis de sentimientos, la extracción de frases clave, el modelado de temas y más para recopilar información del texto. Puede realizar análisis de texto en una amplia variedad de idiomas por sus diversas características.

El resumen de texto es una técnica útil para comprender grandes cantidades de datos de texto porque crea un subconjunto de información contextualmente significativa a partir de documentos de origen. Puede aplicar esta técnica de NLP a artículos y documentos de texto de formato más largo, lo que permite un consumo más rápido y una indexación de documentos más efectiva, por ejemplo, para resumir notas de llamadas de reuniones.

Abrazando la cara es una popular biblioteca de código abierto para NLP, con más de 49,000 185 modelos preentrenados en más de XNUMX idiomas con soporte para diferentes marcos. AWS y Hugging Face tienen un asociación que permite una integración perfecta a través de SageMaker con un conjunto de contenedores de aprendizaje profundo (DLC) de AWS para entrenamiento e inferencia en PyTorch o TensorFlow, y estimadores y predictores Hugging Face para SageMaker Python SDK. Estas capacidades en SageMaker ayudan a los desarrolladores y científicos de datos a comenzar con NLP en AWS más fácilmente. El procesamiento de textos con transformadores en marcos de aprendizaje profundo como PyTorch suele ser una tarea compleja y que requiere mucho tiempo para los científicos de datos, lo que a menudo genera frustración y falta de eficiencia al desarrollar proyectos de NLP. El surgimiento de comunidades de IA como Hugging Face, combinado con el poder de los servicios de ML en la nube como SageMaker, aceleran y simplifican el desarrollo de estas tareas de procesamiento de texto. SageMaker lo ayuda a crear, entrenar, implementar y poner en funcionamiento modelos Hugging Face.

Resumen de resumen de texto

Puede aplicar resúmenes de texto para identificar oraciones clave dentro de un documento o identificar oraciones clave en varios documentos. El resumen de texto puede producir dos tipos de resúmenes: extractivo y abstractivo. Los resúmenes extractivos no contienen ningún texto generado por máquina y son una colección de oraciones importantes seleccionadas del documento de entrada. Los resúmenes abstractivos contienen nuevas frases y oraciones legibles por humanos generadas por el modelo de resumen de texto. La mayoría de los sistemas de resumen de texto se basan en el resumen extractivo porque es difícil lograr un resumen de texto abstracto preciso.

Hugging Face tiene más de 400 usuarios de última generación pre-entrenados. modelos de resumen de texto disponibles, implementando diferentes combinaciones de técnicas de PNL. Estos modelos están entrenados en diferentes conjuntos de datos, cargados y mantenidos por empresas de tecnología y miembros de la comunidad Hugging Face. Puede filtrar los modelos por más descargados o más gustados, y cargarlos directamente al usar el canalización de resumen API de transformador Hugging Face. El transformador Hugging Face simplifica el proceso de implementación de NLP para que los modelos de NLP de alto rendimiento se puedan ajustar para entregar resúmenes de texto, sin necesidad de un amplio conocimiento de operaciones de ML.

Hugging Face modelos de resumen de texto en AWS

SageMaker ofrece a los analistas de negocios, científicos de datos e ingenieros de MLOps una selección de herramientas para diseñar y operar cargas de trabajo de ML en AWS. Estas herramientas le brindan una implementación y prueba más rápidas de los modelos ML para lograr resultados óptimos.

Desde el Kit de herramientas de inferencia de cara abrazada de SageMaker, una biblioteca de código abierto, describimos tres formas diferentes de implementar y alojar modelos de resumen de texto Hugging Face mediante un cuaderno Jupyter:

Tubería de resumen de Hugging Face - Crear un Tubería de resumen de Hugging Face utilizando la "summarization” identificador de tarea para usar un modelo de resumen de texto predeterminado para la inferencia dentro de su cuaderno Jupyter. Estas canalizaciones abstraen el código complejo y ofrecen a los profesionales novatos de ML una API simple para implementar rápidamente el resumen de texto sin configurar un punto final de inferencia. La canalización también permite al profesional de ML seleccionar un modelo preentrenado específico y su tokenizador asociado. Los tokenizadores preparan el texto para que esté listo como entrada para el modelo al dividir el texto en palabras o subpalabras, que luego se convierten en ID a través de una tabla de búsqueda. Para simplificar, el siguiente fragmento de código proporciona el caso predeterminado cuando se usan canalizaciones. los DestilarBART-CNN-12-6 modelo es uno de los modelos de resumen más descargados en Hugging Face y es el modelo predeterminado para la canalización de resumen. La última línea llama al modelo preentrenado para obtener un resumen del texto pasado dados los dos argumentos proporcionados.
```
from transformers import pipeline summarizer = pipeline("summarization")
summarizer("An apple a day, keeps the doctor away", min_length=5, max_length=20)
```

Extremo de SageMaker con modelo preentrenado – Cree un punto final de SageMaker con un modelo previamente entrenado desde el Hub modelo de cara abrazada e impleméntelo en un punto final de inferencia, como la instancia ml.m5.xlarge en el siguiente fragmento de código. Este método permite a los profesionales experimentados de ML seleccionar rápidamente modelos específicos de código abierto, ajustarlos e implementar los modelos en instancias de inferencia de alto rendimiento.

from sagemaker.huggingface import HuggingFaceModel
from sagemaker import get_execution_role role = get_execution_role() # Hub Model configuration. https://huggingface.co/models
hub = { 'HF_MODEL_ID':'sshleifer/distilbart-cnn-12-6', 'HF_TASK':'summarization'
} # create Hugging Face Model Class
huggingface_model = HuggingFaceModel( transformers_version='4.17.0', pytorch_version='1.10.2', py_version='py38', env=hub, role=role,
) # deploy model to SageMaker Inference
predictor = huggingface_model.deploy(initial_instance_count=1,instance_type="ml.m5.xlarge")

Extremo de SageMaker con un modelo entrenado – Cree un extremo de modelo de SageMaker con un modelo entrenado almacenado en un Servicio de almacenamiento simple de Amazon (Amazon S3) e impleméntelo en un punto final de inferencia. Este método permite a los profesionales de ML experimentados implementar rápidamente sus propios modelos almacenados en Amazon S3 en instancias de inferencia de alto rendimiento. El modelo en sí se descarga de Hugging Face y se comprime, y luego se puede cargar en Amazon S3. Este paso se demuestra en el siguiente fragmento de código:
```
from sagemaker.huggingface import HuggingFaceModel
from sagemaker import get_execution_role role = get_execution_role() # create Hugging Face Model Class
huggingface_model = HuggingFaceModel( transformers_version='4.17.0', pytorch_version='1.0.2', py_version='py38', model_data='s3://my-trained-model/artifacts/model.tar.gz', role=role,
) # deploy model to SageMaker Inference
predictor = huggingface_model.deploy(initial_instance_count=1,instance_type="ml.m5.xlarge")
```

AWS tiene varios recursos disponibles para ayudarlo a implementar sus cargas de trabajo de ML. los Lente de aprendizaje automático de las Marco bien diseñado de AWS recomienda las mejores prácticas de cargas de trabajo de ML, incluida la optimización de recursos y la reducción de costos. Estos principios de diseño recomendados garantizan que las cargas de trabajo de ML bien diseñadas en AWS se implementen en producción. Recomendador de inferencia de Amazon SageMaker lo ayuda a seleccionar la instancia adecuada para implementar sus modelos de ML con un rendimiento y costo de inferencia óptimos. El recomendador de inferencias acelera la implementación del modelo y reduce el tiempo de comercialización al automatizar las pruebas de carga y optimizar el rendimiento del modelo en las instancias de ML.

En las siguientes secciones, demostramos cómo cargar un modelo entrenado desde un depósito S3 e implementarlo en una instancia de inferencia adecuada.

Requisitos previos

Para este tutorial, debe tener los siguientes requisitos previos:

An Cuenta de AWS.
Un cuaderno Jupyter dentro Estudio Amazon SageMaker o instancias de cuadernos de SageMaker. En esta publicación, usamos la imagen "Python 3 (PyTorch 1.4 Python 3.6 CPU Optimized)" con los fragmentos de código proporcionados, pero puede usar cualquier otra imagen PyTorch de versión superior de la núcleos de SageMaker disponibles.
Un conjunto de datos en su depósito S3, como el WikiTexto-2 conjunto de datos de la Registro de datos abiertos en AWS.

Cargue el modelo Hugging Face en SageMaker para la inferencia de resumen de texto

Use el siguiente código para descargar el modelo de resumen de texto preentrenado Hugging Face DestilarBART-CNN-12-6 y su tokenizador, y guárdelos localmente en SageMaker en el directorio de su cuaderno Jupyter:

from transformers import BartTokenizer, BartForConditionalGeneration, BartConfig PRE_TRAINED_MODEL_NAME='sshleifer/distilbart-cnn-12-6' model = BartForConditionalGeneration.from_pretrained(PRE_TRAINED_MODEL_NAME, cache_dir=hf_cache_dir)
model.save_pretrained('./models/bart_model/') tokenizer = BartTokenizer.from_pretrained(PRE_TRAINED_MODEL_NAME)
tokenizer.save_pretrained('./models/bart_tokenizer/')

Comprima el modelo de resumen de texto guardado y su tokenizador en formato tar.gz y cargue el artefacto del modelo comprimido en un depósito S3:

! tar -C models/ -czf model.tar.gz code/ bart_tokenizer/ bart_model/
from sagemaker.s3 import S3Uploader file_key = 'model.tar.gz'
model_artifact = S3Uploader.upload(file_key,'s3://my-trained-model/artifacts')

Seleccione un inferencia de la imagen del contenedor de Docker para realizar la inferencia de resumen de texto. Defina el sistema operativo Linux, el marco PyTorch y la versión de Hugging Face Transformer y especifique el Nube informática elástica de Amazon (Amazon EC2) tipo de instancia para ejecutar el contenedor.

La imagen de Docker está disponible en el Registro de contenedores elásticos de Amazon (Amazon ECR) de la misma cuenta de AWS y el enlace para esa imagen de contenedor se devuelve como un URI.

from sagemaker.image_uris import retrieve deploy_instance_type = 'ml.m5.xlarge' pytorch_inference_image_uri = retrieve('huggingface', region=region, version='4.6.1', instance_type=deploy_instance_type, base_framework_version='pytorch1.8.1', image_scope='inference')

Defina el modelo de resumen de texto que implementará la imagen del contenedor seleccionado que realiza la inferencia. En el siguiente fragmento de código, se implementa el modelo comprimido cargado en Amazon S3:

from sagemaker.huggingface.model import HuggingFaceModel
from sagemaker import get_execution_role role = get_execution_role() # create Hugging Face Model Class
huggingface_model = HuggingFaceModel( model_data="s3://my-trained-model/artifacts/model.tar.gz", # path to your trained sagemaker model image_uri=pytorch_inference_image_uri, role=role, # iam role with permissions to create an Endpoint transformers_version="4.6.1", # transformers version used
) # deploy model to SageMaker Inference
predictor = huggingface_model.deploy( initial_instance_count=1, instance_type="ml.m5.xlarge"
)

Pruebe el modelo de resumen de texto implementado en una entrada de muestra:

# example request, you need to define "inputs"
data = { "text": "Camera - You are awarded a SiPix Digital Camera! call 09061221066 fromm landline. Delivery within 28 days."
} # request
predictor.predict(data)

Use el Recomendador de inferencia para evaluar la instancia EC2 óptima para la tarea de inferencia

A continuación, cree varias muestras de carga útil de texto de entrada en formato JSON y comprímalas en un solo archivo de carga útil. El recomendador de inferencias utiliza estas muestras de carga útil para comparar el rendimiento de inferencias entre diferentes tipos de instancias EC2. Cada una de las cargas útiles de muestra debe coincidir con el formato JSON que se mostró anteriormente. Puede obtener ejemplos de la WikiTexto-2 datos administrado por fast.ai, disponible en el Registro de datos abiertos en AWS.

Cargue el artefacto del modelo de resumen de texto comprimido y el archivo de carga útil de muestra comprimido en el depósito de S3. Subimos el modelo en un paso anterior, pero para mayor claridad incluimos el código para volver a subirlo:

bucket = sagemaker.Session().default_bucket() prefix = "sagemaker/inference-recommender" model_archive_name = "model.tar.gz"
payload_archive_name = "payload.tar.gz" sample_payload_url = sagemaker.Session().upload_data( payload_archive_name, bucket=bucket, key_prefix=prefix + "/inference"
)
model_url = sagemaker.Session().upload_data( model_archive_name, bucket=bucket, key_prefix=prefix + "/model"
)

Revise la lista de modelos de aprendizaje automático estándar disponibles en SageMaker en zoológicos modelo común, como la PNL y la visión artificial. Seleccione un modelo NLP para realizar la inferencia de resumen de texto:

import boto3
import pandas as pd inference_client = boto3.client("sagemaker", region) list_model_metadata_response = inference_client.list_model_metadata() domains = []
frameworks = []
framework_versions = []
tasks = []
models = [] for model_summary in list_model_metadata_response["ModelMetadataSummaries"]: domains.append(model_summary["Domain"]) tasks.append(model_summary["Task"]) models.append(model_summary["Model"]) frameworks.append(model_summary["Framework"]) framework_versions.append(model_summary["FrameworkVersion"]) data = { "Domain": domains, "Task": tasks, "Framework": frameworks, "FrameworkVersion": framework_versions, "Model": models,
} df = pd.DataFrame(data) pd.set_option("display.max_rows", None)
pd.set_option("display.max_columns", None)
pd.set_option("display.width", 1000)
pd.set_option("display.colheader_justify", "center")
pd.set_option("display.precision", 3) display(df.sort_values(by=["Domain", "Task", "Framework", "FrameworkVersion"]))

En el siguiente ejemplo se bert-base-cased modelo de PNL. Registre el modelo de resumen de texto en el Registro de modelos de SageMaker con el dominio, el marco y la tarea correctamente identificados del paso anterior. Los parámetros para este ejemplo se muestran al principio del siguiente fragmento de código.

Tenga en cuenta el rango de tipos de instancias EC2 que evaluará el Recomendador de inferencias en SupportedRealtimeInferenceInstanceTypes en el siguiente código. Asegúrese de que el límites de servicio para la cuenta de AWS permitir el despliegue de este tipo de nodos de inferencia.

ml_domain = "NATURAL_LANGUAGE_PROCESSING"
ml_task = "FILL_MASK"
model_name = "bert-base-cased"
dlc_uri = pytorch_inference_image_uri
framework = 'PYTORCH'
framework_version='1.6.0' inference_client = boto3.client("sagemaker", region) model_package_group_name = uuid.uuid1() model_pacakge_group_response = inference_client.create_model_package_group( ModelPackageGroupName=str(model_package_group_name), ModelPackageGroupDescription="description"
) model_package_version_response = inference_client.create_model_package( ModelPackageGroupName=str(model_package_group_name), ModelPackageDescription="InferenceRecommenderDemo", Domain=ml_domain, Task=ml_task, SamplePayloadUrl=sample_payload_url, InferenceSpecification={ "Containers": [ { "ContainerHostname": "huggingface-pytorch", "Image": dlc_uri, "ModelDataUrl": model_url, "Framework": framework, "FrameworkVersion": framework_version, "NearestModelName": model_name, "Environment": { "SAGEMAKER_CONTAINER_LOG_LEVEL": "20", "SAGEMAKER_PROGRAM": "inference.py", "SAGEMAKER_REGION": region, "SAGEMAKER_SUBMIT_DIRECTORY": model_url, }, }, ], "SupportedRealtimeInferenceInstanceTypes": [ "ml.t2.xlarge", "ml.c5.xlarge", "ml.m5.xlarge", "ml.m5d.xlarge", "ml.r5.xlarge", "ml.inf1.xlarge", ], "SupportedContentTypes": [ "application/json", ], "SupportedResponseMIMETypes": ["application/json"], },
)

Cree un trabajo predeterminado de Recomendador de inferencia utilizando el ModelPackageVersion resultante del paso anterior. los uuid La biblioteca de Python se usa para generar un nombre único para el trabajo.

from sagemaker import get_execution_role client = boto3.client("sagemaker", region) role = get_execution_role()
default_job = uuid.uuid1()
default_response = client.create_inference_recommendations_job( JobName=str(default_job), JobDescription="Job Description", JobType="Default", RoleArn=role, InputConfig={"ModelPackageVersionArn": model_package_version_response["ModelPackageArn"]},
)

Puede obtener el estado del trabajo del Recomendador de inferencia ejecutando el siguiente código:

inference_recommender_job = client.describe_inference_recommendations_job( JobName=str(default_job)
)

Cuando el estado del trabajo es COMPLETED, compare la latencia de inferencia, el tiempo de ejecución y otras métricas de los tipos de instancia EC2 evaluados por el trabajo predeterminado del Recomendador de inferencia. Seleccione el tipo de nodo adecuado según los requisitos de su caso de uso.

data = [ {**x["EndpointConfiguration"], **x["ModelConfiguration"], **x["Metrics"]} for x in inference_recommender_job["InferenceRecommendations"]
]
df = pd.DataFrame(data)
df.drop("VariantName", inplace=True, axis=1)
pd.set_option("max_colwidth", 400)
df.head()

Conclusión

SageMaker ofrece múltiples formas de usar los modelos Hugging Face; para más ejemplos, echa un vistazo a la Ejemplos de AWS GitHub. Según la complejidad del caso de uso y la necesidad de ajustar el modelo, puede seleccionar la forma óptima de utilizar estos modelos. Las tuberías Hugging Face pueden ser un buen punto de partida para experimentar rápidamente y seleccionar modelos adecuados. Cuando necesite personalizar y parametrizar los modelos seleccionados, puede descargar los modelos e implementarlos en puntos finales de inferencia personalizados. Para ajustar más el modelo para un caso de uso específico, deberá entrenar el modelo después de descargarlo.

Los modelos NLP en general, incluidos los modelos de resumen de texto, funcionan mejor después de haber sido entrenados en un conjunto de datos que es específico para el caso de uso. Las funciones de monitoreo de modelos y MLOP de SageMaker aseguran que el modelo implementado continúe funcionando dentro de las expectativas. En esta publicación, usamos el Recomendador de inferencias para evaluar el tipo de instancia más adecuado para implementar el modelo de resumen de texto. Estas recomendaciones pueden optimizar el rendimiento y el costo para su caso de uso de ML.

Acerca de los autores

Dr. Nidal Al Beiruti es arquitecto sénior de soluciones en Amazon Web Services, apasionado por las soluciones de aprendizaje automático. Nidal tiene más de 25 años de experiencia trabajando en una variedad de roles de TI globales en diferentes niveles y verticales. Nidal actúa como un asesor de confianza para muchos clientes de AWS para respaldar y acelerar su proceso de adopción de la nube.

darren ko es un arquitecto de soluciones con sede en Londres. Asesora a los clientes de PYMES del Reino Unido e Irlanda sobre la rediseñación y la innovación en la nube. Darren está interesado en aplicaciones creadas con arquitecturas sin servidor y le apasiona resolver desafíos de sostenibilidad con aprendizaje automático.

Sello de tiempo: Sábado, Junio 15, 2022

Sello de tiempo: 13 de septiembre de 2022

Resumen de texto con Amazon SageMaker y Hugging Face

Reeditado por Platón

Resumen de resumen de texto

Hugging Face modelos de resumen de texto en AWS

Requisitos previos

Cargue el modelo Hugging Face en SageMaker para la inferencia de resumen de texto

Use el Recomendador de inferencia para evaluar la instancia EC2 óptima para la tarea de inferencia

Conclusión

Acerca de los autores

Mas de Aprendizaje automático de AWS

Patrones de hospedaje de modelos en SageMaker: prácticas recomendadas para probar y actualizar modelos en SageMaker

Prepare datos de Amazon EMR para el aprendizaje automático con Amazon SageMaker Data Wrangler

Cree un detector de anomalías de puntos de fidelidad con Amazon Lookout for Metrics

Evite la toma de posesión de la cuenta al iniciar sesión con el nuevo modelo Account Takeover Insights en Amazon Fraud Detector

Preguntas frecuentes sobre la automatización e implementación del control de versiones para Amazon Kendra

Extraiga conocimientos de SAP ERP con soluciones de aprendizaje automático sin código con Amazon AppFlow y Amazon SageMaker Canvas

Prepare datos a escala en Amazon SageMaker Studio mediante sesiones interactivas de AWS Glue sin servidor

Sobre Nosotros

Búsqueda vertical y Ai

Productos

Manténganse Conectados

Mi Cuenta