Обобщение текста с помощью Amazon SageMaker и обнимающего лица

Переиздано Платоном

Читают: 0

В этом посте мы покажем вам, как реализовать одну из самых загружаемых предварительно обученных моделей Hugging Face, используемых для суммирования текста. ДистилБАРТ-CNN-12-6, в блокноте Jupyter, используя Создатель мудреца Амазонки и Набор инструментов SageMaker Hugging Face Inference. Основываясь на шагах, показанных в этом посте, вы можете попробовать обобщить текст из 2-вики-текста Набор данных под управлением fast.ai, доступно на Реестр открытых данных на AWS.

Глобальные объемы данных растут в масштабе зеттабайт, поскольку компании и потребители расширяют использование цифровых продуктов и онлайн-сервисов. Чтобы лучше понимать эти растущие данные, методы машинного обучения (МО) обработки естественного языка (НЛП) для анализа текста были усовершенствованы для решения задач, связанных с резюмированием текста, распознаванием сущностей, классификацией, переводом и т. д. AWS предлагает предварительно обученные Сервисы AWS AI которые могут быть интегрированы в приложения с помощью вызовов API и не требуют опыта машинного обучения. Например, Amazon Comprehend может выполнять задачи НЛП, такие как распознавание пользовательских сущностей, анализ настроений, извлечение ключевых фраз, моделирование тем и многое другое, чтобы получить информацию из текста. Он может выполнять анализ текста на самых разных языках для его различных особенностей.

Резюмирование текста — полезный метод для понимания больших объемов текстовых данных, поскольку он создает подмножество контекстуально значимой информации из исходных документов. Вы можете применить этот метод НЛП к текстовым документам и статьям более длинной формы, обеспечивая более быстрое использование и более эффективную индексацию документов, например, для суммирования заметок о звонках с совещаний.

Обнимая лицо — популярная библиотека с открытым исходным кодом для НЛП, содержащая более 49,000 185 предварительно обученных моделей на более чем XNUMX языках с поддержкой различных фреймворков. AWS и Hugging Face имеют партнерство это обеспечивает бесшовную интеграцию через SageMaker с набором контейнеров AWS Deep Learning Containers (DLC) для обучения и вывода в PyTorch или TensorFlow, а также с оценщиками и предикторами Hugging Face для SageMaker Python SDK. Эти возможности SageMaker помогают разработчикам и специалистам по обработке и анализу данных быстрее начать работу с NLP на AWS. Обработка текстов с помощью преобразователей в средах глубокого обучения, таких как PyTorch, обычно является сложной и трудоемкой задачей для специалистов по данным, что часто приводит к разочарованию и снижению эффективности при разработке проектов НЛП. Рост ИИ-сообществ, таких как Hugging Face, в сочетании с мощью облачных сервисов машинного обучения, таких как SageMaker, ускоряет и упрощает разработку этих задач обработки текста. SageMaker помогает создавать, обучать, развертывать и эксплуатировать модели Hugging Face.

Обзор сводки текста

Вы можете применить суммирование текста для определения ключевых предложений в документе или определения ключевых предложений в нескольких документах. Резюме текста может давать два типа резюме: экстрактивное и абстрактное. Извлекающие резюме не содержат машинного текста и представляют собой набор важных предложений, выбранных из входного документа. Абстрактные резюме содержат новые удобочитаемые фразы и предложения, сгенерированные моделью реферирования текста. Большинство систем реферирования текста основаны на экстрактивном реферировании, потому что трудно достичь точного реферативного реферирования текста.

Hugging Face имеет более 400 предварительно обученных современных доступны модели суммирования текста, реализуя различные комбинации техник НЛП. Эти модели обучаются на различных наборах данных, загружаемых и поддерживаемых технологическими компаниями и членами сообщества Hugging Face. Вы можете фильтровать модели по наиболее загруженным или наиболее понравившимся и напрямую загружать их при использовании конвейер суммирования API преобразования Hugging Face. Преобразователь Hugging Face упрощает процесс реализации NLP, поэтому высокопроизводительные модели NLP можно точно настроить для предоставления текстовых сводок, не требуя обширных знаний об операциях ML.

Модели суммирования текста Hugging Face на AWS

SageMaker предлагает бизнес-аналитикам, специалистам по данным и инженерам MLOps набор инструментов для проектирования и управления рабочими нагрузками машинного обучения в AWS. Эти инструменты обеспечивают более быструю реализацию и тестирование моделей машинного обучения для достижения оптимальных результатов.

Из издания Набор инструментов SageMaker Hugging Face Inference, библиотеку с открытым исходным кодом, мы выделяем три различных способа реализации и размещения моделей суммирования текста Hugging Face с помощью блокнота Jupyter:

Конвейер суммирования обнимающего лица - Создать Конвейер суммирования обнимающего лица с помощью "summarization», чтобы использовать модель суммирования текста по умолчанию для логического вывода в блокноте Jupyter. Эти конвейеры абстрагируются от сложного кода, предлагая начинающим специалистам по машинному обучению простой API для быстрой реализации суммирования текста без настройки конечной точки вывода. Конвейер также позволяет специалистам по машинному обучению выбирать конкретную предварительно обученную модель и связанный с ней токенизатор. Токенизаторы подготавливают текст к использованию в качестве входных данных для модели, разбивая текст на слова или подслова, которые затем преобразуются в идентификаторы с помощью таблицы поиска. Для простоты в следующем фрагменте кода представлен случай по умолчанию при использовании конвейеров. ДистилБАРТ-CNN-12-6 модель является одной из самых загружаемых моделей обобщения на Hugging Face и является модель по умолчанию для конвейера суммирования. Последняя строка вызывает предварительно обученную модель, чтобы получить сводку для переданного текста с учетом двух предоставленных аргументов.
```
from transformers import pipeline summarizer = pipeline("summarization")
summarizer("An apple a day, keeps the doctor away", min_length=5, max_length=20)
```
Конечная точка SageMaker с предварительно обученной моделью – Создайте конечную точку SageMaker с предварительно обученной моделью из Обнимающая модель лица Hub и разверните его на конечной точке вывода, такой как экземпляр ml.m5.xlarge в следующем фрагменте кода. Этот метод позволяет опытным специалистам по машинному обучению быстро выбирать конкретные модели с открытым исходным кодом, настраивать их и развертывать модели на высокопроизводительных экземплярах логического вывода.
```
from sagemaker.huggingface import HuggingFaceModel
from sagemaker import get_execution_role role = get_execution_role() # Hub Model configuration. https://huggingface.co/models
hub = { 'HF_MODEL_ID':'sshleifer/distilbart-cnn-12-6', 'HF_TASK':'summarization'
} # create Hugging Face Model Class
huggingface_model = HuggingFaceModel( transformers_version='4.17.0', pytorch_version='1.10.2', py_version='py38', env=hub, role=role,
) # deploy model to SageMaker Inference
predictor = huggingface_model.deploy(initial_instance_count=1,instance_type="ml.m5.xlarge")
```
Конечная точка SageMaker с обученной моделью – Создайте конечную точку модели SageMaker с обученной моделью, хранящейся в Простой сервис хранения Amazon (Amazon S3) и разверните его на конечной точке вывода. Этот метод позволяет опытным специалистам по машинному обучению быстро развертывать свои собственные модели, хранящиеся в Amazon S3, в высокопроизводительных инстансах логического вывода. Сама модель загружается с Hugging Face и сжимается, после чего ее можно загрузить на Amazon S3. Этот шаг показан в следующем фрагменте кода:
```
from sagemaker.huggingface import HuggingFaceModel
from sagemaker import get_execution_role role = get_execution_role() # create Hugging Face Model Class
huggingface_model = HuggingFaceModel( transformers_version='4.17.0', pytorch_version='1.0.2', py_version='py38', model_data='s3://my-trained-model/artifacts/model.tar.gz', role=role,
) # deploy model to SageMaker Inference
predictor = huggingface_model.deploy(initial_instance_count=1,instance_type="ml.m5.xlarge")
```

У AWS есть несколько доступных ресурсов, которые помогут вам в развертывании рабочих нагрузок машинного обучения. Объектив машинного обучения Хорошо спроектированная платформа AWS рекомендует лучшие практики рабочих нагрузок машинного обучения, включая оптимизацию ресурсов и снижение затрат. Эти рекомендуемые принципы проектирования обеспечивают развертывание рабочих нагрузок машинного обучения в AWS с правильной архитектурой в рабочей среде. Рекомендатор выводов Amazon SageMaker помогает выбрать правильный экземпляр для развертывания моделей машинного обучения с оптимальной производительностью и стоимостью. Inference Recommender ускоряет развертывание модели и сокращает время выхода на рынок за счет автоматизации нагрузочного тестирования и оптимизации производительности модели в экземплярах машинного обучения.

В следующих разделах мы покажем, как загрузить обученную модель из корзины S3 и развернуть ее в подходящем экземпляре логического вывода.

Предпосылки

Для этого прохождения у вас должны быть следующие предпосылки:

An Аккаунт AWS.
Блокнот Jupyter внутри Студия Amazon SageMaker или экземпляры блокнота SageMaker. В этом посте мы используем изображение «Python 3 (PyTorch 1.4 Python 3.6 CPU Optimized)» с предоставленными фрагментами кода, но вы можете использовать любой другой образ PyTorch более высокой версии из доступные ядра SageMaker.
Набор данных в корзине S3, например 2-вики-текста набор данных из Реестр открытых данных на AWS.

Загрузите модель Hugging Face в SageMaker для вывода суммирования текста.

Используйте следующий код, чтобы загрузить предварительно обученную модель суммирования текста Hugging Face. ДистилБАРТ-CNN-12-6 и его токенизатор, и сохраните их локально в SageMaker в каталоге блокнота Jupyter:

from transformers import BartTokenizer, BartForConditionalGeneration, BartConfig PRE_TRAINED_MODEL_NAME='sshleifer/distilbart-cnn-12-6' model = BartForConditionalGeneration.from_pretrained(PRE_TRAINED_MODEL_NAME, cache_dir=hf_cache_dir)
model.save_pretrained('./models/bart_model/') tokenizer = BartTokenizer.from_pretrained(PRE_TRAINED_MODEL_NAME)
tokenizer.save_pretrained('./models/bart_tokenizer/')

Сожмите сохраненную модель суммирования текста и ее токенизатор в формат tar.gz и загрузите артефакт сжатой модели в корзину S3:

! tar -C models/ -czf model.tar.gz code/ bart_tokenizer/ bart_model/
from sagemaker.s3 import S3Uploader file_key = 'model.tar.gz'
model_artifact = S3Uploader.upload(file_key,'s3://my-trained-model/artifacts')

Выберите образ контейнера Docker для вывода для выполнения вывода суммирования текста. Определите ОС Linux, платформу PyTorch и версию Hugging Face Transformer и укажите Эластичное вычислительное облако Amazon (Amazon EC2) для запуска контейнера.

Образ Docker доступен в Реестр Amazon Elastic Container (Amazon ECR) той же учетной записи AWS, и ссылка на этот образ контейнера возвращается в виде URI.

from sagemaker.image_uris import retrieve deploy_instance_type = 'ml.m5.xlarge' pytorch_inference_image_uri = retrieve('huggingface', region=region, version='4.6.1', instance_type=deploy_instance_type, base_framework_version='pytorch1.8.1', image_scope='inference')

Определите модель суммирования текста, которая будет развернута выбранным образом контейнера, выполняющим вывод. В следующем фрагменте кода развернута сжатая модель, загруженная в Amazon S3:

from sagemaker.huggingface.model import HuggingFaceModel
from sagemaker import get_execution_role role = get_execution_role() # create Hugging Face Model Class
huggingface_model = HuggingFaceModel( model_data="s3://my-trained-model/artifacts/model.tar.gz", # path to your trained sagemaker model image_uri=pytorch_inference_image_uri, role=role, # iam role with permissions to create an Endpoint transformers_version="4.6.1", # transformers version used
) # deploy model to SageMaker Inference
predictor = huggingface_model.deploy( initial_instance_count=1, instance_type="ml.m5.xlarge"
)

Протестируйте развернутую модель суммирования текста на примере входных данных:

# example request, you need to define "inputs"
data = { "text": "Camera - You are awarded a SiPix Digital Camera! call 09061221066 fromm landline. Delivery within 28 days."
} # request
predictor.predict(data)

Используйте Inference Recommender для оценки оптимального экземпляра EC2 для задачи логического вывода.

Затем создайте несколько образцов полезной нагрузки входного текста в формате JSON и сожмите их в один файл полезной нагрузки. Эти образцы полезной нагрузки используются Рекомендателем вывода для сравнения производительности вывода между различными типами инстансов EC2. Каждый образец полезной нагрузки должен соответствовать формату JSON, показанному ранее. Вы можете получить примеры из 2-вики-текста Набор данных под управлением fast.ai, доступно на Реестр открытых данных на AWS.

Загрузите артефакт модели суммирования сжатого текста и сжатый файл образца полезной нагрузки в корзину S3. Мы загрузили модель на предыдущем шаге, но для ясности мы включили код для ее повторной загрузки:

bucket = sagemaker.Session().default_bucket() prefix = "sagemaker/inference-recommender" model_archive_name = "model.tar.gz"
payload_archive_name = "payload.tar.gz" sample_payload_url = sagemaker.Session().upload_data( payload_archive_name, bucket=bucket, key_prefix=prefix + "/inference"
)
model_url = sagemaker.Session().upload_data( model_archive_name, bucket=bucket, key_prefix=prefix + "/model"
)

Просмотрите список стандартных моделей машинного обучения, доступных в SageMaker по всем обычные модельные зоопарки, такие как НЛП и компьютерное зрение. Выберите модель НЛП для выполнения вывода суммирования текста:

import boto3
import pandas as pd inference_client = boto3.client("sagemaker", region) list_model_metadata_response = inference_client.list_model_metadata() domains = []
frameworks = []
framework_versions = []
tasks = []
models = [] for model_summary in list_model_metadata_response["ModelMetadataSummaries"]: domains.append(model_summary["Domain"]) tasks.append(model_summary["Task"]) models.append(model_summary["Model"]) frameworks.append(model_summary["Framework"]) framework_versions.append(model_summary["FrameworkVersion"]) data = { "Domain": domains, "Task": tasks, "Framework": frameworks, "FrameworkVersion": framework_versions, "Model": models,
} df = pd.DataFrame(data) pd.set_option("display.max_rows", None)
pd.set_option("display.max_columns", None)
pd.set_option("display.width", 1000)
pd.set_option("display.colheader_justify", "center")
pd.set_option("display.precision", 3) display(df.sort_values(by=["Domain", "Task", "Framework", "FrameworkVersion"]))

В следующем примере используется bert-base-cased НЛП модель. Зарегистрируйте модель суммирования текста в Реестр моделей SageMaker с правильно идентифицированным доменом, инфраструктурой и задачей из предыдущего шага. Параметры для этого примера показаны в начале следующего фрагмента кода.

Обратите внимание на диапазон типов инстансов EC2, которые будут оцениваться Inference Recommender в разделе SupportedRealtimeInferenceInstanceTypes в следующем коде. Убедитесь, что лимиты обслуживания для учетной записи AWS разрешить развертывание этих типов узлов вывода.

ml_domain = "NATURAL_LANGUAGE_PROCESSING"
ml_task = "FILL_MASK"
model_name = "bert-base-cased"
dlc_uri = pytorch_inference_image_uri
framework = 'PYTORCH'
framework_version='1.6.0' inference_client = boto3.client("sagemaker", region) model_package_group_name = uuid.uuid1() model_pacakge_group_response = inference_client.create_model_package_group( ModelPackageGroupName=str(model_package_group_name), ModelPackageGroupDescription="description"
) model_package_version_response = inference_client.create_model_package( ModelPackageGroupName=str(model_package_group_name), ModelPackageDescription="InferenceRecommenderDemo", Domain=ml_domain, Task=ml_task, SamplePayloadUrl=sample_payload_url, InferenceSpecification={ "Containers": [ { "ContainerHostname": "huggingface-pytorch", "Image": dlc_uri, "ModelDataUrl": model_url, "Framework": framework, "FrameworkVersion": framework_version, "NearestModelName": model_name, "Environment": { "SAGEMAKER_CONTAINER_LOG_LEVEL": "20", "SAGEMAKER_PROGRAM": "inference.py", "SAGEMAKER_REGION": region, "SAGEMAKER_SUBMIT_DIRECTORY": model_url, }, }, ], "SupportedRealtimeInferenceInstanceTypes": [ "ml.t2.xlarge", "ml.c5.xlarge", "ml.m5.xlarge", "ml.m5d.xlarge", "ml.r5.xlarge", "ml.inf1.xlarge", ], "SupportedContentTypes": [ "application/json", ], "SupportedResponseMIMETypes": ["application/json"], },
)

Создайте задание Inference Recommender по умолчанию, используя ModelPackageVersion в результате предыдущего шага. uuid Библиотека Python используется для создания уникального имени задания.

from sagemaker import get_execution_role client = boto3.client("sagemaker", region) role = get_execution_role()
default_job = uuid.uuid1()
default_response = client.create_inference_recommendations_job( JobName=str(default_job), JobDescription="Job Description", JobType="Default", RoleArn=role, InputConfig={"ModelPackageVersionArn": model_package_version_response["ModelPackageArn"]},
)

Вы можете получить статус задания Inference Recommender, выполнив следующий код:

inference_recommender_job = client.describe_inference_recommendations_job( JobName=str(default_job)
)

Когда статус работы COMPLETED, сравните задержку вывода, время выполнения и другие метрики типов инстансов EC2, оцениваемых заданием по умолчанию Inference Recommender. Выберите подходящий тип узла в зависимости от требований вашего варианта использования.

data = [ {**x["EndpointConfiguration"], **x["ModelConfiguration"], **x["Metrics"]} for x in inference_recommender_job["InferenceRecommendations"]
]
df = pd.DataFrame(data)
df.drop("VariantName", inplace=True, axis=1)
pd.set_option("max_colwidth", 400)
df.head()

Заключение

SageMaker предлагает несколько способов использования моделей Hugging Face; дополнительные примеры см. Образцы AWS GitHub. В зависимости от сложности варианта использования и необходимости тонкой настройки модели можно выбрать оптимальный способ использования этих моделей. Конвейеры Hugging Face могут стать хорошей отправной точкой для быстрого экспериментирования и выбора подходящих моделей. Когда вам нужно настроить и параметризовать выбранные модели, вы можете скачать модели и развернуть их на настраиваемых конечных точках логического вывода. Чтобы более точно настроить модель для конкретного варианта использования, вам потребуется обучить модель после ее загрузки.

Модели NLP в целом, включая модели суммирования текста, работают лучше после обучения на наборе данных, специфичном для варианта использования. MLOP и функции мониторинга моделей SageMaker гарантируют, что развернутая модель продолжает работать в соответствии с ожиданиями. В этом посте мы использовали Inference Recommender для оценки наиболее подходящего типа экземпляра для развертывания модели суммирования текста. Эти рекомендации могут оптимизировать производительность и затраты для вашего варианта использования машинного обучения.

Об авторах

Доктор Нидал Аль-Бейрути является старшим архитектором решений в Amazon Web Services и увлекается решениями для машинного обучения. Нидал имеет более чем 25-летний опыт работы в различных глобальных ИТ-ролях на разных уровнях и вертикалях. Нидал выступает в качестве надежного консультанта для многих клиентов AWS, помогая им поддерживать и ускорять переход к облачным технологиям.

Даррен Ко является архитектором решений из Лондона. Он консультирует клиентов малого и среднего бизнеса в Великобритании и Ирландии по вопросам реструктуризации и инноваций в облаке. Даррен заинтересован в приложениях, созданных с помощью бессерверных архитектур, и он увлечен решением проблем устойчивого развития с помощью машинного обучения.

Отметка времени: 15 июня 2022

Отметка времени: сентябрь 13, 2022

Обобщение текста с помощью Amazon SageMaker и Hugging Face

Переиздано Платоном

Обзор сводки текста

Модели суммирования текста Hugging Face на AWS

Предпосылки

Загрузите модель Hugging Face в SageMaker для вывода суммирования текста.

Используйте Inference Recommender для оценки оптимального экземпляра EC2 для задачи логического вывода.

Заключение

Об авторах

Больше от Машинное обучение AWS

Шаблоны размещения моделей в SageMaker: рекомендации по тестированию и обновлению моделей в SageMaker

Подготовьте данные из Amazon EMR для машинного обучения с помощью Amazon SageMaker Data Wrangler.

Создайте детектор аномалий баллов лояльности с помощью Amazon Lookout for Metrics.

Предотвращение захвата учетной записи при входе в систему с помощью новой модели Account Takeover Insights в Amazon Fraud Detector.

Автоматизируйте и внедрите контроль версий для Amazon Kendra. Часто задаваемые вопросы

Извлекайте ценную информацию из SAP ERP с помощью решений машинного обучения без кода с помощью Amazon AppFlow и Amazon SageMaker Canvas

Подготавливайте данные в масштабе Amazon SageMaker Studio с помощью бессерверных интерактивных сеансов AWS Glue.

О Нас

Вертикальный поиск и AI

Платформа

Оставайтесь на связи

Учетная запись