Узагальнення тексту за допомогою Amazon SageMaker і Hugging Face

Перевидано Платоном

читають: 0

У цій публікації ми покажемо вам, як реалізувати одну з найбільш завантажуваних попередньо навчених моделей Hugging Face, що використовуються для узагальнення тексту, DistilBART-CNN-12-6, у блокноті Jupyter за допомогою Amazon SageMaker і SageMaker Hugging Face Inference Toolkit. На основі кроків, показаних у цій публікації, ви можете спробувати узагальнити текст із Вікітекст-2 набору даних керується fast.ai, доступний за адресою Реєстр відкритих даних на AWS.

Глобальні обсяги даних зростають у масштабі зеттабайт, оскільки компанії та споживачі розширюють використання цифрових продуктів та онлайн-сервісів. Щоб краще зрозуміти ці зростаючі дані, методи машинного навчання (ML) обробки природною мовою (NLP) для аналізу тексту були розроблені для вирішення випадків використання, що включають узагальнення тексту, розпізнавання сутностей, класифікацію, переклад тощо. AWS пропонує попереднє навчання Сервіси AWS AI які можна інтегрувати в програми за допомогою викликів API і не потребують досвіду ML. Наприклад, «Амазонка» може виконувати завдання НЛП, такі як розпізнавання користувацьких сутностей, аналіз настроїв, виділення ключових фраз, моделювання тем тощо, щоб отримати інформацію з тексту. Це може виконувати аналіз тексту на різних мовах за його різноманітні особливості.

Узагальнення тексту є корисною технікою для розуміння великих обсягів текстових даних, оскільки воно створює підмножину контекстуально значущої інформації з вихідних документів. Ви можете застосувати цю техніку НЛП до текстових документів і статей більш довгої форми, що дозволить пришвидшити використання та ефективніше індексувати документи, наприклад, для узагальнення нотаток про дзвінки з зустрічей.

Обіймати обличчя це популярна бібліотека з відкритим вихідним кодом для НЛП, що містить понад 49,000 185 попередньо навчених моделей більш ніж XNUMX мовами з підтримкою різних фреймворків. AWS і Hugging Face мають a партнерство що забезпечує безперебійну інтеграцію через SageMaker з набором контейнерів глибокого навчання (DLC) AWS для навчання та висновків у PyTorch або TensorFlow, а також оцінювачами та предикторами Hugging Face для SageMaker Python SDK. Ці можливості в SageMaker допомагають розробникам і дослідникам даних легше розпочати роботу з НЛП на AWS. Обробка текстів за допомогою трансформаторів у фреймворках глибокого навчання, таких як PyTorch, як правило, є складним і трудомістким завданням для науковців даних, що часто призводить до розчарування та недостатньої ефективності при розробці проектів НЛП. Зростання AI-спільнот, таких як Hugging Face, у поєднанні з потужністю сервісів машинного навчання в хмарі, як-от SageMaker, прискорюють і спрощують розробку цих завдань обробки тексту. SageMaker допомагає створювати, навчати, розгортати та впроваджувати моделі Hugging Face.

Огляд узагальнення тексту

Ви можете застосувати узагальнення тексту для визначення ключових речень у документі або визначення ключових речень у кількох документах. Підсумування тексту може створювати два типи резюме: екстрактивне та абстрактне. Витягувані підсумки не містять машинно згенерованого тексту і представляють собою набір важливих речень, вибраних із вхідного документа. Абстрактні резюме містять нові зрозумілі людині фрази та речення, згенеровані моделлю узагальнення тексту. Більшість систем узагальнення тексту засновані на екстрактивному підсумовуванні, тому що точного абстрактного узагальнення тексту важко досягти.

Hugging Face має понад 400 попередньо підготовлених найсучасніших Доступні моделі узагальнення тексту, реалізуючи різні комбінації технік НЛП. Ці моделі навчаються на різних наборах даних, завантажуються та підтримуються технологічними компаніями та членами спільноти Hugging Face. Ви можете фільтрувати моделі за найбільшою кількістю завантажуваних або найбільш подобаних моделей і безпосередньо завантажувати їх під час використання конвеєр підсумків Hugging Face transformer API. Трансформатор Hugging Face спрощує процес впровадження НЛП, щоб високопродуктивні моделі НЛП можна було точно налаштувати для надання текстових зведень, не вимагаючи великих знань з ML.

Моделі узагальнення тексту Hugging Face на AWS

SageMaker пропонує бізнес-аналітикам, науковцям з даних та інженерам MLOps вибір інструментів для проектування та керування робочими навантаженнями ML на AWS. Ці інструменти забезпечують швидшу реалізацію та тестування моделей машинного навчання для досягнення оптимальних результатів.

Від SageMaker Hugging Face Inference Toolkit, бібліотека з відкритим вихідним кодом, ми викладаємо три різні способи реалізації та розміщення моделей узагальнення тексту Hugging Face за допомогою блокнота Jupyter:

Конвеєр підсумків Hugging Face - Створити Конвеєр підсумків Hugging Face за допомогоюsummarization” ідентифікатор завдання, щоб використовувати модель узагальнення тексту за замовчуванням для висновку у вашому блокноті Jupyter. Ці конвеєри абстрагують складний код, пропонуючи початківцям, які практикують ML, простий API для швидкої реалізації узагальнення тексту без налаштування кінцевої точки висновку. Конвеєр також дозволяє фахівцеві, що практикує ML, вибрати конкретну попередньо навчену модель і пов’язаний з нею токенізатор. Токенізатори готують текст до готовності як вхідних даних для моделі, розбиваючи текст на слова або підслова, які потім перетворюються на ідентифікатори за допомогою таблиці пошуку. Для простоти наведений нижче фрагмент коду передбачає регістр за замовчуванням при використанні конвеєрів. The DistilBART-CNN-12-6 модель є однією з найбільш завантажуваних моделей узагальнення на Hugging Face і є модель за замовчуванням для конвеєра підсумовування. Останній рядок викликає попередньо навчену модель, щоб отримати підсумок для переданого тексту з урахуванням двох наданих аргументів.
```
from transformers import pipeline summarizer = pipeline("summarization")
summarizer("An apple a day, keeps the doctor away", min_length=5, max_length=20)
```
Кінцева точка SageMaker із попередньо навченою моделлю – Створіть кінцеву точку SageMaker з попередньо навченою моделлю з Hugging Face Model Hub і розгорніть його на кінцевій точці висновку, як-от екземпляр ml.m5.xlarge у наведеному нижче фрагменті коду. Цей метод дозволяє досвідченим практикам ML швидко вибирати конкретні моделі з відкритим вихідним кодом, точно налаштовувати їх і розгортати моделі на високопродуктивних екземплярах висновку.
```
from sagemaker.huggingface import HuggingFaceModel
from sagemaker import get_execution_role role = get_execution_role() # Hub Model configuration. https://huggingface.co/models
hub = { 'HF_MODEL_ID':'sshleifer/distilbart-cnn-12-6', 'HF_TASK':'summarization'
} # create Hugging Face Model Class
huggingface_model = HuggingFaceModel( transformers_version='4.17.0', pytorch_version='1.10.2', py_version='py38', env=hub, role=role,
) # deploy model to SageMaker Inference
predictor = huggingface_model.deploy(initial_instance_count=1,instance_type="ml.m5.xlarge")
```
Кінцева точка SageMaker із навченою моделлю – Створіть кінцеву точку моделі SageMaker із навченою моделлю, що зберігається в файлі Служба простого зберігання Amazon (Amazon S3) і розгорніть його на кінцевій точці висновку. Цей метод дозволяє досвідченим практикам ML швидко розгортати власні моделі, збережені на Amazon S3, на високопродуктивних екземплярах висновку. Сама модель завантажується з Hugging Face і стискається, а потім може бути завантажена на Amazon S3. Цей крок демонструється в наступному фрагменті коду:
```
from sagemaker.huggingface import HuggingFaceModel
from sagemaker import get_execution_role role = get_execution_role() # create Hugging Face Model Class
huggingface_model = HuggingFaceModel( transformers_version='4.17.0', pytorch_version='1.0.2', py_version='py38', model_data='s3://my-trained-model/artifacts/model.tar.gz', role=role,
) # deploy model to SageMaker Inference
predictor = huggingface_model.deploy(initial_instance_count=1,instance_type="ml.m5.xlarge")
```

AWS має кілька доступних ресурсів, які допоможуть вам розгорнути робочі навантаження ML. The Об’єктив машинного навчання в Добре архітектурна платформа AWS рекомендує найкращі методи роботи з ML, включаючи оптимізацію ресурсів і зниження витрат. Ці рекомендовані принципи проектування гарантують, що добре спроектовані робочі навантаження ML на AWS будуть розгорнуті у виробництво. Amazon SageMaker Inference Recommender допомагає вибрати правильний екземпляр для розгортання ваших моделей машинного навчання з оптимальною продуктивністю та вартістю висновку. Inference Recommender прискорює розгортання моделі та скорочує час виходу на ринок завдяки автоматизації навантажувального тестування та оптимізації продуктивності моделі в екземплярах ML.

У наступних розділах ми продемонструємо, як завантажити навчену модель із сегмента S3 та розгорнути її у відповідний екземпляр висновку.

Передумови

Для цього покрокового керівництва ви повинні мати такі передумови:

An Обліковий запис AWS.
Блокнот Jupyter всередині Студія Amazon SageMaker або екземпляри блокнота SageMaker. У цій публікації ми використовуємо зображення «Python 3 (PyTorch 1.4 Python 3.6 CPU Optimized)» із наданими фрагментами коду, але ви можете використовувати будь-яке інше зображення PyTorch вищої версії з доступні ядра SageMaker.
Набір даних у вашому сегменті S3, наприклад Вікітекст-2 набір даних з Реєстр відкритих даних на AWS.

Завантажте модель «Обіймає обличчя» в SageMaker, щоб узагальнити текст

Використовуйте наступний код, щоб завантажити попередньо навчену модель узагальнення тексту Hugging Face DistilBART-CNN-12-6 та його токенізатор, і збережіть їх локально в SageMaker у вашому каталозі ноутбука Jupyter:

from transformers import BartTokenizer, BartForConditionalGeneration, BartConfig PRE_TRAINED_MODEL_NAME='sshleifer/distilbart-cnn-12-6' model = BartForConditionalGeneration.from_pretrained(PRE_TRAINED_MODEL_NAME, cache_dir=hf_cache_dir)
model.save_pretrained('./models/bart_model/') tokenizer = BartTokenizer.from_pretrained(PRE_TRAINED_MODEL_NAME)
tokenizer.save_pretrained('./models/bart_tokenizer/')

Стисніть збережену модель підсумовування тексту та її токенізатор у формат tar.gz та завантажте стиснутий артефакт моделі в сегмент S3:

! tar -C models/ -czf model.tar.gz code/ bart_tokenizer/ bart_model/
from sagemaker.s3 import S3Uploader file_key = 'model.tar.gz'
model_artifact = S3Uploader.upload(file_key,'s3://my-trained-model/artifacts')

Виберіть висновок зображення контейнера Docker зробити висновок узагальнення тексту. Визначте версію ОС Linux, фреймворк PyTorch і Hugging Face Transformer і вкажіть Обчислювальна хмара Amazon Elastic (Amazon EC2) тип екземпляра для запуску контейнера.

Образ Docker доступний у файлі Реєстр контейнерів Amazon Elastic (Amazon ECR) того самого облікового запису AWS, а посилання для цього зображення контейнера повертається як URI.

from sagemaker.image_uris import retrieve deploy_instance_type = 'ml.m5.xlarge' pytorch_inference_image_uri = retrieve('huggingface', region=region, version='4.6.1', instance_type=deploy_instance_type, base_framework_version='pytorch1.8.1', image_scope='inference')

Визначте модель узагальнення тексту, яка буде розгорнута вибраним зображенням контейнера, виконуючи висновок. У наступному фрагменті коду розгорнута стиснена модель, завантажена в Amazon S3:

from sagemaker.huggingface.model import HuggingFaceModel
from sagemaker import get_execution_role role = get_execution_role() # create Hugging Face Model Class
huggingface_model = HuggingFaceModel( model_data="s3://my-trained-model/artifacts/model.tar.gz", # path to your trained sagemaker model image_uri=pytorch_inference_image_uri, role=role, # iam role with permissions to create an Endpoint transformers_version="4.6.1", # transformers version used
) # deploy model to SageMaker Inference
predictor = huggingface_model.deploy( initial_instance_count=1, instance_type="ml.m5.xlarge"
)

Перевірте розгорнуту модель узагальнення тексту на зразку введення:

# example request, you need to define "inputs"
data = { "text": "Camera - You are awarded a SiPix Digital Camera! call 09061221066 fromm landline. Delivery within 28 days."
} # request
predictor.predict(data)

Використовуйте Inference Recommender, щоб оцінити оптимальний екземпляр EC2 для завдання висновку

Далі створіть кілька зразків корисного навантаження введеного тексту у форматі JSON і стисніть їх в один файл корисного навантаження. Ці зразки корисного навантаження використовуються Inference Recommender для порівняння продуктивності висновку між різними типами екземплярів EC2. Кожен із зразків корисних даних має відповідати формату JSON, показаному раніше. Ви можете отримати приклади з Вікітекст-2 набору даних керується fast.ai, доступний за адресою Реєстр відкритих даних на AWS.

Завантажте артефакт моделі узагальнення стисненого тексту та стиснутий зразок корисного файлу в сегмент S3. Ми завантажили модель на попередньому кроці, але для ясності додаємо код, щоб завантажити її знову:

bucket = sagemaker.Session().default_bucket() prefix = "sagemaker/inference-recommender" model_archive_name = "model.tar.gz"
payload_archive_name = "payload.tar.gz" sample_payload_url = sagemaker.Session().upload_data( payload_archive_name, bucket=bucket, key_prefix=prefix + "/inference"
)
model_url = sagemaker.Session().upload_data( model_archive_name, bucket=bucket, key_prefix=prefix + "/model"
)

Перегляньте список стандартних моделей ML, доступних на SageMaker типові зоопарки, таких як НЛП і комп'ютерний зір. Виберіть модель НЛП для виконання висновку з підсумовування тексту:

import boto3
import pandas as pd inference_client = boto3.client("sagemaker", region) list_model_metadata_response = inference_client.list_model_metadata() domains = []
frameworks = []
framework_versions = []
tasks = []
models = [] for model_summary in list_model_metadata_response["ModelMetadataSummaries"]: domains.append(model_summary["Domain"]) tasks.append(model_summary["Task"]) models.append(model_summary["Model"]) frameworks.append(model_summary["Framework"]) framework_versions.append(model_summary["FrameworkVersion"]) data = { "Domain": domains, "Task": tasks, "Framework": frameworks, "FrameworkVersion": framework_versions, "Model": models,
} df = pd.DataFrame(data) pd.set_option("display.max_rows", None)
pd.set_option("display.max_columns", None)
pd.set_option("display.width", 1000)
pd.set_option("display.colheader_justify", "center")
pd.set_option("display.precision", 3) display(df.sort_values(by=["Domain", "Task", "Framework", "FrameworkVersion"]))

У наступному прикладі використовується bert-base-cased Модель НЛП. Зареєструйте модель узагальнення тексту в Реєстр моделі SageMaker з правильно визначеним доменом, структурою та завданням з попереднього кроку. Параметри для цього прикладу показані на початку наступного фрагмента коду.

Зверніть увагу на діапазон типів екземплярів EC2, які будуть оцінені Inference Recommender SupportedRealtimeInferenceInstanceTypes у наступному коді. Переконайтеся, що ліміти обслуговування для облікового запису AWS дозволяють розгортати ці типи вузлів висновку.

ml_domain = "NATURAL_LANGUAGE_PROCESSING"
ml_task = "FILL_MASK"
model_name = "bert-base-cased"
dlc_uri = pytorch_inference_image_uri
framework = 'PYTORCH'
framework_version='1.6.0' inference_client = boto3.client("sagemaker", region) model_package_group_name = uuid.uuid1() model_pacakge_group_response = inference_client.create_model_package_group( ModelPackageGroupName=str(model_package_group_name), ModelPackageGroupDescription="description"
) model_package_version_response = inference_client.create_model_package( ModelPackageGroupName=str(model_package_group_name), ModelPackageDescription="InferenceRecommenderDemo", Domain=ml_domain, Task=ml_task, SamplePayloadUrl=sample_payload_url, InferenceSpecification={ "Containers": [ { "ContainerHostname": "huggingface-pytorch", "Image": dlc_uri, "ModelDataUrl": model_url, "Framework": framework, "FrameworkVersion": framework_version, "NearestModelName": model_name, "Environment": { "SAGEMAKER_CONTAINER_LOG_LEVEL": "20", "SAGEMAKER_PROGRAM": "inference.py", "SAGEMAKER_REGION": region, "SAGEMAKER_SUBMIT_DIRECTORY": model_url, }, }, ], "SupportedRealtimeInferenceInstanceTypes": [ "ml.t2.xlarge", "ml.c5.xlarge", "ml.m5.xlarge", "ml.m5d.xlarge", "ml.r5.xlarge", "ml.inf1.xlarge", ], "SupportedContentTypes": [ "application/json", ], "SupportedResponseMIMETypes": ["application/json"], },
)

Створіть завдання за замовчуванням Recommender Inference Recommender за допомогою ModelPackageVersion в результаті попереднього кроку. The uuid Бібліотека Python використовується для створення унікальної назви завдання.

from sagemaker import get_execution_role client = boto3.client("sagemaker", region) role = get_execution_role()
default_job = uuid.uuid1()
default_response = client.create_inference_recommendations_job( JobName=str(default_job), JobDescription="Job Description", JobType="Default", RoleArn=role, InputConfig={"ModelPackageVersionArn": model_package_version_response["ModelPackageArn"]},
)

Ви можете отримати статус завдання Inference Recommender, запустивши такий код:

inference_recommender_job = client.describe_inference_recommendations_job( JobName=str(default_job)
)

Коли статус роботи COMPLETED, порівняйте затримку висновку, час виконання та інші показники типів екземплярів EC2, оцінені завданням Inference Recommender за замовчуванням. Виберіть відповідний тип вузла на основі ваших вимог.

data = [ {**x["EndpointConfiguration"], **x["ModelConfiguration"], **x["Metrics"]} for x in inference_recommender_job["InferenceRecommendations"]
]
df = pd.DataFrame(data)
df.drop("VariantName", inplace=True, axis=1)
pd.set_option("max_colwidth", 400)
df.head()

Висновок

SageMaker пропонує кілька способів використання моделей Hugging Face; більше прикладів див Зразки AWS GitHub. Залежно від складності варіанту використання та необхідності точного налаштування моделі можна вибрати оптимальний спосіб використання цих моделей. Конвеєри Hugging Face можуть стати гарною відправною точкою для швидкого експерименту та вибору відповідних моделей. Коли вам потрібно налаштувати та параметризувати вибрані моделі, ви можете завантажити моделі та розгорнути їх у налаштованих кінцевих точках висновку. Щоб детальніше налаштувати модель для конкретного випадку використання, вам потрібно буде навчити модель після її завантаження.

Моделі НЛП загалом, включаючи моделі узагальнення тексту, працюють краще після навчання на наборі даних, який є специфічним для випадку використання. MLOP і функції моніторингу моделі SageMaker гарантують, що розгорнута модель продовжує працювати в межах очікувань. У цій публікації ми використали Inference Recommender, щоб оцінити найкращий тип екземпляра для розгортання моделі узагальнення тексту. Ці рекомендації можуть оптимізувати продуктивність і вартість для вашого випадку використання ML.

Про авторів

Доктор Нідал Аль-Бейруті є старшим архітектором рішень Amazon Web Services, який захоплюється рішеннями машинного навчання. Нідал має понад 25-річний досвід роботи на різних глобальних IT-ролях на різних рівнях і вертикалях. Nidal виступає в якості надійного радника для багатьох клієнтів AWS, щоб підтримати та прискорити їхнє впровадження в хмару.

Даррен Ко є архітектором рішень із Лондона. Він консультує клієнтів малого та середнього бізнесу у Великобританії та Ірландії щодо реорганізації та інновацій у хмарі. Даррена цікавлять програми, створені з безсерверною архітектурою, і він захоплений вирішенням проблем стійкості за допомогою машинного навчання.

Часова мітка: 15 Червня, 2022.

Часова мітка: Вересень 13, 2022

Узагальнення тексту за допомогою Amazon SageMaker і Hugging Face

Перевидано Платоном

Огляд узагальнення тексту

Моделі узагальнення тексту Hugging Face на AWS

Передумови

Завантажте модель «Обіймає обличчя» в SageMaker, щоб узагальнити текст

Використовуйте Inference Recommender, щоб оцінити оптимальний екземпляр EC2 для завдання висновку

Висновок

Про авторів

Більше від AWS Машинне навчання

Шаблони розміщення моделей у SageMaker: найкращі методи тестування та оновлення моделей у SageMaker

Підготуйте дані з Amazon EMR для машинного навчання за допомогою Amazon SageMaker Data Wrangler

Створіть детектор аномалій балів лояльності за допомогою Amazon Lookout for Metrics

Запобігайте захопленню облікового запису під час входу за допомогою нової моделі Account Takeover Insights у Amazon Fraud Detector

Автоматизуйте та запровадьте контроль версій для Amazon Kendra. Поширені запитання

Отримайте статистику з SAP ERP за допомогою рішень ML без коду за допомогою Amazon AppFlow і Amazon SageMaker Canvas

Готуйте масштабні дані в Amazon SageMaker Studio за допомогою інтерактивних сеансів AWS Glue без сервера

Про нас

Вертикальний пошук & Ai

платформа

Залишайтеся на зв'язку

рахунки