Развертывание предварительно обученных моделей на длине волны AWS с помощью 5G Edge с помощью Amazon SageMaker JumpStart

Переиздано Платоном

Читают: 0

С появлением высокоскоростных мобильных сетей 5G предприятиям легче, чем когда-либо, позиционироваться, имея возможность использовать конвергенцию телекоммуникационных сетей и облака. На сегодняшний день машинное обучение (ML) на периферии является одним из наиболее известных вариантов использования, что позволяет предприятиям развертывать модели ML ближе к своим конечным клиентам, чтобы уменьшить задержку и повысить скорость отклика своих приложений. В качестве примера, умные решения для площадок могут использовать компьютерное зрение почти в реальном времени для анализа толпы в сетях 5G, при этом минимизируя инвестиции в локальное аппаратное сетевое оборудование. С помощью обработки естественного языка (NLP), систем рекомендаций в реальном времени и обнаружения мошенничества розничные продавцы могут обеспечить более удобный опыт работы на ходу. Даже наземная и воздушная робототехника может использовать машинное обучение, чтобы разблокировать более безопасные и автономные операции.

Чтобы уменьшить барьер для входа ML на периферии, мы хотели продемонстрировать пример развертывания предварительно обученной модели из Создатель мудреца Амазонки в AWS Длина волны, всего менее 100 строк кода. В этом посте мы покажем, как развернуть модель SageMaker в AWS Wavelength, чтобы уменьшить задержку вывода модели для сетевых приложений 5G.

Обзор решения

В быстрорастущей глобальной инфраструктуре AWS AWS Wavelength переносит мощь облачных вычислений и хранилищ на границы сетей 5G, открывая более производительные возможности для мобильных устройств. С помощью AWS Wavelength вы можете расширить свое виртуальное частное облако (VPC) до зон длины волны, соответствующих границе сети оператора связи в 29 городов по всему миру. На следующей диаграмме показан пример этой архитектуры.

Эталонная архитектура длины волны AWS

Вы можете подписаться на Зоны длин волн в данном Регионе через Консоль управления AWS или Интерфейс командной строки AWS (интерфейс командной строки AWS). Чтобы узнать больше о развертывании геораспределенных приложений на AWS Wavelength, см. Развертывание геораспределенных кластеров Amazon EKS на AWS Wavelength.

Основываясь на основных принципах, рассмотренных в этом посте, мы рассматриваем периферийное машинное обучение как образец рабочей нагрузки для развертывания в AWS Wavelength. В качестве примера рабочей нагрузки мы развертываем предварительно обученную модель из Amazon SageMaker JumpStart.

SageMaker — это полностью управляемый сервис машинного обучения, который позволяет разработчикам легко развертывать модели машинного обучения в своих средах AWS. Хотя AWS предлагает несколько вариантов обучения моделей — от Торговая площадка AWS модели и встроенные алгоритмы SageMaker — существует ряд методов развертывания моделей машинного обучения с открытым исходным кодом.

JumpStart предоставляет доступ к сотням встроенных алгоритмов с предварительно обученными моделями, которые можно легко развернуть на конечных точках SageMaker. JumpStart поддерживает множество популярных вариантов использования, от профилактического обслуживания и компьютерного зрения до автономного вождения и обнаружения мошенничества, с развертыванием в один клик на консоли.

Поскольку SageMaker изначально не поддерживается в Wavelength Zones, мы покажем, как извлечь артефакты модели из региона и повторно развернуть на периферии. Для этого вы используете Амазон Эластик Кубернетес Сервис (Amazon EKS) и группы узлов в зонах длины волны с последующим созданием манифеста развертывания с образом контейнера, сгенерированным JumpStart. Следующая диаграмма иллюстрирует эту архитектуру.

Эталонная архитектура для Amazon SageMaker JumpStart на AWS Wavelength

Предпосылки

Чтобы сделать это как можно проще, убедитесь, что в вашей учетной записи AWS включены зоны длины волны. Обратите внимание, что эта интеграция доступна только в us-east-1 и us-west-2, и вы будете использовать us-east-1 на время демонстрации.

Чтобы подписаться на AWS Wavelength, выполните следующие действия:

На консоли Amazon VPC выберите Зоны под Настройки , а затем выбрать Восток США (Verizon) / us-east-1-wl1.
Выберите Управление.
Выберите Включено.
Выберите Обновить зоны.

Создайте инфраструктуру AWS Wavelength

Прежде чем мы преобразуем локальную конечную точку вывода модели SageMaker в развертывание Kubernetes, вы можете создать кластер EKS в зоне длины волны. Для этого разверните кластер Amazon EKS с группой узлов AWS Wavelength. Чтобы узнать больше, вы можете посетить это руководство в блоге AWS Containers or Репозиторий Verizon 5GEdgeTutorials для одного такого примера.

Далее, используя Облако AWS9 среду или интерактивную среду разработки (IDE) по выбору, загрузите необходимые пакеты SageMaker и Docker Compose, ключевая зависимость JumpStart.

pip install sagemaker
pip install 'sagemaker[local]' --upgrade
sudo curl -L "https://github.com/docker/compose/releases/download/1.23.1/docker-compose-$(uname -s)-$(uname -m)" -o /usr/local/bin/docker-compose
sudo chmod +x /usr/local/bin/docker-compose
docker-compose --version

Создание артефактов модели с помощью JumpStart

Во-первых, убедитесь, что у вас есть Управление идентификацией и доступом AWS (IAM) исполнительная роль для SageMaker. Чтобы узнать больше, посетите Роли SageMaker.

. этот пример, создайте файл с именем train_model.py, который использует SageMaker Software Development Kit (SDK) для извлечения предварительно созданной модели (замените с именем ресурса Amazon (ARN) вашей роли исполнения SageMaker). В этом файле вы развертываете модель локально, используя instance_type атрибут в model.deploy() функция, которая запускает контейнер Docker в вашей среде IDE, используя все необходимые артефакты модели, которые вы определили:

#train_model.py
from sagemaker import image_uris, model_uris, script_uris
from sagemaker.model import Model
from sagemaker.predictor import Predictor
from sagemaker.utils import name_from_base
import sagemaker, boto3, json
from sagemaker import get_execution_role aws_role = "<your-sagemaker-execution-role>"
aws_region = boto3.Session().region_name
sess = sagemaker.Session() # model_version="*" fetches the latest version of the model.
infer_model_id = "tensorflow-tc-bert-en-uncased-L-12-H-768-A-12-2"
infer_model_version= "*"
endpoint_name = name_from_base(f"jumpstart-example-{infer_model_id}") # Retrieve the inference docker container uri.
deploy_image_uri = image_uris.retrieve(
region=None,
framework=None,
image_scope="inference",
model_id=infer_model_id,
model_version=infer_model_version,
instance_type="local",
)
# Retrieve the inference script uri.
deploy_source_uri = script_uris.retrieve(
model_id=infer_model_id, model_version=infer_model_version, script_scope="inference"
)
# Retrieve the base model uri.
base_model_uri = model_uris.retrieve(
model_id=infer_model_id, model_version=infer_model_version, model_scope="inference"
)
model = Model(
image_uri=deploy_image_uri,
source_dir=deploy_source_uri,
model_data=base_model_uri,
entry_point="inference.py",
role=aws_role,
predictor_cls=Predictor,
name=endpoint_name,
)
print(deploy_image_uri,deploy_source_uri,base_model_uri)
# deploy the Model.
base_model_predictor = model.deploy(
initial_instance_count=1,
instance_type="local",
endpoint_name=endpoint_name,
)

Далее установите infer_model_id на идентификатор модели SageMaker, которую вы хотите использовать.

Полный список см. Встроенные алгоритмы с предварительно обученной таблицей моделей. В нашем примере мы используем модель представления двунаправленного кодировщика от преобразователей (BERT), обычно используемую для обработки естественного языка.

Запустите train_model.py сценарий для извлечения артефактов модели JumpStart и развертывания предварительно обученной модели на локальном компьютере:

python train_model.py

Если этот шаг завершится успешно, ваши выходные данные могут выглядеть следующим образом:

763104351884.dkr.ecr.us-east-1.amazonaws.com/tensorflow-inference:2.8-cpu
s3://jumpstart-cache-prod-us-east-1/source-directory-tarballs/tensorflow/inference/tc/v2.0.0/sourcedir.tar.gz
s3://jumpstart-cache-prod-us-east-1/tensorflow-infer/v2.0.0/infer-tensorflow-tc-bert-en-uncased-L-12-H-768-A-12-2.tar.gz

В выходных данных вы увидите три артефакта по порядку: базовое изображение для вывода TensorFlow, сценарий вывода, который обслуживает модель, и артефакты, содержащие обученную модель. Хотя вы можете создать собственный образ Docker с этими артефактами, другой подход заключается в том, чтобы позволить локальному режиму SageMaker создать образ Docker для вас. На последующих шагах мы извлекаем образ контейнера, работающий локально, и развертываем его на Реестр Amazon Elastic Container (Amazon ECR), а также отправить артефакт модели отдельно в Простой сервис хранения Amazon (Amazon S3).

Преобразование артефактов локального режима в удаленное развертывание Kubernetes

Теперь, когда вы убедились, что SageMaker работает локально, давайте извлечем манифест развертывания из работающего контейнера. Выполните следующие шаги:

Определите расположение манифеста развертывания SageMaker в локальном режиме: для этого выполните поиск в корневом каталоге любых файлов с именами docker-compose.yaml.

docker_manifest=$( find /tmp/tmp* -name "docker-compose.yaml" -printf '%T+ %pn' | sort | tail -n 1 | cut -d' ' -f2-)
echo $docker_manifest

Определите расположение артефактов модели локального режима SageMaker. Затем найдите базовый том, подключенный к локальному контейнеру логических выводов SageMaker, который будет использоваться в каждом рабочем узле EKS после загрузки артефакта в Amazon s3.

model_local_volume = $(grep -A1 -w "volumes:" $docker_manifest | tail -n 1 | tr -d ' ' | awk -F: '{print $1}' | cut -c 2-) # Returns something like: /tmp/tmpcr4bu_a7</p>

Создайте локальную копию запущенного контейнера логического вывода SageMaker. Затем мы найдем текущий запущенный образ контейнера, на котором запущена наша модель логического вывода машинного обучения, и создадим локальную копию контейнера. Это гарантирует, что у нас будет собственная копия образа контейнера, которую можно извлечь из Amazon ECR.

# Find container ID of running SageMaker Local container
mkdir sagemaker-container
container_id=$(docker ps --format "{{.ID}} {{.Image}}" | grep "tensorflow" | awk '{print $1}')
# Retrieve the files of the container locally
docker cp $my_container_id:/ sagemaker-container/

Прежде чем действовать на model_local_volume, который мы отправим в Amazon S3, отправим копию работающего образа Docker, теперь в sagemaker-container в Amazon Elastic Container Registry. Обязательно замените region, aws_account_id, docker_image_id и my-repository:tag или следуйте Руководство пользователя Amazon ECR. Кроме того, обязательно запишите окончательный URL-адрес изображения ECR (aws_account_id.dkr.ecr.region.amazonaws.com/my-repository:tag), который мы будем использовать в развертывании EKS.

aws ecr get-login-password --region region | docker login --username AWS --password-stdin aws_account_id.dkr.ecr.region.amazonaws.com
docker build .
docker tag <docker-image-id> aws_account_id.dkr.ecr.region.amazonaws.com/my-repository:tag
docker push aws_account_id.dkr.ecr.region.amazonaws.com/my-repository:tag

Теперь, когда у нас есть образ ECR, соответствующий конечной точке вывода, создайте новую корзину Amazon S3 и скопируйте локальные артефакты SageMaker (model_local_volume) в это ведро. Параллельно создайте Identity Access Management (IAM), который предоставит инстансам Amazon EC2 доступ для чтения объектов в корзине. Обязательно замените с уникальным глобальным именем для вашей корзины Amazon S3.

# Create S3 Bucket for model artifacts
aws s3api create-bucket --bucket <unique-bucket-name>
aws s3api put-public-access-block --bucket <unique-bucket-name> --public-access-block-configuration "BlockPublicAcls=true,IgnorePublicAcls=true,BlockPublicPolicy=true,RestrictPublicBuckets=true"
# Step 2: Create IAM attachment to Node Group
cat > ec2_iam_policy.json << EOF
{ "Version": "2012-10-17", "Statement": [ { "Effect": "Allow", "Action": [ "s3:GetObject", "s3:PutObject", "s3:ListBucket" ], "Resource": [ "arn:aws:s3:::sagemaker-wavelength-demo-app/*", "arn:aws:s3:::sagemaker-wavelength-demo-app" ] } ]
} # Create IAM policy
policy_arn=$(aws iam create-policy --policy-name sagemaker-demo-app-s3 --policy-document file://ec2_iam_policy.json --query Policy.Arn)
aws iam attach-role-policy --role-name wavelength-eks-Cluster-wl-workers --policy-arn $policy_arn # Push model artifacts to S3
cd $model_local_volume
tar -cvf sagemaker_model.tar .
aws s3 cp sagemaker_model.tar s3://

Затем, чтобы убедиться, что каждый экземпляр EC2 извлекает копию артефакта модели при запуске, отредактируйте пользовательские данные для рабочих узлов EKS. В сценарии пользовательских данных убедитесь, что каждый узел извлекает артефакты модели с помощью S3 API при запуске. Обязательно замените с уникальным глобальным именем для вашей корзины Amazon S3. Учитывая, что пользовательские данные узла также будут включать сценарий начальной загрузки EKS, полные пользовательские данные могут выглядеть примерно так.

#!/bin/bash
mkdir /tmp/model</p><p>cd /tmp/model
aws s3api get-object --bucket sagemaker-wavelength-demo-app --key sagemaker_model.tar  sagemaker_model.tar
tar -xvf sagemaker_model.tar
set -o xtrace
/etc/eks/bootstrap.sh <your-eks-cluster-id>

Теперь вы можете проверить существующий манифест докера и перевести его в удобные для Kubernetes файлы манифеста, используя Составить, известный инструмент преобразования. Примечание. Если вы получили сообщение об ошибке совместимости версий, измените version атрибут в строке 27 файла docker-compose.yml для “2”.

curl -L https://github.com/kubernetes/kompose/releases/download/v1.26.0/kompose-linux-amd64 -o kompose
chmod +x kompose && sudo mv ./kompose /usr/local/bin/compose
cd "$(dirname "$docker_manifest")"
kompose convert

После запуска Kompose вы увидите четыре новых файла: Deployment объект, Service объект, PersistentVolumeClaim объект и NetworkPolicy объект. Теперь у вас есть все необходимое, чтобы начать знакомство с Kubernetes на периферии!

Развертывание артефактов модели SageMaker

Убедитесь, что в IDE AWS Cloud9 загружены kubectl и aws-iam-authenticator. Если нет, следуйте инструкциям по установке:

Теперь выполните следующие шаги:

Изменить service/algo-1-ow3nv объект для переключения типа службы с ClusterIP в NodePort. В нашем примере мы выбрали порт 30,007 XNUMX в качестве нашего NodePort:

# algo-1-ow3nv-service.yaml
apiVersion: v1
kind: Service
metadata: annotations: kompose.cmd: kompose convert kompose.version: 1.26.0 (40646f47) creationTimestamp: null labels: io.kompose.service: algo-1-ow3nv name: algo-1-ow3nv
spec: type: NodePort ports: - name: "8080" port: 8080 targetPort: 8080 nodePort: 30007 selector: io.kompose.service: algo-1-ow3nv
status: loadBalancer: {}

Затем вы должны разрешить NodePort в группе безопасности для вашего узла. Для этого получите идентификатор группы безопасности и добавьте порт NodePort в белый список:

node_group_sg=$(aws ec2 describe-security-groups --filters Name=group-name,Values='wavelength-eks-Cluster*' --query "SecurityGroups[0].GroupId" --output text)
aws ec2 authorize-security-group-ingress --group-id $node_group_sg --ip-permissions IpProtocol=tcp,FromPort=30007,ToPort=30007,IpRanges='[{CidrIp=0.0.0.0/0}]'

Далее измените algo-1-ow3nv-deployment.yaml манифест для монтирования /tmp/model hostPath каталог в контейнер. Заменять с изображением ECR, которое вы создали ранее:

# algo-1-ow3nv-deployment.yaml
apiVersion: apps/v1
kind: Deployment
metadata: annotations: kompose.cmd: kompose convert kompose.version: 1.26.0 (40646f47) creationTimestamp: null labels: io.kompose.service: algo-1-ow3nv name: algo-1-ow3nv
spec: replicas: 1 selector: matchLabels: io.kompose.service: algo-1-ow3nv strategy: type: Recreate template: metadata: annotations: kompose.cmd: kompose convert kompose.version: 1.26.0 (40646f47) creationTimestamp: null labels: io.kompose.network/environment-sagemaker-local: "true" io.kompose.service: algo-1-ow3nv spec: containers: - args: - serve env: - name: SAGEMAKER_CONTAINER_LOG_LEVEL value: "20" - name: SAGEMAKER_PROGRAM value: inference.py - name: SAGEMAKER_REGION value: us-east-1 - name: SAGEMAKER_SUBMIT_DIRECTORY value: /opt/ml/model/code image: <your-ecr-image> name: sagemaker-test-model ports: - containerPort: 8080 resources: {} stdin: true tty: true volumeMounts: - mountPath: /opt/ml/model name: algo-1-ow3nv-claim0 restartPolicy: Always volumes: - name: algo-1-ow3nv-claim0 hostPath: path: /tmp/model
status: {}

С файлами манифеста, которые вы создали из Kompose, используйте kubectl для применения конфигураций к вашему кластеру:

$ kubectl apply -f algo-1-ow3nv-deployment.yaml algo-1-ow3nv-service.yaml
deployment.apps/algo-1-ow3nv created
service/algo-1-ow3nv created

Подключиться к периферийной модели 5G

Чтобы подключиться к вашей модели, выполните следующие действия:

В консоли Amazon EC2 получите IP-адрес оператора рабочего узла EKS или используйте интерфейс командной строки AWS для прямого запроса IP-адреса оператора:

aws ec2 describe-instances --filters "Name=tag:aws:autoscaling:groupName,Values=eks-EKSNodeGroup*" --query 'Reservations[*].Instances[*].[Placement.AvailabilityZone,NetworkInterfaces[].Association.CarrierIp]' --output text
# Example Output: 155.146.1.12

Теперь, когда IP-адрес оператора извлечен, вы можете подключиться к модели напрямую с помощью NodePort. Создайте файл с именем invoke.py чтобы вызвать модель BERT напрямую, предоставив текстовый ввод, который будет запущен на анализаторе настроений, чтобы определить, был ли тон положительным или отрицательным:

import json
endpoint_name="jumpstart-example-tensorflow-tc-bert-en-uncased-L-12-H-768-A-12-2"
request_body = "simply stupid , irrelevant and deeply , truly , bottomlessly cynical ".encode("utf-8")
import requests
r2=requests.post(url="http://155.146.1.12:30007/invocations", data=request_body, headers={"Content-Type":"application/x-text","Accept":"application/json;verbose"})
print(r2.text)

Ваш вывод должен выглядеть следующим образом:

{"probabilities": [0.998723, 0.0012769578], "labels": [0, 1], "predicted_label": 0}

Убирать

Чтобы уничтожить все созданные ресурсы приложения, удалите рабочие узлы AWS Wavelength, плоскость управления EKS и все ресурсы, созданные в VPC. Кроме того, удалите репозиторий ECR, используемый для размещения образа контейнера, корзины S3, используемые для размещения артефактов модели SageMaker, и sagemaker-demo-app-s3 IAM Политика.

Заключение

В этом посте мы продемонстрировали новый подход к развертыванию моделей SageMaker на границе сети с помощью Amazon EKS и AWS Wavelength. Чтобы узнать о передовых практиках Amazon EKS для AWS Wavelength, см. Развертывание геораспределенных кластеров Amazon EKS на AWS Wavelength. Кроме того, чтобы узнать больше о Jumpstart, посетите Руководство разработчика по Amazon SageMaker JumpStart или Таблица доступных моделей JumpStart.

Об авторах

Роберт Белсон является советником разработчиков в бизнес-подразделении AWS Worldwide Telecom, специализирующимся на граничных вычислениях AWS. Он фокусируется на работе с сообществом разработчиков и крупными корпоративными клиентами для решения их бизнес-задач с помощью автоматизации, гибридных сетей и пограничного облака.

Развертывайте предварительно обученные модели на AWS Wavelength с периферией 5G с помощью Amazon SageMaker JumpStart PlatoBlockchain Data Intelligence. Вертикальный поиск. Ай. Мохаммед Аль-Мехдар является старшим архитектором решений в бизнес-подразделении Worldwide Telecom в AWS. Его основная задача — помочь клиентам создавать и развертывать рабочие нагрузки телекоммуникационных и корпоративных ИТ на AWS. До прихода в AWS Мохаммед более 13 лет работал в сфере телекоммуникаций и обладает богатым опытом в области LTE Packet Core, 5G, IMS и WebRTC. Мохаммед имеет степень бакалавра в области телекоммуникаций Университета Конкордия.

Эван Кравиц — инженер-программист в Amazon Web Services, работающий над SageMaker JumpStart. Он любит готовить и бегать по Нью-Йорку.

Джастин Сент-Арно является заместителем директора по архитектуре решений в Verizon для государственного сектора с более чем 15-летним опытом работы в ИТ-индустрии. Он является страстным сторонником возможностей граничных вычислений и сетей 5G и является экспертом в разработке инновационных технологических решений, использующих эти технологии. Джастин с особым энтузиазмом относится к возможностям, предлагаемым Amazon Web Services (AWS) в предоставлении передовых решений для его клиентов. В свободное время Джастин любит быть в курсе последних технологических тенденций и делиться своими знаниями и идеями с другими в отрасли.