Implante modelos pré-treinados no AWS Wavelength com 5G Edge usando Amazon SageMaker JumpStart

Republicado por Platão

seguidores: 0

Com o advento das redes móveis 5G de alta velocidade, as empresas estão mais facilmente posicionadas do que nunca com a oportunidade de aproveitar a convergência das redes de telecomunicações e da nuvem. Como um dos casos de uso mais proeminentes até o momento, o aprendizado de máquina (ML) na borda permitiu que as empresas implantassem modelos de ML mais perto de seus clientes finais para reduzir a latência e aumentar a capacidade de resposta de seus aplicativos. Como um exemplo, soluções inteligentes para espaços pode usar visão computacional quase em tempo real para análise de multidão em redes 5G, minimizando o investimento em equipamentos de rede de hardware no local. Os varejistas podem oferecer experiências mais descomplicadas em trânsito com processamento de linguagem natural (NLP), sistemas de recomendação em tempo real e detecção de fraudes. Até robótica terrestre e aérea pode usar ML para desbloquear operações mais seguras e autônomas.

Para reduzir a barreira à entrada de ML na borda, queríamos demonstrar um exemplo de implantação de um modelo pré-treinado de Amazon Sage Maker para Comprimento de onda AWS, tudo em menos de 100 linhas de código. Nesta postagem, demonstramos como implantar um modelo SageMaker no AWS Wavelength para reduzir a latência de inferência de modelo para aplicativos baseados em rede 5G.

Visão geral da solução

Na infraestrutura global em rápida expansão da AWS, o AWS Wavelength traz o poder da computação em nuvem e do armazenamento para a borda das redes 5G, desbloqueando experiências móveis com mais desempenho. Com o AWS Wavelength, você pode estender sua nuvem privada virtual (VPC) para zonas de comprimento de onda correspondentes à borda da rede da operadora de telecomunicações em Cidades 29 em todo o mundo. O diagrama a seguir mostra um exemplo dessa arquitetura.

Arquitetura de referência de comprimento de onda da AWS

Você pode optar pelas Zonas de Comprimento de Onda dentro de uma determinada Região por meio do Console de gerenciamento da AWS ou de Interface de linha de comando da AWS (AWS CLI). Para saber mais sobre a implantação de aplicativos distribuídos geograficamente no AWS Wavelength, consulte Implante clusters Amazon EKS distribuídos geograficamente no AWS Wavelength.

Com base nos fundamentos discutidos nesta postagem, consideramos o ML na borda como uma amostra de carga de trabalho para implantar no AWS Wavelength. Como nossa amostra de carga de trabalho, implantamos um modelo pré-treinado de JumpStart do Amazon SageMaker.

O SageMaker é um serviço de ML totalmente gerenciado que permite aos desenvolvedores implantar facilmente modelos de ML em seus ambientes da AWS. Embora a AWS ofereça várias opções para treinamento de modelos, desde Mercado da AWS modelos e algoritmos integrados do SageMaker — há várias técnicas para implantar modelos de ML de código aberto.

O JumpStart fornece acesso a centenas de algoritmos integrados com modelos pré-treinados que podem ser implantados perfeitamente nos endpoints do SageMaker. De manutenção preditiva e visão computacional a direção autônoma e detecção de fraudes, o JumpStart oferece suporte a uma variedade de casos de uso populares com implantação de um clique no console.

Como o SageMaker não tem suporte nativo em zonas de comprimento de onda, demonstramos como extrair os artefatos de modelo da região e reimplantá-los na borda. Para fazer isso, você usa Serviço Amazon Elastic Kubernetes (Amazon EKS) e grupos de nós em zonas de comprimento de onda, seguidos pela criação de um manifesto de implantação com a imagem do contêiner gerada pelo JumpStart. O diagrama a seguir ilustra essa arquitetura.

Arquitetura de referência para Amazon SageMaker JumpStart no AWS Wavelength

Pré-requisitos

Para tornar isso o mais fácil possível, certifique-se de que sua conta da AWS tenha zonas de comprimento de onda habilitadas. Observe que esta integração está disponível apenas em us-east-1 e us-west-2, e você estará usando us-east-1 durante a demonstração.

Para aceitar o AWS Wavelength, conclua as seguintes etapas:

No console Amazon VPC, escolha Zonas para Configurações e escolha Leste dos EUA (Verizon) / us-east-1-wl1.
Escolha Gerencie.
Selecionar Optado.
Escolha Atualizar zonas.

Criar infraestrutura do AWS Wavelength

Antes de convertermos o endpoint de inferência de modelo local do SageMaker em uma implantação do Kubernetes, você pode criar um cluster EKS em uma zona de comprimento de onda. Para fazer isso, implante um cluster do Amazon EKS com um grupo de nós do AWS Wavelength. Para saber mais, você pode visitar este guia no blog de contêineres da AWS or Repositório 5GEdgeTutorials da Verizon para um desses exemplos.

A seguir, usando um Nuvem AWS9 ambiente ou ambiente de desenvolvimento interativo (IDE) de sua escolha, baixe os pacotes necessários do SageMaker e Docker Compose, uma dependência chave do JumpStart.

pip install sagemaker
pip install 'sagemaker[local]' --upgrade
sudo curl -L "https://github.com/docker/compose/releases/download/1.23.1/docker-compose-$(uname -s)-$(uname -m)" -o /usr/local/bin/docker-compose
sudo chmod +x /usr/local/bin/docker-compose
docker-compose --version

Crie artefatos de modelo usando o JumpStart

Primeiro, certifique-se de ter um Gerenciamento de acesso e identidade da AWS (IAM) função de execução para SageMaker. Para saber mais, visite Funções do SageMaker.

utilização Neste exemplo, crie um arquivo chamado train_model.py que usa o SageMaker Software Development Kit (SDK) para recuperar um modelo pré-construído (substitua com o nome de recurso da Amazon (ARN) de sua função de execução do SageMaker). Neste arquivo, você implanta um modelo localmente usando o instance_type atributo no model.deploy() função, que inicia um contêiner do Docker em seu IDE usando todos os artefatos de modelo necessários que você definiu:

#train_model.py
from sagemaker import image_uris, model_uris, script_uris
from sagemaker.model import Model
from sagemaker.predictor import Predictor
from sagemaker.utils import name_from_base
import sagemaker, boto3, json
from sagemaker import get_execution_role aws_role = "<your-sagemaker-execution-role>"
aws_region = boto3.Session().region_name
sess = sagemaker.Session() # model_version="*" fetches the latest version of the model.
infer_model_id = "tensorflow-tc-bert-en-uncased-L-12-H-768-A-12-2"
infer_model_version= "*"
endpoint_name = name_from_base(f"jumpstart-example-{infer_model_id}") # Retrieve the inference docker container uri.
deploy_image_uri = image_uris.retrieve(
region=None,
framework=None,
image_scope="inference",
model_id=infer_model_id,
model_version=infer_model_version,
instance_type="local",
)
# Retrieve the inference script uri.
deploy_source_uri = script_uris.retrieve(
model_id=infer_model_id, model_version=infer_model_version, script_scope="inference"
)
# Retrieve the base model uri.
base_model_uri = model_uris.retrieve(
model_id=infer_model_id, model_version=infer_model_version, model_scope="inference"
)
model = Model(
image_uri=deploy_image_uri,
source_dir=deploy_source_uri,
model_data=base_model_uri,
entry_point="inference.py",
role=aws_role,
predictor_cls=Predictor,
name=endpoint_name,
)
print(deploy_image_uri,deploy_source_uri,base_model_uri)
# deploy the Model.
base_model_predictor = model.deploy(
initial_instance_count=1,
instance_type="local",
endpoint_name=endpoint_name,
)

A seguir, defina infer_model_id ao ID do modelo SageMaker que você gostaria de usar.

Para obter uma lista completa, consulte Algoritmos integrados com tabela de modelo pré-treinada. Em nosso exemplo, usamos o modelo Bidirectional Encoder Representations from Transformers (BERT), comumente usado para processamento de linguagem natural.

execute o train_model.py script para recuperar os artefatos do modelo JumpStart e implantar o modelo pré-treinado em sua máquina local:

python train_model.py

Se esta etapa for bem-sucedida, sua saída pode ser semelhante à seguinte:

763104351884.dkr.ecr.us-east-1.amazonaws.com/tensorflow-inference:2.8-cpu
s3://jumpstart-cache-prod-us-east-1/source-directory-tarballs/tensorflow/inference/tc/v2.0.0/sourcedir.tar.gz
s3://jumpstart-cache-prod-us-east-1/tensorflow-infer/v2.0.0/infer-tensorflow-tc-bert-en-uncased-L-12-H-768-A-12-2.tar.gz

Na saída, você verá três artefatos em ordem: a imagem base para a inferência do TensorFlow, o script de inferência que atende ao modelo e os artefatos que contêm o modelo treinado. Embora você possa criar uma imagem do Docker personalizada com esses artefatos, outra abordagem é permitir que o modo local do SageMaker crie a imagem do Docker para você. Nas etapas subsequentes, extraímos a imagem do contêiner em execução localmente e implantamos em Registro do Amazon Elastic Container (Amazon ECR), bem como enviar o artefato do modelo separadamente para Serviço de armazenamento simples da Amazon (Amazônia S3).

Converter artefatos de modo local em implantação remota do Kubernetes

Agora que você confirmou que o SageMaker está funcionando localmente, vamos extrair o manifesto de implantação do contêiner em execução. Conclua as seguintes etapas:

Identifique a localização do manifesto de implantação do modo local do SageMaker: Para fazer isso, procure em nosso diretório raiz por quaisquer arquivos nomeados docker-compose.yaml.

docker_manifest=$( find /tmp/tmp* -name "docker-compose.yaml" -printf '%T+ %pn' | sort | tail -n 1 | cut -d' ' -f2-)
echo $docker_manifest

Identifique a localização dos artefatos de modelo de modo local do SageMaker: Em seguida, localize o volume subjacente montado no contêiner de inferência local do SageMaker, que será usado em cada nó de trabalho EKS após fazermos o upload do artefato para o Amazon s3.

model_local_volume = $(grep -A1 -w "volumes:" $docker_manifest | tail -n 1 | tr -d ' ' | awk -F: '{print $1}' | cut -c 2-) # Returns something like: /tmp/tmpcr4bu_a7</p>

Crie uma cópia local do contêiner de inferência do SageMaker em execução: em seguida, encontraremos a imagem do contêiner atualmente em execução executando nosso modelo de inferência de aprendizado de máquina e faremos uma cópia do contêiner localmente. Isso garantirá que tenhamos nossa própria cópia da imagem do contêiner para extrair do Amazon ECR.

# Find container ID of running SageMaker Local container
mkdir sagemaker-container
container_id=$(docker ps --format "{{.ID}} {{.Image}}" | grep "tensorflow" | awk '{print $1}')
# Retrieve the files of the container locally
docker cp $my_container_id:/ sagemaker-container/

Antes de agir no model_local_volume, que enviaremos para o Amazon S3, enviaremos uma cópia da imagem do Docker em execução, agora no sagemaker-container diretório, para o Amazon Elastic Container Registry. Certifique-se de substituir region, aws_account_id, docker_image_id e my-repository:tag ou siga o Guia do usuário do Amazon ECR. Além disso, certifique-se de anotar o URL final da imagem ECR (aws_account_id.dkr.ecr.region.amazonaws.com/my-repository:tag), que usaremos em nossa implantação do EKS.

aws ecr get-login-password --region region | docker login --username AWS --password-stdin aws_account_id.dkr.ecr.region.amazonaws.com
docker build .
docker tag <docker-image-id> aws_account_id.dkr.ecr.region.amazonaws.com/my-repository:tag
docker push aws_account_id.dkr.ecr.region.amazonaws.com/my-repository:tag

Agora que temos uma imagem ECR correspondente ao endpoint de inferência, crie um novo bucket do Amazon S3 e copie os artefatos SageMaker Local (model_local_volume) para este intervalo. Em paralelo, crie um Identity Access Management (IAM) que forneça às instâncias do Amazon EC2 acesso para ler objetos dentro do bucket. Certifique-se de substituir com um nome globalmente exclusivo para seu bucket do Amazon S3.

# Create S3 Bucket for model artifacts
aws s3api create-bucket --bucket <unique-bucket-name>
aws s3api put-public-access-block --bucket <unique-bucket-name> --public-access-block-configuration "BlockPublicAcls=true,IgnorePublicAcls=true,BlockPublicPolicy=true,RestrictPublicBuckets=true"
# Step 2: Create IAM attachment to Node Group
cat > ec2_iam_policy.json << EOF
{ "Version": "2012-10-17", "Statement": [ { "Effect": "Allow", "Action": [ "s3:GetObject", "s3:PutObject", "s3:ListBucket" ], "Resource": [ "arn:aws:s3:::sagemaker-wavelength-demo-app/*", "arn:aws:s3:::sagemaker-wavelength-demo-app" ] } ]
} # Create IAM policy
policy_arn=$(aws iam create-policy --policy-name sagemaker-demo-app-s3 --policy-document file://ec2_iam_policy.json --query Policy.Arn)
aws iam attach-role-policy --role-name wavelength-eks-Cluster-wl-workers --policy-arn $policy_arn # Push model artifacts to S3
cd $model_local_volume
tar -cvf sagemaker_model.tar .
aws s3 cp sagemaker_model.tar s3://

Em seguida, para garantir que cada instância do EC2 extraia uma cópia do artefato de modelo na inicialização, edite os dados do usuário para os nós de trabalho EKS. No script de dados do usuário, certifique-se de que cada nó recupere os artefatos de modelo usando a API do S3 na inicialização. Certifique-se de substituir com um nome globalmente exclusivo para seu bucket do Amazon S3. Dado que os dados do usuário do nó também incluirão o script de inicialização EKS, os dados completos do usuário podem se parecer com isto.

#!/bin/bash
mkdir /tmp/model</p><p>cd /tmp/model
aws s3api get-object --bucket sagemaker-wavelength-demo-app --key sagemaker_model.tar  sagemaker_model.tar
tar -xvf sagemaker_model.tar
set -o xtrace
/etc/eks/bootstrap.sh <your-eks-cluster-id>

Agora, você pode inspecionar o manifesto do docker existente e traduzi-lo para arquivos de manifesto compatíveis com o Kubernetes usando KomposeName, uma ferramenta de conversão bem conhecida. Observação: se você receber um erro de compatibilidade de versão, altere o version atributo na linha 27 de docker-compose.yml para “2”.

curl -L https://github.com/kubernetes/kompose/releases/download/v1.26.0/kompose-linux-amd64 -o kompose
chmod +x kompose && sudo mv ./kompose /usr/local/bin/compose
cd "$(dirname "$docker_manifest")"
kompose convert

Depois de executar o Kompose, você verá quatro novos arquivos: um Deployment objeto, Service objeto, PersistentVolumeClaim objeto, e NetworkPolicy objeto. Agora você tem tudo o que precisa para começar sua incursão no Kubernetes na borda!

Implantar artefatos de modelo do SageMaker

Certifique-se de ter baixado o kubectl e o aws-iam-authenticator para o AWS Cloud9 IDE. Caso contrário, siga os guias de instalação:

Agora, conclua as seguintes etapas:

Modifique o service/algo-1-ow3nv objeto para mudar o tipo de serviço de ClusterIP para NodePort. Em nosso exemplo, selecionamos a porta 30,007 como nossa NodePort:

# algo-1-ow3nv-service.yaml
apiVersion: v1
kind: Service
metadata: annotations: kompose.cmd: kompose convert kompose.version: 1.26.0 (40646f47) creationTimestamp: null labels: io.kompose.service: algo-1-ow3nv name: algo-1-ow3nv
spec: type: NodePort ports: - name: "8080" port: 8080 targetPort: 8080 nodePort: 30007 selector: io.kompose.service: algo-1-ow3nv
status: loadBalancer: {}

Em seguida, você deve permitir o NodePort no grupo de segurança para o seu nó. Para fazer isso, recupere o security groupID e faça uma lista de permissões do NodePort:

node_group_sg=$(aws ec2 describe-security-groups --filters Name=group-name,Values='wavelength-eks-Cluster*' --query "SecurityGroups[0].GroupId" --output text)
aws ec2 authorize-security-group-ingress --group-id $node_group_sg --ip-permissions IpProtocol=tcp,FromPort=30007,ToPort=30007,IpRanges='[{CidrIp=0.0.0.0/0}]'

A seguir, modifique o algo-1-ow3nv-deployment.yaml manifeste-se para montar o /tmp/model hostPath diretório para o contêiner. Substituir com a imagem ECR que você criou anteriormente:

# algo-1-ow3nv-deployment.yaml
apiVersion: apps/v1
kind: Deployment
metadata: annotations: kompose.cmd: kompose convert kompose.version: 1.26.0 (40646f47) creationTimestamp: null labels: io.kompose.service: algo-1-ow3nv name: algo-1-ow3nv
spec: replicas: 1 selector: matchLabels: io.kompose.service: algo-1-ow3nv strategy: type: Recreate template: metadata: annotations: kompose.cmd: kompose convert kompose.version: 1.26.0 (40646f47) creationTimestamp: null labels: io.kompose.network/environment-sagemaker-local: "true" io.kompose.service: algo-1-ow3nv spec: containers: - args: - serve env: - name: SAGEMAKER_CONTAINER_LOG_LEVEL value: "20" - name: SAGEMAKER_PROGRAM value: inference.py - name: SAGEMAKER_REGION value: us-east-1 - name: SAGEMAKER_SUBMIT_DIRECTORY value: /opt/ml/model/code image: <your-ecr-image> name: sagemaker-test-model ports: - containerPort: 8080 resources: {} stdin: true tty: true volumeMounts: - mountPath: /opt/ml/model name: algo-1-ow3nv-claim0 restartPolicy: Always volumes: - name: algo-1-ow3nv-claim0 hostPath: path: /tmp/model
status: {}

Com os arquivos de manifesto que você criou no Kompose, use o kubectl para aplicar as configurações ao seu cluster:

$ kubectl apply -f algo-1-ow3nv-deployment.yaml algo-1-ow3nv-service.yaml
deployment.apps/algo-1-ow3nv created
service/algo-1-ow3nv created

Conecte-se ao modelo de borda 5G

Para se conectar ao seu modelo, conclua as seguintes etapas:

No console do Amazon EC2, recupere o IP da operadora do nó de trabalho EKS ou use a AWS CLI para consultar o endereço IP da operadora diretamente:

aws ec2 describe-instances --filters "Name=tag:aws:autoscaling:groupName,Values=eks-EKSNodeGroup*" --query 'Reservations[*].Instances[*].[Placement.AvailabilityZone,NetworkInterfaces[].Association.CarrierIp]' --output text
# Example Output: 155.146.1.12

Agora, com o endereço IP da operadora extraído, você pode se conectar ao modelo diretamente usando o NodePort. Crie um arquivo chamado invoke.py para invocar o modelo BERT diretamente, fornecendo uma entrada baseada em texto que será executada em um analisador de sentimentos para determinar se o tom foi positivo ou negativo:

import json
endpoint_name="jumpstart-example-tensorflow-tc-bert-en-uncased-L-12-H-768-A-12-2"
request_body = "simply stupid , irrelevant and deeply , truly , bottomlessly cynical ".encode("utf-8")
import requests
r2=requests.post(url="http://155.146.1.12:30007/invocations", data=request_body, headers={"Content-Type":"application/x-text","Accept":"application/json;verbose"})
print(r2.text)

Sua saída deve se parecer com o seguinte:

{"probabilities": [0.998723, 0.0012769578], "labels": [0, 1], "predicted_label": 0}

limpar

Para destruir todos os recursos de aplicativos criados, exclua os nós de trabalho do AWS Wavelength, o plano de controle EKS e todos os recursos criados na VPC. Além disso, exclua o repositório ECR usado para hospedar a imagem do contêiner, os buckets S3 usados para hospedar os artefatos do modelo SageMaker e o sagemaker-demo-app-s3 IAM .

Conclusão

Nesta postagem, demonstramos uma nova abordagem para implantar modelos SageMaker na borda da rede usando Amazon EKS e AWS Wavelength. Para saber mais sobre as práticas recomendadas do Amazon EKS no AWS Wavelength, consulte Implante clusters Amazon EKS distribuídos geograficamente no AWS Wavelength. Além disso, para saber mais sobre o Jumpstart, visite o Guia do desenvolvedor do Amazon SageMaker JumpStart ou de Tabela de modelos disponíveis do JumpStart.

Sobre os autores

Roberto Belson é um Developer Advocate na AWS Worldwide Telecom Business Unit, especializado em AWS Edge Computing. Ele se concentra em trabalhar com a comunidade de desenvolvedores e clientes de grandes empresas para resolver seus desafios de negócios usando automação, rede híbrida e nuvem de ponta.

Implante modelos pré-treinados no AWS Wavelength com borda 5G usando Amazon SageMaker JumpStart PlatoBlockchain Data Intelligence. Pesquisa vertical. Ai. Mohammed Al Mehdar é Arquiteto de Soluções Sênior na Unidade de Negócios de Telecomunicações Mundiais da AWS. Seu foco principal é ajudar os clientes a criar e implantar cargas de trabalho de TI empresarial e de telecomunicações na AWS. Antes de ingressar na AWS, Mohammed trabalhou no setor de telecomunicações por mais de 13 anos e traz uma vasta experiência nas áreas de LTE Packet Core, 5G, IMS e WebRTC. Mohammed é bacharel em Engenharia de Telecomunicações pela Concordia University.

Evan Kravitz é engenheiro de software da Amazon Web Services, trabalhando no SageMaker JumpStart. Ele gosta de cozinhar e correr em Nova York.

Justin St Arnauld é um Diretor Associado – Arquitetos de Soluções da Verizon para o Setor Público com mais de 15 anos de experiência no setor de TI. Ele é um defensor apaixonado do poder da computação de ponta e das redes 5G e é especialista no desenvolvimento de soluções tecnológicas inovadoras que aproveitam essas tecnologias. Justin está particularmente entusiasmado com os recursos oferecidos pela Amazon Web Services (AWS) no fornecimento de soluções de ponta para seus clientes. Em seu tempo livre, Justin gosta de se manter atualizado com as últimas tendências tecnológicas e compartilhar seu conhecimento e percepções com outras pessoas do setor.