Deploy Pre-trained Models On AWS Wavelength With 5G Edge Using Amazon SageMaker JumpStart

Republicat de Platon

Urmaritori: 0

Odată cu apariția rețelelor mobile 5G de mare viteză, întreprinderile sunt mai ușor de poziționat decât oricând cu posibilitatea de a valorifica convergența rețelelor de telecomunicații și a cloud-ului. Fiind unul dintre cele mai proeminente cazuri de utilizare până în prezent, învățarea automată (ML) la margine a permis companiilor să implementeze modele ML mai aproape de clienții lor finali pentru a reduce latența și a crește capacitatea de răspuns a aplicațiilor lor. Ca exemplu, soluții inteligente pentru locații poate folosi viziunea computerizată în timp aproape real pentru analize de mulțimi prin rețele 5G, toate în același timp reducând la minimum investițiile în echipamente hardware de rețea la nivel local. Comercianții cu amănuntul pot oferi mai multe experiențe fără fricțiuni din mers cu procesarea limbajului natural (NLP), sisteme de recomandare în timp real și detectarea fraudelor. Chiar robotică terestră și aeriană poate folosi ML pentru a debloca operațiuni mai sigure și mai autonome.

Pentru a reduce bariera de intrare a ML la margine, am vrut să demonstrăm un exemplu de implementare a unui model pre-antrenat de la Amazon SageMaker la AWS Lungime de undă, totul în mai puțin de 100 de linii de cod. În această postare, demonstrăm cum să implementăm un model SageMaker pe AWS Wavelength pentru a reduce latența de inferență a modelului pentru aplicațiile bazate pe rețea 5G.

Prezentare generală a soluțiilor

În infrastructura globală AWS în expansiune rapidă, AWS Wavelength aduce puterea de calcul în cloud și stocare la marginea rețelelor 5G, deblocând experiențe mobile mai performante. Cu AWS Wavelength, vă puteți extinde cloudul privat virtual (VPC) la zonele de lungime de undă corespunzătoare marginii rețelei operatorului de telecomunicații în Orașele 29 pe tot globul. Următoarea diagramă prezintă un exemplu al acestei arhitecturi.

Arhitectura de referință pentru lungimea de undă AWS

Puteți opta pentru zonele de lungime de undă dintr-o anumită regiune prin intermediul Consola de administrare AWS sau Interfața liniei de comandă AWS (AWS CLI). Pentru a afla mai multe despre implementarea aplicațiilor geo-distribuite pe AWS Wavelength, consultați Implementați clustere Amazon EKS geo-distribuite pe AWS Wavelength.

Bazându-ne pe elementele fundamentale discutate în această postare, ne uităm la ML la margine ca un exemplu de încărcare de lucru cu care să putem implementa în AWS Wavelength. Ca exemplu de volum de lucru, implementăm un model pre-instruit din Amazon SageMaker JumpStart.

SageMaker este un serviciu ML gestionat complet care permite dezvoltatorilor să implementeze cu ușurință modele ML în mediile lor AWS. Deși AWS oferă o serie de opțiuni pentru formarea modelelor—de la Piața AWS modele și algoritmi încorporați SageMaker — există o serie de tehnici de implementare a modelelor ML cu sursă deschisă.

JumpStart oferă acces la sute de algoritmi încorporați cu modele pre-antrenate care pot fi implementate fără probleme la punctele finale SageMaker. De la întreținerea predictivă și viziunea computerizată până la conducerea autonomă și detectarea fraudelor, JumpStart acceptă o varietate de cazuri de utilizare populare cu implementare cu un singur clic pe consolă.

Deoarece SageMaker nu este acceptat nativ în zonele de lungime de undă, demonstrăm cum să extragem artefactele modelului din regiune și să le reinstalăm la margine. Pentru a face acest lucru, folosiți Serviciul Amazon Elastic Kubernetes (Amazon EKS) clustere și grupuri de noduri în zonele de lungime de undă, urmate de crearea unui manifest de implementare cu imaginea containerului generată de JumpStart. Următoarea diagramă ilustrează această arhitectură.

Arhitectură de referință pentru Amazon SageMaker JumpStart pe AWS Wavelength

Cerințe preliminare

Pentru a face acest lucru cât mai ușor posibil, asigurați-vă că contul dvs. AWS are zonele de lungime de undă activate. Rețineți că această integrare este disponibilă numai în us-east-1 și us-west-2, și veți folosi us-east-1 pe durata demo-ului.

Pentru a vă înscrie la AWS Wavelength, parcurgeți următorii pași:

În consola Amazon VPC, alegeți zonele în Setări cont Și alegeți Estul SUA (Verizon) / us-east-1-wl1.
Alege Administrare.
Selectați S-a înscris.
Alege Actualizați zonele.

Creați infrastructură AWS Wavelength

Înainte de a converti punctul final de inferență model SageMaker local într-o implementare Kubernetes, puteți crea un cluster EKS într-o zonă de lungime de undă. Pentru a face acest lucru, implementați un cluster Amazon EKS cu un grup de noduri AWS Wavelength. Pentru a afla mai multe, puteți vizita acest ghid pe blogul AWS Containers or Depozitul 5GEdgeTutorials al Verizon pentru un astfel de exemplu.

Apoi, folosind un AWS Cloud9 mediu sau mediu de dezvoltare interactiv (IDE) la alegere, descărcați pachetele necesare SageMaker și Docker Compune, o dependență cheie a JumpStart.

pip install sagemaker
pip install 'sagemaker[local]' --upgrade
sudo curl -L "https://github.com/docker/compose/releases/download/1.23.1/docker-compose-$(uname -s)-$(uname -m)" -o /usr/local/bin/docker-compose
sudo chmod +x /usr/local/bin/docker-compose
docker-compose --version

Creați artefacte model folosind JumpStart

În primul rând, asigurați-vă că aveți un Gestionarea identității și accesului AWS (IAM) rol de execuție pentru SageMaker. Pentru a afla mai multe, vizitați Roluri SageMaker.

Utilizarea acest exemplu, creați un fișier numit train_model.py care utilizează kit-ul de dezvoltare software (SDK) SageMaker pentru a prelua un model pre-construit (înlocuiți cu Amazon Resource Name (ARN) al rolului dvs. de execuție SageMaker). În acest fișier, implementați un model la nivel local folosind instance_type atribut în model.deploy() funcția, care pornește un container Docker în IDE-ul dvs. folosind toate artefactele de model necesare pe care le-ați definit:

#train_model.py
from sagemaker import image_uris, model_uris, script_uris
from sagemaker.model import Model
from sagemaker.predictor import Predictor
from sagemaker.utils import name_from_base
import sagemaker, boto3, json
from sagemaker import get_execution_role aws_role = "<your-sagemaker-execution-role>"
aws_region = boto3.Session().region_name
sess = sagemaker.Session() # model_version="*" fetches the latest version of the model.
infer_model_id = "tensorflow-tc-bert-en-uncased-L-12-H-768-A-12-2"
infer_model_version= "*"
endpoint_name = name_from_base(f"jumpstart-example-{infer_model_id}") # Retrieve the inference docker container uri.
deploy_image_uri = image_uris.retrieve(
region=None,
framework=None,
image_scope="inference",
model_id=infer_model_id,
model_version=infer_model_version,
instance_type="local",
)
# Retrieve the inference script uri.
deploy_source_uri = script_uris.retrieve(
model_id=infer_model_id, model_version=infer_model_version, script_scope="inference"
)
# Retrieve the base model uri.
base_model_uri = model_uris.retrieve(
model_id=infer_model_id, model_version=infer_model_version, model_scope="inference"
)
model = Model(
image_uri=deploy_image_uri,
source_dir=deploy_source_uri,
model_data=base_model_uri,
entry_point="inference.py",
role=aws_role,
predictor_cls=Predictor,
name=endpoint_name,
)
print(deploy_image_uri,deploy_source_uri,base_model_uri)
# deploy the Model.
base_model_predictor = model.deploy(
initial_instance_count=1,
instance_type="local",
endpoint_name=endpoint_name,
)

Apoi, setați infer_model_id la ID-ul modelului SageMaker pe care doriți să-l utilizați.

Pentru o listă completă, consultați Algoritmi încorporați cu tabel model pre-antrenat. În exemplul nostru, folosim modelul Bidirectional Encoder Representations from Transformers (BERT), folosit în mod obișnuit pentru procesarea limbajului natural.

Pornește train_model.py script pentru a prelua artefactele modelului JumpStart și a implementa modelul pre-antrenat pe mașina dvs. locală:

python train_model.py

Dacă acest pas reușește, rezultatul dvs. poate să semene cu următorul:

763104351884.dkr.ecr.us-east-1.amazonaws.com/tensorflow-inference:2.8-cpu
s3://jumpstart-cache-prod-us-east-1/source-directory-tarballs/tensorflow/inference/tc/v2.0.0/sourcedir.tar.gz
s3://jumpstart-cache-prod-us-east-1/tensorflow-infer/v2.0.0/infer-tensorflow-tc-bert-en-uncased-L-12-H-768-A-12-2.tar.gz

În rezultat, veți vedea trei artefacte în ordine: imaginea de bază pentru inferența TensorFlow, scriptul de inferență care servește modelului și artefactele care conțin modelul antrenat. Deși puteți crea o imagine Docker personalizată cu aceste artefacte, o altă abordare este să lăsați modul local SageMaker să creeze imaginea Docker pentru dvs. În pașii următori, extragem imaginea containerului care rulează local și o implementăm Registrul Amazon de containere elastice (Amazon ECR), precum și împingeți artefactul modelului separat Serviciul Amazon de stocare simplă (Amazon S3).

Convertiți artefactele în modul local în implementarea Kubernetes la distanță

Acum că ați confirmat că SageMaker funcționează local, să extragem manifestul de implementare din containerul care rulează. Parcurgeți următorii pași:

Identificați locația manifestului de implementare a modului local SageMaker: Pentru a face acest lucru, căutați în directorul nostru rădăcină orice fișiere numite docker-compose.yaml.

docker_manifest=$( find /tmp/tmp* -name "docker-compose.yaml" -printf '%T+ %pn' | sort | tail -n 1 | cut -d' ' -f2-)
echo $docker_manifest

Identificați locația artefactelor modelului în modul local SageMaker: Apoi, găsiți volumul de bază montat pe containerul de inferență local SageMaker, care va fi utilizat în fiecare nod de lucru EKS după ce încărcăm artefactul pe Amazon s3.

model_local_volume = $(grep -A1 -w "volumes:" $docker_manifest | tail -n 1 | tr -d ' ' | awk -F: '{print $1}' | cut -c 2-) # Returns something like: /tmp/tmpcr4bu_a7</p>

Creați o copie locală a containerului de inferență SageMaker care rulează: În continuare, vom găsi imaginea containerului care rulează în prezent, care rulează modelul nostru de inferență de învățare automată și vom face o copie a containerului la nivel local. Acest lucru ne va asigura că avem propria noastră copie a imaginii containerului de extras din Amazon ECR.

# Find container ID of running SageMaker Local container
mkdir sagemaker-container
container_id=$(docker ps --format "{{.ID}} {{.Image}}" | grep "tensorflow" | awk '{print $1}')
# Retrieve the files of the container locally
docker cp $my_container_id:/ sagemaker-container/

Înainte de a acționa asupra model_local_volume, pe care îl vom împinge către Amazon S3, împinge o copie a imaginii Docker care rulează, acum în sagemaker-container director, către Amazon Elastic Container Registry. Asigurați-vă că înlocuiți region, aws_account_id, docker_image_id și my-repository:tag sau urmați Ghid de utilizare Amazon ECR. De asemenea, asigurați-vă că țineți cont de URL-ul final al imaginii ECR (aws_account_id.dkr.ecr.region.amazonaws.com/my-repository:tag), pe care îl vom folosi în implementarea noastră EKS.

aws ecr get-login-password --region region | docker login --username AWS --password-stdin aws_account_id.dkr.ecr.region.amazonaws.com
docker build .
docker tag <docker-image-id> aws_account_id.dkr.ecr.region.amazonaws.com/my-repository:tag
docker push aws_account_id.dkr.ecr.region.amazonaws.com/my-repository:tag

Acum că avem o imagine ECR corespunzătoare punctului final de inferență, creați o nouă găleată Amazon S3 și copiați artefactele locale SageMaker (model_local_volume) la această găleată. În paralel, creați un Identity Access Management (IAM) care oferă acces instanțelor Amazon EC2 pentru a citi obiectele din compartiment. Asigurați-vă că înlocuiți cu un nume unic la nivel global pentru bucket-ul tău Amazon S3.

# Create S3 Bucket for model artifacts
aws s3api create-bucket --bucket <unique-bucket-name>
aws s3api put-public-access-block --bucket <unique-bucket-name> --public-access-block-configuration "BlockPublicAcls=true,IgnorePublicAcls=true,BlockPublicPolicy=true,RestrictPublicBuckets=true"
# Step 2: Create IAM attachment to Node Group
cat > ec2_iam_policy.json << EOF
{ "Version": "2012-10-17", "Statement": [ { "Effect": "Allow", "Action": [ "s3:GetObject", "s3:PutObject", "s3:ListBucket" ], "Resource": [ "arn:aws:s3:::sagemaker-wavelength-demo-app/*", "arn:aws:s3:::sagemaker-wavelength-demo-app" ] } ]
} # Create IAM policy
policy_arn=$(aws iam create-policy --policy-name sagemaker-demo-app-s3 --policy-document file://ec2_iam_policy.json --query Policy.Arn)
aws iam attach-role-policy --role-name wavelength-eks-Cluster-wl-workers --policy-arn $policy_arn # Push model artifacts to S3
cd $model_local_volume
tar -cvf sagemaker_model.tar .
aws s3 cp sagemaker_model.tar s3://

Apoi, pentru a vă asigura că fiecare instanță EC2 extrage o copie a artefactului model la lansare, editați datele utilizatorului pentru nodurile de lucru EKS. În scriptul de date utilizator, asigurați-vă că fiecare nod preia artefactele modelului folosind API-ul S3 la lansare. Asigurați-vă că înlocuiți cu un nume unic la nivel global pentru bucket-ul tău Amazon S3. Având în vedere că datele utilizatorului nodului vor include și scriptul de bootstrap EKS, datele complete ale utilizatorului pot arăta cam așa.

#!/bin/bash
mkdir /tmp/model</p><p>cd /tmp/model
aws s3api get-object --bucket sagemaker-wavelength-demo-app --key sagemaker_model.tar  sagemaker_model.tar
tar -xvf sagemaker_model.tar
set -o xtrace
/etc/eks/bootstrap.sh <your-eks-cluster-id>

Acum, puteți inspecta manifestul docker existent și îl puteți traduce în fișiere manifest compatibile cu Kubernetes folosind Compone, un instrument de conversie binecunoscut. Notă: dacă primiți o eroare de compatibilitate cu versiunea, modificați version atribut în linia 27 din docker-compose.yml la “2”.

curl -L https://github.com/kubernetes/kompose/releases/download/v1.26.0/kompose-linux-amd64 -o kompose
chmod +x kompose && sudo mv ./kompose /usr/local/bin/compose
cd "$(dirname "$docker_manifest")"
kompose convert

După ce rulați Kompose, veți vedea patru fișiere noi: a Deployment obiect, Service obiect, PersistentVolumeClaim obiect, și NetworkPolicy obiect. Acum aveți tot ce aveți nevoie pentru a vă începe incursiunea în Kubernetes la margine!

Implementați artefacte model SageMaker

Asigurați-vă că aveți kubectl și aws-iam-authenticator descărcate în IDE-ul dvs. AWS Cloud9. Dacă nu, urmați ghidurile de instalare:

Acum, parcurgeți următorii pași:

Modificați service/algo-1-ow3nv obiect pentru a comuta tipul de serviciu ClusterIP la NodePort. În exemplul nostru, am selectat portul 30,007 drept nostru NodePort:

# algo-1-ow3nv-service.yaml
apiVersion: v1
kind: Service
metadata: annotations: kompose.cmd: kompose convert kompose.version: 1.26.0 (40646f47) creationTimestamp: null labels: io.kompose.service: algo-1-ow3nv name: algo-1-ow3nv
spec: type: NodePort ports: - name: "8080" port: 8080 targetPort: 8080 nodePort: 30007 selector: io.kompose.service: algo-1-ow3nv
status: loadBalancer: {}

Apoi, trebuie să permiteți NodePort în grupul de securitate pentru nodul dvs. Pentru a face acest lucru, preluați ID-ul grupului de securitate și listați NodePort:

node_group_sg=$(aws ec2 describe-security-groups --filters Name=group-name,Values='wavelength-eks-Cluster*' --query "SecurityGroups[0].GroupId" --output text)
aws ec2 authorize-security-group-ingress --group-id $node_group_sg --ip-permissions IpProtocol=tcp,FromPort=30007,ToPort=30007,IpRanges='[{CidrIp=0.0.0.0/0}]'

Apoi, modificați algo-1-ow3nv-deployment.yaml manifest pentru a monta /tmp/model hostPath directorul către container. A inlocui cu imaginea ECR creată mai devreme:

# algo-1-ow3nv-deployment.yaml
apiVersion: apps/v1
kind: Deployment
metadata: annotations: kompose.cmd: kompose convert kompose.version: 1.26.0 (40646f47) creationTimestamp: null labels: io.kompose.service: algo-1-ow3nv name: algo-1-ow3nv
spec: replicas: 1 selector: matchLabels: io.kompose.service: algo-1-ow3nv strategy: type: Recreate template: metadata: annotations: kompose.cmd: kompose convert kompose.version: 1.26.0 (40646f47) creationTimestamp: null labels: io.kompose.network/environment-sagemaker-local: "true" io.kompose.service: algo-1-ow3nv spec: containers: - args: - serve env: - name: SAGEMAKER_CONTAINER_LOG_LEVEL value: "20" - name: SAGEMAKER_PROGRAM value: inference.py - name: SAGEMAKER_REGION value: us-east-1 - name: SAGEMAKER_SUBMIT_DIRECTORY value: /opt/ml/model/code image: <your-ecr-image> name: sagemaker-test-model ports: - containerPort: 8080 resources: {} stdin: true tty: true volumeMounts: - mountPath: /opt/ml/model name: algo-1-ow3nv-claim0 restartPolicy: Always volumes: - name: algo-1-ow3nv-claim0 hostPath: path: /tmp/model
status: {}

Cu fișierele manifest pe care le-ați creat din Kompose, utilizați kubectl pentru a aplica configurațiile clusterului dvs.:

$ kubectl apply -f algo-1-ow3nv-deployment.yaml algo-1-ow3nv-service.yaml
deployment.apps/algo-1-ow3nv created
service/algo-1-ow3nv created

Conectați-vă la modelul 5G edge

Pentru a vă conecta la modelul dvs., parcurgeți următorii pași:

Pe consola Amazon EC2, preluați IP-ul operatorului de transport al nodului de lucru EKS sau utilizați AWS CLI pentru a interoga direct adresa IP a operatorului:

aws ec2 describe-instances --filters "Name=tag:aws:autoscaling:groupName,Values=eks-EKSNodeGroup*" --query 'Reservations[*].Instances[*].[Placement.AvailabilityZone,NetworkInterfaces[].Association.CarrierIp]' --output text
# Example Output: 155.146.1.12

Acum, cu adresa IP a operatorului extrasă, vă puteți conecta direct la model folosind NodePort. Creați un fișier numit invoke.py pentru a invoca modelul BERT direct, oferind o intrare bazată pe text care va fi executată împotriva unui analizor de sentimente pentru a determina dacă tonul a fost pozitiv sau negativ:

import json
endpoint_name="jumpstart-example-tensorflow-tc-bert-en-uncased-L-12-H-768-A-12-2"
request_body = "simply stupid , irrelevant and deeply , truly , bottomlessly cynical ".encode("utf-8")
import requests
r2=requests.post(url="http://155.146.1.12:30007/invocations", data=request_body, headers={"Content-Type":"application/x-text","Accept":"application/json;verbose"})
print(r2.text)

Ieșirea dvs. ar trebui să semene cu următoarele:

{"probabilities": [0.998723, 0.0012769578], "labels": [0, 1], "predicted_label": 0}

A curăța

Pentru a distruge toate resursele aplicației create, ștergeți nodurile de lucru AWS Wavelength, planul de control EKS și toate resursele create în VPC. În plus, ștergeți depozitul ECR folosit pentru a găzdui imaginea containerului, gălețile S3 utilizate pentru a găzdui artefactele modelului SageMaker și sagemaker-demo-app-s3 IAM politică.

Concluzie

În această postare, am demonstrat o abordare nouă pentru implementarea modelelor SageMaker la marginea rețelei folosind Amazon EKS și AWS Wavelength. Pentru a afla despre cele mai bune practici Amazon EKS privind lungimea de undă AWS, consultați Implementați clustere Amazon EKS geo-distribuite pe AWS Wavelength. În plus, pentru a afla mai multe despre Jumpstart, vizitați Ghid pentru dezvoltatori Amazon SageMaker JumpStart sau Tabelul modelului disponibil JumpStart.

Despre Autori

Robert Belson este un avocat pentru dezvoltatori în Unitatea de afaceri AWS Worldwide Telecom, specializat în AWS Edge Computing. El se concentrează pe lucrul cu comunitatea de dezvoltatori și cu clienții companiilor mari pentru a-și rezolva provocările de afaceri folosind automatizarea, rețelele hibride și cloud-ul edge.

Deploy pre-trained models on AWS Wavelength with 5G edge using Amazon SageMaker JumpStart PlatoBlockchain Data Intelligence. Vertical Search. Ai. Mohammed Al-Mehdar este arhitect senior de soluții în unitatea de afaceri Worldwide Telecom de la AWS. Obiectivul său principal este de a ajuta clienții să creeze și să implementeze sarcini de lucru IT pentru Telco și Enterprise pe AWS. Înainte de a se alătura AWS, Mohammed a lucrat în industria Telco de peste 13 ani și aduce o experiență bogată în domeniile LTE Packet Core, 5G, IMS și WebRTC. Mohammed deține o diplomă de licență în Ingineria Telecomunicațiilor de la Universitatea Concordia.

Evan Kravitz este inginer software la Amazon Web Services, lucrând la SageMaker JumpStart. Îi place să gătească și să alerge în New York.

Justin St. Arnauld este director asociat – Arhitecți de soluții la Verizon pentru sectorul public, cu peste 15 ani de experiență în industria IT. El este un susținător pasionat al puterii edge computing și a rețelelor 5G și este un expert în dezvoltarea de soluții tehnologice inovatoare care folosesc aceste tehnologii. Justin este deosebit de entuziasmat de capacitățile oferite de Amazon Web Services (AWS) în furnizarea de soluții de ultimă oră pentru clienții săi. În timpul său liber, lui Justin îi place să fie la curent cu cele mai recente tendințe tehnologice și să-și împărtășească cunoștințele și cunoștințele cu alții din industrie.