Implementer fortrænede modeller på AWS-bølgelængde med 5G Edge ved hjælp af Amazon SageMaker JumpStart

Genudgivet af Platon

Abonnenter: 0

Med fremkomsten af højhastigheds 5G-mobilnetværk er virksomheder nemmere end nogensinde før med muligheden for at udnytte konvergensen mellem telekommunikationsnetværk og skyen. Som en af de mest fremtrædende use cases til dato har maskinlæring (ML) på kanten gjort det muligt for virksomheder at implementere ML-modeller tættere på deres slutkunder for at reducere latens og øge reaktionsevnen af deres applikationer. Som et eksempel, smarte spillestedsløsninger kan bruge næsten-realtid computersyn til crowd-analyse over 5G-netværk, alt imens investeringen i lokalt hardwarenetværksudstyr minimeres. Forhandlere kan levere mere friktionsfri oplevelser på farten med naturlig sprogbehandling (NLP), anbefalingssystemer i realtid og registrering af svindel. Også selvom jord- og luftrobotik kan bruge ML til at låse op for sikrere, mere autonome operationer.

For at reducere barrieren for indtrængen af ML på kanten, ønskede vi at demonstrere et eksempel på implementering af en præ-trænet model fra Amazon SageMaker til AWS bølgelængde, alt sammen i mindre end 100 linjer kode. I dette indlæg demonstrerer vi, hvordan man implementerer en SageMaker-model til AWS Wavelength for at reducere modelslutningsforsinkelse for 5G-netværksbaserede applikationer.

Løsningsoversigt

På tværs af AWS' hurtigt ekspanderende globale infrastruktur bringer AWS Wavelength kraften i cloud compute og lagring til kanten af 5G-netværk og låser op for mere effektive mobile oplevelser. Med AWS Wavelength kan du udvide din virtuelle private sky (VPC) til bølgelængdezoner svarende til teleoperatørens netværkskant i 29 byer verden over. Følgende diagram viser et eksempel på denne arkitektur.

AWS Wavelength Reference Architecture

Du kan tilmelde dig bølgelængdezonerne inden for en given region via AWS Management Console eller AWS kommandolinjegrænseflade (AWS CLI). For at lære mere om implementering af geo-distribuerede applikationer på AWS Wavelength, se Implementer geo-distribuerede Amazon EKS-klynger på AWS Wavelength.

Med udgangspunkt i de grundlæggende principper, der er diskuteret i dette indlæg, ser vi på ML på kanten som et eksempel på en arbejdsbyrde, som vi kan implementere til AWS Wavelength. Som vores eksempel på arbejdsbyrde implementerer vi en præ-trænet model fra Amazon SageMaker JumpStart.

SageMaker er en fuldt administreret ML-tjeneste, der giver udviklere mulighed for nemt at implementere ML-modeller i deres AWS-miljøer. Selvom AWS tilbyder en række muligheder for modeltræning — fra AWS Marketplace modeller og SageMaker indbyggede algoritmer – der er en række teknikker til at implementere open source ML-modeller.

JumpStart giver adgang til hundredvis af indbyggede algoritmer med forudtrænede modeller, der problemfrit kan implementeres til SageMaker-slutpunkter. Fra forudsigelig vedligeholdelse og computersyn til autonom kørsel og registrering af svindel understøtter JumpStart en række populære brugssager med et-klik-implementering på konsollen.

Fordi SageMaker ikke er indbygget understøttet i bølgelængdezoner, demonstrerer vi, hvordan man udtrækker modelartefakter fra regionen og genudruller til kanten. For at gøre det bruger du Amazon Elastic Kubernetes Service (Amazon EKS) klynger og nodegrupper i bølgelængdezoner, efterfulgt af oprettelse af et implementeringsmanifest med containerbilledet genereret af JumpStart. Følgende diagram illustrerer denne arkitektur.

Referencearkitektur for Amazon SageMaker JumpStart på AWS Wavelength

Forudsætninger

For at gøre dette så nemt som muligt skal du sikre dig, at din AWS-konto har bølgelængdezoner aktiveret. Bemærk, at denne integration kun er tilgængelig i us-east-1 , us-west-2, og du vil bruge us-east-1 i løbet af demoen.

For at tilmelde dig AWS Wavelength skal du udføre følgende trin:

På Amazon VPC-konsollen skal du vælge Zoner under Indstillinger Og vælg US East (Verizon) / us-east-1-wl1.
Vælg Administrer.
Type Tilmeldt.
Vælg Opdater zoner.

Opret AWS-bølgelængde-infrastruktur

Før vi konverterer det lokale SageMaker-modelslutningsendepunkt til en Kubernetes-implementering, kan du oprette en EKS-klynge i en bølgelængdezone. For at gøre det skal du implementere en Amazon EKS-klynge med en AWS Wavelength-nodegruppe. Hvis du vil vide mere, kan du besøge denne vejledning på AWS Containers Blog or Verizons 5GEdgeTutorials-depot for et sådant eksempel.

Dernæst ved hjælp af en AWS Cloud9 miljø eller interaktivt udviklingsmiljø (IDE) efter eget valg, download de nødvendige SageMaker-pakker og Docker komponere, en nøgleafhængighed af JumpStart.

pip install sagemaker
pip install 'sagemaker[local]' --upgrade
sudo curl -L "https://github.com/docker/compose/releases/download/1.23.1/docker-compose-$(uname -s)-$(uname -m)" -o /usr/local/bin/docker-compose
sudo chmod +x /usr/local/bin/docker-compose
docker-compose --version

Opret modelartefakter ved hjælp af JumpStart

Først skal du sikre dig, at du har en AWS identitets- og adgangsstyring (IAM) eksekveringsrolle for SageMaker. For at lære mere, besøg SageMaker roller.

Ved brug af dette eksempel, opret en fil kaldet train_model.py, der bruger SageMaker Software Development Kit (SDK) til at hente en forudbygget model (erstat med Amazon Resource Name (ARN) for din SageMaker-udførelsesrolle). I denne fil implementerer du en model lokalt ved hjælp af instance_type attribut i model.deploy() funktion, som starter en Docker-beholder i din IDE ved hjælp af alle nødvendige modelartefakter, du har defineret:

#train_model.py
from sagemaker import image_uris, model_uris, script_uris
from sagemaker.model import Model
from sagemaker.predictor import Predictor
from sagemaker.utils import name_from_base
import sagemaker, boto3, json
from sagemaker import get_execution_role aws_role = "<your-sagemaker-execution-role>"
aws_region = boto3.Session().region_name
sess = sagemaker.Session() # model_version="*" fetches the latest version of the model.
infer_model_id = "tensorflow-tc-bert-en-uncased-L-12-H-768-A-12-2"
infer_model_version= "*"
endpoint_name = name_from_base(f"jumpstart-example-{infer_model_id}") # Retrieve the inference docker container uri.
deploy_image_uri = image_uris.retrieve(
region=None,
framework=None,
image_scope="inference",
model_id=infer_model_id,
model_version=infer_model_version,
instance_type="local",
)
# Retrieve the inference script uri.
deploy_source_uri = script_uris.retrieve(
model_id=infer_model_id, model_version=infer_model_version, script_scope="inference"
)
# Retrieve the base model uri.
base_model_uri = model_uris.retrieve(
model_id=infer_model_id, model_version=infer_model_version, model_scope="inference"
)
model = Model(
image_uri=deploy_image_uri,
source_dir=deploy_source_uri,
model_data=base_model_uri,
entry_point="inference.py",
role=aws_role,
predictor_cls=Predictor,
name=endpoint_name,
)
print(deploy_image_uri,deploy_source_uri,base_model_uri)
# deploy the Model.
base_model_predictor = model.deploy(
initial_instance_count=1,
instance_type="local",
endpoint_name=endpoint_name,
)

Dernæst sæt infer_model_id til ID'et for SageMaker-modellen, som du gerne vil bruge.

For en komplet liste, se Indbyggede algoritmer med fortrænet modelbord. I vores eksempel bruger vi BERT-modellen (Bidirectional Encoder Representations from Transformers), der almindeligvis bruges til naturlig sprogbehandling.

Kør train_model.py script for at hente JumpStart-modellens artefakter og implementere den forudtrænede model til din lokale maskine:

python train_model.py

Hvis dette trin lykkes, kan dit output ligne følgende:

763104351884.dkr.ecr.us-east-1.amazonaws.com/tensorflow-inference:2.8-cpu
s3://jumpstart-cache-prod-us-east-1/source-directory-tarballs/tensorflow/inference/tc/v2.0.0/sourcedir.tar.gz
s3://jumpstart-cache-prod-us-east-1/tensorflow-infer/v2.0.0/infer-tensorflow-tc-bert-en-uncased-L-12-H-768-A-12-2.tar.gz

I outputtet vil du se tre artefakter i rækkefølge: basisbilledet for TensorFlow-inferens, inferensscriptet, der tjener modellen, og artefakterne, der indeholder den trænede model. Selvom du kunne oprette et brugerdefineret Docker-billede med disse artefakter, er en anden tilgang at lade SageMaker lokal tilstand skabe Docker-billedet for dig. I de efterfølgende trin udtrækker vi containerbilledet, der kører lokalt og implementerer til Amazon Elastic Container Registry (Amazon ECR) samt skubbe modelartefakten separat til Amazon Simple Storage Service (Amazon S3).

Konverter artefakter i lokal tilstand til ekstern Kubernetes-implementering

Nu hvor du har bekræftet, at SageMaker arbejder lokalt, lad os udtrække implementeringsmanifestet fra den kørende container. Udfør følgende trin:

Identificer placeringen af SageMaker lokal tilstand implementeringsmanifestet: For at gøre det skal du søge i vores rodmappe efter filer med navn docker-compose.yaml.

docker_manifest=$( find /tmp/tmp* -name "docker-compose.yaml" -printf '%T+ %pn' | sort | tail -n 1 | cut -d' ' -f2-)
echo $docker_manifest

Identificer placeringen af SageMaker-lokaltilstandsmodelartefakter: Find derefter det underliggende volumen monteret på den lokale SageMaker-inferensbeholder, som vil blive brugt i hver EKS-arbejderknude, efter at vi har uploadet artefakten til Amazon s3.

model_local_volume = $(grep -A1 -w "volumes:" $docker_manifest | tail -n 1 | tr -d ' ' | awk -F: '{print $1}' | cut -c 2-) # Returns something like: /tmp/tmpcr4bu_a7</p>

Opret lokal kopi af at køre SageMaker-inferenscontainer: Dernæst finder vi det aktuelle containerbillede, der kører vores maskinlærings-inferensmodel og laver en kopi af containeren lokalt. Dette sikrer, at vi har vores egen kopi af containerbilledet til at hente fra Amazon ECR.

# Find container ID of running SageMaker Local container
mkdir sagemaker-container
container_id=$(docker ps --format "{{.ID}} {{.Image}}" | grep "tensorflow" | awk '{print $1}')
# Retrieve the files of the container locally
docker cp $my_container_id:/ sagemaker-container/

Før du handler på model_local_volume, som vi sender til Amazon S3, skal du skubbe en kopi af det kørende Docker-billede, nu i sagemaker-container bibliotek, til Amazon Elastic Container Registry. Sørg for at udskifte region, aws_account_id, docker_image_id , my-repository:tag eller følg Amazon ECR brugervejledning. Husk også at notere den endelige ECR-billed-URL (aws_account_id.dkr.ecr.region.amazonaws.com/my-repository:tag), som vi vil bruge i vores EKS-implementering.

aws ecr get-login-password --region region | docker login --username AWS --password-stdin aws_account_id.dkr.ecr.region.amazonaws.com
docker build .
docker tag <docker-image-id> aws_account_id.dkr.ecr.region.amazonaws.com/my-repository:tag
docker push aws_account_id.dkr.ecr.region.amazonaws.com/my-repository:tag

Nu hvor vi har et ECR-billede, der svarer til inferensslutpunktet, skal du oprette en ny Amazon S3-bøtte og kopiere SageMaker Local-artefakter (model_local_volume) til denne spand. Opret sideløbende en Identity Access Management (IAM), der giver Amazon EC2-instanser adgang til at læse objekter i bucket. Sørg for at udskifte med et globalt unikt navn til din Amazon S3-spand.

# Create S3 Bucket for model artifacts
aws s3api create-bucket --bucket <unique-bucket-name>
aws s3api put-public-access-block --bucket <unique-bucket-name> --public-access-block-configuration "BlockPublicAcls=true,IgnorePublicAcls=true,BlockPublicPolicy=true,RestrictPublicBuckets=true"
# Step 2: Create IAM attachment to Node Group
cat > ec2_iam_policy.json << EOF
{ "Version": "2012-10-17", "Statement": [ { "Effect": "Allow", "Action": [ "s3:GetObject", "s3:PutObject", "s3:ListBucket" ], "Resource": [ "arn:aws:s3:::sagemaker-wavelength-demo-app/*", "arn:aws:s3:::sagemaker-wavelength-demo-app" ] } ]
} # Create IAM policy
policy_arn=$(aws iam create-policy --policy-name sagemaker-demo-app-s3 --policy-document file://ec2_iam_policy.json --query Policy.Arn)
aws iam attach-role-policy --role-name wavelength-eks-Cluster-wl-workers --policy-arn $policy_arn # Push model artifacts to S3
cd $model_local_volume
tar -cvf sagemaker_model.tar .
aws s3 cp sagemaker_model.tar s3://

For at sikre, at hver EC2-instans trækker en kopi af modelartefakten ved lancering, skal du redigere brugerdataene for dine EKS-arbejderknudepunkter. I dit brugerdatascript skal du sikre dig, at hver node henter modelartefakter ved hjælp af S3 API'et ved lanceringen. Sørg for at udskifte med et globalt unikt navn til din Amazon S3-spand. Da nodens brugerdata også vil inkludere EKS bootstrap scriptet, kan de komplette brugerdata se nogenlunde sådan ud.

#!/bin/bash
mkdir /tmp/model</p><p>cd /tmp/model
aws s3api get-object --bucket sagemaker-wavelength-demo-app --key sagemaker_model.tar  sagemaker_model.tar
tar -xvf sagemaker_model.tar
set -o xtrace
/etc/eks/bootstrap.sh <your-eks-cluster-id>

Nu kan du inspicere det eksisterende docker-manifest og oversætte det til Kubernetes-venlige manifestfiler ved hjælp af Komponere, et velkendt konverteringsværktøj. Bemærk: Hvis du får en versionskompatibilitetsfejl, skal du ændre version attribut i linje 27 i docker-compose.yml til “2”.

curl -L https://github.com/kubernetes/kompose/releases/download/v1.26.0/kompose-linux-amd64 -o kompose
chmod +x kompose && sudo mv ./kompose /usr/local/bin/compose
cd "$(dirname "$docker_manifest")"
kompose convert

Efter at have kørt Kompose, vil du se fire nye filer: a Deployment objekt, Service objekt, PersistentVolumeClaim objekt, og NetworkPolicy objekt. Du har nu alt, hvad du behøver for at begynde dit indtog i Kubernetes på kanten!

Implementer SageMaker-modelartefakter

Sørg for, at du har downloadet kubectl og aws-iam-authenticator til din AWS Cloud9 IDE. Hvis ikke, følg installationsvejledningerne:

Udfør nu følgende trin:

Rediger service/algo-1-ow3nv objekt at skifte servicetype fra ClusterIP til NodePort. I vores eksempel har vi valgt port 30,007 som vores NodePort:

# algo-1-ow3nv-service.yaml
apiVersion: v1
kind: Service
metadata: annotations: kompose.cmd: kompose convert kompose.version: 1.26.0 (40646f47) creationTimestamp: null labels: io.kompose.service: algo-1-ow3nv name: algo-1-ow3nv
spec: type: NodePort ports: - name: "8080" port: 8080 targetPort: 8080 nodePort: 30007 selector: io.kompose.service: algo-1-ow3nv
status: loadBalancer: {}

Dernæst skal du tillade NodePort i sikkerhedsgruppen for din node. For at gøre det skal du hente sikkerhedsgruppe-id'et og tillade NodePort:

node_group_sg=$(aws ec2 describe-security-groups --filters Name=group-name,Values='wavelength-eks-Cluster*' --query "SecurityGroups[0].GroupId" --output text)
aws ec2 authorize-security-group-ingress --group-id $node_group_sg --ip-permissions IpProtocol=tcp,FromPort=30007,ToPort=30007,IpRanges='[{CidrIp=0.0.0.0/0}]'

Dernæst skal du ændre algo-1-ow3nv-deployment.yaml manifest at montere /tmp/model hostPath mappe til containeren. Erstatte med det ECR-billede, du oprettede tidligere:

# algo-1-ow3nv-deployment.yaml
apiVersion: apps/v1
kind: Deployment
metadata: annotations: kompose.cmd: kompose convert kompose.version: 1.26.0 (40646f47) creationTimestamp: null labels: io.kompose.service: algo-1-ow3nv name: algo-1-ow3nv
spec: replicas: 1 selector: matchLabels: io.kompose.service: algo-1-ow3nv strategy: type: Recreate template: metadata: annotations: kompose.cmd: kompose convert kompose.version: 1.26.0 (40646f47) creationTimestamp: null labels: io.kompose.network/environment-sagemaker-local: "true" io.kompose.service: algo-1-ow3nv spec: containers: - args: - serve env: - name: SAGEMAKER_CONTAINER_LOG_LEVEL value: "20" - name: SAGEMAKER_PROGRAM value: inference.py - name: SAGEMAKER_REGION value: us-east-1 - name: SAGEMAKER_SUBMIT_DIRECTORY value: /opt/ml/model/code image: <your-ecr-image> name: sagemaker-test-model ports: - containerPort: 8080 resources: {} stdin: true tty: true volumeMounts: - mountPath: /opt/ml/model name: algo-1-ow3nv-claim0 restartPolicy: Always volumes: - name: algo-1-ow3nv-claim0 hostPath: path: /tmp/model
status: {}

Med de manifestfiler, du har oprettet fra Kompose, skal du bruge kubectl til at anvende konfigurationerne på din klynge:

$ kubectl apply -f algo-1-ow3nv-deployment.yaml algo-1-ow3nv-service.yaml
deployment.apps/algo-1-ow3nv created
service/algo-1-ow3nv created

Tilslut til 5G edge-modellen

For at oprette forbindelse til din model skal du udføre følgende trin:

På Amazon EC2-konsollen skal du hente operatørens IP-adresse for EKS-arbejderknuden eller bruge AWS CLI til at forespørge operatørens IP-adresse direkte:

aws ec2 describe-instances --filters "Name=tag:aws:autoscaling:groupName,Values=eks-EKSNodeGroup*" --query 'Reservations[*].Instances[*].[Placement.AvailabilityZone,NetworkInterfaces[].Association.CarrierIp]' --output text
# Example Output: 155.146.1.12

Nu, med transportørens IP-adresse udtrukket, kan du oprette forbindelse til modellen direkte ved hjælp af NodePort. Opret en fil kaldet invoke.py at påberåbe BERT-modellen direkte ved at give et tekstbaseret input, der vil blive kørt mod en sentiment-analyzer for at bestemme, om tonen var positiv eller negativ:

import json
endpoint_name="jumpstart-example-tensorflow-tc-bert-en-uncased-L-12-H-768-A-12-2"
request_body = "simply stupid , irrelevant and deeply , truly , bottomlessly cynical ".encode("utf-8")
import requests
r2=requests.post(url="http://155.146.1.12:30007/invocations", data=request_body, headers={"Content-Type":"application/x-text","Accept":"application/json;verbose"})
print(r2.text)

Dit output skal ligne følgende:

{"probabilities": [0.998723, 0.0012769578], "labels": [0, 1], "predicted_label": 0}

Ryd op

For at ødelægge alle oprettede applikationsressourcer skal du slette AWS Wavelength-arbejderknuderne, EKS-kontrolplanet og alle de ressourcer, der er oprettet i VPC'en. Derudover skal du slette ECR-reposen, der blev brugt til at være vært for containerbilledet, S3-bøtterne, der blev brugt til at være vært for SageMaker-modelartefakter og sagemaker-demo-app-s3 IAM politik.

Konklusion

I dette indlæg demonstrerede vi en ny tilgang til implementering af SageMaker-modeller til netværkskanten ved hjælp af Amazon EKS og AWS Wavelength. For at lære om Amazon EKS bedste praksis på AWS Wavelength, se Implementer geo-distribuerede Amazon EKS-klynger på AWS Wavelength. Besøg desuden for at lære mere om Jumpstart Amazon SageMaker JumpStart Developer Guide eller JumpStart tilgængelig model tabel.

Om forfatterne

Robert Belson er udvikleradvokat i AWS Worldwide Telecom Business Unit med speciale i AWS Edge Computing. Han fokuserer på at arbejde med udviklerfællesskabet og store virksomhedskunder for at løse deres forretningsudfordringer ved hjælp af automatisering, hybrid netværk og edge-skyen.

Deploy pre-trained models on AWS Wavelength with 5G edge using Amazon SageMaker JumpStart PlatoBlockchain Data Intelligence. Vertical Search. Ai. Mohammed Al-Mehdar er Senior Solutions Architect i Worldwide Telecom Business Unit hos AWS. Hans hovedfokus er at hjælpe kunder med at opbygge og implementere Telco- og Enterprise IT-arbejdsbelastninger på AWS. Før han kom til AWS, har Mohammed arbejdet i telekommunikationsindustrien i over 13 år og bringer et væld af erfaring inden for områderne LTE Packet Core, 5G, IMS og WebRTC. Mohammed har en bachelorgrad i telekommunikationsingeniør fra Concordia University.

Evan Kravitz er softwareingeniør hos Amazon Web Services, der arbejder på SageMaker JumpStart. Han nyder at lave mad og løbe i New York City.

Justin St. Arnauld er Associate Director – Solution Architects hos Verizon for den offentlige sektor med over 15 års erfaring i it-branchen. Han er en lidenskabelig fortaler for styrken af edge computing og 5G-netværk og er ekspert i at udvikle innovative teknologiløsninger, der udnytter disse teknologier. Justin er især begejstret for de muligheder, som Amazon Web Services (AWS) tilbyder til at levere banebrydende løsninger til sine kunder. I sin fritid nyder Justin at holde sig ajour med de nyeste teknologitrends og dele sin viden og indsigt med andre i branchen.