Distribuer ferdigtrente modeller på AWS-bølgelengde med 5G Edge ved å bruke Amazon SageMaker JumpStart

Publisert av Platon

Følgere: 0

Med bruken av høyhastighets 5G-mobilnettverk er bedrifter lettere enn noen gang posisjonert med muligheten til å utnytte konvergensen av telekommunikasjonsnettverk og skyen. Som en av de mest fremtredende brukssakene til dags dato, har maskinlæring (ML) på kanten gjort det mulig for bedrifter å distribuere ML-modeller nærmere sluttkundene for å redusere ventetiden og øke responsen til applikasjonene deres. Som et eksempel, smarte lokale løsninger kan bruke nesten-sanntidsdatasyn for publikumsanalyse over 5G-nettverk, samtidig som investeringene i lokalt maskinvarenettverksutstyr minimeres. Forhandlere kan levere mer friksjonsfrie opplevelser på farten med naturlig språkbehandling (NLP), anbefalingssystemer i sanntid og svindeloppdagelse. Til og med bakke- og luftrobotikk kan bruke ML for å låse opp sikrere, mer autonome operasjoner.

For å redusere barrieren for inntreden av ML på kanten, ønsket vi å demonstrere et eksempel på utplassering av en forhåndstrent modell fra Amazon SageMaker til AWS Bølgelengde, alt på mindre enn 100 linjer med kode. I dette innlegget viser vi hvordan du distribuerer en SageMaker-modell til AWS Wavelength for å redusere modellslutningsforsinkelse for 5G-nettverksbaserte applikasjoner.

Løsningsoversikt

På tvers av AWSs raskt voksende globale infrastruktur bringer AWS Wavelength kraften til cloud computing og lagring til kanten av 5G-nettverk, og låser opp mer effektive mobile opplevelser. Med AWS Wavelength kan du utvide din virtuelle private sky (VPC) til Wavelength Zones som tilsvarer teleoperatørens nettverkskant i 29 byer over hele kloden. Følgende diagram viser et eksempel på denne arkitekturen.

AWS Wavelength Reference Architecture

Du kan melde deg på bølgelengdesonene innenfor en gitt region via AWS-administrasjonskonsoll eller AWS kommandolinjegrensesnitt (AWS CLI). For å lære mer om distribusjon av geodistribuerte applikasjoner på AWS Wavelength, se Distribuer geodistribuerte Amazon EKS-klynger på AWS Wavelength.

Ved å bygge på det grunnleggende som er diskutert i dette innlegget, ser vi på ML ved kanten som et eksempel på en arbeidsbelastning for å distribuere til AWS Wavelength. Som vårt eksempel på arbeidsmengden distribuerer vi en forhåndsopplært modell fra Amazon SageMaker JumpStart.

SageMaker er en fullt administrert ML-tjeneste som lar utviklere enkelt distribuere ML-modeller i sine AWS-miljøer. Selv om AWS tilbyr en rekke alternativer for modelltrening—fra AWS Marketplace modeller og SageMaker innebygde algoritmer – det finnes en rekke teknikker for å distribuere åpen kildekode ML-modeller.

JumpStart gir tilgang til hundrevis av innebygde algoritmer med forhåndstrente modeller som sømløst kan distribueres til SageMaker-endepunkter. Fra prediktivt vedlikehold og datasyn til autonom kjøring og svindeldeteksjon, støtter JumpStart en rekke populære brukstilfeller med ett-klikks-distribusjon på konsollen.

Fordi SageMaker ikke er naturlig støttet i bølgelengdesoner, viser vi hvordan man trekker ut modellartefakter fra regionen og distribuerer på nytt til kanten. For å gjøre det bruker du Amazon Elastic Kubernetes-tjeneste (Amazon EKS) klynger og nodegrupper i bølgelengdesoner, etterfulgt av å lage et distribusjonsmanifest med beholderbildet generert av JumpStart. Følgende diagram illustrerer denne arkitekturen.

Referansearkitektur for Amazon SageMaker JumpStart på AWS Wavelength

Forutsetninger

For å gjøre dette så enkelt som mulig, sørg for at AWS-kontoen din har aktivert bølgelengdesoner. Merk at denne integrasjonen kun er tilgjengelig i us-east-1 og us-west-2, og du vil bruke us-east-1 for varigheten av demoen.

For å melde deg på AWS Wavelength, fullfør følgende trinn:

Velg på Amazon VPC-konsollen Soner etter innstillinger Og velg US East (Verizon) / us-east-1-wl1.
Velg Administrer.
Plukke ut Meldte seg på.
Velg Oppdater soner.

Lag AWS Wavelength-infrastruktur

Før vi konverterer det lokale SageMaker-modellens sluttpunkt til en Kubernetes-distribusjon, kan du opprette en EKS-klynge i en bølgelengdesone. For å gjøre det, distribuer en Amazon EKS-klynge med en AWS Wavelength-nodegruppe. For å lære mer, kan du besøke denne veiledningen på AWS Containers Blog or Verizons 5GEdgeTutorials-depot for et slikt eksempel.

Deretter bruker du en AWS Cloud9 miljø eller interaktivt utviklingsmiljø (IDE) etter eget valg, last ned de nødvendige SageMaker-pakkene og Docker komponere, en nøkkelavhengighet av JumpStart.

pip install sagemaker
pip install 'sagemaker[local]' --upgrade
sudo curl -L "https://github.com/docker/compose/releases/download/1.23.1/docker-compose-$(uname -s)-$(uname -m)" -o /usr/local/bin/docker-compose
sudo chmod +x /usr/local/bin/docker-compose
docker-compose --version

Lag modellartefakter ved hjelp av JumpStart

Først må du sørge for at du har en AWS identitets- og tilgangsadministrasjon (IAM) utførelsesrolle for SageMaker. For å lære mer, besøk SageMaker-roller.

Ved hjelp av dette eksemplet, opprette en fil kalt train_model.py som bruker SageMaker Software Development Kit (SDK) for å hente en forhåndsbygd modell (erstatt med Amazon Resource Name (ARN) til SageMaker-utførelsesrollen din). I denne filen distribuerer du en modell lokalt ved å bruke instance_type attributt i model.deploy() funksjon, som starter en Docker-beholder i IDE-en din ved å bruke alle nødvendige modellartefakter du definerte:

#train_model.py
from sagemaker import image_uris, model_uris, script_uris
from sagemaker.model import Model
from sagemaker.predictor import Predictor
from sagemaker.utils import name_from_base
import sagemaker, boto3, json
from sagemaker import get_execution_role aws_role = "<your-sagemaker-execution-role>"
aws_region = boto3.Session().region_name
sess = sagemaker.Session() # model_version="*" fetches the latest version of the model.
infer_model_id = "tensorflow-tc-bert-en-uncased-L-12-H-768-A-12-2"
infer_model_version= "*"
endpoint_name = name_from_base(f"jumpstart-example-{infer_model_id}") # Retrieve the inference docker container uri.
deploy_image_uri = image_uris.retrieve(
region=None,
framework=None,
image_scope="inference",
model_id=infer_model_id,
model_version=infer_model_version,
instance_type="local",
)
# Retrieve the inference script uri.
deploy_source_uri = script_uris.retrieve(
model_id=infer_model_id, model_version=infer_model_version, script_scope="inference"
)
# Retrieve the base model uri.
base_model_uri = model_uris.retrieve(
model_id=infer_model_id, model_version=infer_model_version, model_scope="inference"
)
model = Model(
image_uri=deploy_image_uri,
source_dir=deploy_source_uri,
model_data=base_model_uri,
entry_point="inference.py",
role=aws_role,
predictor_cls=Predictor,
name=endpoint_name,
)
print(deploy_image_uri,deploy_source_uri,base_model_uri)
# deploy the Model.
base_model_predictor = model.deploy(
initial_instance_count=1,
instance_type="local",
endpoint_name=endpoint_name,
)

Neste, sett infer_model_id til ID-en til SageMaker-modellen du ønsker å bruke.

For en fullstendig liste, se Innebygde algoritmer med forhåndstrent modellbord. I vårt eksempel bruker vi Bidirectional Encoder Representations from Transformers (BERT)-modellen, vanligvis brukt for naturlig språkbehandling.

Kjør train_model.py skript for å hente JumpStart-modellartefakter og distribuere den forhåndstrente modellen til din lokale maskin:

python train_model.py

Hvis dette trinnet lykkes, kan utgangen din ligne på følgende:

763104351884.dkr.ecr.us-east-1.amazonaws.com/tensorflow-inference:2.8-cpu
s3://jumpstart-cache-prod-us-east-1/source-directory-tarballs/tensorflow/inference/tc/v2.0.0/sourcedir.tar.gz
s3://jumpstart-cache-prod-us-east-1/tensorflow-infer/v2.0.0/infer-tensorflow-tc-bert-en-uncased-L-12-H-768-A-12-2.tar.gz

I utdataene vil du se tre artefakter i rekkefølge: basisbildet for TensorFlow-inferens, inferensskriptet som tjener modellen, og artefaktene som inneholder den trente modellen. Selv om du kan lage et tilpasset Docker-bilde med disse artefaktene, er en annen tilnærming å la SageMaker lokal modus lage Docker-bildet for deg. I de påfølgende trinnene trekker vi ut beholderbildet som kjører lokalt og distribuerer til Amazon Elastic Container Registry (Amazon ECR) samt skyve modellartefakten separat til Amazon enkel lagringstjeneste (Amazon S3).

Konverter lokalmodusartefakter til ekstern Kubernetes-distribusjon

Nå som du har bekreftet at SageMaker fungerer lokalt, la oss trekke ut distribusjonsmanifestet fra den kjørende beholderen. Fullfør følgende trinn:

Identifiser plasseringen av SageMaker lokal modus-implementeringsmanifestet: For å gjøre det, søk i rotkatalogen vår etter filer med navn docker-compose.yaml.

docker_manifest=$( find /tmp/tmp* -name "docker-compose.yaml" -printf '%T+ %pn' | sort | tail -n 1 | cut -d' ' -f2-)
echo $docker_manifest

Identifiser plasseringen av SageMaker lokalmodusmodellartefakter: Finn deretter det underliggende volumet montert på den lokale SageMaker-inferensbeholderen, som vil bli brukt i hver EKS-arbeidernode etter at vi lastet opp artefakten til Amazon s3.

model_local_volume = $(grep -A1 -w "volumes:" $docker_manifest | tail -n 1 | tr -d ' ' | awk -F: '{print $1}' | cut -c 2-) # Returns something like: /tmp/tmpcr4bu_a7</p>

Lag en lokal kopi av å kjøre SageMaker-inferensbeholder: Deretter finner vi det aktuelle beholderbildet som kjører vår maskinlærings-inferensmodell og lager en kopi av beholderen lokalt. Dette vil sikre at vi har vår egen kopi av beholderbildet å hente fra Amazon ECR.

# Find container ID of running SageMaker Local container
mkdir sagemaker-container
container_id=$(docker ps --format "{{.ID}} {{.Image}}" | grep "tensorflow" | awk '{print $1}')
# Retrieve the files of the container locally
docker cp $my_container_id:/ sagemaker-container/

Før du handler på model_local_volume, som vi sender til Amazon S3, skyver en kopi av det kjørende Docker-bildet, nå i sagemaker-container katalog, til Amazon Elastic Container Registry. Pass på å bytte ut region, aws_account_id, docker_image_id og my-repository:tag eller følg Amazon ECR brukerveiledning. Husk også å legge merke til den endelige ECR-bilde-URLen (aws_account_id.dkr.ecr.region.amazonaws.com/my-repository:tag), som vi vil bruke i vår EKS-distribusjon.

aws ecr get-login-password --region region | docker login --username AWS --password-stdin aws_account_id.dkr.ecr.region.amazonaws.com
docker build .
docker tag <docker-image-id> aws_account_id.dkr.ecr.region.amazonaws.com/my-repository:tag
docker push aws_account_id.dkr.ecr.region.amazonaws.com/my-repository:tag

Nå som vi har et ECR-bilde som tilsvarer inferensendepunktet, lag en ny Amazon S3-bøtte og kopier SageMaker Local-artefakter (model_local_volume) til denne bøtta. Parallelt oppretter du en Identity Access Management (IAM) som gir Amazon EC2-forekomster tilgang til å lese objekter i bøtten. Pass på å bytte ut med et globalt unikt navn for din Amazon S3-bøtte.

# Create S3 Bucket for model artifacts
aws s3api create-bucket --bucket <unique-bucket-name>
aws s3api put-public-access-block --bucket <unique-bucket-name> --public-access-block-configuration "BlockPublicAcls=true,IgnorePublicAcls=true,BlockPublicPolicy=true,RestrictPublicBuckets=true"
# Step 2: Create IAM attachment to Node Group
cat > ec2_iam_policy.json << EOF
{ "Version": "2012-10-17", "Statement": [ { "Effect": "Allow", "Action": [ "s3:GetObject", "s3:PutObject", "s3:ListBucket" ], "Resource": [ "arn:aws:s3:::sagemaker-wavelength-demo-app/*", "arn:aws:s3:::sagemaker-wavelength-demo-app" ] } ]
} # Create IAM policy
policy_arn=$(aws iam create-policy --policy-name sagemaker-demo-app-s3 --policy-document file://ec2_iam_policy.json --query Policy.Arn)
aws iam attach-role-policy --role-name wavelength-eks-Cluster-wl-workers --policy-arn $policy_arn # Push model artifacts to S3
cd $model_local_volume
tar -cvf sagemaker_model.tar .
aws s3 cp sagemaker_model.tar s3://

Deretter, for å sikre at hver EC2-forekomst henter en kopi av modellartefakten ved lansering, rediger brukerdataene for EKS-arbeidernodene dine. I brukerdataskriptet ditt, sørg for at hver node henter modellartefakter ved hjelp av S3 API ved lansering. Pass på å bytte ut med et globalt unikt navn for din Amazon S3-bøtte. Gitt at nodens brukerdata også vil inkludere EKS bootstrap-skriptet, kan de fullstendige brukerdataene se omtrent slik ut.

#!/bin/bash
mkdir /tmp/model</p><p>cd /tmp/model
aws s3api get-object --bucket sagemaker-wavelength-demo-app --key sagemaker_model.tar  sagemaker_model.tar
tar -xvf sagemaker_model.tar
set -o xtrace
/etc/eks/bootstrap.sh <your-eks-cluster-id>

Nå kan du inspisere det eksisterende docker-manifestet og oversette det til Kubernetes-vennlige manifestfiler ved hjelp av Komponer, et velkjent konverteringsverktøy. Merk: Hvis du får en versjonskompatibilitetsfeil, endre version attributt i linje 27 i docker-compose.yml til “2”.

curl -L https://github.com/kubernetes/kompose/releases/download/v1.26.0/kompose-linux-amd64 -o kompose
chmod +x kompose && sudo mv ./kompose /usr/local/bin/compose
cd "$(dirname "$docker_manifest")"
kompose convert

Etter å ha kjørt Kompose, vil du se fire nye filer: a Deployment gjenstand, Service gjenstand, PersistentVolumeClaim objekt, og NetworkPolicy gjenstand. Du har nå alt du trenger for å begynne ditt inntog i Kubernetes på kanten!

Distribuer SageMaker-modellartefakter

Sørg for at du har lastet ned kubectl og aws-iam-authenticator til din AWS Cloud9 IDE. Hvis ikke, følg installasjonsveiledningene:

Fullfør nå følgende trinn:

endre service/algo-1-ow3nv objekt å bytte tjenestetype fra ClusterIP til NodePort. I vårt eksempel har vi valgt port 30,007 XNUMX som vår NodePort:

# algo-1-ow3nv-service.yaml
apiVersion: v1
kind: Service
metadata: annotations: kompose.cmd: kompose convert kompose.version: 1.26.0 (40646f47) creationTimestamp: null labels: io.kompose.service: algo-1-ow3nv name: algo-1-ow3nv
spec: type: NodePort ports: - name: "8080" port: 8080 targetPort: 8080 nodePort: 30007 selector: io.kompose.service: algo-1-ow3nv
status: loadBalancer: {}

Deretter må du tillate NodePort i sikkerhetsgruppen for noden din. For å gjøre det, hent sikkerhetsgruppe-IDen og tillat-liste NodePort:

node_group_sg=$(aws ec2 describe-security-groups --filters Name=group-name,Values='wavelength-eks-Cluster*' --query "SecurityGroups[0].GroupId" --output text)
aws ec2 authorize-security-group-ingress --group-id $node_group_sg --ip-permissions IpProtocol=tcp,FromPort=30007,ToPort=30007,IpRanges='[{CidrIp=0.0.0.0/0}]'

Deretter endrer du algo-1-ow3nv-deployment.yaml manifest for å montere /tmp/model hostPath katalogen til beholderen. Erstatte med ECR-bildet du opprettet tidligere:

# algo-1-ow3nv-deployment.yaml
apiVersion: apps/v1
kind: Deployment
metadata: annotations: kompose.cmd: kompose convert kompose.version: 1.26.0 (40646f47) creationTimestamp: null labels: io.kompose.service: algo-1-ow3nv name: algo-1-ow3nv
spec: replicas: 1 selector: matchLabels: io.kompose.service: algo-1-ow3nv strategy: type: Recreate template: metadata: annotations: kompose.cmd: kompose convert kompose.version: 1.26.0 (40646f47) creationTimestamp: null labels: io.kompose.network/environment-sagemaker-local: "true" io.kompose.service: algo-1-ow3nv spec: containers: - args: - serve env: - name: SAGEMAKER_CONTAINER_LOG_LEVEL value: "20" - name: SAGEMAKER_PROGRAM value: inference.py - name: SAGEMAKER_REGION value: us-east-1 - name: SAGEMAKER_SUBMIT_DIRECTORY value: /opt/ml/model/code image: <your-ecr-image> name: sagemaker-test-model ports: - containerPort: 8080 resources: {} stdin: true tty: true volumeMounts: - mountPath: /opt/ml/model name: algo-1-ow3nv-claim0 restartPolicy: Always volumes: - name: algo-1-ow3nv-claim0 hostPath: path: /tmp/model
status: {}

Med manifestfilene du opprettet fra Kompose, bruk kubectl til å bruke konfigurasjonene til klyngen din:

$ kubectl apply -f algo-1-ow3nv-deployment.yaml algo-1-ow3nv-service.yaml
deployment.apps/algo-1-ow3nv created
service/algo-1-ow3nv created

Koble til 5G-kantmodellen

For å koble til modellen din, fullfør følgende trinn:

På Amazon EC2-konsollen, hent operatør-IP-en til EKS-arbeidernoden eller bruk AWS CLI for å spørre operatørens IP-adresse direkte:

aws ec2 describe-instances --filters "Name=tag:aws:autoscaling:groupName,Values=eks-EKSNodeGroup*" --query 'Reservations[*].Instances[*].[Placement.AvailabilityZone,NetworkInterfaces[].Association.CarrierIp]' --output text
# Example Output: 155.146.1.12

Nå, med operatørens IP-adresse ekstrahert, kan du koble til modellen direkte ved å bruke NodePort. Lag en fil som heter invoke.py å påkalle BERT-modellen direkte ved å gi en tekstbasert inngang som kjøres mot en sentimentanalysator for å avgjøre om tonen var positiv eller negativ:

import json
endpoint_name="jumpstart-example-tensorflow-tc-bert-en-uncased-L-12-H-768-A-12-2"
request_body = "simply stupid , irrelevant and deeply , truly , bottomlessly cynical ".encode("utf-8")
import requests
r2=requests.post(url="http://155.146.1.12:30007/invocations", data=request_body, headers={"Content-Type":"application/x-text","Accept":"application/json;verbose"})
print(r2.text)

Utgangen din skal ligne følgende:

{"probabilities": [0.998723, 0.0012769578], "labels": [0, 1], "predicted_label": 0}

Rydd opp

For å ødelegge alle opprettede applikasjonsressurser, slett AWS Wavelength-arbeidernodene, EKS-kontrollplanet og alle ressursene som er opprettet i VPC. Slett i tillegg ECR-repoen som ble brukt til å være vert for beholderbildet, S3-bøttene som ble brukt til å være vert for SageMaker-modellartefakter og sagemaker-demo-app-s3 IAM Politikk.

konklusjonen

I dette innlegget demonstrerte vi en ny tilnærming til å distribuere SageMaker-modeller til nettverkskanten ved å bruke Amazon EKS og AWS Wavelength. For å lære om Amazon EKS beste praksis på AWS Wavelength, se Distribuer geodistribuerte Amazon EKS-klynger på AWS Wavelength. I tillegg, for å lære mer om Jumpstart, besøk Amazon SageMaker JumpStart utviklerveiledning eller JumpStart tilgjengelig modellbord.

Om forfatterne

Robert Belson er en utvikleradvokat i AWS Worldwide Telecom Business Unit, som spesialiserer seg på AWS Edge Computing. Han fokuserer på å jobbe med utviklermiljøet og store bedriftskunder for å løse forretningsutfordringene deres ved å bruke automatisering, hybridnettverk og edge-skyen.

Distribuer forhåndstrente modeller på AWS Wavelength med 5G-kant ved hjelp av Amazon SageMaker JumpStart PlatoBlockchain Data Intelligence. Vertikalt søk. Ai. Mohammed Al-Mehdar er Senior Solutions Architect i Worldwide Telecom Business Unit hos AWS. Hans hovedfokus er å hjelpe kunder i stand til å bygge og distribuere Telco- og Enterprise IT-arbeidsbelastninger på AWS. Før han begynte i AWS, har Mohammed jobbet i Telco-bransjen i over 13 år og har et vell av erfaring innen områdene LTE Packet Core, 5G, IMS og WebRTC. Mohammed har en bachelorgrad i telekommunikasjonsteknikk fra Concordia University.

Evan Kravitz er programvareingeniør hos Amazon Web Services, og jobber med SageMaker JumpStart. Han liker å lage mat og gå på løpetur i New York City.

Justin St. Arnauld er Associate Director – Solution Architects hos Verizon for offentlig sektor med over 15 års erfaring i IT-bransjen. Han er en lidenskapelig talsmann for kraften i edge computing og 5G-nettverk og er en ekspert på å utvikle innovative teknologiløsninger som utnytter disse teknologiene. Justin er spesielt begeistret for mulighetene som tilbys av Amazon Web Services (AWS) for å levere banebrytende løsninger for sine kunder. På fritiden liker Justin å holde seg oppdatert med de nyeste teknologitrendene og dele sin kunnskap og innsikt med andre i bransjen.