Implementeer vooraf getrainde modellen op AWS-golflengte met 5G Edge met behulp van Amazon SageMaker JumpStart

Heruitgegeven door Plato

volgers: 0

Met de komst van supersnelle 5G mobiele netwerken zijn ondernemingen gemakkelijker dan ooit gepositioneerd met de mogelijkheid om de convergentie van telecommunicatienetwerken en de cloud te benutten. Als een van de meest prominente use-cases tot nu toe, heeft machine learning (ML) aan de edge bedrijven in staat gesteld om ML-modellen dichter bij hun eindklanten te implementeren om latentie te verminderen en de responsiviteit van hun applicaties te vergroten. Als voorbeeld, slimme locatie-oplossingen kan bijna-realtime computervisie gebruiken voor crowd-analyse via 5G-netwerken, terwijl investeringen in hardware-netwerkapparatuur op locatie worden geminimaliseerd. Winkeliers kunnen onderweg meer probleemloze ervaringen bieden met natuurlijke taalverwerking (NLP), realtime aanbevelingssystemen en fraudedetectie. Zelfs grond- en luchtrobotica kan ML gebruiken om veiligere, meer autonome bewerkingen te ontgrendelen.

Om de toetredingsdrempel van ML aan de rand te verminderen, wilden we een voorbeeld demonstreren van het inzetten van een vooraf getraind model van Amazon Sage Maker naar AWS-golflengte, allemaal in minder dan 100 regels code. In dit bericht laten we zien hoe u een SageMaker-model kunt implementeren in AWS Wavelength om modelinferentielatentie voor 5G-netwerkgebaseerde applicaties te verminderen.

Overzicht oplossingen

In de snelgroeiende wereldwijde infrastructuur van AWS brengt AWS Wavelength de kracht van cloudcomputing en -opslag naar de rand van 5G-netwerken, waardoor meer performante mobiele ervaringen worden ontgrendeld. Met AWS Wavelength kunt u uw virtual private cloud (VPC) uitbreiden naar Wavelength Zones die overeenkomen met de netwerkrand van de telecomaanbieder in 29 steden over de wereld. Het volgende diagram toont een voorbeeld van deze architectuur.

AWS-golflengtereferentiearchitectuur

U kunt zich aanmelden voor de golflengtezones binnen een bepaalde regio via de AWS-beheerconsole of de AWS-opdrachtregelinterface (AWS CLI). Raadpleeg voor meer informatie over het implementeren van geografisch gedistribueerde applicaties op AWS Wavelength Implementeer geografisch gedistribueerde Amazon EKS-clusters op AWS Wavelength.

Voortbouwend op de basisprincipes die in dit bericht zijn besproken, kijken we naar ML aan de rand als een voorbeeld van een werklast waarmee we kunnen inzetten op AWS Wavelength. Als onze voorbeeldwerkbelasting implementeren we een vooraf getraind model van Amazon SageMaker JumpStart.

SageMaker is een volledig beheerde ML-service waarmee ontwikkelaars eenvoudig ML-modellen kunnen implementeren in hun AWS-omgevingen. Hoewel AWS een aantal opties biedt voor modeltraining - van AWS Marketplace modellen en ingebouwde algoritmen van SageMaker: er zijn een aantal technieken om open-source ML-modellen te implementeren.

JumpStart biedt toegang tot honderden ingebouwde algoritmen met vooraf getrainde modellen die naadloos kunnen worden ingezet op SageMaker-eindpunten. Van voorspellend onderhoud en computervisie tot autonoom rijden en fraudedetectie, JumpStart ondersteunt een verscheidenheid aan populaire use-cases met implementatie met één klik op de console.

Omdat SageMaker niet standaard wordt ondersteund in Wavelength Zones, demonstreren we hoe de modelartefacten uit de regio kunnen worden gehaald en opnieuw naar de rand kunnen worden geïmplementeerd. Hiervoor gebruik je Amazon Elastic Kubernetes-service (Amazon EKS) clusters en knooppuntgroepen in Wavelength Zones, gevolgd door het maken van een implementatiemanifest met de containerimage gegenereerd door JumpStart. Het volgende diagram illustreert deze architectuur.

Referentiearchitectuur voor Amazon SageMaker JumpStart op AWS Wavelength

Voorwaarden

Om dit zo gemakkelijk mogelijk te maken, moet u ervoor zorgen dat uw AWS-account Wavelength Zones heeft ingeschakeld. Merk op dat deze integratie alleen beschikbaar is in us-east-1 en us-west-2, en je gaat gebruiken us-east-1 voor de duur van de demo.

Voer de volgende stappen uit om u aan te melden voor AWS Wavelength:

Kies op de Amazon VPC-console Zones voor Instellingen En kies VS Oost (Verizon) / us-east-1-wl1.
Kies Beheren.
kies Toegetreden.
Kies Zones updaten.

Creëer een AWS Wavelength-infrastructuur

Voordat we het lokale SageMaker-modelinferentie-eindpunt converteren naar een Kubernetes-implementatie, kunt u een EKS-cluster maken in een Wavelength Zone. Implementeer hiervoor een Amazon EKS-cluster met een AWS Wavelength-knooppuntgroep. Voor meer informatie kunt u bezoeken deze gids op de AWS Containers Blog or Verizon's 5GEdgeTutorials-repository voor zo'n voorbeeld.

Gebruik vervolgens een AWS-Cloud9 omgeving of interactieve ontwikkelomgeving (IDE) naar keuze, download de vereiste SageMaker-pakketten en Docker Compose, een belangrijke afhankelijkheid van JumpStart.

pip install sagemaker
pip install 'sagemaker[local]' --upgrade
sudo curl -L "https://github.com/docker/compose/releases/download/1.23.1/docker-compose-$(uname -s)-$(uname -m)" -o /usr/local/bin/docker-compose
sudo chmod +x /usr/local/bin/docker-compose
docker-compose --version

Maak modelartefacten met behulp van JumpStart

Zorg er eerst voor dat u een AWS Identiteits- en toegangsbeheer (IAM) uitvoeringsrol voor SageMaker. Ga voor meer informatie naar SageMaker-rollen.

gebruik dit voorbeeld, maak een bestand met de naam train_model.py dat de SageMaker Software Development Kit (SDK) gebruikt om een vooraf gebouwd model op te halen (vervang met de Amazon Resource Name (ARN) van uw SageMaker-uitvoeringsrol). In dit bestand implementeert u een model lokaal met behulp van het instance_type attribuut in het model.deploy() functie, die een Docker-container binnen uw IDE start met alle vereiste modelartefacten die u hebt gedefinieerd:

#train_model.py
from sagemaker import image_uris, model_uris, script_uris
from sagemaker.model import Model
from sagemaker.predictor import Predictor
from sagemaker.utils import name_from_base
import sagemaker, boto3, json
from sagemaker import get_execution_role aws_role = "<your-sagemaker-execution-role>"
aws_region = boto3.Session().region_name
sess = sagemaker.Session() # model_version="*" fetches the latest version of the model.
infer_model_id = "tensorflow-tc-bert-en-uncased-L-12-H-768-A-12-2"
infer_model_version= "*"
endpoint_name = name_from_base(f"jumpstart-example-{infer_model_id}") # Retrieve the inference docker container uri.
deploy_image_uri = image_uris.retrieve(
region=None,
framework=None,
image_scope="inference",
model_id=infer_model_id,
model_version=infer_model_version,
instance_type="local",
)
# Retrieve the inference script uri.
deploy_source_uri = script_uris.retrieve(
model_id=infer_model_id, model_version=infer_model_version, script_scope="inference"
)
# Retrieve the base model uri.
base_model_uri = model_uris.retrieve(
model_id=infer_model_id, model_version=infer_model_version, model_scope="inference"
)
model = Model(
image_uri=deploy_image_uri,
source_dir=deploy_source_uri,
model_data=base_model_uri,
entry_point="inference.py",
role=aws_role,
predictor_cls=Predictor,
name=endpoint_name,
)
print(deploy_image_uri,deploy_source_uri,base_model_uri)
# deploy the Model.
base_model_predictor = model.deploy(
initial_instance_count=1,
instance_type="local",
endpoint_name=endpoint_name,
)

Stel vervolgens in infer_model_id naar de ID van het SageMaker-model dat u wilt gebruiken.

Voor een volledige lijst, zie Ingebouwde algoritmen met vooraf getrainde modeltabel. In ons voorbeeld gebruiken we het model Bidirectional Encoder Representations from Transformers (BERT), dat gewoonlijk wordt gebruikt voor natuurlijke taalverwerking.

Voer de ... uit train_model.py script om de artefacten van het JumpStart-model op te halen en het vooraf getrainde model op uw lokale computer te implementeren:

python train_model.py

Als deze stap slaagt, kan uw uitvoer er als volgt uitzien:

763104351884.dkr.ecr.us-east-1.amazonaws.com/tensorflow-inference:2.8-cpu
s3://jumpstart-cache-prod-us-east-1/source-directory-tarballs/tensorflow/inference/tc/v2.0.0/sourcedir.tar.gz
s3://jumpstart-cache-prod-us-east-1/tensorflow-infer/v2.0.0/infer-tensorflow-tc-bert-en-uncased-L-12-H-768-A-12-2.tar.gz

In de uitvoer ziet u drie artefacten in volgorde: de basisafbeelding voor TensorFlow-inferentie, het inferentiescript dat het model bedient en de artefacten die het getrainde model bevatten. Hoewel u met deze artefacten een aangepaste Docker-afbeelding kunt maken, is een andere benadering om de lokale modus van SageMaker de Docker-afbeelding voor u te laten maken. In de volgende stappen extraheren we de containerimage die lokaal wordt uitgevoerd en implementeren we deze Amazon Elastic Container-register (Amazon ECR) en duw het modelartefact afzonderlijk naar Amazon eenvoudige opslagservice (Amazone S3).

Converteer artefacten in lokale modus naar externe Kubernetes-implementatie

Nu u hebt bevestigd dat SageMaker lokaal werkt, gaan we het implementatiemanifest extraheren uit de actieve container. Voer de volgende stappen uit:

Identificeer de locatie van het SageMaker-implementatiemanifest in de lokale modus: zoek hiervoor in onze hoofdmap naar bestanden met de naam docker-compose.yaml.

docker_manifest=$( find /tmp/tmp* -name "docker-compose.yaml" -printf '%T+ %pn' | sort | tail -n 1 | cut -d' ' -f2-)
echo $docker_manifest

Identificeer de locatie van de SageMaker-modelartefacten in de lokale modus: zoek vervolgens het onderliggende volume dat is gekoppeld aan de lokale SageMaker-inferentiecontainer, die zal worden gebruikt in elk EKS-werkknooppunt nadat we het artefact hebben geüpload naar Amazon s3.

model_local_volume = $(grep -A1 -w "volumes:" $docker_manifest | tail -n 1 | tr -d ' ' | awk -F: '{print $1}' | cut -c 2-) # Returns something like: /tmp/tmpcr4bu_a7</p>

Maak een lokale kopie van de actieve SageMaker-inferentiecontainer: vervolgens zoeken we de momenteel actieve containerimage waarop ons machine learning-inferentiemodel draait en maken we lokaal een kopie van de container. Dit zorgt ervoor dat we onze eigen kopie van de containerafbeelding hebben om uit Amazon ECR te halen.

# Find container ID of running SageMaker Local container
mkdir sagemaker-container
container_id=$(docker ps --format "{{.ID}} {{.Image}}" | grep "tensorflow" | awk '{print $1}')
# Retrieve the files of the container locally
docker cp $my_container_id:/ sagemaker-container/

Alvorens te handelen op de model_local_volume, die we naar Amazon S3 zullen pushen, een kopie van de draaiende Docker-image pushen, nu in de sagemaker-container directory, naar Amazon Elastic Container Registry. Zorg ervoor dat u vervangt region, aws_account_id, docker_image_id en my-repository:tag of volg de Amazon ECR-gebruikershandleiding. Let ook op de uiteindelijke URL van de ECR-afbeelding (aws_account_id.dkr.ecr.region.amazonaws.com/my-repository:tag), die we zullen gebruiken in onze EKS-implementatie.

aws ecr get-login-password --region region | docker login --username AWS --password-stdin aws_account_id.dkr.ecr.region.amazonaws.com
docker build .
docker tag <docker-image-id> aws_account_id.dkr.ecr.region.amazonaws.com/my-repository:tag
docker push aws_account_id.dkr.ecr.region.amazonaws.com/my-repository:tag

Nu we een ECR-afbeelding hebben die overeenkomt met het inferentie-eindpunt, maakt u een nieuwe Amazon S3-bucket en kopieert u de SageMaker Local-artefacten (model_local_volume) naar deze emmer. Creëer tegelijkertijd een Identity Access Management (IAM) dat Amazon EC2-instanties toegang geeft tot het lezen van objecten in de bucket. Zorg ervoor dat u vervangt met een wereldwijd unieke naam voor uw Amazon S3-bucket.

# Create S3 Bucket for model artifacts
aws s3api create-bucket --bucket <unique-bucket-name>
aws s3api put-public-access-block --bucket <unique-bucket-name> --public-access-block-configuration "BlockPublicAcls=true,IgnorePublicAcls=true,BlockPublicPolicy=true,RestrictPublicBuckets=true"
# Step 2: Create IAM attachment to Node Group
cat > ec2_iam_policy.json << EOF
{ "Version": "2012-10-17", "Statement": [ { "Effect": "Allow", "Action": [ "s3:GetObject", "s3:PutObject", "s3:ListBucket" ], "Resource": [ "arn:aws:s3:::sagemaker-wavelength-demo-app/*", "arn:aws:s3:::sagemaker-wavelength-demo-app" ] } ]
} # Create IAM policy
policy_arn=$(aws iam create-policy --policy-name sagemaker-demo-app-s3 --policy-document file://ec2_iam_policy.json --query Policy.Arn)
aws iam attach-role-policy --role-name wavelength-eks-Cluster-wl-workers --policy-arn $policy_arn # Push model artifacts to S3
cd $model_local_volume
tar -cvf sagemaker_model.tar .
aws s3 cp sagemaker_model.tar s3://

Bewerk vervolgens de gebruikersgegevens voor uw EKS-werkknooppunten om ervoor te zorgen dat elke EC2-instantie bij het opstarten een kopie van het modelartefact ophaalt. Zorg er in uw gebruikersgegevensscript voor dat elk knooppunt de modelartefacten ophaalt met behulp van de S3 API bij het opstarten. Zorg ervoor dat u vervangt met een wereldwijd unieke naam voor uw Amazon S3-bucket. Aangezien de gebruikersgegevens van het knooppunt ook het EKS-bootstrapscript zullen bevatten, kunnen de volledige gebruikersgegevens er ongeveer zo uitzien.

#!/bin/bash
mkdir /tmp/model</p><p>cd /tmp/model
aws s3api get-object --bucket sagemaker-wavelength-demo-app --key sagemaker_model.tar  sagemaker_model.tar
tar -xvf sagemaker_model.tar
set -o xtrace
/etc/eks/bootstrap.sh <your-eks-cluster-id>

Nu kunt u het bestaande docker-manifest inspecteren en vertalen naar Kubernetes-vriendelijke manifestbestanden met behulp van Komponeren, een bekende conversietool. Opmerking: als u een versiecompatibiliteitsfout krijgt, wijzigt u het version attribuut in regel 27 van docker-compose.yml to “2”.

curl -L https://github.com/kubernetes/kompose/releases/download/v1.26.0/kompose-linux-amd64 -o kompose
chmod +x kompose && sudo mv ./kompose /usr/local/bin/compose
cd "$(dirname "$docker_manifest")"
kompose convert

Nadat u Kompose heeft uitgevoerd, ziet u vier nieuwe bestanden: a Deployment voorwerp, Service voorwerp, PersistentVolumeClaim object, en NetworkPolicy voorwerp. Je hebt nu alles wat je nodig hebt om je uitstapje naar Kubernetes aan de rand te beginnen!

Implementeer SageMaker-modelartefacten

Zorg ervoor dat u kubectl en aws-iam-authenticator hebt gedownload naar uw AWS Cloud9 IDE. Zo niet, volg dan de installatiehandleidingen:

Voer nu de volgende stappen uit:

Wijzig de service/algo-1-ow3nv object om van servicetype te wisselen ClusterIP naar NodePort. In ons voorbeeld hebben we poort 30,007 geselecteerd als onze NodePort:

# algo-1-ow3nv-service.yaml
apiVersion: v1
kind: Service
metadata: annotations: kompose.cmd: kompose convert kompose.version: 1.26.0 (40646f47) creationTimestamp: null labels: io.kompose.service: algo-1-ow3nv name: algo-1-ow3nv
spec: type: NodePort ports: - name: "8080" port: 8080 targetPort: 8080 nodePort: 30007 selector: io.kompose.service: algo-1-ow3nv
status: loadBalancer: {}

Vervolgens moet u de NodePort toestaan in de beveiligingsgroep voor uw knooppunt. Om dit te doen, haalt u de beveiligingsgroep-ID op en zet u de NodePort op de toelatingslijst:

node_group_sg=$(aws ec2 describe-security-groups --filters Name=group-name,Values='wavelength-eks-Cluster*' --query "SecurityGroups[0].GroupId" --output text)
aws ec2 authorize-security-group-ingress --group-id $node_group_sg --ip-permissions IpProtocol=tcp,FromPort=30007,ToPort=30007,IpRanges='[{CidrIp=0.0.0.0/0}]'

Wijzig vervolgens de algo-1-ow3nv-deployment.yaml manifesteren om de te monteren /tmp/model hostPath map naar de container. Vervangen met de ECR-afbeelding die u eerder hebt gemaakt:

# algo-1-ow3nv-deployment.yaml
apiVersion: apps/v1
kind: Deployment
metadata: annotations: kompose.cmd: kompose convert kompose.version: 1.26.0 (40646f47) creationTimestamp: null labels: io.kompose.service: algo-1-ow3nv name: algo-1-ow3nv
spec: replicas: 1 selector: matchLabels: io.kompose.service: algo-1-ow3nv strategy: type: Recreate template: metadata: annotations: kompose.cmd: kompose convert kompose.version: 1.26.0 (40646f47) creationTimestamp: null labels: io.kompose.network/environment-sagemaker-local: "true" io.kompose.service: algo-1-ow3nv spec: containers: - args: - serve env: - name: SAGEMAKER_CONTAINER_LOG_LEVEL value: "20" - name: SAGEMAKER_PROGRAM value: inference.py - name: SAGEMAKER_REGION value: us-east-1 - name: SAGEMAKER_SUBMIT_DIRECTORY value: /opt/ml/model/code image: <your-ecr-image> name: sagemaker-test-model ports: - containerPort: 8080 resources: {} stdin: true tty: true volumeMounts: - mountPath: /opt/ml/model name: algo-1-ow3nv-claim0 restartPolicy: Always volumes: - name: algo-1-ow3nv-claim0 hostPath: path: /tmp/model
status: {}

Met de manifestbestanden die u vanuit Kompose hebt gemaakt, gebruikt u kubectl om de configuraties op uw cluster toe te passen:

$ kubectl apply -f algo-1-ow3nv-deployment.yaml algo-1-ow3nv-service.yaml
deployment.apps/algo-1-ow3nv created
service/algo-1-ow3nv created

Maak verbinding met het 5G edge-model

Voer de volgende stappen uit om verbinding te maken met uw model:

Haal op de Amazon EC2-console het IP-adres van de provider van het EKS-werkknooppunt op of gebruik de AWS CLI om het IP-adres van de provider rechtstreeks op te vragen:

aws ec2 describe-instances --filters "Name=tag:aws:autoscaling:groupName,Values=eks-EKSNodeGroup*" --query 'Reservations[*].Instances[*].[Placement.AvailabilityZone,NetworkInterfaces[].Association.CarrierIp]' --output text
# Example Output: 155.146.1.12

Nu, met het IP-adres van de provider geëxtraheerd, kunt u rechtstreeks verbinding maken met het model met behulp van de NodePort. Maak een bestand aan met de naam invoke.py om het BERT-model rechtstreeks aan te roepen door een op tekst gebaseerde invoer te leveren die wordt uitgevoerd tegen een sentimentanalysator om te bepalen of de toon positief of negatief was:

import json
endpoint_name="jumpstart-example-tensorflow-tc-bert-en-uncased-L-12-H-768-A-12-2"
request_body = "simply stupid , irrelevant and deeply , truly , bottomlessly cynical ".encode("utf-8")
import requests
r2=requests.post(url="http://155.146.1.12:30007/invocations", data=request_body, headers={"Content-Type":"application/x-text","Accept":"application/json;verbose"})
print(r2.text)

Uw uitvoer zou er als volgt uit moeten zien:

{"probabilities": [0.998723, 0.0012769578], "labels": [0, 1], "predicted_label": 0}

Opruimen

Om alle gecreëerde applicatieresources te vernietigen, verwijdert u de AWS Wavelength-werkknooppunten, het EKS-besturingsvlak en alle resources die binnen de VPC zijn gemaakt. Verwijder bovendien de ECR-repo die wordt gebruikt om de containerimage te hosten, de S3-buckets die worden gebruikt om de SageMaker-modelartefacten te hosten en de sagemaker-demo-app-s3 IAM beleid.

Conclusie

In dit bericht hebben we een nieuwe benadering gedemonstreerd voor het implementeren van SageMaker-modellen op de netwerkrand met behulp van Amazon EKS en AWS Wavelength. Raadpleeg voor meer informatie over Amazon EKS best practices op AWS Wavelength Implementeer geografisch gedistribueerde Amazon EKS-clusters op AWS Wavelength. Ga daarnaast voor meer informatie over Jumpstart naar de Amazon SageMaker JumpStart-ontwikkelaarsgids of de Tabel met beschikbare JumpStart-modellen.

Over de auteurs

Robert Bellson is een Developer Advocate in de AWS Worldwide Telecom Business Unit, gespecialiseerd in AWS Edge Computing. Hij richt zich op het werken met de ontwikkelaarsgemeenschap en grote zakelijke klanten om hun zakelijke uitdagingen op te lossen met behulp van automatisering, hybride netwerken en de edge-cloud.

Implementeer vooraf getrainde modellen op AWS Wavelength met 5G edge met behulp van Amazon SageMaker JumpStart PlatoBlockchain Data Intelligence. Verticaal zoeken. Ai. Mohammed Al Mehdar is een Senior Solutions Architect in de Worldwide Telecom Business Unit bij AWS. Zijn belangrijkste focus is om klanten te helpen bij het bouwen en implementeren van Telco- en Enterprise IT-workloads op AWS. Voordat hij bij AWS kwam, werkte Mohammed al meer dan 13 jaar in de telecomindustrie en brengt hij een schat aan ervaring mee op het gebied van LTE Packet Core, 5G, IMS en WebRTC. Mohammed heeft een bachelordiploma in telecommunicatie-engineering van Concordia University.

Evan Kravitz is een software-engineer bij Amazon Web Services en werkt aan SageMaker JumpStart. Hij houdt van koken en hardlopen in New York City.

Justin St. Arnauld is een Associate Director – Solution Architects bij Verizon for the Public Sector met meer dan 15 jaar ervaring in de IT-industrie. Hij is een gepassioneerd pleitbezorger voor de kracht van edge computing en 5G-netwerken en is een expert in het ontwikkelen van innovatieve technologische oplossingen die gebruikmaken van deze technologieën. Justin is bijzonder enthousiast over de mogelijkheden die Amazon Web Services (AWS) biedt bij het leveren van geavanceerde oplossingen voor zijn klanten. In zijn vrije tijd houdt Justin ervan om op de hoogte te blijven van de nieuwste technologische trends en zijn kennis en inzichten te delen met anderen in de branche.

Door SEO aangedreven content en PR-distributie. Word vandaag nog versterkt.
Platoblockchain. Web3 Metaverse Intelligentie. Kennis versterkt. Toegang hier.
Bron: https://aws.amazon.com/blogs/machine-learning/deploy-pre-trained-models-on-aws-wavelength-with-5g-edge-using-amazon-sagemaker-jumpstart/

Tijdstempel: 7 april 2023

Tijdstempel: September 22, 2022

Heruitgegeven door Plato

Ensemble ML-modellen uitvoeren op Amazon SageMaker

Visualiseer een Amazon Comprehend-analyse met een woordwolk in Amazon QuickSight | Amazon-webservices

Maak volledig homomorfe codering mogelijk met Amazon SageMaker-eindpunten voor veilige, real-time deductie

Gebruik Amazon Lex om straatadressen vast te leggen

Verplaats Amazon SageMaker Autopilot ML-modellen van experiment naar productie met behulp van Amazon SageMaker Pipelines

Intelligent Alfresco-inhoud doorzoeken met Amazon Kendra

Detecteer populatievariantie van bedreigde diersoorten met behulp van Amazon Rekognition

Over Ons

Verticaal zoeken & Ai

Platform

Blijf verbonden

Account