Créez et déployez des applications d'inférence ML à partir de zéro à l'aide d'Amazon SageMaker

Republié par Platon

Suiveurs: 0

À mesure que l’apprentissage automatique (ML) se généralise et est de plus en plus adopté, les applications d’inférence basées sur le ML deviennent de plus en plus courantes pour résoudre une série de problèmes commerciaux complexes. La solution à ces problèmes commerciaux complexes nécessite souvent l’utilisation de plusieurs modèles et étapes de ML. Cet article vous montre comment créer et héberger une application ML avec des conteneurs personnalisés sur Amazon Sage Maker.

Offres Amazon SageMaker algorithmes intégrés ainsi que le SageMaker pré-construit images Docker pour le déploiement du modèle. Mais si ceux-ci ne répondent pas à vos besoins, vous pouvez apporter vos propres conteneurs (BYOC) pour l'hébergement sur Amazon SageMaker.

Il existe plusieurs cas d'utilisation dans lesquels les utilisateurs peuvent avoir besoin de BYOC pour l'hébergement sur Amazon SageMaker.

Frameworks ou bibliothèques de ML personnalisés : si vous envisagez d'utiliser un framework ou des bibliothèques de ML qui ne sont pas pris en charge par les algorithmes intégrés d'Amazon SageMaker ou les conteneurs prédéfinis, vous devrez créer un conteneur personnalisé.
Modèles spécialisés : pour certains domaines ou secteurs, vous pouvez avoir besoin d'architectures de modèles spécifiques ou d'étapes de prétraitement personnalisées qui ne sont pas disponibles dans les offres Amazon SageMaker intégrées.
Algorithmes propriétaires : si vous avez développé vos propres algorithmes propriétaires en interne, vous aurez besoin d'un conteneur personnalisé pour les déployer sur Amazon SageMaker.
Pipelines d'inférence complexes : si votre flux de travail d'inférence ML implique une logique métier personnalisée (une série d'étapes complexes qui doivent être exécutées dans un ordre particulier), alors BYOC peut vous aider à gérer et orchestrer ces étapes plus efficacement.

Vue d'ensemble de la solution

Dans cette solution, nous montrons comment héberger une application d'inférence série ML sur Amazon SageMaker avec des points de terminaison en temps réel à l'aide de deux conteneurs d'inférence personnalisés avec la dernière scikit-learn ainsi que le xgboost packages.

Le premier conteneur utilise un scikit-learn modèle pour transformer les données brutes en colonnes présentées. Ça s'applique Échelle standard pour les colonnes numériques et OneHotEncoder aux catégoriques.

Créez et déployez des applications d'inférence ML à partir de zéro à l'aide d'Amazon SageMaker | Amazon Web Services PlatoBlockchain Data Intelligence. Recherche verticale. Aï.

Le deuxième conteneur héberge un pré-entraîné XGboost modèle (c'est-à-dire, prédicteur). Le modèle prédictif accepte les prédictions d’entrée et de sortie présentées.

Créez et déployez des applications d'inférence ML à partir de zéro à l'aide d'Amazon SageMaker | Amazon Web Services PlatoBlockchain Data Intelligence. Recherche verticale. Aï.

Enfin, nous déployons le featureuriseur ainsi que le prédicteur dans un pipeline d'inférence série vers un point de terminaison en temps réel Amazon SageMaker.

Voici quelques considérations différentes expliquant pourquoi vous souhaiterez peut-être avoir des conteneurs séparés dans votre application d'inférence.

Découplage – Différentes étapes du pipeline ont un objectif clairement défini et doivent être exécutées sur des conteneurs séparés en raison des dépendances sous-jacentes impliquées. Cela permet également de garder le pipeline bien structuré.
Cadres – Différentes étapes du pipeline utilisent des cadres spécifiques adaptés à l'objectif (tels que scikit ou Spark ML) et doivent donc être exécutés sur des conteneurs distincts.
Isolement des ressources – Différentes étapes du pipeline ont des exigences de consommation de ressources variables et doivent donc être exécutées sur des conteneurs séparés pour plus de flexibilité et de contrôle.
Entretien et mises à niveau – D'un point de vue opérationnel, cela favorise l'isolement fonctionnel et vous pouvez continuer à mettre à niveau ou modifier des étapes individuelles beaucoup plus facilement, sans affecter les autres modèles.

De plus, la construction locale des conteneurs individuels facilite le processus itératif de développement et de test avec les outils préférés et les environnements de développement intégrés (IDE). Une fois les conteneurs prêts, vous pouvez les déployer sur le cloud AWS pour inférence à l'aide des points de terminaison Amazon SageMaker.

L'implémentation complète, y compris les extraits de code, est disponible dans ce référentiel Github ici.

Créez et déployez des applications d'inférence ML à partir de zéro à l'aide d'Amazon SageMaker | Amazon Web Services PlatoBlockchain Data Intelligence. Recherche verticale. Aï.

Pré-requis

Comme nous testons d’abord ces conteneurs personnalisés localement, nous aurons besoin du bureau Docker installé sur votre ordinateur local. Vous devez être familier avec la création de conteneurs Docker.

Vous aurez également besoin d'un compte AWS avec accès à Amazon SageMaker, Amazon ECR et Amazon S3 pour tester cette application de bout en bout.

Assurez-vous d'avoir la dernière version de Boto3 et les packages Amazon SageMaker Python installés :

pip install --upgrade boto3 sagemaker scikit-learn

Présentation de la solution

Créer un conteneur de fonctionnalités personnalisé

Pour construire le premier conteneur, le conteneur featureurizer, nous formons un scikit-learn modèle pour traiter les caractéristiques brutes dans le ormeau base de données. Le script de prétraitement utilise SimpleImputeur pour gérer les valeurs manquantes, Échelle standard pour normaliser les colonnes numériques, et OneHotEncoder pour transformer les colonnes catégorielles. Après avoir installé le transformateur, nous sauvegardons le modèle dans joblib format. Nous compressons et téléchargeons ensuite cet artefact de modèle enregistré sur un Amazon Simple Storage Service (Amazon S3) seau.

Voici un exemple d'extrait de code qui illustre cela. Faire référence à featureurizer.ipynb pour une mise en œuvre complète :

```python
numeric_features = list(feature_columns_names)
numeric_features.remove("sex")
numeric_transformer = Pipeline( steps=[ ("imputer", SimpleImputer(strategy="median")), ("scaler", StandardScaler()), ]
) categorical_features = ["sex"]
categorical_transformer = Pipeline( steps=[ ("imputer", SimpleImputer(strategy="constant", fill_value="missing")), ("onehot", OneHotEncoder(handle_unknown="ignore")), ]
) preprocess = ColumnTransformer( transformers=[ ("num", numeric_transformer, numeric_features), ("cat", categorical_transformer, categorical_features), ]
) # Call fit on ColumnTransformer to fit all transformers to X, y
preprocessor = preprocess.fit(df_train_val) # Save the processor model to disk
joblib.dump(preprocess, os.path.join(model_dir, "preprocess.joblib"))
```

Ensuite, pour créer un conteneur d'inférence personnalisé pour le modèle de featurizer, nous construisons une image Docker avec les packages nginx, gunicorn, flask, ainsi que d'autres dépendances requises pour le modèle de featurizer.

Nginx, gunicorn et l'application Flask serviront de pile de service modèle sur les points de terminaison en temps réel Amazon SageMaker.

Lorsque vous apportez des conteneurs personnalisés pour l'hébergement sur Amazon SageMaker, nous devons nous assurer que le script d'inférence effectue les tâches suivantes après avoir été lancé à l'intérieur du conteneur :

Chargement du modèle : Script d'inférence (preprocessing.py) doit faire référence à /opt/ml/model répertoire pour charger le modèle dans le conteneur. Les artefacts de modèle dans Amazon S3 seront téléchargés et montés sur le conteneur au niveau du chemin /opt/ml/model.
Variables d'environnement: Pour transmettre des variables d'environnement personnalisées au conteneur, vous devez les spécifier lors de la Modèle étape de création ou pendant Endpoint création à partir d’un emploi de formation.
Exigences API : Le script d'inférence doit implémenter à la fois /ping ainsi que le /invocations itinéraires en tant qu’application Flask. Le /ping L'API est utilisée pour les contrôles de santé, tandis que l'API /invocations L'API gère les demandes d'inférence.
Enregistrement: Les journaux de sortie dans le script d'inférence doivent être écrits sur la sortie standard (Stdout) et l'erreur standard (stderr) ruisseaux. Ces journaux sont ensuite diffusés vers Amazon Cloud Watch par Amazon SageMaker.

Voici un extrait de preprocessing.py qui montrent la mise en œuvre de /ping ainsi que le /invocations.

Reportez-vous à prétraitement.py sous le dossier featurizer pour une implémentation complète.

```python
def load_model(): # Construct the path to the featurizer model file ft_model_path = os.path.join(MODEL_PATH, "preprocess.joblib") featurizer = None try: # Open the model file and load the featurizer using joblib with open(ft_model_path, "rb") as f: featurizer = joblib.load(f) print("Featurizer model loaded", flush=True) except FileNotFoundError: print(f"Error: Featurizer model file not found at {ft_model_path}", flush=True) except Exception as e: print(f"Error loading featurizer model: {e}", flush=True) # Return the loaded featurizer model, or None if there was an error return featurizer def transform_fn(request_body, request_content_type): """ Transform the request body into a usable numpy array for the model. This function takes the request body and content type as input, and returns a transformed numpy array that can be used as input for the prediction model. Parameters: request_body (str): The request body containing the input data. request_content_type (str): The content type of the request body. Returns: data (np.ndarray): Transformed input data as a numpy array. """ # Define the column names for the input data feature_columns_names = [ "sex", "length", "diameter", "height", "whole_weight", "shucked_weight", "viscera_weight", "shell_weight", ] label_column = "rings" # Check if the request content type is supported (text/csv) if request_content_type == "text/csv": # Load the featurizer model featurizer = load_model() # Check if the featurizer is a ColumnTransformer if isinstance( featurizer, sklearn.compose._column_transformer.ColumnTransformer ): print(f"Featurizer model loaded", flush=True) # Read the input data from the request body as a CSV file df = pd.read_csv(StringIO(request_body), header=None) # Assign column names based on the number of columns in the input data if len(df.columns) == len(feature_columns_names) + 1: # This is a labelled example, includes the ring label df.columns = feature_columns_names + [label_column] elif len(df.columns) == len(feature_columns_names): # This is an unlabelled example. df.columns = feature_columns_names # Transform the input data using the featurizer data = featurizer.transform(df) # Return the transformed data as a numpy array return data else: # Raise an error if the content type is unsupported raise ValueError("Unsupported content type: {}".format(request_content_type)) @app.route("/ping", methods=["GET"])
def ping(): # Check if the model can be loaded, set the status accordingly featurizer = load_model() status = 200 if featurizer is not None else 500 # Return the response with the determined status code return flask.Response(response="n", status=status, mimetype="application/json") @app.route("/invocations", methods=["POST"])
def invocations(): # Convert from JSON to dict print(f"Featurizer: received content type: {flask.request.content_type}") if flask.request.content_type == "text/csv": # Decode input data and transform input = flask.request.data.decode("utf-8") transformed_data = transform_fn(input, flask.request.content_type) # Format transformed_data into a csv string csv_buffer = io.StringIO() csv_writer = csv.writer(csv_buffer) for row in transformed_data: csv_writer.writerow(row) csv_buffer.seek(0) # Return the transformed data as a CSV string in the response return flask.Response(response=csv_buffer, status=200, mimetype="text/csv") else: print(f"Received: {flask.request.content_type}", flush=True) return flask.Response( response="Transformer: This predictor only supports CSV data", status=415, mimetype="text/plain", )
```

Créer une image Docker avec un fonctionnalité et une pile de diffusion de modèles

Créons maintenant un Dockerfile à l'aide d'une image de base personnalisée et installons les dépendances requises.

Pour cela, nous utilisons python:3.9-slim-buster comme image de base. Vous pouvez modifier cette image avec toute autre image de base pertinente à votre cas d'utilisation.

Nous copions ensuite la configuration nginx, le fichier de passerelle du serveur Web de gunicorn et le script d'inférence dans le conteneur. Nous créons également un script python appelé serve qui lance les processus nginx et gunicorn en arrière-plan et définit le script d'inférence (c'est-à-dire l'application preprocessing.py Flask) comme point d'entrée du conteneur.

Voici un extrait du Dockerfile pour héberger le modèle featurizer. Pour une mise en œuvre complète, reportez-vous à Dockerfile sous featureuriseur dossier.

```docker
FROM python:3.9-slim-buster
… # Copy requirements.txt to /opt/program folder
COPY requirements.txt /opt/program/requirements.txt # Install packages listed in requirements.txt
RUN pip3 install --no-cache-dir -r /opt/program/requirements.txt # Copy contents of code/ dir to /opt/program
COPY code/ /opt/program/ # Set working dir to /opt/program which has the serve and inference.py scripts
WORKDIR /opt/program # Expose port 8080 for serving
EXPOSE 8080 ENTRYPOINT ["python"] # serve is a python script under code/ directory that launches nginx and gunicorn processes
CMD [ "serve" ]
```

Testez l'image d'inférence personnalisée avec le featureurizer localement

Maintenant, créez et testez localement le conteneur d'inférence personnalisé avec le featurizer, à l'aide d'Amazon. Mode local SageMaker. Le mode local est parfait pour tester vos scripts de traitement, de formation et d'inférence sans lancer de tâches sur Amazon SageMaker. Après avoir confirmé les résultats de vos tests locaux, vous pouvez facilement adapter les scripts de formation et d'inférence pour le déploiement sur Amazon SageMaker avec des modifications minimes.

Pour tester l'image personnalisée du featurizer localement, créez d'abord l'image en utilisant le paramètre défini précédemment. Dockerfile. Ensuite, lancez un conteneur en montant le répertoire contenant le modèle de fonctionnalité (preprocess.joblib) au /opt/ml/model répertoire à l’intérieur du conteneur. De plus, mappez le port 8080 du conteneur vers l’hôte.

Une fois lancé, vous pouvez envoyer des requêtes d'inférence à http://localhost:8080/invocations.

Pour créer et lancer le conteneur, ouvrez un terminal et exécutez les commandes suivantes.

Notez que vous devez remplacer le <IMAGE_NAME>, comme indiqué dans le code suivant, avec le nom de l'image de votre conteneur.

La commande suivante suppose également que la personne formée scikit-learn modèle (preprocess.joblib) est présent dans un répertoire appelé models.

```shell
docker build -t <IMAGE_NAME> .
``` ```shell
docker run –rm -v $(pwd)/models:/opt/ml/model -p 8080:8080 <IMAGE_NAME>
```

Une fois le conteneur opérationnel, nous pouvons tester à la fois le /ping ainsi que le /invocations itinéraires à l’aide des commandes curl.

Exécutez les commandes ci-dessous à partir d'un terminal

```shell
# test /ping route on local endpoint
curl http://localhost:8080/ping # send raw csv string to /invocations. Endpoint should return transformed data
curl --data-raw 'I,0.365,0.295,0.095,0.25,0.1075,0.0545,0.08,9.0' -H 'Content-Type: text/csv' -v http://localhost:8080/invocations
```

Lorsque des données brutes (non transformées) sont envoyées à http://localhost:8080/invocations, le point de terminaison répond avec des données transformées.

Vous devriez voir une réponse similaire à celle-ci :

```shell
* Trying 127.0.0.1:8080...
* Connected to localhost (127.0.0.1) port 8080 (#0)
> POST /invocations HTTP/1.1
> Host: localhost: 8080
> User-Agent: curl/7.87.0
> Accept: */*
> Content -Type: text/csv
> Content -Length: 47
>
* Mark bundle as not supporting multiuse
> HTTP/1.1 200 OK
> Server: nginx/1.14.2
> Date: Sun, 09 Apr 2023 20:47:48 GMT
> Content -Type: text/csv; charset=utf-8
> Content -Length: 150
> Connection: keep -alive
-1.3317586042173168, -1.1425409076053987, -1.0579488602777858, -1.177706547272754, -1.130662184748842,
* Connection #0 to host localhost left intact
```

Nous terminons maintenant le conteneur en cours d'exécution, puis marquons et transférons l'image personnalisée locale vers un registre Amazon Elastic Container Registry privé (ECR d'Amazon) référentiel.

Consultez les commandes suivantes pour vous connecter à Amazon ECR, qui balisent l'image locale avec le chemin complet de l'image Amazon ECR, puis transfèrent l'image vers Amazon ECR. Assurez-vous de remplacer region ainsi que le account variables adaptées à votre environnement.

```shell
# login to ecr with your credentials
aws ecr get-login-password - -region "${region}" |
docker login - -username AWS - -password-stdin ${account}".dkr.ecr."${region}".amazonaws.com # tag and push the image to private Amazon ECR
docker tag ${image} ${fullname}
docker push $ {fullname} ```

Reportez-vous à créer un référentiel ainsi que le envoyer une image vers Amazon ECR Interface de ligne de commande AWS (CLI AWS) commandes pour plus d’informations.

Étape facultative

Vous pouvez éventuellement effectuer un test en direct en déployant le modèle de fonctionnalité sur un point de terminaison en temps réel avec l'image Docker personnalisée dans Amazon ECR. Faire référence à featureurizer.ipynb notebook pour la mise en œuvre complète de la création, des tests et du transfert de l'image personnalisée vers Amazon ECR.

Amazon SageMaker initialise le point de terminaison d'inférence et copie les artefacts du modèle dans le /opt/ml/model répertoire à l’intérieur du conteneur. Voir Comment SageMaker charge vos artefacts de modèle.

Créer un conteneur de prédicteurs XGBoost personnalisé

Pour créer le conteneur d'inférence XGBoost, nous suivons des étapes similaires à celles utilisées lors de la création de l'image pour le conteneur featurizer :

Télécharger pré-entraîné XGBoost modèle d'Amazon S3.
Créez la inference.py script qui charge le pré-entraîné XGBoost modèle, convertit les données d'entrée transformées reçues du featurerizer et les convertit en XGBoost.DMatrix formater, s'exécute predict sur le booster, et renvoie les prédictions au format json.
Scripts et fichiers de configuration qui forment la pile de diffusion de modèles (c'est-à-dire nginx.conf, wsgi.pyet une serve restent les mêmes et ne nécessitent aucune modification.
Nous utilisons Ubuntu:18.04 comme image de base pour le Dockerfile. Ce n'est pas une condition préalable. Nous utilisons l'image de base Ubuntu pour démontrer que les conteneurs peuvent être construits avec n'importe quelle image de base.
Les étapes de création de l'image Docker client, de test de l'image localement et de transmission de l'image testée vers Amazon ECR restent les mêmes qu'auparavant.

Par souci de concision, car les étapes sont similaires à celles indiquées précédemment ; cependant, nous montrons uniquement le codage modifié dans ce qui suit.

La première, la inference.py scénario. Voici un extrait qui montre la mise en œuvre de /ping ainsi que le /invocations. Faire référence à inférence.py sous le prédicteur dossier pour une implémentation complète de ce fichier.

```python
@app.route("/ping", methods=["GET"])
def ping(): """ Check the health of the model server by verifying if the model is loaded. Returns a 200 status code if the model is loaded successfully, or a 500 status code if there is an error. Returns: flask.Response: A response object containing the status code and mimetype. """ status = 200 if model is not None else 500 return flask.Response(response="n", status=status, mimetype="application/json") @app.route("/invocations", methods=["POST"])
def invocations(): """ Handle prediction requests by preprocessing the input data, making predictions, and returning the predictions as a JSON object. This function checks if the request content type is supported (text/csv; charset=utf-8), and if so, decodes the input data, preprocesses it, makes predictions, and returns the predictions as a JSON object. If the content type is not supported, a 415 status code is returned. Returns: flask.Response: A response object containing the predictions, status code, and mimetype. """ print(f"Predictor: received content type: {flask.request.content_type}") if flask.request.content_type == "text/csv; charset=utf-8": input = flask.request.data.decode("utf-8") transformed_data = preprocess(input, flask.request.content_type) predictions = predict(transformed_data) # Return the predictions as a JSON object return json.dumps({"result": predictions}) else: print(f"Received: {flask.request.content_type}", flush=True) return flask.Response( response=f"XGBPredictor: This predictor only supports CSV data; Received: {flask.request.content_type}", status=415, mimetype="text/plain", ) ```

Voici un extrait du Dockerfile pour héberger le modèle prédicteur. Pour une mise en œuvre complète, reportez-vous à Dockerfile sous le dossier prédicteur.

```docker
FROM ubuntu:18.04 … # install required dependencies including flask, gunicorn, xgboost etc.,
RUN pip3 --no-cache-dir install flask gunicorn gevent numpy pandas xgboost # Copy contents of code/ dir to /opt/program
COPY code /opt/program # Set working dir to /opt/program which has the serve and inference.py scripts
WORKDIR /opt/program # Expose port 8080 for serving
EXPOSE 8080 ENTRYPOINT ["python"] # serve is a python script under code/ directory that launches nginx and gunicorn processes
CMD ["serve"]
```

Nous continuons ensuite à créer, tester et transférer cette image de prédicteur personnalisée vers un référentiel privé dans Amazon ECR. Faire référence à prédicteur.ipynb notebook pour la mise en œuvre complète de la création, des tests et de la transmission de l'image personnalisée vers Amazon ECR.

Déployer un pipeline d'inférence série

Après avoir testé les images du featurizer et du prédicteur et les avoir transférées vers Amazon ECR, nous téléchargeons maintenant nos artefacts de modèle dans un compartiment Amazon S3.

Ensuite, nous créons deux objets modèles : un pour le featurizer (c'est à dire, preprocess.joblib) et d'autres pour le predictor (c'est à dire, xgboost-model) en spécifiant l'URI de l'image personnalisée que nous avons créée précédemment.

Voici un extrait qui le montre. Faire référence à pipeline-d'inférence-série.ipynb pour une mise en œuvre complète.

```python
suffix = f"{str(uuid4())[:5]}-{datetime.now().strftime('%d%b%Y')}" # Featurizer Model (SKLearn Model)
image_name = "<FEATURIZER_IMAGE_NAME>"
sklearn_image_uri = f"{account_id}.dkr.ecr.{region}.amazonaws.com/{image_name}:latest" featurizer_model_name = f""<FEATURIZER_MODEL_NAME>-{suffix}"
print(f"Creating Featurizer model: {featurizer_model_name}")
sklearn_model = Model( image_uri=featurizer_ecr_repo_uri, name=featurizer_model_name, model_data=featurizer_model_data, role=role,
) # Full name of the ECR repository
predictor_image_name = "<PREDICTOR_IMAGE_NAME>"
predictor_ecr_repo_uri
= f"{account_id}.dkr.ecr.{region}.amazonaws.com/{predictor_image_name}:latest" # Predictor Model (XGBoost Model)
predictor_model_name = f"""<PREDICTOR_MODEL_NAME>-{suffix}"
print(f"Creating Predictor model: {predictor_model_name}")
xgboost_model = Model( image_uri=predictor_ecr_repo_uri, name=predictor_model_name, model_data=predictor_model_data, role=role,
)
```

Maintenant, pour déployer ces conteneurs de manière série, nous créons d'abord un Modèle de pipeline objet et passer le featurizer modèle et predictor modèle en un objet de liste python dans le même ordre.

Ensuite, nous appelons le .deploy() méthode sur le Modèle de pipeline en spécifiant le type d'instance et le nombre d'instances.

```python
from sagemaker.pipeline import PipelineModel pipeline_model_name = f"Abalone-pipeline-{suffix}" pipeline_model = PipelineModel( name=pipeline_model_name, role=role, models=[sklearn_model, xgboost_model], sagemaker_session=sm_session,
) print(f"Deploying pipeline model {pipeline_model_name}...")
predictor = pipeline_model.deploy( initial_instance_count=1, instance_type="ml.m5.xlarge",
)
```

À ce stade, Amazon SageMaker déploie le pipeline d'inférence série sur un point de terminaison en temps réel. Nous attendons que le point final soit InService.

Nous pouvons maintenant tester le point de terminaison en envoyant des requêtes d'inférence à ce point de terminaison en direct.

Reportez-vous à pipeline-d'inférence-série.ipynb pour une mise en œuvre complète.

Nettoyer

Une fois les tests terminés, veuillez suivre les instructions de la section de nettoyage du bloc-notes pour supprimer les ressources fournies dans cet article afin d'éviter des frais inutiles. Faire référence à Tarification d'Amazon SageMaker pour plus de détails sur le coût des instances d’inférence.

```python
# Delete endpoint, model
try: print(f"Deleting model: {pipeline_model_name}") predictor.delete_model()
except Exception as e: print(f"Error deleting model: {pipeline_model_name}n{e}") pass try: print(f"Deleting endpoint: {endpoint_name}") predictor.delete_endpoint()
except Exception as e: print(f"Error deleting EP: {endpoint_name}n{e}") pass ```

Conclusion

Dans cet article, j'ai montré comment nous pouvons créer et déployer une application d'inférence ML en série à l'aide de conteneurs d'inférence personnalisés sur des points de terminaison en temps réel sur Amazon SageMaker.

Cette solution montre comment les clients peuvent apporter leurs propres conteneurs personnalisés pour l'hébergement sur Amazon SageMaker de manière rentable. Avec l'option BYOC, les clients peuvent rapidement créer et adapter leurs applications ML à déployer sur Amazon SageMaker.

Nous vous encourageons à essayer cette solution avec un ensemble de données pertinent pour les indicateurs clés de performance (KPI) de votre entreprise. Vous pouvez vous référer à l'intégralité de la solution dans ce GitHub référentiel.

Bibliographie

À propos de l’auteur

Praveen Chamarthi est un spécialiste principal de l'IA/ML chez Amazon Web Services. Il est passionné par l'IA/ML et tout ce qui concerne AWS. Il aide les clients à travers les Amériques à faire évoluer, innover et exploiter efficacement les charges de travail ML sur AWS. Pendant son temps libre, Praveen aime lire et aime les films de science-fiction.

Contenu propulsé par le référencement et distribution de relations publiques. Soyez amplifié aujourd'hui.
PlatoData.Network Ai générative verticale. Autonomisez-vous. Accéder ici.
PlatoAiStream. Intelligence Web3. Connaissance Amplifiée. Accéder ici.
PlatonESG. Carbone, Technologie propre, Énergie, Environnement, Solaire, La gestion des déchets. Accéder ici.
PlatoHealth. Veille biotechnologique et essais cliniques. Accéder ici.
La source: https://aws.amazon.com/blogs/machine-learning/build-and-deploy-ml-inference-applications-from-scratch-using-amazon-sagemaker/

Horodatage: 26 septembre 2023

Horodatage: Le 13 octobre 2022

Republié par Platon

L'instance Amazon EC2 DL2q pour une inférence d'IA rentable et hautes performances est désormais généralement disponible | Services Web Amazon

Favorisez la découverte et la réutilisation des fonctionnalités dans votre organisation à l'aide d'Amazon SageMaker Feature Store et de sa capacité de métadonnées au niveau des fonctionnalités

Premiers pas avec le déploiement de modèles en temps réel sur Amazon SageMaker

Prédire l'état de survie du cancer du poumon à l'aide de données multimodales sur Amazon SageMaker JumpStart

Comment Amazon Search exécute des projets de machine learning résilients à grande échelle avec Amazon SageMaker

À propos de nous

Recherche verticale et Ai

Plateforme

Restez à l'affût

Compte