Build And Deploy ML Inference Applications From Scratch Using Amazon SageMaker

Újra kiadta Platón

Követő: 0

Ahogy a gépi tanulás (ML) általánossá válik és egyre szélesebb körben elterjed, az ML-alapú következtetési alkalmazások egyre gyakoribbak számos összetett üzleti probléma megoldására. Ezeknek az összetett üzleti problémáknak a megoldása gyakran több ML modell és lépés alkalmazását igényli. Ez a bejegyzés bemutatja, hogyan hozhat létre és tárolhat ML-alkalmazást egyéni tárolókkal Amazon SageMaker.

Amazon SageMaker kínál beépített algoritmusok és a előre elkészített SageMaker docker képek a modell telepítéséhez. De ha ezek nem felelnek meg az Ön igényeinek, hozhatja saját konténereit (BYOC) az Amazon SageMaker tárhelyére.

Számos olyan felhasználási eset létezik, amikor a felhasználóknak szükségük lehet a BYOC használatára az Amazon SageMaker webhelyen való tároláshoz.

Egyéni ML-keretrendszerek vagy -könyvtárak: Ha olyan ML-keretrendszert vagy könyvtárakat tervez használni, amelyeket nem támogatnak az Amazon SageMaker beépített algoritmusai vagy előre elkészített tárolói, akkor létre kell hoznia egy egyéni tárolót.
Speciális modellek: Bizonyos tartományok vagy iparágak esetében olyan egyedi modellarchitektúrákra vagy személyre szabott előfeldolgozási lépésekre lehet szükség, amelyek nem állnak rendelkezésre a beépített Amazon SageMaker ajánlatokban.
Szabadalmaztatott algoritmusok: Ha házon belül fejlesztette ki saját szabadalmaztatott algoritmusait, akkor szüksége lesz egy egyéni tárolóra, hogy telepítse őket az Amazon SageMakeren.
Összetett következtetési folyamatok: Ha az ML következtetési munkafolyamat egyéni üzleti logikát tartalmaz – összetett lépések sorozatát, amelyeket egy adott sorrendben kell végrehajtani –, akkor a BYOC segíthet ezeknek a lépéseknek a hatékonyabb kezelésében és összehangolásában.

Megoldás áttekintése

Ebben a megoldásban bemutatjuk, hogyan lehet ML soros következtetési alkalmazást tárolni az Amazon SageMakeren valós idejű végpontokkal, két egyedi következtetési konténer használatával scikit-learn és a xgboost csomagokat.

Az első tartály a scikit-learn modell a nyers adatok kiemelt oszlopokká alakításához. Ez vonatkozik StandardScaler numerikus oszlopokhoz és OneHotEncoder a kategorikusaknak.

Build and deploy ML inference applications from scratch using Amazon SageMaker | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.

A második konténer egy előképzett XGboost modell (azaz előrejelző). Az előrejelző modell elfogadja a jellemző bemenetet és előrejelzéseket ad ki.

Build and deploy ML inference applications from scratch using Amazon SageMaker | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.

Végül telepítjük a jellemzője és a előrejelzője soros következtetési folyamatban egy Amazon SageMaker valós idejű végponthoz.

Íme néhány különböző megfontolás arra vonatkozóan, hogy miért érdemes külön tárolókat használni a következtetési alkalmazásban.

függetlenítés – A csővezeték különböző lépéseinek világosan meghatározott célja van, és a mögöttes függőségek miatt külön konténereken kell őket futtatni. Ez azt is segíti, hogy a csővezeték jól felépített legyen.
keretek – A csővezeték különböző lépései speciális, a célnak megfelelő keretrendszereket használnak (mint például a scikit vagy a Spark ML), ezért külön konténereken kell futtatni őket.
Erőforrások elszigeteltsége – A csővezeték különböző lépései eltérő erőforrás-felhasználással rendelkeznek, ezért külön konténereken kell futtatni a nagyobb rugalmasság és irányítás érdekében.
Karbantartás és frissítések – Működési szempontból ez elősegíti a funkcionális elkülönítést, és sokkal könnyebben folytathatja az egyes lépések frissítését vagy módosítását anélkül, hogy ez más modelleket érintene.

Ezenkívül az egyes tárolók helyi felépítése segít a fejlesztés és tesztelés iteratív folyamatában kedvenc eszközökkel és integrált fejlesztési környezetekkel (IDE). Ha a tárolók készen állnak, telepítheti őket az AWS-felhőbe az Amazon SageMaker végpontok használatával történő következtetések levonásához.

A teljes megvalósítás, beleértve a kódrészleteket, elérhető ebben a Github-tárházban itt.

Build and deploy ML inference applications from scratch using Amazon SageMaker | Amazon Web Services PlatoBlockchain Data Intelligence. Vertical Search. Ai.

Előfeltételek

Mivel ezeket az egyéni tárolókat először helyileg teszteljük, a dokkoló asztali számítógépet telepíteni kell a helyi számítógépére. Ismernie kell a dokkolókonténerek építését.

Az alkalmazás teljes körű teszteléséhez szüksége lesz egy AWS-fiókra is, amely hozzáféréssel rendelkezik az Amazon SageMaker, az Amazon ECR és az Amazon S3 szolgáltatásokhoz.

Győződjön meg arról, hogy a legújabb verzióval rendelkezik Boto3 és a telepített Amazon SageMaker Python csomagok:

pip install --upgrade boto3 sagemaker scikit-learn

Megoldás áttekintése

Készítsen egyedi jellemzők tárolóját

Az első konténer, a featurizer konténer megépítéséhez betanítjuk a scikit-learn modell nyers jellemzőinek feldolgozásához a kaliforniai ehető kagyló adatkészlet. Az előfeldolgozó szkript használja SimpleIputer a hiányzó értékek kezelésére, StandardScaler a numerikus oszlopok normalizálására, és OneHotEncoder kategorikus oszlopok átalakításához. A transzformátor felszerelése után elmentjük a modellt joblib formátum. Ezután tömörítjük és feltöltjük ezt a mentett modellterméket egy Amazon Simple Storage Service szolgáltatásba (Amazon S3) vödör.

Íme egy példa kódrészlet, amely ezt szemlélteti. Hivatkozni featurizer.ipynb a teljes megvalósításhoz:

```python
numeric_features = list(feature_columns_names)
numeric_features.remove("sex")
numeric_transformer = Pipeline( steps=[ ("imputer", SimpleImputer(strategy="median")), ("scaler", StandardScaler()), ]
) categorical_features = ["sex"]
categorical_transformer = Pipeline( steps=[ ("imputer", SimpleImputer(strategy="constant", fill_value="missing")), ("onehot", OneHotEncoder(handle_unknown="ignore")), ]
) preprocess = ColumnTransformer( transformers=[ ("num", numeric_transformer, numeric_features), ("cat", categorical_transformer, categorical_features), ]
) # Call fit on ColumnTransformer to fit all transformers to X, y
preprocessor = preprocess.fit(df_train_val) # Save the processor model to disk
joblib.dump(preprocess, os.path.join(model_dir, "preprocess.joblib"))
```

Ezután egy egyéni következtetési tároló létrehozásához a jellemzői modellhez készítünk egy Docker-képet nginx, gunicorn, lombik csomagokkal, valamint a jellemzői modell egyéb szükséges függőségeivel.

Az Nginx, a gunicorn és a Flask alkalmazás szolgál majd a tálalókészlet modelljeként az Amazon SageMaker valós idejű végpontjain.

Amikor egyéni konténereket viszünk be az Amazon SageMaker tárhelyére, biztosítanunk kell, hogy a következtetési szkript a következő feladatokat hajtsa végre, miután elindította a tárolón belül:

Modell betöltése: Következtetési szkript (preprocessing.py) hivatkoznia kell /opt/ml/model könyvtárba a modell tárolóba való betöltéséhez. Az Amazon S3 modellműtermékei letöltésre kerülnek, és az elérési úton lévő tárolóra fel lesznek szerelve /opt/ml/model.
Környezeti változók: Ha egyéni környezeti változókat szeretne átadni a tárolónak, meg kell adnia őket a tárolóban Modell létrehozási lépésben vagy közben Endpoint képzési munkából való létrehozás.
API követelmények: Az Inference szkriptnek mindkettőt meg kell valósítania /ping és a /invocations útvonalak Flask alkalmazásként. A /ping Az API-t egészségügyi ellenőrzésekhez használják, míg a /invocations Az API kezeli a következtetési kéréseket.
Fakitermelés: A következtetési szkriptben lévő kimeneti naplókat szabványos kimenetre kell írni (stdout) és standard hiba (stderr) patakok. Ezek a naplók ezután streamelésre kerülnek amazonfelhőóra az Amazon SageMaker által.

Itt egy részlet preprocessing.py amelyek végrehajtását mutatják be /ping és a /invocations.

Hivatkozni előfeldolgozás.py a Featurizer mappában a teljes megvalósításhoz.

```python
def load_model(): # Construct the path to the featurizer model file ft_model_path = os.path.join(MODEL_PATH, "preprocess.joblib") featurizer = None try: # Open the model file and load the featurizer using joblib with open(ft_model_path, "rb") as f: featurizer = joblib.load(f) print("Featurizer model loaded", flush=True) except FileNotFoundError: print(f"Error: Featurizer model file not found at {ft_model_path}", flush=True) except Exception as e: print(f"Error loading featurizer model: {e}", flush=True) # Return the loaded featurizer model, or None if there was an error return featurizer def transform_fn(request_body, request_content_type): """ Transform the request body into a usable numpy array for the model. This function takes the request body and content type as input, and returns a transformed numpy array that can be used as input for the prediction model. Parameters: request_body (str): The request body containing the input data. request_content_type (str): The content type of the request body. Returns: data (np.ndarray): Transformed input data as a numpy array. """ # Define the column names for the input data feature_columns_names = [ "sex", "length", "diameter", "height", "whole_weight", "shucked_weight", "viscera_weight", "shell_weight", ] label_column = "rings" # Check if the request content type is supported (text/csv) if request_content_type == "text/csv": # Load the featurizer model featurizer = load_model() # Check if the featurizer is a ColumnTransformer if isinstance( featurizer, sklearn.compose._column_transformer.ColumnTransformer ): print(f"Featurizer model loaded", flush=True) # Read the input data from the request body as a CSV file df = pd.read_csv(StringIO(request_body), header=None) # Assign column names based on the number of columns in the input data if len(df.columns) == len(feature_columns_names) + 1: # This is a labelled example, includes the ring label df.columns = feature_columns_names + [label_column] elif len(df.columns) == len(feature_columns_names): # This is an unlabelled example. df.columns = feature_columns_names # Transform the input data using the featurizer data = featurizer.transform(df) # Return the transformed data as a numpy array return data else: # Raise an error if the content type is unsupported raise ValueError("Unsupported content type: {}".format(request_content_type)) @app.route("/ping", methods=["GET"])
def ping(): # Check if the model can be loaded, set the status accordingly featurizer = load_model() status = 200 if featurizer is not None else 500 # Return the response with the determined status code return flask.Response(response="n", status=status, mimetype="application/json") @app.route("/invocations", methods=["POST"])
def invocations(): # Convert from JSON to dict print(f"Featurizer: received content type: {flask.request.content_type}") if flask.request.content_type == "text/csv": # Decode input data and transform input = flask.request.data.decode("utf-8") transformed_data = transform_fn(input, flask.request.content_type) # Format transformed_data into a csv string csv_buffer = io.StringIO() csv_writer = csv.writer(csv_buffer) for row in transformed_data: csv_writer.writerow(row) csv_buffer.seek(0) # Return the transformed data as a CSV string in the response return flask.Response(response=csv_buffer, status=200, mimetype="text/csv") else: print(f"Received: {flask.request.content_type}", flush=True) return flask.Response( response="Transformer: This predictor only supports CSV data", status=415, mimetype="text/plain", )
```

Készítsen Docker-képet jellemzőkkel és modellkiszolgálási kötegekkel

Most készítsünk egy Dockerfile-t egy egyéni alapkép használatával, és telepítsük a szükséges függőségeket.

Ehhez használjuk python:3.9-slim-buster mint az alapkép. Ezt bármely más, az Ön használati esetéhez kapcsolódó alapképet módosíthatja.

Ezután bemásoljuk az nginx konfigurációt, a gunicorn webszerver átjárófájlját és a következtetési szkriptet a tárolóba. Létrehozunk egy serve nevű python-szkriptet is, amely elindítja az nginx és gunicorn folyamatokat a háttérben, és a következtetési szkriptet (azaz a preprocessing.py Flask alkalmazást) állítja be a tároló belépési pontjaként.

Íme egy részlet a Dockerfile-ból a featurizer modell tárolására. A teljes megvalósításhoz lásd dockerfile alatt jellemzője mappát.

```docker
FROM python:3.9-slim-buster
… # Copy requirements.txt to /opt/program folder
COPY requirements.txt /opt/program/requirements.txt # Install packages listed in requirements.txt
RUN pip3 install --no-cache-dir -r /opt/program/requirements.txt # Copy contents of code/ dir to /opt/program
COPY code/ /opt/program/ # Set working dir to /opt/program which has the serve and inference.py scripts
WORKDIR /opt/program # Expose port 8080 for serving
EXPOSE 8080 ENTRYPOINT ["python"] # serve is a python script under code/ directory that launches nginx and gunicorn processes
CMD [ "serve" ]
```

Tesztelje az egyéni következtetési képet a jellemzővel helyileg

Most készítse el és tesztelje az egyéni következtetési tárolót a jellemzővel helyileg, az Amazon használatával SageMaker helyi mód. A helyi mód tökéletes a feldolgozási, betanítási és következtetési szkriptek tesztelésére anélkül, hogy bármilyen munkát elindítana az Amazon SageMakeren. A helyi tesztek eredményeinek megerősítése után minimális változtatásokkal könnyedén adaptálhatja a képzési és következtetési szkripteket az Amazon SageMakeren történő telepítéshez.

A featurizer egyéni képének helyi teszteléséhez először készítse el a képet a korábban definiált módon dockerfile. Ezután indítson el egy tárolót a jellemzői modellt tartalmazó könyvtár felcsatolásával (preprocess.joblib) hoz /opt/ml/model könyvtárban a tárolóban. Ezenkívül rendelje hozzá a 8080-as portot a tárolótól a gazdagéphez.

Az indítást követően következtetési kéréseket küldhet a következő címre http://localhost:8080/invocations.

A tároló felépítéséhez és elindításához nyisson meg egy terminált, és futtassa a következő parancsokat.

Vegye figyelembe, hogy ki kell cserélnie a <IMAGE_NAME>, ahogy az a következő kódban is látható, a tároló képnevével.

A következő parancs azt is feltételezi, hogy a betanított scikit-learn modell (preprocess.joblib) nevű könyvtárban található models.

```shell
docker build -t <IMAGE_NAME> .
``` ```shell
docker run –rm -v $(pwd)/models:/opt/ml/model -p 8080:8080 <IMAGE_NAME>
```

A tároló üzembe helyezése és működése után mind a kettőt tesztelhetjük /ping és a /invocations útvonalak curl parancsok segítségével.

Futtassa az alábbi parancsokat egy terminálról

```shell
# test /ping route on local endpoint
curl http://localhost:8080/ping # send raw csv string to /invocations. Endpoint should return transformed data
curl --data-raw 'I,0.365,0.295,0.095,0.25,0.1075,0.0545,0.08,9.0' -H 'Content-Type: text/csv' -v http://localhost:8080/invocations
```

Amikor nyers (transzformálatlan) adatokat küldenek a címre http://localhost:8080/invocations, a végpont átalakított adatokkal válaszol.

Valami ehhez hasonló választ kell látnod:

```shell
* Trying 127.0.0.1:8080...
* Connected to localhost (127.0.0.1) port 8080 (#0)
> POST /invocations HTTP/1.1
> Host: localhost: 8080
> User-Agent: curl/7.87.0
> Accept: */*
> Content -Type: text/csv
> Content -Length: 47
>
* Mark bundle as not supporting multiuse
> HTTP/1.1 200 OK
> Server: nginx/1.14.2
> Date: Sun, 09 Apr 2023 20:47:48 GMT
> Content -Type: text/csv; charset=utf-8
> Content -Length: 150
> Connection: keep -alive
-1.3317586042173168, -1.1425409076053987, -1.0579488602777858, -1.177706547272754, -1.130662184748842,
* Connection #0 to host localhost left intact
```

Most leállítjuk a futó tárolót, majd megcímkézzük és továbbítjuk a helyi egyéni képet egy privát Amazon Elastic Container Registry-be (Amazon ECR) adattár.

Tekintse meg a következő parancsokat az Amazon ECR-be való bejelentkezéshez, amely megcímkézi a helyi képet a teljes Amazon ECR-kép elérési útjával, majd továbbítja a képet az Amazon ECR-be. Ügyeljen arra, hogy cserélje ki region és a account változókat, hogy illeszkedjenek a környezetéhez.

```shell
# login to ecr with your credentials
aws ecr get-login-password - -region "${region}" |
docker login - -username AWS - -password-stdin ${account}".dkr.ecr."${region}".amazonaws.com # tag and push the image to private Amazon ECR
docker tag ${image} ${fullname}
docker push $ {fullname} ```

Hivatkozni tárat hozzon létre és a küldjön egy képet az Amazon ECR-re AWS parancssori felület (AWS CLI) parancsokat további információkért.

Választható lépés

Opcionálisan végrehajthat egy élő tesztet úgy, hogy a jellemzői modellt valós idejű végpontra telepíti az egyéni dokkolókép segítségével az Amazon ECR-ben. Hivatkozni featurizer.ipynb notebook az építkezés, a tesztelés és az egyéni kép Amazon ECR-be való küldésének teljes megvalósításához.

Az Amazon SageMaker inicializálja a következtetési végpontot, és átmásolja a modell melléktermékeit a /opt/ml/model könyvtárban a tárolóban. Lát Hogyan tölti be a SageMaker a modell műtermékeit.

Készítsen egyedi XGBoost előrejelző tárolót

Az XGBoost következtetési tároló felépítéséhez hasonló lépéseket követünk, mint a jellemzőkonténer képének elkészítésekor:

Letöltés előre kiképzett XGBoost az Amazon S3 modellje.
Hozza létre a inference.py szkript, amely betölti az előképzettet XGBoost modell, átalakítja a jellemzőből kapott transzformált bemeneti adatokat, és átalakítja a következőre XGBoost.DMatrix formátum, fut predict az emlékeztetőn, és json formátumban adja vissza az előrejelzéseket.
A modellkiszolgáló veremét alkotó parancsfájlok és konfigurációs fájlok (pl. nginx.conf, wsgi.pyés serve ugyanaz marad, és nem igényel módosítást.
Az általunk használt Ubuntu:18.04 mint a Dockerfile alapképe. Ez nem előfeltétel. Az ubuntu alapképet használjuk annak demonstrálására, hogy a konténerek bármilyen alapképpel építhetők.
Az ügyfél dokkolóképének felépítésének, a kép helyi tesztelésének és a tesztelt kép Amazon ECR-be küldésének lépései ugyanazok maradnak, mint korábban.

A rövidség kedvéért, mivel a lépések hasonlóak az előzőekben bemutatott módon; azonban a következőkben csak a megváltozott kódolást mutatjuk be.

Először is, a inference.py forgatókönyv. Íme egy részlet, amely bemutatja a megvalósítását /ping és a /invocations. Hivatkozni következtetés.py alatt a előrejelzője mappát a fájl teljes megvalósításához.

```python
@app.route("/ping", methods=["GET"])
def ping(): """ Check the health of the model server by verifying if the model is loaded. Returns a 200 status code if the model is loaded successfully, or a 500 status code if there is an error. Returns: flask.Response: A response object containing the status code and mimetype. """ status = 200 if model is not None else 500 return flask.Response(response="n", status=status, mimetype="application/json") @app.route("/invocations", methods=["POST"])
def invocations(): """ Handle prediction requests by preprocessing the input data, making predictions, and returning the predictions as a JSON object. This function checks if the request content type is supported (text/csv; charset=utf-8), and if so, decodes the input data, preprocesses it, makes predictions, and returns the predictions as a JSON object. If the content type is not supported, a 415 status code is returned. Returns: flask.Response: A response object containing the predictions, status code, and mimetype. """ print(f"Predictor: received content type: {flask.request.content_type}") if flask.request.content_type == "text/csv; charset=utf-8": input = flask.request.data.decode("utf-8") transformed_data = preprocess(input, flask.request.content_type) predictions = predict(transformed_data) # Return the predictions as a JSON object return json.dumps({"result": predictions}) else: print(f"Received: {flask.request.content_type}", flush=True) return flask.Response( response=f"XGBPredictor: This predictor only supports CSV data; Received: {flask.request.content_type}", status=415, mimetype="text/plain", ) ```

Íme egy részlet a Docker-fájlból az előrejelző modell tárolására. A teljes megvalósításhoz lásd dockerfile a prediktor mappa alatt.

```docker
FROM ubuntu:18.04 … # install required dependencies including flask, gunicorn, xgboost etc.,
RUN pip3 --no-cache-dir install flask gunicorn gevent numpy pandas xgboost # Copy contents of code/ dir to /opt/program
COPY code /opt/program # Set working dir to /opt/program which has the serve and inference.py scripts
WORKDIR /opt/program # Expose port 8080 for serving
EXPOSE 8080 ENTRYPOINT ["python"] # serve is a python script under code/ directory that launches nginx and gunicorn processes
CMD ["serve"]
```

Ezt követően folytatjuk ennek az egyéni előrejelző képnek az építését, tesztelését és az Amazon ECR egy privát adattárába történő elküldését. Hivatkozni előrejelző.ipynb notebook az egyéni kép létrehozásának, tesztelésének és az Amazon ECR-nek való elküldéséhez.

Telepítse a soros következtetési folyamatot

Miután mind a jellemző, mind az előrejelző képeket teszteltük, és továbbítottuk őket az Amazon ECR-hez, most feltöltjük modelltermékeinket egy Amazon S3 tárolóba.

Ezután két modellobjektumot hozunk létre: egyet a featurizer (azaz, preprocess.joblib) és egyéb a predictor (azaz, xgboost-model) a korábban felépített egyéni kép uri megadásával.

Itt van egy részlet, amely ezt mutatja. Hivatkozni serial-inference-pipeline.ipynb a teljes megvalósításhoz.

```python
suffix = f"{str(uuid4())[:5]}-{datetime.now().strftime('%d%b%Y')}" # Featurizer Model (SKLearn Model)
image_name = "<FEATURIZER_IMAGE_NAME>"
sklearn_image_uri = f"{account_id}.dkr.ecr.{region}.amazonaws.com/{image_name}:latest" featurizer_model_name = f""<FEATURIZER_MODEL_NAME>-{suffix}"
print(f"Creating Featurizer model: {featurizer_model_name}")
sklearn_model = Model( image_uri=featurizer_ecr_repo_uri, name=featurizer_model_name, model_data=featurizer_model_data, role=role,
) # Full name of the ECR repository
predictor_image_name = "<PREDICTOR_IMAGE_NAME>"
predictor_ecr_repo_uri
= f"{account_id}.dkr.ecr.{region}.amazonaws.com/{predictor_image_name}:latest" # Predictor Model (XGBoost Model)
predictor_model_name = f"""<PREDICTOR_MODEL_NAME>-{suffix}"
print(f"Creating Predictor model: {predictor_model_name}")
xgboost_model = Model( image_uri=predictor_ecr_repo_uri, name=predictor_model_name, model_data=predictor_model_data, role=role,
)
```

Most, hogy ezeket a tárolókat soros módon telepítsük, először létrehozunk egy PipelineModel tárgyat, és adja át a featurizer modell és a predictor modellt egy python lista objektumra ugyanabban a sorrendben.

Ezután hívjuk a .deploy() módszer a PipelineModel a példány típusának és példányszámának megadása.

```python
from sagemaker.pipeline import PipelineModel pipeline_model_name = f"Abalone-pipeline-{suffix}" pipeline_model = PipelineModel( name=pipeline_model_name, role=role, models=[sklearn_model, xgboost_model], sagemaker_session=sm_session,
) print(f"Deploying pipeline model {pipeline_model_name}...")
predictor = pipeline_model.deploy( initial_instance_count=1, instance_type="ml.m5.xlarge",
)
```

Ebben a szakaszban az Amazon SageMaker a soros következtetési folyamatot egy valós idejű végponthoz telepíti. Várjuk a végpontot InService.

Most már tesztelhetjük a végpontot úgy, hogy néhány következtetési kérést küldünk ennek az élő végpontnak.

Hivatkozni serial-inference-pipeline.ipynb a teljes megvalósításhoz.

Tisztítsuk meg

A tesztelés befejezése után kövesse a jegyzetfüzet tisztítási szakaszában található utasításokat az ebben a bejegyzésben biztosított erőforrások törléséhez, hogy elkerülje a felesleges költségeket. Hivatkozni Amazon SageMaker árképzés a következtetési példányok költségeivel kapcsolatos részletekért.

```python
# Delete endpoint, model
try: print(f"Deleting model: {pipeline_model_name}") predictor.delete_model()
except Exception as e: print(f"Error deleting model: {pipeline_model_name}n{e}") pass try: print(f"Deleting endpoint: {endpoint_name}") predictor.delete_endpoint()
except Exception as e: print(f"Error deleting EP: {endpoint_name}n{e}") pass ```

Következtetés

Ebben a bejegyzésben bemutattam, hogyan építhetünk fel és telepíthetünk soros ML következtetési alkalmazást egyéni következtetési tárolók használatával valós idejű végpontokhoz az Amazon SageMakeren.

Ez a megoldás bemutatja, hogyan hozhatják az ügyfelek költséghatékony módon saját egyedi konténereiket az Amazon SageMaker szolgáltatásra. A BYOC opcióval az ügyfelek gyorsan elkészíthetik és hozzáigazíthatják ML-alkalmazásaikat az Amazon SageMaker rendszerbe való telepítéséhez.

Javasoljuk, hogy próbálja ki ezt a megoldást az üzleti kulcsfontosságú teljesítménymutatók (KPI) szempontjából releváns adatkészlettel. Ebben a teljes megoldásra hivatkozhat GitHub tárház.

Referenciák

A szerzőről

Praveen Chamarthi az Amazon Web Services vezető AI/ML szakértője. Szenvedélye az AI/ML és minden AWS. Amerika-szerte segít ügyfeleinek az ML-munkaterhelések AWS-en való hatékony skálázásában, innovációjában és kezelésében. Szabadidejében Praveen szeret olvasni, és szereti a sci-fi filmeket.

SEO által támogatott tartalom és PR terjesztés. Erősödjön még ma.
PlatoData.Network Vertical Generative Ai. Erősítse meg magát. Hozzáférés itt.
PlatoAiStream. Web3 Intelligence. Felerősített tudás. Hozzáférés itt.
PlatoESG. Carbon, CleanTech, Energia, Környezet, Nap, Hulladékgazdálkodás. Hozzáférés itt.
PlatoHealth. Biotechnológiai és klinikai vizsgálatok intelligencia. Hozzáférés itt.
Forrás: https://aws.amazon.com/blogs/machine-learning/build-and-deploy-ml-inference-applications-from-scratch-using-amazon-sagemaker/

Időbélyeg: 26. szeptember 2023.

Időbélyeg: 27. szeptember 2023.

Az AWS az Amazon SageMaker 5 éves innovációját ünnepli

Forrás klaszter:

AWS gépi tanulás

Forrás csomópont: 1731317

Időbélyeg: 26. október 2022.

Nagy méretben készítsen elő adatokat az Amazon SageMaker Studio alkalmazásban a kiszolgáló nélküli AWS Glue interaktív PlatoBlockchain Data Intelligence munkamenetekkel. Függőleges keresés. Ai.

Az Amazon SageMaker Studio alkalmazásban kiszolgáló nélküli AWS Glue interaktív munkamenetek segítségével készítsen elő adatokat

Forrás klaszter:

AWS gépi tanulás

Forrás csomópont: 1663642

Időbélyeg: 13. szeptember 2022.

Újra kiadta Platón

Hozzon létre egy HCLS dokumentum-összefoglaló alkalmazást a Falcon segítségével az Amazon SageMaker JumpStart | Amazon webszolgáltatások

Használjon generatív mesterségesintelligencia-alapmodellt az összegzéshez és a kérdések megválaszolásához saját adatai alapján | Amazon webszolgáltatások

A jelzáloghitel-dokumentumok feldolgozása intelligens dokumentumfeldolgozással az Amazon Textract és az Amazon Comprehend segítségével

Csökkentse a gépi tanulási feladatok energiafogyasztását akár 90%-kal az AWS erre a célra épített gyorsítóival | Amazon webszolgáltatások

A többnyelvű ügyfélszolgálati fordítás egyszerűvé vált a Salesforce Service Cloudban az Amazon Translate segítségével

Gyorsítsa fel a befektetési folyamatot az AWS Low Code-No Code szolgáltatásokkal

Az MDaudit mesterséges intelligencia segítségével javítja az egészségügyi ügyfelek bevételeit | Amazon webszolgáltatások

Az AWS az Amazon SageMaker 5 éves innovációját ünnepli

Az Amazon SageMaker Studio alkalmazásban kiszolgáló nélküli AWS Glue interaktív munkamenetek segítségével készítsen elő adatokat

Rólunk

Vertical Search & Ai

Emelvény

Maradjon kapcsolatban

Fiók