Bangun dan Terapkan Aplikasi Inferensi ML Dari Awal Menggunakan Amazon SageMaker

Diterbitkan Ulang Oleh Plato

Followers: 0

Seiring dengan semakin populernya pembelajaran mesin (ML) dan adopsi yang lebih luas, aplikasi inferensi yang didukung ML menjadi semakin umum untuk memecahkan berbagai masalah bisnis yang kompleks. Solusi terhadap masalah bisnis yang kompleks ini sering kali memerlukan penggunaan beberapa model dan langkah ML. Postingan ini menunjukkan kepada Anda cara membuat dan menghosting aplikasi ML dengan container khusus Amazon SageMaker.

Penawaran Amazon SageMaker algoritme bawaan dan SageMaker yang sudah dibuat sebelumnya gambar buruh pelabuhan untuk penerapan model. Namun, jika ini tidak sesuai dengan kebutuhan Anda, Anda dapat membawa wadah Anda sendiri (BYOC) untuk hosting di Amazon SageMaker.

Ada beberapa kasus penggunaan di mana pengguna mungkin memerlukan BYOC untuk hosting di Amazon SageMaker.

Kerangka kerja atau pustaka ML khusus: Jika Anda berencana menggunakan kerangka kerja atau pustaka ML yang tidak didukung oleh algoritma bawaan Amazon SageMaker atau kontainer bawaan, maka Anda harus membuat kontainer khusus.
Model khusus: Untuk domain atau industri tertentu, Anda mungkin memerlukan arsitektur model tertentu atau langkah-langkah prapemrosesan khusus yang tidak tersedia dalam penawaran Amazon SageMaker bawaan.
Algoritme kepemilikan: Jika Anda telah mengembangkan algoritme kepemilikan Anda sendiri, maka Anda memerlukan wadah khusus untuk menerapkannya di Amazon SageMaker.
Pipeline inferensi kompleks: Jika alur kerja inferensi ML Anda melibatkan logika bisnis khusus — serangkaian langkah kompleks yang perlu dijalankan dalam urutan tertentu — maka BYOC dapat membantu Anda mengelola dan mengatur langkah-langkah ini dengan lebih efisien.

Ikhtisar solusi

Dalam solusi ini, kami menunjukkan cara menghosting aplikasi inferensi serial ML di Amazon SageMaker dengan titik akhir real-time menggunakan dua kontainer inferensi khusus dengan versi terbaru scikit-learn dan xgboost paket.

Wadah pertama menggunakan a scikit-learn model untuk mengubah data mentah menjadi kolom unggulan. Itu berlaku Penskala Standar untuk kolom numerik dan OneHotEncoder ke kategorikal.

Bangun dan terapkan aplikasi inferensi ML dari awal menggunakan Amazon SageMaker | Kecerdasan Data PlatoBlockchain Layanan Web Amazon. Pencarian Vertikal. Ai.

Kontainer kedua menampung yang sudah dilatih sebelumnya XGboost model (yaitu, prediktor). Model prediktor menerima prediksi masukan dan keluaran unggulan.

Bangun dan terapkan aplikasi inferensi ML dari awal menggunakan Amazon SageMaker | Kecerdasan Data PlatoBlockchain Layanan Web Amazon. Pencarian Vertikal. Ai.

Terakhir, kami menerapkan fituriser dan prediktor dalam pipa inferensi serial ke titik akhir real-time Amazon SageMaker.

Berikut adalah beberapa pertimbangan berbeda mengapa Anda mungkin ingin memiliki wadah terpisah dalam aplikasi inferensi Anda.

Decoupling – Berbagai langkah pipa memiliki tujuan yang jelas dan perlu dijalankan pada wadah terpisah karena dependensi mendasar yang terlibat. Ini juga membantu menjaga saluran tetap terstruktur dengan baik.
Kerangka – Berbagai langkah pipeline menggunakan kerangka kerja khusus yang sesuai dengan tujuan (seperti scikit atau Spark ML) dan oleh karena itu perlu dijalankan pada wadah terpisah.
Isolasi sumber daya – Berbagai langkah dari pipeline memiliki persyaratan konsumsi sumber daya yang berbeda dan oleh karena itu perlu dijalankan pada container terpisah untuk lebih banyak fleksibilitas dan kontrol.
Pemeliharaan dan peningkatan – Dari sudut pandang operasional, hal ini mendorong isolasi fungsional dan Anda dapat terus meningkatkan atau memodifikasi setiap langkah dengan lebih mudah, tanpa memengaruhi model lainnya.

Selain itu, pembangunan lokal dari masing-masing container membantu dalam proses pengembangan dan pengujian berulang dengan alat favorit dan Lingkungan Pengembangan Terpadu (IDE). Setelah kontainer siap, Anda dapat menerapkannya ke AWS cloud untuk inferensi menggunakan titik akhir Amazon SageMaker.

Implementasi penuh, termasuk cuplikan kode, tersedia di repositori Github ini di sini.

Bangun dan terapkan aplikasi inferensi ML dari awal menggunakan Amazon SageMaker | Kecerdasan Data PlatoBlockchain Layanan Web Amazon. Pencarian Vertikal. Ai.

Prasyarat

Saat kami menguji kontainer khusus ini secara lokal terlebih dahulu, kami perlu menginstal docker desktop di komputer lokal Anda. Anda harus terbiasa dengan pembuatan container buruh pelabuhan.

Anda juga memerlukan akun AWS dengan akses ke Amazon SageMaker, Amazon ECR, dan Amazon S3 untuk menguji aplikasi ini secara end-to-end.

Pastikan Anda memiliki versi terbaru Boto3 dan paket Amazon SageMaker Python diinstal:

pip install --upgrade boto3 sagemaker scikit-learn

Panduan Solusi

Buat wadah fitur khusus

Untuk membangun container pertama, container featureizer, kami melatih a scikit-learn model untuk memproses fitur mentah di pauhi Himpunan data. Skrip prapemrosesan menggunakan SederhanaImputer untuk menangani nilai yang hilang, Penskala Standar untuk normalisasi kolom numerik, dan OneHotEncoder untuk mengubah kolom kategorikal. Setelah memasang trafo, kita simpan modelnya pekerjaan format. Kami kemudian mengompres dan mengunggah artefak model tersimpan ini ke Amazon Simple Storage Service (Amazon S3) keranjang.

Berikut cuplikan kode contoh yang menunjukkan hal ini. Mengacu pada fiturizer.ipynb untuk implementasi penuh:

```python
numeric_features = list(feature_columns_names)
numeric_features.remove("sex")
numeric_transformer = Pipeline( steps=[ ("imputer", SimpleImputer(strategy="median")), ("scaler", StandardScaler()), ]
) categorical_features = ["sex"]
categorical_transformer = Pipeline( steps=[ ("imputer", SimpleImputer(strategy="constant", fill_value="missing")), ("onehot", OneHotEncoder(handle_unknown="ignore")), ]
) preprocess = ColumnTransformer( transformers=[ ("num", numeric_transformer, numeric_features), ("cat", categorical_transformer, categorical_features), ]
) # Call fit on ColumnTransformer to fit all transformers to X, y
preprocessor = preprocess.fit(df_train_val) # Save the processor model to disk
joblib.dump(preprocess, os.path.join(model_dir, "preprocess.joblib"))
```

Selanjutnya, untuk membuat wadah inferensi khusus untuk model featurizer, kami membuat image Docker dengan paket nginx, gunicorn, flask, serta dependensi lain yang diperlukan untuk model featurizer.

Nginx, gunicorn, dan aplikasi Flask akan berfungsi sebagai tumpukan penyajian model di titik akhir real-time Amazon SageMaker.

Saat membawa kontainer khusus untuk hosting di Amazon SageMaker, kita perlu memastikan bahwa skrip inferensi melakukan tugas-tugas berikut setelah diluncurkan di dalam kontainer:

Pemuatan model: Skrip inferensi (preprocessing.py) harus mengacu pada /opt/ml/model direktori untuk memuat model dalam wadah. Artefak model di Amazon S3 akan diunduh dan dipasang ke kontainer di jalur tersebut /opt/ml/model.
Variabel lingkungan: Untuk meneruskan variabel lingkungan khusus ke kontainer, Anda harus menentukannya selama proses Model langkah pembuatan atau selama Titik akhir penciptaan dari pekerjaan pelatihan.
Persyaratan API: Skrip Inferensi harus mengimplementasikan keduanya /ping dan /invocations rute sebagai aplikasi Flask. Itu /ping API digunakan untuk pemeriksaan kesehatan, sedangkan /invocations API menangani permintaan inferensi.
Pencatatan: Log keluaran dalam skrip inferensi harus ditulis ke keluaran standar (stdout) dan kesalahan standar (stderr) aliran. Log ini kemudian dialirkan ke amazoncloudwatch oleh Amazon SageMaker.

Ini cuplikan dari preprocessing.py yang menunjukkan implementasi /ping dan /invocations.

Lihat prapemrosesan.py di bawah folder featureizer untuk implementasi penuh.

```python
def load_model(): # Construct the path to the featurizer model file ft_model_path = os.path.join(MODEL_PATH, "preprocess.joblib") featurizer = None try: # Open the model file and load the featurizer using joblib with open(ft_model_path, "rb") as f: featurizer = joblib.load(f) print("Featurizer model loaded", flush=True) except FileNotFoundError: print(f"Error: Featurizer model file not found at {ft_model_path}", flush=True) except Exception as e: print(f"Error loading featurizer model: {e}", flush=True) # Return the loaded featurizer model, or None if there was an error return featurizer def transform_fn(request_body, request_content_type): """ Transform the request body into a usable numpy array for the model. This function takes the request body and content type as input, and returns a transformed numpy array that can be used as input for the prediction model. Parameters: request_body (str): The request body containing the input data. request_content_type (str): The content type of the request body. Returns: data (np.ndarray): Transformed input data as a numpy array. """ # Define the column names for the input data feature_columns_names = [ "sex", "length", "diameter", "height", "whole_weight", "shucked_weight", "viscera_weight", "shell_weight", ] label_column = "rings" # Check if the request content type is supported (text/csv) if request_content_type == "text/csv": # Load the featurizer model featurizer = load_model() # Check if the featurizer is a ColumnTransformer if isinstance( featurizer, sklearn.compose._column_transformer.ColumnTransformer ): print(f"Featurizer model loaded", flush=True) # Read the input data from the request body as a CSV file df = pd.read_csv(StringIO(request_body), header=None) # Assign column names based on the number of columns in the input data if len(df.columns) == len(feature_columns_names) + 1: # This is a labelled example, includes the ring label df.columns = feature_columns_names + [label_column] elif len(df.columns) == len(feature_columns_names): # This is an unlabelled example. df.columns = feature_columns_names # Transform the input data using the featurizer data = featurizer.transform(df) # Return the transformed data as a numpy array return data else: # Raise an error if the content type is unsupported raise ValueError("Unsupported content type: {}".format(request_content_type)) @app.route("/ping", methods=["GET"])
def ping(): # Check if the model can be loaded, set the status accordingly featurizer = load_model() status = 200 if featurizer is not None else 500 # Return the response with the determined status code return flask.Response(response="n", status=status, mimetype="application/json") @app.route("/invocations", methods=["POST"])
def invocations(): # Convert from JSON to dict print(f"Featurizer: received content type: {flask.request.content_type}") if flask.request.content_type == "text/csv": # Decode input data and transform input = flask.request.data.decode("utf-8") transformed_data = transform_fn(input, flask.request.content_type) # Format transformed_data into a csv string csv_buffer = io.StringIO() csv_writer = csv.writer(csv_buffer) for row in transformed_data: csv_writer.writerow(row) csv_buffer.seek(0) # Return the transformed data as a CSV string in the response return flask.Response(response=csv_buffer, status=200, mimetype="text/csv") else: print(f"Received: {flask.request.content_type}", flush=True) return flask.Response( response="Transformer: This predictor only supports CSV data", status=415, mimetype="text/plain", )
```

Bangun image Docker dengan featureizer dan tumpukan penyajian model

Sekarang mari kita membangun Dockerfile menggunakan image dasar kustom dan menginstal dependensi yang diperlukan.

Untuk ini, kami menggunakan python:3.9-slim-buster sebagai gambar dasar. Anda dapat mengubah gambar dasar lainnya yang relevan dengan kasus penggunaan Anda.

Kami kemudian menyalin konfigurasi nginx, file gateway server web gunicorn, dan skrip inferensi ke container. Kami juga membuat skrip python bernama serve yang meluncurkan proses nginx dan gunicorn di latar belakang dan menetapkan skrip inferensi (yaitu, aplikasi preprocessing.py Flask) sebagai titik masuk untuk container.

Berikut cuplikan Dockerfile untuk menghosting model featureizer. Untuk implementasi penuh, lihat Dockerfile bawah fituriser folder.

```docker
FROM python:3.9-slim-buster
… # Copy requirements.txt to /opt/program folder
COPY requirements.txt /opt/program/requirements.txt # Install packages listed in requirements.txt
RUN pip3 install --no-cache-dir -r /opt/program/requirements.txt # Copy contents of code/ dir to /opt/program
COPY code/ /opt/program/ # Set working dir to /opt/program which has the serve and inference.py scripts
WORKDIR /opt/program # Expose port 8080 for serving
EXPOSE 8080 ENTRYPOINT ["python"] # serve is a python script under code/ directory that launches nginx and gunicorn processes
CMD [ "serve" ]
```

Uji gambar inferensi khusus dengan featureizer secara lokal

Sekarang, buat dan uji wadah inferensi khusus dengan featureizer secara lokal, menggunakan Amazon Mode lokal SageMaker. Mode lokal sempurna untuk menguji skrip pemrosesan, pelatihan, dan inferensi Anda tanpa meluncurkan tugas apa pun di Amazon SageMaker. Setelah mengonfirmasi hasil pengujian lokal, Anda dapat dengan mudah mengadaptasi skrip pelatihan dan inferensi untuk penerapan di Amazon SageMaker dengan sedikit perubahan.

Untuk menguji gambar kustom featureizer secara lokal, pertama-tama buat gambar menggunakan gambar yang telah ditentukan sebelumnya Dockerfile. Kemudian, luncurkan sebuah container dengan memasang direktori yang berisi model featureizer (preprocess.joblib) ke /opt/ml/model direktori di dalam wadah. Selain itu, petakan port 8080 dari kontainer ke host.

Setelah diluncurkan, Anda dapat mengirim permintaan inferensi ke http://localhost:8080/invocations.

Untuk membangun dan meluncurkan kontainer, buka terminal dan jalankan perintah berikut.

Perhatikan bahwa Anda harus mengganti <IMAGE_NAME>, seperti yang ditunjukkan pada kode berikut, dengan nama gambar container Anda.

Perintah berikut juga mengasumsikan bahwa yang terlatih scikit-learn model (preprocess.joblib) ada di bawah direktori bernama models.

```shell
docker build -t <IMAGE_NAME> .
``` ```shell
docker run –rm -v $(pwd)/models:/opt/ml/model -p 8080:8080 <IMAGE_NAME>
```

Setelah container aktif dan berjalan, kita dapat menguji keduanya /ping dan / doa rute menggunakan perintah curl.

Jalankan perintah di bawah ini dari terminal

```shell
# test /ping route on local endpoint
curl http://localhost:8080/ping # send raw csv string to /invocations. Endpoint should return transformed data
curl --data-raw 'I,0.365,0.295,0.095,0.25,0.1075,0.0545,0.08,9.0' -H 'Content-Type: text/csv' -v http://localhost:8080/invocations
```

Ketika data mentah (belum diubah) dikirim ke http://localhost:8080/invocations, titik akhir merespons dengan data yang diubah.

Anda akan melihat respons yang mirip dengan berikut ini:

```shell
* Trying 127.0.0.1:8080...
* Connected to localhost (127.0.0.1) port 8080 (#0)
> POST /invocations HTTP/1.1
> Host: localhost: 8080
> User-Agent: curl/7.87.0
> Accept: */*
> Content -Type: text/csv
> Content -Length: 47
>
* Mark bundle as not supporting multiuse
> HTTP/1.1 200 OK
> Server: nginx/1.14.2
> Date: Sun, 09 Apr 2023 20:47:48 GMT
> Content -Type: text/csv; charset=utf-8
> Content -Length: 150
> Connection: keep -alive
-1.3317586042173168, -1.1425409076053987, -1.0579488602777858, -1.177706547272754, -1.130662184748842,
* Connection #0 to host localhost left intact
```

Kami sekarang menghentikan kontainer yang sedang berjalan, lalu memberi tag dan mendorong citra kustom lokal ke Amazon Elastic Container Registry pribadi (ECR Amazon) penyimpanan.

Lihat perintah berikut untuk masuk ke Amazon ECR, yang menandai citra lokal dengan jalur citra Amazon ECR lengkap dan kemudian mendorong citra tersebut ke Amazon ECR. Pastikan Anda menggantinya region dan account variabel yang sesuai dengan lingkungan Anda.

```shell
# login to ecr with your credentials
aws ecr get-login-password - -region "${region}" |
docker login - -username AWS - -password-stdin ${account}".dkr.ecr."${region}".amazonaws.com # tag and push the image to private Amazon ECR
docker tag ${image} ${fullname}
docker push $ {fullname} ```

Lihat membuat repositori dan mendorong gambar ke Amazon ECR Antarmuka Baris Perintah AWS (AWS CLI) perintah untuk informasi lebih lanjut.

Langkah opsional

Secara opsional, Anda dapat melakukan pengujian langsung dengan menerapkan model featureizer ke titik akhir real-time dengan citra buruh pelabuhan khusus di Amazon ECR. Mengacu pada fiturizer.ipynb notebook untuk implementasi penuh pembuatan, pengujian, dan pengiriman citra kustom ke Amazon ECR.

Amazon SageMaker menginisialisasi titik akhir inferensi dan menyalin artefak model ke /opt/ml/model direktori di dalam wadah. Melihat Bagaimana SageMaker Memuat artefak Model Anda.

Buat wadah prediktor XGBoost khusus

Untuk membuat wadah inferensi XGBoost, kami mengikuti langkah serupa seperti yang kami lakukan saat membuat gambar untuk wadah featureizer:

Unduh pra-terlatih XGBoost model dari Amazon S3.
Buat inference.py skrip yang memuat yang telah dilatih sebelumnya XGBoost model, mengonversi data masukan yang diubah yang diterima dari featureizer, dan mengonversinya menjadi XGBoost.DMatrix format, berjalan predict di booster, dan mengembalikan prediksi dalam format json.
Skrip dan file konfigurasi yang membentuk tumpukan penyajian model (yaitu, nginx.conf, wsgi.py, dan serve tetap sama dan tidak memerlukan modifikasi.
Kami menggunakan Ubuntu:18.04 sebagai gambar dasar untuk Dockerfile. Ini bukanlah prasyarat. Kami menggunakan gambar dasar ubuntu untuk menunjukkan bahwa container dapat dibuat dengan gambar dasar apa pun.
Langkah-langkah untuk membangun citra buruh pelabuhan pelanggan, menguji citra secara lokal, dan mendorong citra yang diuji ke Amazon ECR tetap sama seperti sebelumnya.

Untuk singkatnya, langkah-langkah serupa ditunjukkan sebelumnya; namun, kami hanya menampilkan perubahan kode berikut ini.

Pertama, inference.py naskah. Berikut cuplikan yang menunjukkan implementasi /ping dan /invocations. Mengacu pada inferensi.py bawah prediktor folder untuk implementasi penuh file ini.

```python
@app.route("/ping", methods=["GET"])
def ping(): """ Check the health of the model server by verifying if the model is loaded. Returns a 200 status code if the model is loaded successfully, or a 500 status code if there is an error. Returns: flask.Response: A response object containing the status code and mimetype. """ status = 200 if model is not None else 500 return flask.Response(response="n", status=status, mimetype="application/json") @app.route("/invocations", methods=["POST"])
def invocations(): """ Handle prediction requests by preprocessing the input data, making predictions, and returning the predictions as a JSON object. This function checks if the request content type is supported (text/csv; charset=utf-8), and if so, decodes the input data, preprocesses it, makes predictions, and returns the predictions as a JSON object. If the content type is not supported, a 415 status code is returned. Returns: flask.Response: A response object containing the predictions, status code, and mimetype. """ print(f"Predictor: received content type: {flask.request.content_type}") if flask.request.content_type == "text/csv; charset=utf-8": input = flask.request.data.decode("utf-8") transformed_data = preprocess(input, flask.request.content_type) predictions = predict(transformed_data) # Return the predictions as a JSON object return json.dumps({"result": predictions}) else: print(f"Received: {flask.request.content_type}", flush=True) return flask.Response( response=f"XGBPredictor: This predictor only supports CSV data; Received: {flask.request.content_type}", status=415, mimetype="text/plain", ) ```

Berikut cuplikan Dockerfile untuk menghosting model prediktor. Untuk implementasi penuh, lihat Dockerfile di bawah folder prediktor.

```docker
FROM ubuntu:18.04 … # install required dependencies including flask, gunicorn, xgboost etc.,
RUN pip3 --no-cache-dir install flask gunicorn gevent numpy pandas xgboost # Copy contents of code/ dir to /opt/program
COPY code /opt/program # Set working dir to /opt/program which has the serve and inference.py scripts
WORKDIR /opt/program # Expose port 8080 for serving
EXPOSE 8080 ENTRYPOINT ["python"] # serve is a python script under code/ directory that launches nginx and gunicorn processes
CMD ["serve"]
```

Kami kemudian melanjutkan membangun, menguji, dan mendorong citra prediktor khusus ini ke repositori pribadi di Amazon ECR. Mengacu pada prediktor.ipynb notebook untuk implementasi penuh pembuatan, pengujian, dan pengiriman citra kustom ke Amazon ECR.

Menyebarkan alur inferensi serial

Setelah kami menguji gambar featureizer dan prediktor dan mendorongnya ke Amazon ECR, sekarang kami mengunggah artefak model kami ke bucket Amazon S3.

Lalu, kita membuat dua objek model: satu untuk featurizer (yaitu, preprocess.joblib) dan lainnya untuk predictor (yaitu, xgboost-model) dengan menentukan uri gambar khusus yang kita buat sebelumnya.

Berikut cuplikan yang menunjukkan hal itu. Mengacu pada serial-inferensi-pipa.ipynb untuk implementasi penuh.

```python
suffix = f"{str(uuid4())[:5]}-{datetime.now().strftime('%d%b%Y')}" # Featurizer Model (SKLearn Model)
image_name = "<FEATURIZER_IMAGE_NAME>"
sklearn_image_uri = f"{account_id}.dkr.ecr.{region}.amazonaws.com/{image_name}:latest" featurizer_model_name = f""<FEATURIZER_MODEL_NAME>-{suffix}"
print(f"Creating Featurizer model: {featurizer_model_name}")
sklearn_model = Model( image_uri=featurizer_ecr_repo_uri, name=featurizer_model_name, model_data=featurizer_model_data, role=role,
) # Full name of the ECR repository
predictor_image_name = "<PREDICTOR_IMAGE_NAME>"
predictor_ecr_repo_uri
= f"{account_id}.dkr.ecr.{region}.amazonaws.com/{predictor_image_name}:latest" # Predictor Model (XGBoost Model)
predictor_model_name = f"""<PREDICTOR_MODEL_NAME>-{suffix}"
print(f"Creating Predictor model: {predictor_model_name}")
xgboost_model = Model( image_uri=predictor_ecr_repo_uri, name=predictor_model_name, model_data=predictor_model_data, role=role,
)
```

Sekarang, untuk menyebarkan container ini secara serial, pertama-tama kita membuat a Model Pipa objek dan lulus featurizer model dan predictor model ke objek daftar python dalam urutan yang sama.

Kemudian, kami memanggil .deploy() metode di Model Pipa menentukan jenis instans dan jumlah instans.

```python
from sagemaker.pipeline import PipelineModel pipeline_model_name = f"Abalone-pipeline-{suffix}" pipeline_model = PipelineModel( name=pipeline_model_name, role=role, models=[sklearn_model, xgboost_model], sagemaker_session=sm_session,
) print(f"Deploying pipeline model {pipeline_model_name}...")
predictor = pipeline_model.deploy( initial_instance_count=1, instance_type="ml.m5.xlarge",
)
```

Pada tahap ini, Amazon SageMaker menyebarkan pipa inferensi serial ke titik akhir waktu nyata. Kami menunggu titik akhir InService.

Kami sekarang dapat menguji titik akhir dengan mengirimkan beberapa permintaan inferensi ke titik akhir langsung ini.

Lihat serial-inferensi-pipa.ipynb untuk implementasi penuh.

Membersihkan

Setelah Anda selesai menguji, ikuti petunjuk di bagian pembersihan buku catatan untuk menghapus sumber daya yang disediakan dalam postingan ini untuk menghindari biaya yang tidak perlu. Mengacu pada Harga Amazon SageMaker untuk rincian tentang biaya instans inferensi.

```python
# Delete endpoint, model
try: print(f"Deleting model: {pipeline_model_name}") predictor.delete_model()
except Exception as e: print(f"Error deleting model: {pipeline_model_name}n{e}") pass try: print(f"Deleting endpoint: {endpoint_name}") predictor.delete_endpoint()
except Exception as e: print(f"Error deleting EP: {endpoint_name}n{e}") pass ```

Kesimpulan

Dalam postingan ini, saya menunjukkan bagaimana kita dapat membangun dan menerapkan aplikasi inferensi ML serial menggunakan wadah inferensi khusus ke titik akhir waktu nyata di Amazon SageMaker.

Solusi ini menunjukkan bagaimana pelanggan dapat membawa wadah khusus mereka sendiri untuk hosting di Amazon SageMaker dengan cara yang hemat biaya. Dengan opsi BYOC, pelanggan dapat dengan cepat membangun dan mengadaptasi aplikasi ML mereka untuk diterapkan ke Amazon SageMaker.

Kami mendorong Anda untuk mencoba solusi ini dengan kumpulan data yang relevan dengan Indikator Kinerja Utama (KPI) bisnis Anda. Anda dapat merujuk ke seluruh solusi di sini Repositori GitHub.

Referensi

tentang Penulis

Praveen Chamarthi adalah Spesialis AI/ML Senior di Amazon Web Services. Dia sangat menyukai AI/ML dan semua hal tentang AWS. Dia membantu pelanggan di seluruh Amerika untuk menskalakan, berinovasi, dan mengoperasikan beban kerja ML secara efisien di AWS. Di waktu luangnya, Praveen suka membaca dan menikmati film sci-fi.

Konten Bertenaga SEO & Distribusi PR. Dapatkan Amplifikasi Hari Ini.
PlatoData.Jaringan Vertikal Generatif Ai. Berdayakan Diri Anda. Akses Di Sini.
PlatoAiStream. Intelijen Web3. Pengetahuan Diperkuat. Akses Di Sini.
PlatoESG. Karbon, teknologi bersih, energi, Lingkungan Hidup, Tenaga surya, Penanganan limbah. Akses Di Sini.
PlatoHealth. Kecerdasan Uji Coba Biotek dan Klinis. Akses Di Sini.
Sumber: https://aws.amazon.com/blogs/machine-learning/build-and-deploy-ml-inference-applications-from-scratch-using-amazon-sagemaker/

Stempel Waktu: September 26, 2023

Stempel Waktu: Agustus 25, 2022

Diterbitkan Ulang Oleh Plato

Bangun saluran penguraian dokumen multi-format yang dapat dilacak, kustom, dengan Amazon Textract

Temukan wawasan dari Zendesk dengan pencarian cerdas Amazon Kendra

Latih model perkiraan deret waktu lebih cepat dengan Amazon SageMaker Canvas Quick build

Peramalan yang mudah dan akurat dengan AutoGluon-TimeSeries

Menyusun data PII di The Very Group dengan Amazon Comprehend

Ubah, analisis, dan temukan wawasan dari data layanan kesehatan tidak terstruktur menggunakan Amazon HealthLake

Bangun alur kerja terjemahan dokumen multibahasa dengan penyesuaian khusus domain dan bahasa tertentu

Tentang Kami

Pencarian Vertikal & Ai

Platform

Tetap Berhubung

Akun