Studio Amazon SageMaker adalah lingkungan pengembangan terintegrasi penuh (IDE) pertama untuk pembelajaran mesin (ML). Studio menyediakan satu antarmuka visual berbasis web tempat Anda dapat melakukan semua langkah pengembangan ML yang diperlukan untuk menyiapkan data, serta membangun, melatih, dan menerapkan model. Konfigurasi siklus hidup adalah skrip shell yang dipicu oleh peristiwa siklus hidup Studio, seperti memulai notebook Studio baru. Anda dapat menggunakan konfigurasi siklus hidup untuk mengotomatiskan penyesuaian untuk lingkungan Studio Anda. Penyesuaian ini mencakup penginstalan paket khusus, pengonfigurasian ekstensi notebook, pramuat set data, dan penyiapan repositori kode sumber. Misalnya, sebagai administrator untuk domain Studio, Anda mungkin menginginkannya hemat biaya dengan mematikan aplikasi notebook secara otomatis setelah lama tidak aktif.
Grafik Kit Pengembangan AWS Cloud (AWS CDK) adalah kerangka kerja untuk menentukan infrastruktur cloud melalui kode dan menyediakannya melalui Formasi AWS Cloud tumpukan. Tumpukan adalah kumpulan sumber daya AWS yang dapat diperbarui, dipindahkan, atau dihapus secara terprogram. CDK AWS konstruksi adalah blok pembangun aplikasi AWS CDK, yang mewakili cetak biru untuk menentukan arsitektur cloud.
Dalam postingan ini, kami menunjukkan cara menggunakan AWS CDK untuk menyiapkan Studio, menggunakan konfigurasi siklus hidup Studio, dan mengaktifkan aksesnya untuk ilmuwan data dan pengembang di organisasi Anda.
Ikhtisar solusi
Modularitas konfigurasi siklus hidup memungkinkan Anda menerapkannya ke semua pengguna di domain atau ke pengguna tertentu. Dengan cara ini, Anda dapat menyiapkan konfigurasi siklus hidup dan mereferensikannya di Studio gateway kernel atau server Jupyter dengan cepat dan konsisten. Gateway kernel adalah titik masuk untuk berinteraksi dengan instance notebook, sedangkan server Jupyter mewakili instance Studio. Ini memungkinkan Anda menerapkan praktik terbaik DevOps dan memenuhi standar keamanan, kepatuhan, dan konfigurasi di semua akun dan Wilayah AWS. Untuk posting ini, kami menggunakan Python sebagai bahasa utama, tetapi kodenya dapat dengan mudah diubah ke bahasa lain yang didukung AWS CDK. Untuk informasi lebih lanjut, lihat Bekerja dengan AWS CDK.
Prasyarat
Untuk memulai, pastikan Anda memiliki prasyarat berikut:
Kloning repositori GitHub
Pertama, clone itu Repositori GitHub.
Saat Anda mengkloning repositori, Anda dapat mengamati bahwa kami memiliki proyek AWS CDK klasik dengan direktori tersebut studio-lifecycle-config-construct
, yang berisi konstruk dan sumber daya yang diperlukan untuk membuat konfigurasi siklus hidup.
Konstruksi AWS CDK
File yang ingin kita periksa adalah aws_sagemaker_lifecycle.py
. File ini berisi SageMakerStudioLifeCycleConfig
konstruksi yang kami gunakan untuk mengatur dan membuat konfigurasi siklus hidup.
Grafik SageMakerStudioLifeCycleConfig
construct menyediakan kerangka kerja untuk membangun konfigurasi siklus hidup menggunakan kebiasaan AWS Lambda fungsi dan kode shell dibaca dari file. Konstruk berisi parameter berikut:
- ID โ Nama proyek saat ini.
- studio_lifecycle_content - The base64 konten yang dikodekan.
- studio_lifecycle_tags โ Label yang Anda tetapkan untuk mengatur sumber daya Amazon. Mereka dimasukkan sebagai key-value pair dan bersifat opsional untuk konfigurasi ini.
- studio_lifecycle_config_app_type -
JupyterServer
adalah untuk server unik itu sendiri, danKernelGateway
app sesuai dengan wadah gambar SageMaker yang sedang berjalan.
Untuk informasi selengkapnya tentang arsitektur notebook Studio, lihat Selami jauh ke dalam arsitektur Notebook Amazon SageMaker Studio.
Berikut ini adalah cuplikan kode konstruksi konfigurasi siklus hidup Studio (aws_sagemaker_lifecycle.py
):
Setelah Anda mengimpor dan menginstal konstruk, Anda dapat menggunakannya. Cuplikan kode berikut menunjukkan cara membuat konfigurasi siklus hidup menggunakan konstruk dalam tumpukan app.py
atau konstruksi lain:
Terapkan konstruksi AWS CDK
Untuk menerapkan tumpukan AWS CDK Anda, jalankan perintah berikut di lokasi tempat Anda mengkloning repositori.
Perintahnya mungkin python
alih-alih python3
tergantung pada konfigurasi jalur Anda.
- Buat lingkungan virtual:
- Untuk macOS/Linux, gunakan
python3 -m venv .cdk-venv
. - Untuk Windows, gunakan
python3 -m venv .cdk-venv
.
- Untuk macOS/Linux, gunakan
- Aktifkan lingkungan virtual:
- Untuk macOS/Linux, gunakan
source .cdk-venvbinactivate
. - Untuk Windows, gunakan
.cdk-venv/Scripts/activate.bat
. - Untuk PowerShell, gunakan
.cdk-venv/Scripts/activate.ps1
.
- Untuk macOS/Linux, gunakan
- Instal dependensi yang diperlukan:
pip install -r requirements.txt
pip install -r requirements-dev.txt
- Pada titik ini, Anda dapat secara opsional mensintesis template CloudFormation untuk kode ini:
- Terapkan solusi dengan perintah berikut:
aws configure
cdk bootstrap
cdk deploy
Saat tumpukan berhasil diterapkan, Anda seharusnya dapat melihat tumpukan di konsol CloudFormation.
Anda juga dapat melihat konfigurasi siklus proses di konsol SageMaker.
Pilih konfigurasi siklus proses untuk melihat kode shell yang berjalan serta semua tag yang Anda tetapkan.
Lampirkan konfigurasi siklus proses Studio
Ada beberapa cara untuk melampirkan konfigurasi siklus hidup. Pada bagian ini, kami menyajikan dua metode: menggunakan Konsol Manajemen AWS, dan secara terprogram menggunakan infrastruktur yang disediakan.
Lampirkan konfigurasi siklus hidup menggunakan konsol
Untuk menggunakan konsol, selesaikan langkah-langkah berikut:
- Di konsol SageMaker, pilih Domain di panel navigasi.
- Pilih nama domain yang Anda gunakan dan profil pengguna saat ini, lalu pilih Edit.
- Pilih konfigurasi siklus hidup yang ingin Anda gunakan dan pilih Melampirkan.
Dari sini, Anda juga dapat mengaturnya sebagai default.
Lampirkan konfigurasi siklus hidup secara terprogram
Anda juga dapat mengambil ARN dari konfigurasi siklus hidup Studio yang dibuat oleh konstruksi dan melampirkannya ke konstruksi Studio secara terprogram. Kode berikut menunjukkan ARN konfigurasi siklus hidup yang diteruskan ke konstruksi Studio:
Membersihkan
Selesaikan langkah-langkah di bagian ini untuk membersihkan sumber daya Anda.
Hapus konfigurasi siklus hidup Studio
Untuk menghapus konfigurasi siklus hidup Anda, selesaikan langkah-langkah berikut:
- Di konsol SageMaker, pilih Konfigurasi siklus hidup studio di panel navigasi.
- Pilih konfigurasi siklus hidup, lalu pilih Delete.
Hapus tumpukan AWS CDK
Setelah selesai dengan sumber daya yang Anda buat, Anda dapat menghancurkan tumpukan AWS CDK dengan menjalankan perintah berikut di lokasi tempat Anda mengkloning repositori:
Saat diminta untuk mengonfirmasi penghapusan tumpukan, masukkan yes
.
Anda juga dapat menghapus tumpukan di konsol AWS CloudFormation dengan langkah-langkah berikut:
- Pada konsol AWS CloudFormation, pilih Tumpukan di panel navigasi.
- Pilih tumpukan yang ingin Anda hapus.
- Di panel detail tumpukan, pilih Delete.
- Pilih Hapus tumpukan ketika diminta.
Jika Anda mengalami kesalahan, Anda mungkin harus menghapus beberapa sumber daya secara manual tergantung pada konfigurasi akun Anda.
Kesimpulan
Dalam postingan ini, kami membahas bagaimana Studio berfungsi sebagai IDE untuk beban kerja ML. Studio menawarkan dukungan konfigurasi siklus hidup, yang memungkinkan Anda menyiapkan skrip shell khusus untuk melakukan tugas otomatis, atau menyiapkan lingkungan pengembangan saat peluncuran. Kami menggunakan konstruksi AWS CDK untuk membangun infrastruktur untuk sumber daya kustom dan konfigurasi siklus hidup. Konstruksi disintesis ke dalam tumpukan CloudFormation yang kemudian diterapkan untuk membuat sumber daya kustom dan skrip siklus hidup yang digunakan di Studio dan kernel notebook.
Untuk informasi lebih lanjut, kunjungi Studio Amazon SageMaker.
Tentang Penulis
Corry Hairston adalah Insinyur Perangkat Lunak dengan Amazon ML Solutions Lab. Dia saat ini bekerja untuk menyediakan solusi perangkat lunak yang dapat digunakan kembali.
Alex Chirayath adalah Insinyur Pembelajaran Mesin Senior di Lab Solusi Amazon ML. Dia memimpin tim ilmuwan dan insinyur data untuk membangun aplikasi AI untuk memenuhi kebutuhan bisnis.
Gouri Pandeshwar adalah Manajer Insinyur di Amazon ML Solutions Lab. Dia dan tim insinyurnya bekerja untuk membangun solusi dan kerangka kerja yang dapat digunakan kembali yang membantu mempercepat adopsi layanan AI/ML AWS untuk kasus penggunaan bisnis pelanggan.
- Konten Bertenaga SEO & Distribusi PR. Dapatkan Amplifikasi Hari Ini.
- Keuangan EVM. Antarmuka Terpadu untuk Keuangan Terdesentralisasi. Akses Di Sini.
- Grup Media Kuantum. IR/PR Diperkuat. Akses Di Sini.
- PlatoAiStream. Kecerdasan Data Web3. Pengetahuan Diperkuat. Akses Di Sini.
- Sumber: https://aws.amazon.com/blogs/machine-learning/use-the-aws-cdk-to-deploy-amazon-sagemaker-studio-lifecycle-configurations/
- :adalah
- :Di mana
- $NAIK
- 100
- 12
- 14
- 7
- a
- Sanggup
- mempercepat
- mengakses
- Akun
- Akun
- di seluruh
- alamat
- Adopsi
- Setelah
- AI
- AI / ML
- Semua
- memungkinkan
- juga
- Amazon
- Lab Solusi Amazon ML
- Amazon SageMaker
- Studio Amazon SageMaker
- Amazon Web Services
- an
- dan
- Lain
- Apa pun
- aplikasi
- aplikasi
- Mendaftar
- aplikasi
- arsitektur
- ADALAH
- AS
- ditugaskan
- At
- melampirkan
- mengotomatisasikan
- Otomatis
- secara otomatis
- AWS
- Formasi AWS Cloud
- BE
- makhluk
- TERBAIK
- Praktik Terbaik
- Blok
- membangun
- Bangunan
- bisnis
- tapi
- by
- CAN
- kasus
- berubah
- Pilih
- klasik
- awan
- infrastruktur cloud
- kode
- koleksi
- COM
- lengkap
- pemenuhan
- konfigurasi
- Memastikan
- konsul
- membangun
- Wadah
- mengandung
- Konten
- berkorespondensi
- Biaya
- membuat
- dibuat
- terbaru
- Sekarang
- adat
- kustomisasi
- data
- kumpulan data
- mendalam
- Default
- mendefinisikan
- Tergantung
- menyebarkan
- dikerahkan
- menghancurkan
- rincian
- pengembang
- Pengembangan
- dibahas
- domain
- Nama domain
- dilakukan
- turun
- mudah
- antara
- aktif
- memungkinkan
- insinyur
- Insinyur
- Enter
- masuk
- Lingkungan Hidup
- lingkungan
- kesalahan
- peristiwa
- contoh
- ekstensi
- File
- Pertama
- berikut
- Untuk
- Kerangka
- kerangka
- dari
- sepenuhnya
- fungsi
- pintu gerbang
- mendapatkan
- GitHub
- Memiliki
- memiliki
- he
- membantu
- di sini
- -nya
- Seterpercayaapakah Olymp Trade? Kesimpulan
- How To
- HTML
- http
- HTTPS
- ID
- gambar
- mengimpor
- in
- termasuk
- informasi
- Infrastruktur
- install
- Instalasi
- contoh
- sebagai gantinya
- terpadu
- berinteraksi
- Antarmuka
- ke
- IT
- NYA
- Diri
- jpg
- laboratorium
- Label
- bahasa
- Bahasa
- jalankan
- Memimpin
- pengetahuan
- siklus hidup
- tempat
- Panjang
- mesin
- Mesin belajar
- Utama
- membuat
- pengelolaan
- manajer
- manual
- Mungkin..
- Pelajari
- metode
- ML
- model
- lebih
- terharu
- beberapa
- nama
- Navigasi
- kebutuhan
- New
- buku catatan
- mengamati
- of
- Penawaran
- on
- or
- organisasi
- Lainnya
- paket
- pasang
- pane
- parameter
- Lulus
- path
- Melakukan
- periode
- plato
- Kecerdasan Data Plato
- Data Plato
- Titik
- Pos
- PowerShell
- praktek
- Mempersiapkan
- prasyarat
- menyajikan
- Profil
- proyek
- disediakan
- menyediakan
- menyediakan
- Ular sanca
- segera
- Baca
- daerah
- gudang
- mewakili
- merupakan
- wajib
- Persyaratan
- sumber
- Sumber
- dapat digunakan kembali
- Run
- berjalan
- Safety/keselamatan
- pembuat bijak
- ilmuwan
- cakupan
- script
- Bagian
- DIRI
- senior
- melayani
- Layanan
- set
- pengaturan
- Kulit
- harus
- Menunjukkan
- Pertunjukkan
- menutup
- tunggal
- Perangkat lunak
- Software Engineer
- larutan
- Solusi
- beberapa
- sumber
- kode sumber
- tertentu
- tumpukan
- Tumpukan
- standar
- mulai
- Mulai
- Tangga
- studio
- berhasil
- seperti itu
- mendukung
- Didukung
- sistem
- tugas
- tim
- tim
- Template
- bahwa
- Grafik
- Mereka
- kemudian
- mereka
- ini
- Melalui
- untuk
- Pelatihan VE
- dipicu
- dua
- unik
- diperbarui
- menggunakan
- bekas
- Pengguna
- Pengguna
- menggunakan
- View
- maya
- Mengunjungi
- ingin
- Cara..
- cara
- we
- jaringan
- layanan web
- berbasis web
- BAIK
- ketika
- sedangkan
- yang
- akan
- Windows
- dengan
- kerja
- bekerja
- Kamu
- Anda
- zephyrnet.dll