RStudio di Amazon SageMaker adalah RStudio Workbench pertama yang dikelola sepenuhnya di industri di cloud. Anda dapat dengan cepat meluncurkan lingkungan pengembangan terintegrasi (IDE) RStudio yang familier, dan menghubungkan sumber daya komputasi yang mendasarinya tanpa mengganggu pekerjaan Anda, membuatnya mudah untuk membangun pembelajaran mesin (ML) dan solusi analitik dalam skala R. RStudio di SageMaker sudah hadir dengan gambar bawaan prakonfigurasi dengan pemrograman R dan alat ilmu data; namun, Anda sering kali perlu menyesuaikan lingkungan IDE Anda. Mulai hari ini, Anda dapat membawa gambar kustom Anda sendiri dengan paket dan alat pilihan Anda, dan membuatnya tersedia untuk semua pengguna RStudio di SageMaker dalam beberapa klik.
Membawa gambar kustom Anda sendiri memiliki beberapa manfaat. Anda dapat menstandardisasi dan menyederhanakan pengalaman memulai untuk ilmuwan dan pengembang data dengan menyediakan gambar awal, mengonfigurasi awal driver yang diperlukan untuk menghubungkan ke penyimpanan data, atau pra-instal perangkat lunak ilmu data khusus untuk domain bisnis Anda. Selain itu, organisasi yang sebelumnya telah menghosting RStudio Workbench mereka sendiri mungkin memiliki lingkungan kemas yang ingin terus mereka gunakan di RStudio di SageMaker.
Dalam posting ini, kami membagikan petunjuk langkah demi langkah untuk membuat gambar khusus dan membawanya ke RStudio di SageMaker menggunakan Konsol Manajemen AWS or Antarmuka Baris Perintah AWS (AWS CLI). Anda bisa mendapatkan lingkungan IDE kustom pertama Anda dan berjalan dalam beberapa langkah sederhana. Untuk informasi lebih lanjut tentang konten yang dibahas dalam posting ini, lihat Bawa gambar RStudio Anda sendiri.
Ikhtisar solusi
Saat ilmuwan data memulai sesi baru di RStudio di SageMaker, instans komputasi ML sesuai permintaan baru disediakan dan gambar kontainer yang mendefinisikan lingkungan waktu proses (sistem operasi, pustaka, versi R, dan seterusnya) dijalankan di ML contoh. Anda dapat memberikan beberapa pilihan kepada ilmuwan data Anda untuk lingkungan runtime dengan membuat gambar wadah khusus dan membuatnya tersedia di peluncur RStudio Workbench, seperti yang ditunjukkan pada tangkapan layar berikut.
Diagram berikut menjelaskan proses untuk menghadirkan gambar kustom Anda. Pertama, Anda membuat image container khusus dari Dockerfile dan mendorongnya ke repositori di Registry Kontainer Elastis Amazon (Amazon ECR). Selanjutnya, Anda membuat gambar SageMaker yang mengarah ke gambar kontainer di Amazon ECR, dan melampirkan gambar itu ke Domain SageMaker. Ini membuat gambar kustom tersedia untuk meluncurkan sesi baru di RStudio.
Prasyarat
Untuk menerapkan solusi ini, Anda harus memiliki prasyarat berikut:
- RStudio di domain SageMaker
- Identitas AWS dan Manajemen Akses (IAM) kebijakan untuk berinteraksi dengan Amazon ECR
- Versi AWS CLI yang sesuai
Kami memberikan rincian lebih lanjut tentang masing-masing di bagian ini.
RStudio di domain SageMaker
Jika Anda sudah memiliki domain SageMaker dengan RStudio yang diaktifkan sebelum 7 April 2022, Anda harus menghapus dan membuat ulang RStudioServerPro
aplikasi dengan nama profil pengguna domain-shared
untuk mendapatkan pembaruan terbaru untuk menghadirkan kemampuan gambar kustom Anda sendiri. Perintah AWS CLI adalah sebagai berikut. Perhatikan bahwa tindakan ini mengganggu pengguna RStudio di SageMaker.
Jika ini pertama kalinya Anda menggunakan RStudio di SageMaker, ikuti proses penyiapan langkah demi langkah yang dijelaskan di Mulai dengan RStudio di Amazon SageMaker, atau jalankan yang berikut ini Formasi AWS Cloud template untuk menyiapkan RStudio pertama Anda di domain SageMaker. Jika Anda sudah memiliki RStudio yang berfungsi di domain SageMaker, Anda dapat melewati langkah ini.
Template RStudio di SageMaker CloudFormation berikut memerlukan lisensi RStudio yang disetujui melalui AWS License Manager. Untuk lebih lanjut tentang lisensi, lihat Lisensi RStudio. Perhatikan juga bahwa hanya satu domain SageMaker yang diizinkan per Wilayah AWS, jadi Anda harus menggunakan akun dan Wilayah AWS yang tidak memiliki domain yang ada.
- Pilih Luncurkan Stack.
Tautan membawa Anda ke Wilayah us-timur-1, tetapi Anda dapat mengubah ke Wilayah pilihan Anda. - Dalam majalah Tentukan template bagian, pilih Selanjutnya.
- Dalam majalah Tentukan detail tumpukan bagian, untuk Nama tumpukan, masukkan nama.
- Untuk parameter, masukkan nama profil pengguna SageMaker.
- Pilih Selanjutnya.
- Dalam majalah Konfigurasikan opsi tumpukan bagian, pilih Selanjutnya.
- Dalam majalah ULASAN bagian, pilih Saya mengakui bahwa AWS CloudFormation dapat menciptakan sumber daya IAM Dan pilihlah Selanjutnya.
- Saat status tumpukan berubah menjadi
CREATE_COMPLETE
, buka Control Panel di konsol SageMaker untuk menemukan domain dan pengguna baru.
Kebijakan IAM untuk berinteraksi dengan Amazon ECR
Untuk berinteraksi dengan repositori Amazon ECR pribadi, Anda memerlukan izin IAM berikut di pengguna atau peran IAM yang akan Anda gunakan untuk membuat dan mendorong image Docker:
Untuk awalnya membangun dari gambar Amazon ECR publik seperti yang ditunjukkan dalam posting ini, Anda harus melampirkan AWS-managed AmazonElasticContainerRegistryPublikHanya Baca kebijakan untuk pengguna atau peran IAM Anda juga.
Untuk membuat image container Docker, Anda dapat menggunakan klien Docker lokal atau Pembuatan Docker SageMaker Alat CLI dari terminal dalam RStudio di SageMaker. Untuk yang terakhir, ikuti prasyarat di Menggunakan CLI Amazon SageMaker Studio Image Build untuk membuat gambar container dari notebook Studio Anda untuk menyiapkan izin IAM dan alat CLI.
Versi AWS CLI
Ada persyaratan versi minimum untuk alat AWS CLI untuk menjalankan perintah yang disebutkan dalam posting ini. Pastikan untuk memutakhirkan AWS CLI di terminal pilihan Anda:
- AWS CLI v1 >= 1.23.6
- AWS CLI v2 >= 2.6.2
Siapkan file Docker
Anda dapat menyesuaikan lingkungan runtime Anda di RStudio di Dockerfile. Karena penyesuaian bergantung pada kasus penggunaan dan persyaratan Anda, kami menunjukkan hal-hal penting dan penyesuaian paling umum dalam contoh ini. Anda dapat mengunduh yang lengkap contoh file Docker.
Instal komponen sesi RStudio Workbench
Perangkat lunak yang paling penting untuk diinstal dalam gambar kontainer kustom Anda adalah RStudio Workbench. Kami mengunduh dari ember S3 publik yang diselenggarakan oleh RStudio PBC. Ada banyak rilis versi dan distribusi OS untuk digunakan. Versi instalasi harus kompatibel dengan versi RStudio Workbench yang digunakan di RStudio pada SageMaker, yaitu 1.4.1717-3 pada saat penulisan. OS (OS argumen dalam cuplikan berikut) harus cocok dengan basisnya OS
digunakan dalam gambar kontainer. Dalam sampel kami Dockerfile, gambar dasar yang kami gunakan adalah Amazon Linux 2 dari repositori Amazon ECR publik yang dikelola AWS. OS Workbench RStudio yang kompatibel adalah centos7.
Anda dapat menemukan semua opsi rilis OS dengan perintah berikut:
Instal R (dan versi R)
Waktu proses untuk image container RStudio kustom Anda memerlukan setidaknya satu versi R. Pertama-tama kita dapat menginstal versi R dan menjadikannya sebagai R default dengan membuat tautan lunak ke /usr/local/bin/
:
Ilmuwan data sering membutuhkan beberapa versi R sehingga mereka dapat dengan mudah beralih antara proyek dan basis kode. RStudio di SageMaker mendukung peralihan yang mudah di antara versi R, seperti yang ditunjukkan pada tangkapan layar berikut.
RStudio di SageMaker secara otomatis memindai dan menemukan versi R di direktori berikut:
Kami dapat menginstal lebih banyak versi di gambar penampung, seperti yang ditunjukkan pada cuplikan berikut. Mereka akan dipasang di /opt/R/
.
Instal Driver Profesional RStudio
Ilmuwan data sering kali perlu mengakses data dari sumber seperti: Amazon Athena dan Pergeseran Merah Amazon dalam RStudio di SageMaker. Anda dapat melakukannya menggunakan Driver Profesional RStudio dan Koneksi RStudio. Pastikan Anda menginstal pustaka dan driver yang relevan seperti yang ditunjukkan dalam cuplikan berikut:
Instal perpustakaan khusus
Anda juga dapat menginstal pustaka R dan Python tambahan sehingga ilmuwan data tidak perlu menginstalnya dengan cepat:
Setelah Anda menyelesaikan kustomisasi di Dockerfile, saatnya membuat image container dan mendorongnya ke Amazon ECR.
Bangun dan dorong ke Amazon ECR
Anda dapat membuat image container dari Dockerfile dari terminal tempat mesin Docker diinstal, seperti terminal lokal atau AWS Cloud9. Jika Anda membangunnya dari terminal dalam RStudio di SageMaker, Anda dapat menggunakan Pembuatan Gambar SageMaker Studio. Kami menunjukkan langkah-langkah untuk kedua pendekatan.
Di terminal lokal tempat mesin Docker hadir, Anda dapat menjalankan perintah berikut dari tempat Dockerfile berada. Anda dapat menggunakan contoh skrip buat-dan-perbarui-image.sh.
Di terminal RStudio di SageMaker, jalankan perintah berikut:
Setelah perintah ini, Anda memiliki repositori dan image container Docker di Amazon ECR untuk langkah selanjutnya, di mana kami melampirkan image container untuk digunakan di RStudio di SageMaker. Perhatikan URI gambar di Amazon ECR <ACCOUNT_ID>.dkr.ecr.<REGION>.amazonaws.com/<REPO>:<TAG>
untuk digunakan nanti.
Perbarui RStudio di SageMaker melalui konsol
RStudio di SageMaker memungkinkan penyesuaian waktu proses melalui penggunaan gambar SageMaker khusus. Gambar SageMaker adalah tempat untuk serangkaian versi gambar SageMaker. Setiap versi gambar mewakili gambar kontainer yang kompatibel dengan RStudio di SageMaker dan disimpan dalam repositori Amazon ECR. Untuk membuat gambar SageMaker khusus tersedia untuk semua pengguna RStudio dalam domain, Anda dapat melampirkan gambar ke domain dengan mengikuti langkah-langkah di bagian ini.
- Di konsol SageMaker, navigasikan ke Gambar SageMaker Studio khusus yang dilampirkan ke domain halaman, dan pilih Lampirkan gambar.
- Pilih Gambar baru, dan masukkan URI gambar Amazon ECR Anda.
- Pilih Selanjutnya.
- Dalam majalah Properti gambar bagian, berikan Nama gambar (diperlukan), Nama tampilan gambar (opsional), Deskripsi Produk (opsional), peran IAM, dan tag.
Grafik nama tampilan gambar, jika tersedia, ditampilkan di peluncur sesi di RStudio di SageMaker. jika Nama tampilan gambar lapangan dibiarkan kosong, nama gambar ditampilkan di RStudio di SageMaker sebagai gantinya. - Meninggalkan Jalur pemasangan EFS dan Konfigurasi lanjutan (ID pengguna dan kelompok ID) sebagai default karena RStudio di SageMaker mengelola konfigurasi untuk kami.
- Dalam majalah Jenis gambar bagian, pilih gambar RStudio.
- Pilih Kirim.
Anda sekarang dapat melihat entri baru dalam daftar. Perlu dicatat bahwa, dengan diperkenalkannya dukungan gambar RStudio khusus, Anda dapat melihat gambar baru Jenis penggunaan kolom dalam tabel untuk menunjukkan apakah suatu gambar adalah gambar RStudio atau Studio Amazon SageMaker gambar.
Mungkin diperlukan waktu hingga 5-10 menit agar gambar khusus tersedia di UI peluncur sesi. Anda kemudian dapat meluncurkan sesi R baru di RStudio di SageMaker dengan gambar khusus Anda.
Seiring waktu, Anda mungkin ingin menghentikan gambar lama dan usang. Untuk menghapus gambar khusus dari daftar gambar khusus di RStudio, pilih gambar dalam daftar dan pilih Melepaskan.
Pilih Melepaskan lagi untuk konfirmasi.
Perbarui RStudio di SageMaker melalui AWS CLI
Bagian berikut menjelaskan langkah-langkah untuk membuat gambar SageMaker dan melampirkannya untuk digunakan di RStudio pada SageMaker pada konsol SageMaker dan menggunakan AWS CLI. Anda dapat menggunakan contoh skrip buat-dan-perbarui-image.sh.
Buat versi gambar dan gambar SageMaker
Langkah pertama adalah membuat image SageMaker dari image container kustom di Amazon ECR dengan menjalankan dua perintah berikut:
Perhatikan bahwa gambar khusus yang ditampilkan di peluncur sesi di RStudio pada SageMaker ditentukan oleh masukan dari --display-name
. Jika nama tampilan opsional tidak tersedia, masukan dari --image-name
digunakan sebagai gantinya. Perhatikan juga bahwa peran IAM memungkinkan SageMaker untuk melampirkan gambar Amazon ECR ke RStudio di SageMaker.
Buat AppImageConfig
Selain gambar SageMaker, yang menangkap URI gambar dari Amazon ECR, konfigurasi gambar aplikasi (AppImageConfig) diperlukan untuk digunakan dalam domain SageMaker. Kami menyederhanakan konfigurasi untuk RSessionApp
image sehingga kita bisa membuat konfigurasi placeholder dengan perintah berikut:
Lampirkan ke domain SageMaker
Dengan gambar SageMaker dan konfigurasi gambar aplikasi yang dibuat, kami siap untuk melampirkan gambar wadah khusus ke domain SageMaker. Untuk membuat gambar SageMaker khusus tersedia untuk semua pengguna RStudio dalam domain, Anda melampirkan gambar ke domain sebagai pengaturan pengguna default. Semua pengguna yang ada dan pengguna baru akan dapat menggunakan gambar kustom.
Untuk keterbacaan yang lebih baik, kami menempatkan konfigurasi berikut ke dalam file JSON pengaturan-pengguna-default.json:
Dalam file ini, kita dapat menentukan gambar dan AppImageConfig
pasangan nama dalam daftar di DefaultUserSettings.RSessionAppSettings.CustomImages
. Cuplikan sebelumnya ini mengasumsikan dua gambar khusus sedang dibuat.
Kemudian jalankan perintah berikut untuk memperbarui domain SageMaker:
Setelah Anda memperbarui domain, mungkin diperlukan waktu hingga 5-10 menit agar gambar khusus tersedia di UI peluncur sesi. Anda kemudian dapat meluncurkan sesi R baru di RStudio di SageMaker dengan gambar khusus Anda.
Lepaskan gambar dari domain SageMaker
Anda dapat melepaskan gambar hanya dengan menghapus ImageName
dan AppImageConfigName
pasangan dari default-user-settings.json
dan memperbarui domain.
Misalnya, memperbarui domain dengan yang berikut: default-user-settings.json
menghapus r-4.1.3-rstudio-2022
dari sesi R meluncurkan UI dan pergi r-4.1.3-rstudio-1.4.1717-3
sebagai satu-satunya gambar khusus yang tersedia untuk semua pengguna di domain:
Membersihkan
Untuk menghapus gambar dan sumber daya dengan aman di domain SageMaker, selesaikan langkah-langkah berikut di Bersihkan sumber daya gambar.
Untuk menghapus RStudio di SageMaker dan domain SageMaker dengan aman, selesaikan langkah-langkah berikut di Hapus Domain Amazon SageMaker untuk menghapus aplikasi RSessionGateway, profil pengguna, dan domain.
Untuk menghapus gambar dan repositori dengan aman di Amazon ECR, selesaikan langkah-langkah berikut di Menghapus gambar.
Terakhir, untuk menghapus template CloudFormation:
- Di konsol AWS CloudFormation, pilih Tumpukan.
- Pilih tumpukan yang Anda terapkan untuk solusi ini.
- Pilih Hapus.
Kesimpulan
RStudio di SageMaker memudahkan para ilmuwan data untuk membangun ML dan solusi analitik dalam skala R, dan bagi administrator untuk mengelola lingkungan ilmu data yang kuat untuk pengembang mereka. Ilmuwan data ingin menyesuaikan lingkungan sehingga mereka dapat menggunakan perpustakaan yang tepat untuk pekerjaan yang tepat dan mencapai reproduktifitas yang diinginkan untuk setiap proyek ML. Administrator perlu menstandardisasi lingkungan ilmu data untuk alasan peraturan dan keamanan. Anda sekarang dapat membuat gambar container khusus yang memenuhi persyaratan organisasi Anda dan memungkinkan ilmuwan data menggunakannya di RStudio di SageMaker.
Kami mendorong Anda untuk mencobanya. Selamat berkembang!
Tentang Penulis
Michael Hsieh adalah Arsitek Solusi Spesialis AI/ML Senior. Dia bekerja dengan pelanggan untuk memajukan perjalanan ML mereka dengan kombinasi penawaran AWS ML dan pengetahuan domain ML-nya. Sebagai transplantasi Seattle, ia suka menjelajahi Ibu Pertiwi yang ditawarkan kota ini, seperti jalur hiking, pemandangan kayak di SLU, dan matahari terbenam di Shilshole Bay.
Declan Kelly adalah Insinyur Perangkat Lunak di tim Amazon SageMaker Studio. Dia telah bekerja di Amazon SageMaker Studio sejak diluncurkan di AWS re:Invent 2019. Di luar pekerjaan, dia menikmati hiking dan climbing.
Sean Morgan adalah Arsitek Solusi AI/ML di AWS. Dia memiliki pengalaman di bidang penelitian semikonduktor dan akademik, dan menggunakan pengalamannya untuk membantu pelanggan mencapai tujuan mereka di AWS. Di waktu luangnya, Sean adalah kontributor dan pengelola open-source aktif, dan merupakan pemimpin kelompok minat khusus untuk Add-on TensorFlow.
- Coinsmart. Pertukaran Bitcoin dan Crypto Terbaik Eropa.
- Platoblockchain. Intelijen Metaverse Web3. Pengetahuan Diperkuat. AKSES GRATIS.
- CryptoHawk. Radar Altcoin. Uji Coba Gratis.
- Sumber: https://aws.amazon.com/blogs/machine-learning/use-a-custom-image-to-bring-your-own-development-environment-to-rstudio-on-amazon-sagemaker/
- "
- &
- 1.3
- 10
- 100
- 2019
- 2022
- 7
- a
- Tentang Kami
- mengakses
- Akun
- Mencapai
- Tindakan
- aktif
- tambahan
- Tambahan
- administrator
- memajukan
- Semua
- memungkinkan
- sudah
- Amazon
- analisis
- aplikasi
- pendekatan
- sesuai
- April
- tersedia
- AWS
- Teluk
- karena
- makhluk
- Manfaat
- Lebih baik
- antara
- batas
- membawa
- membangun
- Bangunan
- bisnis
- Bisa Dapatkan
- menangkap
- kasus
- perubahan
- pilihan
- pilihan
- Pilih
- Kota
- awan
- kode
- Kolom
- kombinasi
- Umum
- cocok
- lengkap
- menghitung
- konfigurasi
- Menghubungkan
- konsul
- Wadah
- Konten
- terus
- penyumbang
- membuat
- dibuat
- membuat
- adat
- pelanggan
- menyesuaikan
- data
- ilmu data
- ilmuwan data
- mendemonstrasikan
- tergantung
- dikerahkan
- menggambarkan
- dijelaskan
- rincian
- pengembang
- Pengembangan
- Display
- distribusi
- Buruh pelabuhan
- Tidak
- domain
- turun
- Download
- setiap
- mudah
- efek
- mendorong
- Mesin
- insinyur
- Enter
- Lingkungan Hidup
- penting
- contoh
- ada
- pengalaman
- akrab
- Fields
- Pertama
- pertama kali
- mengikuti
- berikut
- berikut
- Gratis
- dari
- penuh
- Selanjutnya
- mendapatkan
- Anda
- besar
- Kelompok
- senang
- membantu
- pemegang
- host
- Namun
- HTTPS
- identitas
- gambar
- gambar
- melaksanakan
- penting
- industri
- informasi
- memasukkan
- install
- contoh
- terpadu
- bunga
- IT
- Pekerjaan
- perjalanan
- pengetahuan
- Terbaru
- jalankan
- peluncuran
- memimpin
- pengetahuan
- Lisensi
- Perizinan
- baris
- LINK
- link
- linux
- Daftar
- lokal
- mesin
- Mesin belajar
- membuat
- MEMBUAT
- Membuat
- mengelola
- berhasil
- pengelolaan
- manajer
- Cocok
- tersebut
- mungkin
- minimum
- ML
- lebih
- morgan
- paling
- ibu
- beberapa
- Alam
- Arahkan
- kebutuhan
- berikutnya
- menawarkan
- Penawaran
- operasi
- sistem operasi
- Opsi
- organisatoris
- organisasi
- sendiri
- poin
- Kebijakan
- kebijaksanaan
- disukai
- menyajikan
- swasta
- proses
- profesional
- Profil
- Pemrograman
- proyek
- memprojeksikan
- memberikan
- disediakan
- menyediakan
- publik
- segera
- RE
- mencapai
- alasan
- wilayah
- regulator
- melepaskan
- Pers
- relevan
- menghapus
- gudang
- merupakan
- wajib
- Persyaratan
- membutuhkan
- penelitian
- sumber
- Sumber
- Peran
- Run
- berjalan
- aman
- Skala
- Ilmu
- ilmuwan
- ilmuwan
- Sean
- keamanan
- semikonduktor
- set
- pengaturan
- penyiapan
- beberapa
- Share
- Menunjukkan
- ditunjukkan
- Sederhana
- sejak
- So
- Lunak
- Perangkat lunak
- Software Engineer
- padat
- larutan
- Solusi
- khusus
- spesialis
- khusus
- tumpukan
- mulai
- dimulai
- Pernyataan
- Status
- toko
- studio
- Matahari terbenam
- mendukung
- Mendukung
- Beralih
- sistem
- tim
- terminal
- Grafik
- Melalui
- waktu
- hari ini
- alat
- alat
- ui
- bawah
- Memperbarui
- Pembaruan
- memperbarui
- us
- menggunakan
- Pengguna
- versi
- apakah
- dalam
- tanpa
- Kerja
- kerja
- bekerja
- bernilai
- penulisan
- Anda