Gunakan Amazon DocumentDB untuk membangun solusi pembelajaran mesin tanpa kode di Amazon SageMaker Canvas | Layanan Web Amazon

Gunakan Amazon DocumentDB untuk membangun solusi pembelajaran mesin tanpa kode di Amazon SageMaker Canvas | Layanan Web Amazon

Kami sangat gembira mengumumkan peluncuran Amazon DocumentDB (dengan kompatibilitas MongoDB) integrasi dengan Kanvas Amazon SageMaker, memungkinkan pelanggan Amazon DocumentDB membangun dan menggunakan solusi AI generatif dan pembelajaran mesin (ML) tanpa menulis kode. Amazon DocumentDB adalah database dokumen JSON asli yang dikelola sepenuhnya sehingga memudahkan dan menghemat biaya untuk mengoperasikan beban kerja dokumen penting di hampir semua skala tanpa mengelola infrastruktur. Amazon SageMaker Canvas adalah ruang kerja ML tanpa kode yang menawarkan model siap pakai, termasuk model dasar, dan kemampuan untuk menyiapkan data serta membangun dan menerapkan model kustom.

Dalam postingan ini, kami membahas cara membawa data yang disimpan di Amazon DocumentDB ke SageMaker Canvas dan menggunakan data tersebut untuk membangun model ML untuk analisis prediktif. Tanpa membuat dan memelihara pipeline data, Anda akan dapat mendukung model ML dengan data tidak terstruktur yang disimpan di Amazon DocumentDB.

Ikhtisar solusi

Mari kita ambil peran sebagai analis bisnis untuk perusahaan pengiriman makanan. Aplikasi seluler Anda menyimpan informasi tentang restoran di Amazon DocumentDB karena skalabilitas dan kemampuan skema yang fleksibel. Anda ingin mengumpulkan wawasan tentang data ini dan membuat model ML untuk memprediksi penilaian restoran baru, tetapi merasa kesulitan untuk melakukan analisis pada data tidak terstruktur. Anda mengalami hambatan karena Anda harus mengandalkan tim teknik data dan ilmu data untuk mencapai tujuan ini.

Integrasi baru ini memecahkan masalah ini dengan mempermudah menghadirkan data Amazon DocumentDB ke SageMaker Canvas dan segera mulai menyiapkan dan menganalisis data untuk ML. Selain itu, SageMaker Canvas menghilangkan ketergantungan pada keahlian ML untuk membangun model berkualitas tinggi dan menghasilkan prediksi.

Kami mendemonstrasikan cara menggunakan data Amazon DocumentDB untuk membangun model ML di SageMaker Canvas dalam langkah-langkah berikut:

  1. Buat konektor Amazon DocumentDB di SageMaker Canvas.
  2. Analisis data menggunakan AI generatif.
  3. Siapkan data untuk pembelajaran mesin.
  4. Membangun model dan menghasilkan prediksi.

Prasyarat

Untuk menerapkan solusi ini, selesaikan prasyarat berikut:

  1. Miliki akses admin AWS Cloud dengan Identitas AWS dan Manajemen Akses (IAM) pemakai dengan izin yang diperlukan untuk menyelesaikan integrasi.
  2. Selesaikan pengaturan lingkungan menggunakan Formasi AWS Cloud melalui salah satu opsi berikut:
    1. Terapkan templat CloudFormation ke VPC baru โ€“ Opsi ini membangun lingkungan AWS baru yang terdiri dari VPC, subnet privat, grup keamanan, peran eksekusi IAM, Amazon Cloud9, titik akhir VPC yang diperlukan, dan Domain SageMaker. Kemudian menyebarkan Amazon DocumentDB ke VPC baru ini. Unduh Template atau luncurkan cepat tumpukan CloudFormation dengan memilih Luncurkan Stack:
      Luncurkan tumpukan CloudFormation
    2. Terapkan templat CloudFormation ke VPC yang ada โ€“ Opsi ini membuat VPC endpoint, peran eksekusi IAM, dan domain SageMaker yang diperlukan di VPC yang ada dengan subnet privat. Unduh Template atau luncurkan cepat tumpukan CloudFormation dengan memilih Luncurkan Stack:
      Luncurkan tumpukan CloudFormation

Perhatikan bahwa jika Anda membuat domain SageMaker baru, Anda harus mengonfigurasi domain tersebut agar berada di VPC pribadi tanpa akses internet agar dapat menambahkan konektor ke Amazon DocumentDB. Untuk mempelajari lebih lanjut, lihat Konfigurasikan Amazon SageMaker Canvas di VPC tanpa akses internet.

  1. Ikuti tutorial untuk memuat contoh data restoran ke Amazon DocumentDB.
  2. Tambahkan akses ke Amazon Bedrock dan model Anthropic Claude di dalamnya. Untuk informasi lebih lanjut, lihat Tambahkan akses model.

Buat konektor Amazon DocumentDB di SageMaker Canvas

Setelah Anda membuat domain SageMaker, selesaikan langkah-langkah berikut:

  1. Di konsol Amazon DocumentDB, pilih Pembelajaran mesin tanpa kode di panel navigasi.
  2. Bawah Pilih domain dan profilยธ pilih domain SageMaker dan profil pengguna Anda.
  3. Pilih Luncurkan Kanvas untuk meluncurkan SageMaker Canvas di tab baru.
    Gunakan Amazon DocumentDB untuk membangun solusi pembelajaran mesin tanpa kode di Amazon SageMaker Canvas | Kecerdasan Data PlatoBlockchain Layanan Web Amazon. Pencarian Vertikal. Ai.

Saat SageMaker Canvas selesai dimuat, Anda akan diarahkan ke Data mengalir Tab.

  1. Pilih membuat untuk membuat aliran data baru.
    Gunakan Amazon DocumentDB untuk membangun solusi pembelajaran mesin tanpa kode di Amazon SageMaker Canvas | Kecerdasan Data PlatoBlockchain Layanan Web Amazon. Pencarian Vertikal. Ai.
  2. Masukkan nama untuk aliran data Anda dan pilih membuat.
  3. Tambahkan koneksi Amazon DocumentDB baru dengan memilih Impor data, Lalu pilih Datar untuk Jenis kumpulan data.
  4. pada Impor data halaman, untuk Sumber data, pilih DokumenDB dan Tambahkan Koneksi.
    Gunakan Amazon DocumentDB untuk membangun solusi pembelajaran mesin tanpa kode di Amazon SageMaker Canvas | Kecerdasan Data PlatoBlockchain Layanan Web Amazon. Pencarian Vertikal. Ai.
  5. Masukkan nama koneksi seperti demo dan pilih klaster Amazon DocumentDB yang Anda inginkan.

Perhatikan bahwa SageMaker Canvas akan mengisi menu tarik-turun dengan klaster di VPC yang sama dengan domain SageMaker Anda.

  1. Masukkan nama pengguna, kata sandi, dan nama basis data.
  2. Terakhir, pilih preferensi membaca Anda.

Untuk melindungi kinerja instans utama, SageMaker Canvas secara default adalah Sekunder, artinya hanya akan membaca dari instance sekunder. Ketika preferensi membaca adalah Pilihan sekunder, SageMaker Canvas membaca dari instans sekunder yang tersedia, namun akan membaca dari instans utama jika instans sekunder tidak tersedia. Untuk informasi selengkapnya tentang cara mengonfigurasi koneksi Amazon DocumentDB, lihat Hubungkan ke database yang disimpan di AWS.

  1. Pilih Tambahkan koneksi.
    Gunakan Amazon DocumentDB untuk membangun solusi pembelajaran mesin tanpa kode di Amazon SageMaker Canvas | Kecerdasan Data PlatoBlockchain Layanan Web Amazon. Pencarian Vertikal. Ai.

Jika koneksi berhasil, Anda akan melihat koleksi di database Amazon DocumentDB Anda ditampilkan sebagai tabel.

  1. Seret meja pilihan Anda ke kanvas kosong. Untuk postingan ini, kami menambahkan data restoran kami.

100 baris pertama ditampilkan sebagai pratinjau.

  1. Untuk mulai menganalisis dan menyiapkan data Anda, pilih Impor data.
    Gunakan Amazon DocumentDB untuk membangun solusi pembelajaran mesin tanpa kode di Amazon SageMaker Canvas | Kecerdasan Data PlatoBlockchain Layanan Web Amazon. Pencarian Vertikal. Ai.
  2. Masukkan nama kumpulan data dan pilih Impor data.

Analisis data menggunakan AI generatif

Selanjutnya, kami ingin mendapatkan wawasan tentang data kami dan mencari polanya. SageMaker Canvas menyediakan antarmuka bahasa alami untuk menganalisis dan menyiapkan data. Ketika Data tab dimuat, Anda dapat mulai mengobrol dengan data Anda dengan langkah-langkah berikut:

  1. Pilih Ngobrol untuk persiapan data.
    Gunakan Amazon DocumentDB untuk membangun solusi pembelajaran mesin tanpa kode di Amazon SageMaker Canvas | Kecerdasan Data PlatoBlockchain Layanan Web Amazon. Pencarian Vertikal. Ai.
  2. Kumpulkan wawasan tentang data Anda dengan mengajukan pertanyaan seperti contoh yang ditunjukkan pada tangkapan layar berikut.
    Gunakan Amazon DocumentDB untuk membangun solusi pembelajaran mesin tanpa kode di Amazon SageMaker Canvas | Kecerdasan Data PlatoBlockchain Layanan Web Amazon. Pencarian Vertikal. Ai.

Untuk mempelajari selengkapnya tentang cara menggunakan bahasa alami untuk mengeksplorasi dan menyiapkan data, lihat Gunakan bahasa alami untuk mengeksplorasi dan menyiapkan data dengan kemampuan baru Amazon SageMaker Canvas.

Mari kita pahami lebih dalam kualitas data kita dengan menggunakan Laporan Kualitas Data dan Wawasan SageMaker, yang secara otomatis mengevaluasi kualitas data dan mendeteksi kelainan.

  1. pada Analisis tab, pilih Kualitas Data dan Laporan Wawasan.
  2. Pilih rating sebagai kolom target dan Regresi sebagai jenis masalah, lalu pilih membuat.

Ini akan menyimulasikan pelatihan model dan memberikan wawasan tentang bagaimana kami dapat meningkatkan data untuk pembelajaran mesin. Laporan lengkap dihasilkan dalam beberapa menit.

Laporan kami menunjukkan bahwa 2.47% baris dalam target kami memiliki nilai yang hilangโ€”kami akan mengatasinya di langkah berikutnya. Selain itu, analisis menunjukkan bahwa address line 2, name, dan type_of_food fitur memiliki kekuatan prediksi paling besar dalam data kami. Hal ini menunjukkan bahwa informasi dasar restoran seperti lokasi dan masakan mungkin berdampak besar pada rating.

Gunakan Amazon DocumentDB untuk membangun solusi pembelajaran mesin tanpa kode di Amazon SageMaker Canvas | Kecerdasan Data PlatoBlockchain Layanan Web Amazon. Pencarian Vertikal. Ai.

Siapkan data untuk pembelajaran mesin

SageMaker Canvas menawarkan lebih dari 300 transformasi bawaan untuk menyiapkan data yang Anda impor. Untuk informasi selengkapnya tentang fitur transformasi SageMaker Canvas, lihat Siapkan data dengan transformasi lanjutan. Mari tambahkan beberapa transformasi agar data kita siap untuk melatih model ML.

  1. Navigasi kembali ke Aliran data halaman dengan memilih nama aliran data Anda di bagian atas halaman.
  2. Pilih tanda plus di sebelah Tipe data Dan pilihlah Tambahkan transformasi.
    Gunakan Amazon DocumentDB untuk membangun solusi pembelajaran mesin tanpa kode di Amazon SageMaker Canvas | Kecerdasan Data PlatoBlockchain Layanan Web Amazon. Pencarian Vertikal. Ai.
  3. Pilih Tambahkan langkah.
  4. Mari kita ganti nama address line 2 kolom ke cities.
    1. Pilih Kelola kolom.
    2. Pilih Ganti nama kolom untuk Mengubah.
    3. Pilih address line 2 untuk Kolom masukan, Masuk cities untuk Nama baru, dan pilih Add.
      Gunakan Amazon DocumentDB untuk membangun solusi pembelajaran mesin tanpa kode di Amazon SageMaker Canvas | Kecerdasan Data PlatoBlockchain Layanan Web Amazon. Pencarian Vertikal. Ai.
  5. Selain itu, mari hilangkan beberapa kolom yang tidak perlu.
    1. Tambahkan transformasi baru.
    2. Untuk Mengubah, pilih Jatuhkan kolom.
    3. Untuk Kolom untuk dijatuhkan, pilih URL dan restaurant_id.
    4. Pilih Add.
      Gunakan Amazon DocumentDB untuk membangun solusi pembelajaran mesin tanpa kode di Amazon SageMaker Canvas | Kecerdasan Data PlatoBlockchain Layanan Web Amazon. Pencarian Vertikal. Ai.[
  6. Kami rating kolom fitur memiliki beberapa nilai yang hilang, jadi mari kita isi baris tersebut dengan nilai rata-rata kolom ini.
    1. Tambahkan transformasi baru.
    2. Untuk Mengubah, pilih Menyalahkan.
    3. Untuk Jenis kolom, pilih Numeric.
    4. Untuk Kolom masukan, memilih rating kolom.
    5. Untuk Memperhitungkan strategi, pilih Berarti.
    6. Untuk kolom keluaran, Masuk rating_avg_filled.
    7. Pilih Add.
      Gunakan Amazon DocumentDB untuk membangun solusi pembelajaran mesin tanpa kode di Amazon SageMaker Canvas | Kecerdasan Data PlatoBlockchain Layanan Web Amazon. Pencarian Vertikal. Ai.
  7. Kita bisa membatalkannya rating kolom karena kita memiliki kolom baru dengan nilai yang terisi.
  8. Karena type_of_food bersifat kategorikal, kami ingin menyandikannya secara numerik. Mari kita enkode fitur ini menggunakan teknik enkode one-hot.
    1. Tambahkan transformasi baru.
    2. Untuk Mengubah, pilih Enkode satu-panas.
    3. Untuk Kolom masukan, pilih type_of_food.
    4. Untuk Strategi penanganan tidak validยธ pilih Menjaga.
    5. Untuk Gaya keluaranยธ pilih Kolom.
    6. Untuk kolom keluaran, Masuk encoded.
    7. Pilih Add.
      Gunakan Amazon DocumentDB untuk membangun solusi pembelajaran mesin tanpa kode di Amazon SageMaker Canvas | Kecerdasan Data PlatoBlockchain Layanan Web Amazon. Pencarian Vertikal. Ai.

Membangun model dan menghasilkan prediksi

Sekarang setelah kita mengubah data, mari kita latih model ML numerik untuk memprediksi rating restoran.

  1. Pilih Buat model.
  2. Untuk Nama kumpulan data, masukkan nama untuk ekspor kumpulan data.
  3. Pilih Ekspor dan tunggu data yang diubah diekspor.
    Gunakan Amazon DocumentDB untuk membangun solusi pembelajaran mesin tanpa kode di Amazon SageMaker Canvas | Kecerdasan Data PlatoBlockchain Layanan Web Amazon. Pencarian Vertikal. Ai.
  4. Pilih Buat model tautan di sudut kiri bawah halaman.

Anda juga dapat memilih kumpulan data dari fitur Data Wrangler di sebelah kiri halaman.

Gunakan Amazon DocumentDB untuk membangun solusi pembelajaran mesin tanpa kode di Amazon SageMaker Canvas | Kecerdasan Data PlatoBlockchain Layanan Web Amazon. Pencarian Vertikal. Ai.

  1. Masukkan nama model.
  2. Pilih Analisis prediktif, Lalu pilih membuat.
  3. Pilih rating_avg_filled sebagai kolom tujuan.

SageMaker Canvas secara otomatis memilih jenis model yang sesuai.

  1. Pilih Pratinjau model untuk memastikan tidak ada masalah kualitas data.
  2. Pilih Membangun cepat untuk membangun model.
    Gunakan Amazon DocumentDB untuk membangun solusi pembelajaran mesin tanpa kode di Amazon SageMaker Canvas | Kecerdasan Data PlatoBlockchain Layanan Web Amazon. Pencarian Vertikal. Ai.

Pembuatan model akan memakan waktu sekitar 2โ€“15 menit untuk diselesaikan.

Anda dapat melihat status model setelah model menyelesaikan pelatihan. Model kami memiliki RSME sebesar 0.422, yang berarti model tersebut sering kali memprediksi peringkat sebuah restoran dalam kisaran +/- 0.422 dari nilai sebenarnya, yang merupakan perkiraan yang solid untuk skala peringkat 1โ€“6.

Gunakan Amazon DocumentDB untuk membangun solusi pembelajaran mesin tanpa kode di Amazon SageMaker Canvas | Kecerdasan Data PlatoBlockchain Layanan Web Amazon. Pencarian Vertikal. Ai.

  1. Terakhir, Anda dapat membuat contoh prediksi dengan menavigasi ke Meramalkan Tab.
    Gunakan Amazon DocumentDB untuk membangun solusi pembelajaran mesin tanpa kode di Amazon SageMaker Canvas | Kecerdasan Data PlatoBlockchain Layanan Web Amazon. Pencarian Vertikal. Ai.

Membersihkan

Untuk menghindari timbulnya biaya di masa mendatang, hapus sumber daya yang Anda buat saat mengikuti postingan ini. SageMaker Canvas menagih Anda selama durasi sesi, dan kami menyarankan Anda keluar dari SageMaker Canvas saat Anda tidak menggunakannya. Mengacu pada Keluar dari Amazon SageMaker Canvas lebih lanjut.

Kesimpulan

Dalam postingan ini, kami membahas bagaimana Anda dapat menggunakan SageMaker Canvas untuk AI generatif dan ML dengan data yang disimpan di Amazon DocumentDB. Dalam contoh kami, kami menunjukkan bagaimana seorang analis dapat dengan cepat membuat model ML berkualitas tinggi menggunakan contoh kumpulan data restoran.

Kami menunjukkan langkah-langkah untuk mengimplementasikan solusi tersebut, mulai dari mengimpor data dari Amazon DocumentDB hingga membangun model ML di SageMaker Canvas. Seluruh proses diselesaikan melalui antarmuka visual tanpa menulis satu baris kode pun.

Untuk memulai perjalanan ML kode rendah/tanpa kode, lihat Kanvas Amazon SageMaker.


Tentang penulis

Gunakan Amazon DocumentDB untuk membangun solusi pembelajaran mesin tanpa kode di Amazon SageMaker Canvas | Kecerdasan Data PlatoBlockchain Layanan Web Amazon. Pencarian Vertikal. Ai.Adeleke Coker adalah Arsitek Solusi Global dengan AWS. Dia bekerja dengan pelanggan secara global untuk memberikan panduan dan bantuan teknis dalam menerapkan beban kerja produksi dalam skala besar di AWS. Di waktu luangnya, ia senang belajar, membaca, bermain game, dan menonton acara olahraga.

Gunakan Amazon DocumentDB untuk membangun solusi pembelajaran mesin tanpa kode di Amazon SageMaker Canvas | Kecerdasan Data PlatoBlockchain Layanan Web Amazon. Pencarian Vertikal. Ai. Gururaj S Bayari adalah Arsitek Solusi Spesialis Senior DocumentDB di AWS. Dia senang membantu pelanggan mengadopsi database Amazon yang dibuat khusus. Dia membantu pelanggan merancang, mengevaluasi, dan mengoptimalkan skala internet dan beban kerja berkinerja tinggi yang didukung oleh NoSQL dan/atau database Relasional.

Gunakan Amazon DocumentDB untuk membangun solusi pembelajaran mesin tanpa kode di Amazon SageMaker Canvas | Kecerdasan Data PlatoBlockchain Layanan Web Amazon. Pencarian Vertikal. Ai.Tim Pusateri adalah Manajer Produk Senior di AWS tempat dia bekerja di Amazon SageMaker Canvas. Tujuannya adalah membantu pelanggan memperoleh nilai dengan cepat dari AI/ML. Di luar pekerjaan, dia suka berada di luar ruangan, bermain gitar, menonton musik live, dan menghabiskan waktu bersama keluarga dan teman.

Gunakan Amazon DocumentDB untuk membangun solusi pembelajaran mesin tanpa kode di Amazon SageMaker Canvas | Kecerdasan Data PlatoBlockchain Layanan Web Amazon. Pencarian Vertikal. Ai.Pratik Das adalah Manajer Produk di AWS. Dia senang bekerja dengan pelanggan yang ingin membangun beban kerja yang tangguh dan fondasi data yang kuat di cloud. Dia membawa keahlian bekerja dengan perusahaan dalam inisiatif modernisasi, analitis, dan transformasi data.

Gunakan Amazon DocumentDB untuk membangun solusi pembelajaran mesin tanpa kode di Amazon SageMaker Canvas | Kecerdasan Data PlatoBlockchain Layanan Web Amazon. Pencarian Vertikal. Ai.Varma Gottumukkala adalah Arsitek Solusi Spesialis Basis Data Senior di AWS yang berbasis di Dallas Fort Worth. Varma bekerja dengan pelanggan dalam strategi database mereka dan merancang beban kerja mereka menggunakan database yang dibuat khusus untuk AWS. Sebelum bergabung dengan AWS, ia bekerja secara ekstensif dengan database relasional, database NOSQL, dan berbagai bahasa pemrograman selama 22 tahun terakhir.

Stempel Waktu:

Lebih dari Pembelajaran Mesin AWS