Meningkatkan produktivitas pengembang: Bagaimana Deloitte menggunakan Amazon SageMaker Canvas untuk pembelajaran mesin tanpa kode/kode rendah | Layanan Web Amazon

Meningkatkan produktivitas pengembang: Bagaimana Deloitte menggunakan Amazon SageMaker Canvas untuk pembelajaran mesin tanpa kode/kode rendah | Layanan Web Amazon

Kemampuan untuk membangun dan menerapkan model pembelajaran mesin (ML) dengan cepat menjadi semakin penting di dunia berbasis data saat ini. Namun, membangun model ML memerlukan banyak waktu, tenaga, dan keahlian khusus. Mulai dari pengumpulan dan pembersihan data hingga rekayasa fitur, pembuatan model, penyetelan, dan penerapan, proyek ML sering kali membutuhkan waktu berbulan-bulan untuk diselesaikan oleh pengembang. Dan data scientist yang berpengalaman mungkin sulit didapat.

Di sinilah rangkaian layanan ML berkode rendah dan tanpa kode AWS menjadi alat yang penting. Hanya dengan beberapa klik menggunakan Kanvas Amazon SageMaker, Anda dapat memanfaatkan kehebatan ML tanpa perlu menulis kode apa pun.

Sebagai integrator sistem strategis dengan pengalaman ML yang mendalam, Deloitte memanfaatkan alat ML tanpa kode dan kode rendah dari AWS untuk membangun dan menerapkan model ML secara efisien untuk klien Deloitte dan aset internal. Alat-alat ini memungkinkan Deloitte mengembangkan solusi ML tanpa perlu membuat kode tangan pada model dan pipeline. Hal ini dapat membantu mempercepat jadwal pengiriman proyek dan memungkinkan Deloitte menangani lebih banyak pekerjaan klien.

Berikut adalah beberapa alasan spesifik mengapa Deloitte menggunakan alat-alat ini:

  • Aksesibilitas untuk non-programmer โ€“ Alat tanpa kode membuka pembuatan model ML bagi non-pemrogram. Anggota tim yang hanya memiliki keahlian domain dan sedikit keterampilan coding dapat mengembangkan model ML.
  • Adopsi teknologi baru yang cepat โ€“ Ketersediaan dan peningkatan berkelanjutan pada model siap pakai dan AutoML membantu memastikan bahwa pengguna terus menggunakan teknologi kelas terdepan.
  • Pengembangan hemat biaya โ€“ Alat tanpa kode membantu mengurangi biaya dan waktu yang diperlukan untuk pengembangan model ML, sehingga lebih mudah diakses oleh klien, sehingga dapat membantu mereka mencapai laba atas investasi yang lebih tinggi.

Selain itu, alat-alat ini memberikan solusi komprehensif untuk alur kerja yang lebih cepat, memungkinkan hal-hal berikut:

  • Persiapan data lebih cepat โ€“ SageMaker Canvas memiliki lebih dari 300 transformasi bawaan dan kemampuan untuk menggunakan bahasa alami yang dapat mempercepat persiapan data dan menyiapkan data untuk pembuatan model.
  • Pembuatan model lebih cepat โ€“ SageMaker Canvas menawarkan model siap pakai atau Amazon AutoML teknologi yang memungkinkan Anda membuat model khusus pada data perusahaan hanya dengan beberapa klik. Ini membantu mempercepat proses dibandingkan dengan model pengkodean dari awal.
  • Penerapan lebih mudah โ€“ SageMaker Canvas menawarkan kemampuan untuk menerapkan model siap produksi ke Pembuat Sag Amazon titik akhir dalam beberapa klik sambil mendaftarkannya Registri Model Amazon SageMaker.

Vishveshwara Vasa, Cloud CTO untuk Deloitte, mengatakan:

โ€œMelalui layanan ML tanpa kode AWS seperti SageMaker Canvas dan SageMaker Data Wrangler, kami di Deloitte Consulting telah membuka efisiensi baru, meningkatkan kecepatan pengembangan dan produktivitas penerapan sebesar 30โ€“40% di seluruh proyek yang dihadapi klien dan internal kami.โ€

Dalam postingan ini, kami mendemonstrasikan kekuatan membangun model ML end-to-end tanpa kode menggunakan SageMaker Canvas dengan menunjukkan kepada Anda cara membuat model klasifikasi untuk memprediksi apakah pelanggan akan gagal membayar pinjaman. Dengan memprediksi gagal bayar pinjaman secara lebih akurat, model ini dapat membantu perusahaan jasa keuangan mengelola risiko, menentukan harga pinjaman dengan tepat, meningkatkan operasional, menyediakan layanan tambahan, dan memperoleh keunggulan kompetitif. Kami mendemonstrasikan bagaimana SageMaker Canvas dapat membantu Anda dengan cepat beralih dari data mentah ke model klasifikasi biner yang diterapkan untuk prediksi gagal bayar pinjaman.

SageMaker Canvas menawarkan kemampuan persiapan data komprehensif yang didukung oleh Pengatur Data Amazon SageMaker di ruang kerja SageMaker Canvas. Hal ini memungkinkan Anda menjalani semua fase alur kerja ML standar, mulai dari persiapan data hingga pembuatan model dan penerapan, pada satu platform.

Persiapan data biasanya merupakan fase alur kerja ML yang paling memakan waktu. Untuk mengurangi waktu yang dihabiskan pada persiapan data, SageMaker Canvas memungkinkan Anda menyiapkan data menggunakan lebih dari 300 transformasi bawaan. Kalau tidak, Anda dapat menulis perintah bahasa alami, seperti โ€œhapus baris untuk kolom c yang merupakan outlierโ€, dan disajikan cuplikan kode yang diperlukan untuk langkah persiapan data ini. Anda kemudian dapat menambahkan ini ke alur kerja persiapan data Anda dalam beberapa klik. Kami juga menunjukkan cara menggunakannya di postingan ini.

Ikhtisar solusi

Diagram berikut menjelaskan arsitektur model klasifikasi default pinjaman menggunakan alat kode rendah dan tanpa kode SageMaker.

Meningkatkan produktivitas pengembang: Bagaimana Deloitte menggunakan Amazon SageMaker Canvas untuk pembelajaran mesin tanpa kode/kode rendah | Kecerdasan Data PlatoBlockchain Layanan Web Amazon. Pencarian Vertikal. Ai.

Dimulai dengan dataset yang memiliki detail tentang data gagal bayar pinjaman Layanan Penyimpanan Sederhana Amazon (Amazon S3), kami menggunakan SageMaker Canvas untuk mendapatkan wawasan tentang data. Kami kemudian melakukan rekayasa fitur untuk menerapkan transformasi seperti pengkodean fitur kategorikal, menghapus fitur yang tidak diperlukan, dan banyak lagi. Selanjutnya, kami menyimpan kembali data yang telah dibersihkan di Amazon S3. Kami menggunakan kumpulan data yang telah dibersihkan untuk membuat model klasifikasi untuk memprediksi gagal bayar pinjaman. Kemudian kami memiliki model siap produksi untuk inferensi.

Prasyarat

Pastikan hal berikut ini prasyarat sudah selesai dan Anda telah mengaktifkannya Model kanvas siap pakai opsi saat menyiapkan domain SageMaker. Jika Anda sudah menyiapkan domain Anda, edit pengaturan domain Anda dan pergi ke Pengaturan kanvas untuk mengaktifkan Aktifkan model Canvas Siap Pakai pilihan. Selain itu, atur dan buat aplikasi SageMaker Canvas, lalu minta dan aktifkan Akses model antropik Claude on Batuan Dasar Amazon.

Dataset

Kami menggunakan kumpulan data publik dari kaggle yang berisi informasi tentang pinjaman keuangan. Setiap baris dalam kumpulan data mewakili satu pinjaman, dan kolom memberikan rincian tentang setiap transaksi. Unduh kumpulan data ini dan simpan dalam bucket S3 pilihan Anda. Tabel berikut mencantumkan bidang dalam kumpulan data.

Nama kolom Tipe data Deskripsi Produk
Person_age Bilangan bulat Usia orang yang mengambil pinjaman
Person_income Bilangan bulat Pendapatan peminjam
Person_home_ownership Tali Status kepemilikan rumah (dimiliki atau disewakan)
Person_emp_length Desimal Jumlah tahun mereka bekerja
Loan_intent Tali Alasan pinjaman (pribadi, medis, pendidikan, dan sebagainya)
Loan_grade Tali Nilai pinjaman (Aโ€“E)
Loan_int_rate Desimal Suku bunga
Loan_amnt Bilangan bulat Jumlah total pinjaman
Loan_status Bilangan bulat Target (apakah gagal bayar atau tidak)
Loan_percent_income Desimal Jumlah pinjaman dibandingkan dengan persentase pendapatan
Cb_person_default_on_file Bilangan bulat Default sebelumnya (jika ada)
Cb_person_credit_history_length Tali Panjang riwayat kredit mereka

Sederhanakan persiapan data dengan SageMaker Canvas

Persiapan data dapat menghabiskan hingga 80% upaya dalam proyek ML. Persiapan data yang tepat menghasilkan performa model yang lebih baik dan prediksi yang lebih akurat. SageMaker Canvas memungkinkan eksplorasi, transformasi, dan persiapan data interaktif tanpa menulis kode SQL atau Python apa pun.

Selesaikan langkah-langkah berikut untuk menyiapkan data Anda:

  1. Di konsol Kanvas SageMaker, pilih Persiapan data di panel navigasi.
  2. pada membuat menu, pilih Dokumen.
  3. Untuk Nama kumpulan data, masukkan nama untuk kumpulan data Anda.
  4. Pilih membuat.
    Meningkatkan produktivitas pengembang: Bagaimana Deloitte menggunakan Amazon SageMaker Canvas untuk pembelajaran mesin tanpa kode/kode rendah | Kecerdasan Data PlatoBlockchain Layanan Web Amazon. Pencarian Vertikal. Ai.
  5. Pilih Amazon S3 sebagai sumber data dan sambungkan ke kumpulan data.
  6. Setelah kumpulan data dimuat, buat aliran data menggunakan kumpulan data tersebut.
    Meningkatkan produktivitas pengembang: Bagaimana Deloitte menggunakan Amazon SageMaker Canvas untuk pembelajaran mesin tanpa kode/kode rendah | Kecerdasan Data PlatoBlockchain Layanan Web Amazon. Pencarian Vertikal. Ai.
  7. Beralih ke tab analisis dan buat a Kualitas Data dan Laporan Wawasan.

Ini adalah langkah yang disarankan untuk menganalisis kualitas kumpulan data masukan. Keluaran laporan ini menghasilkan wawasan instan yang didukung ML seperti data yang miring, duplikat dalam data, nilai yang hilang, dan banyak lagi. Tangkapan layar berikut menunjukkan contoh laporan yang dihasilkan untuk kumpulan data pinjaman.

Meningkatkan produktivitas pengembang: Bagaimana Deloitte menggunakan Amazon SageMaker Canvas untuk pembelajaran mesin tanpa kode/kode rendah | Kecerdasan Data PlatoBlockchain Layanan Web Amazon. Pencarian Vertikal. Ai.

Meningkatkan produktivitas pengembang: Bagaimana Deloitte menggunakan Amazon SageMaker Canvas untuk pembelajaran mesin tanpa kode/kode rendah | Kecerdasan Data PlatoBlockchain Layanan Web Amazon. Pencarian Vertikal. Ai.

Dengan menghasilkan wawasan ini atas nama Anda, SageMaker Canvas memberi Anda serangkaian masalah pada data yang memerlukan perbaikan dalam fase persiapan data. Untuk memilih dua masalah teratas yang diidentifikasi oleh SageMaker Canvas, Anda perlu mengkodekan fitur kategorikal dan menghapus baris duplikat sehingga kualitas model Anda tinggi. Anda dapat melakukan keduanya dan lebih banyak lagi dalam alur kerja visual dengan SageMaker Canvas.

  1. Pertama, enkode one-hot loan_intent, loan_grade, dan person_home_ownership
  2. Anda dapat menjatuhkannya cb_person_cred_history_length kolom karena kolom tersebut memiliki kekuatan prediksi paling kecil, seperti yang ditunjukkan dalam Laporan Kualitas Data dan Wawasan.
    Meningkatkan produktivitas pengembang: Bagaimana Deloitte menggunakan Amazon SageMaker Canvas untuk pembelajaran mesin tanpa kode/kode rendah | Kecerdasan Data PlatoBlockchain Layanan Web Amazon. Pencarian Vertikal. Ai.
    SageMaker Canvas baru-baru ini menambahkan a Mengobrol dengan data pilihan. Fitur ini menggunakan kekuatan model dasar untuk menafsirkan kueri bahasa alami dan menghasilkan kode berbasis Python untuk menerapkan transformasi rekayasa fitur. Fitur ini didukung oleh Amazon Bedrock, dan dapat dikonfigurasi untuk dijalankan sepenuhnya di VPC Anda sehingga data tidak pernah meninggalkan lingkungan Anda.
  3. Untuk menggunakan fitur ini guna menghapus baris duplikat, pilih tanda tambah di sebelah Jatuhkan kolom ubah, lalu pilih Mengobrol dengan data.
    Meningkatkan produktivitas pengembang: Bagaimana Deloitte menggunakan Amazon SageMaker Canvas untuk pembelajaran mesin tanpa kode/kode rendah | Kecerdasan Data PlatoBlockchain Layanan Web Amazon. Pencarian Vertikal. Ai.
  4. Masukkan kueri Anda dalam bahasa alami (misalnya, โ€œHapus baris duplikat dari kumpulan dataโ€).
  5. Tinjau transformasi yang dihasilkan dan pilih Tambahkan ke langkah-langkah untuk menambahkan transformasi ke aliran.
    Meningkatkan produktivitas pengembang: Bagaimana Deloitte menggunakan Amazon SageMaker Canvas untuk pembelajaran mesin tanpa kode/kode rendah | Kecerdasan Data PlatoBlockchain Layanan Web Amazon. Pencarian Vertikal. Ai.
  6. Terakhir, ekspor keluaran transformasi ini ke Amazon S3 atau opsional Toko Fitur Amazon SageMaker untuk menggunakan fitur ini di beberapa proyek.

Anda juga dapat menambahkan langkah lain untuk membuat tujuan Amazon S3 untuk kumpulan data guna menskalakan alur kerja untuk kumpulan data besar. Diagram berikut menunjukkan aliran data SageMaker Canvas setelah menambahkan transformasi visual.

Meningkatkan produktivitas pengembang: Bagaimana Deloitte menggunakan Amazon SageMaker Canvas untuk pembelajaran mesin tanpa kode/kode rendah | Kecerdasan Data PlatoBlockchain Layanan Web Amazon. Pencarian Vertikal. Ai.

Anda telah menyelesaikan seluruh langkah pemrosesan data dan rekayasa fitur menggunakan alur kerja visual di SageMaker Canvas. Hal ini membantu mengurangi waktu yang dihabiskan teknisi data untuk membersihkan dan menyiapkan data untuk pengembangan model dari berminggu-minggu menjadi berhari-hari. Langkah selanjutnya adalah membangun model ML.

Bangun model dengan SageMaker Canvas

Amazon SageMaker Canvas menyediakan alur kerja end-to-end tanpa kode untuk membangun, menganalisis, menguji, dan menerapkan model klasifikasi biner ini. Selesaikan langkah-langkah berikut:

  1. Buat himpunan data di SageMaker Canvas.
  2. Tentukan lokasi S3 yang digunakan untuk mengekspor data atau lokasi S3 yang menjadi tujuan pekerjaan SageMaker Canvas.
    Meningkatkan produktivitas pengembang: Bagaimana Deloitte menggunakan Amazon SageMaker Canvas untuk pembelajaran mesin tanpa kode/kode rendah | Kecerdasan Data PlatoBlockchain Layanan Web Amazon. Pencarian Vertikal. Ai.
    Sekarang Anda siap membuat modelnya.
  3. Pilih Model di panel navigasi dan pilih Model baru.
  4. Beri nama model dan pilih Analisis prediktif sebagai tipe model.
  5. Pilih kumpulan data yang dibuat pada langkah sebelumnya.
    Meningkatkan produktivitas pengembang: Bagaimana Deloitte menggunakan Amazon SageMaker Canvas untuk pembelajaran mesin tanpa kode/kode rendah | Kecerdasan Data PlatoBlockchain Layanan Web Amazon. Pencarian Vertikal. Ai.
    Langkah selanjutnya adalah mengkonfigurasi tipe model.
  6. Pilih kolom target dan jenis model akan ditetapkan secara otomatis 2 kategori prediksi.
  7. Pilih jenis bangunan Anda, bangunan standar or Membangun cepat.
    Meningkatkan produktivitas pengembang: Bagaimana Deloitte menggunakan Amazon SageMaker Canvas untuk pembelajaran mesin tanpa kode/kode rendah | Kecerdasan Data PlatoBlockchain Layanan Web Amazon. Pencarian Vertikal. Ai.
    SageMaker Canvas menampilkan perkiraan waktu pembuatan segera setelah Anda mulai membuat model. Pembuatan standar biasanya memakan waktu antara 2โ€“4 โ€‹โ€‹jam; Anda dapat menggunakan opsi Quick build untuk kumpulan data yang lebih kecil, yang hanya membutuhkan waktu 2โ€“15 menit. Untuk kumpulan data khusus ini, diperlukan waktu sekitar 45 menit untuk menyelesaikan pembuatan model. SageMaker Canvas terus memberi Anda informasi tentang kemajuan proses pembangunan.
  8. Setelah model dibuat, Anda dapat melihat performa model.
    Meningkatkan produktivitas pengembang: Bagaimana Deloitte menggunakan Amazon SageMaker Canvas untuk pembelajaran mesin tanpa kode/kode rendah | Kecerdasan Data PlatoBlockchain Layanan Web Amazon. Pencarian Vertikal. Ai.
    SageMaker Canvas menyediakan berbagai metrik seperti akurasi, presisi, dan skor F1 bergantung pada jenis modelnya. Tangkapan layar berikut menunjukkan keakuratan dan beberapa metrik lanjutan lainnya untuk model klasifikasi biner ini.
  9. Langkah selanjutnya adalah membuat prediksi tes.
    SageMaker Canvas memungkinkan Anda membuat prediksi batch pada beberapa input atau satu prediksi untuk memverifikasi kualitas model dengan cepat. Tangkapan layar berikut menunjukkan contoh inferensi.
    Meningkatkan produktivitas pengembang: Bagaimana Deloitte menggunakan Amazon SageMaker Canvas untuk pembelajaran mesin tanpa kode/kode rendah | Kecerdasan Data PlatoBlockchain Layanan Web Amazon. Pencarian Vertikal. Ai.
  10. Langkah terakhir adalah menerapkan model terlatih.
    SageMaker Canvas menerapkan model pada titik akhir SageMaker, dan sekarang Anda memiliki model produksi yang siap untuk inferensi. Tangkapan layar berikut menunjukkan titik akhir yang disebarkan.
    Meningkatkan produktivitas pengembang: Bagaimana Deloitte menggunakan Amazon SageMaker Canvas untuk pembelajaran mesin tanpa kode/kode rendah | Kecerdasan Data PlatoBlockchain Layanan Web Amazon. Pencarian Vertikal. Ai.

Setelah model diterapkan, Anda dapat memanggilnya melalui AWS SDK atau Antarmuka Baris Perintah AWS (AWS CLI) atau lakukan panggilan API ke aplikasi apa pun pilihan Anda untuk memprediksi risiko calon peminjam dengan yakin. Untuk informasi lebih lanjut tentang pengujian model Anda, lihat Panggil titik akhir waktu nyata.

Membersihkan

Untuk menghindari dikenakan biaya tambahan, keluar dari SageMaker Canvas or hapus domain SageMaker yang diciptakan. Selain itu, hapus titik akhir model SageMaker dan hapus kumpulan data yang diunggah ke Amazon S3.

Kesimpulan

ML tanpa kode mempercepat pengembangan, menyederhanakan penerapan, tidak memerlukan keterampilan pemrograman, meningkatkan standardisasi, dan mengurangi biaya. Manfaat ini membuat ML tanpa kode menarik bagi Deloitte untuk meningkatkan penawaran layanan ML-nya, dan mereka telah mempersingkat jangka waktu pembuatan model ML-nya sebesar 30โ€“40%.

Deloitte adalah integrator sistem global yang strategis dengan lebih dari 17,000 praktisi AWS tersertifikasi di seluruh dunia. Perusahaan ini terus meningkatkan standarnya melalui partisipasi dalam Program Kompetensi AWS bersama 25 kompetensi, termasuk Machine Learning. Terhubung dengan Deloitte untuk mulai menggunakan solusi tanpa kode dan kode rendah AWS untuk perusahaan Anda.


Tentang penulis

Meningkatkan produktivitas pengembang: Bagaimana Deloitte menggunakan Amazon SageMaker Canvas untuk pembelajaran mesin tanpa kode/kode rendah | Kecerdasan Data PlatoBlockchain Layanan Web Amazon. Pencarian Vertikal. Ai.Chida Sadayapan memimpin praktik Cloud AI/Machine Learning Deloitte. Dia membawa pengalaman kepemimpinan pemikiran yang kuat ke dalam keterlibatan dan berkembang dalam mendukung pemangku kepentingan eksekutif mencapai tujuan peningkatan kinerja dan modernisasi di seluruh industri menggunakan AI/ML. Chida adalah seorang pengusaha teknologi serial dan pembangun komunitas yang rajin dalam ekosistem startup dan pengembang.

Meningkatkan produktivitas pengembang: Bagaimana Deloitte menggunakan Amazon SageMaker Canvas untuk pembelajaran mesin tanpa kode/kode rendah | Kecerdasan Data PlatoBlockchain Layanan Web Amazon. Pencarian Vertikal. Ai.Kuldeep Singh, pemimpin Utama AI/ML Global di AWS dengan pengalaman lebih dari 20 tahun di bidang teknologi, dengan terampil menggabungkan keahlian penjualan dan kewirausahaannya dengan pemahaman mendalam tentang AI, ML, dan keamanan siber. Dia unggul dalam menjalin kemitraan global yang strategis, mendorong solusi dan strategi transformatif di berbagai industri dengan fokus pada AI generatif dan GSI.

Meningkatkan produktivitas pengembang: Bagaimana Deloitte menggunakan Amazon SageMaker Canvas untuk pembelajaran mesin tanpa kode/kode rendah | Kecerdasan Data PlatoBlockchain Layanan Web Amazon. Pencarian Vertikal. Ai.Kasi Muthu adalah arsitek solusi mitra senior yang berfokus pada data dan AI/ML di AWS yang berbasis di Houston, TX. Dia bersemangat membantu mitra dan pelanggan mempercepat perjalanan data cloud mereka. Dia adalah penasihat tepercaya di bidang ini dan memiliki banyak pengalaman dalam merancang dan membangun beban kerja yang skalabel, tangguh, dan berperforma tinggi di cloud. Di luar pekerjaan, dia menikmati menghabiskan waktu bersama keluarganya.

Stempel Waktu:

Lebih dari Pembelajaran Mesin AWS