Selesaikan masalah bisnis secara end-to-end melalui pembelajaran mesin di solusi Amazon SageMaker JumpStart PlatoBlockchain Data Intelligence. Pencarian Vertikal. Ai.

Selesaikan masalah bisnis secara menyeluruh melalui pembelajaran mesin di solusi Amazon SageMaker JumpStart

Mulai Lompatan Amazon SageMaker menyediakan model sumber terbuka yang telah dilatih sebelumnya untuk berbagai jenis masalah guna membantu Anda memulai pembelajaran mesin (ML). JumpStart juga menyediakan template solusi yang menyiapkan infrastruktur untuk kasus penggunaan umum, dan notebook contoh yang dapat dieksekusi untuk ML dengan Amazon SageMaker.

Sebagai pengguna bisnis, Anda dapat melakukan hal berikut dengan solusi JumpStart:

  • Jelajahi solusi dan evaluasi mana yang cocok untuk kebutuhan bisnis Anda.
  • Luncurkan solusi dengan satu klik di Studio Amazon SageMaker. Ini meluncurkan Formasi AWS Cloud template untuk membuat sumber daya yang diperlukan.
  • Ubah solusi untuk memenuhi kebutuhan Anda dengan akses ke notebook pokok dan aset model.
  • Hapus sumber daya yang diperoleh setelah selesai.

Postingan ini berfokus pada lima solusi ML yang baru-baru ini ditambahkan untuk mengatasi lima tantangan bisnis yang berbeda. Pada tulisan ini, JumpStart menawarkan 23 solusi bisnis yang bervariasi mulai dari mendeteksi penipuan dalam transaksi keuangan hingga mengenali tulisan tangan. Jumlah solusi yang ditawarkan melalui JumpStart meningkat secara teratur karena lebih banyak solusi ditambahkan ke dalamnya.

Ikhtisar solusi

Lima solusi baru tersebut adalah sebagai berikut:

  • Optimalisasi harga โ€“ Menawarkan model ML yang dapat disesuaikan untuk membantu Anda membuat keputusan optimal untuk menetapkan harga produk atau layanan Anda guna mencapai tujuan bisnis Anda, seperti memaksimalkan pendapatan, laba, atau metrik khusus lainnya.
  • Prediksi jenis burung โ€“ Menunjukkan bagaimana Anda dapat melatih dan menyempurnakan model deteksi objek. Ini menunjukkan penyetelan model melalui augmentasi gambar pelatihan, dan memetakan peningkatan akurasi yang terjadi di seluruh iterasi (zaman) dari pekerjaan pelatihan.
  • Prediksi kelangsungan hidup kanker paru- Menunjukkan bagaimana Anda dapat memasukkan fitur radiomik 2D dan 3D serta demografi pasien ke algoritme ML untuk memprediksi peluang bertahan hidup dari kanker paru-paru pasien. Hasil dari prediksi ini dapat membantu penyedia mengambil tindakan proaktif yang tepat.
  • Klasifikasi pembayaran keuangan โ€“ Mendemonstrasikan cara melatih dan menerapkan model ML untuk mengklasifikasikan transaksi keuangan berdasarkan informasi transaksi. Anda juga dapat menggunakan solusi ini sebagai langkah perantara dalam deteksi penipuan, personalisasi, atau deteksi anomali.
  • Prediksi churn untuk pelanggan ponsel โ€“ Mendemonstrasikan cara mengembangkan model prediksi churn dengan cepat menggunakan kumpulan data transaksi panggilan seluler. Ini adalah contoh sederhana untuk pengguna yang baru mengenal ML.

Prasyarat

Untuk menggunakan solusi ini, pastikan Anda memiliki akses ke Studio dengan peran eksekusi yang memungkinkan Anda menjalankan fungsionalitas SageMaker. Untuk peran pengguna Anda dalam Studio, pastikan bahwa Proyek SageMaker dan JumpStart opsi diaktifkan.

Di bagian berikut, kami membahas masing-masing dari lima solusi baru dan mendiskusikan cara kerjanya secara mendetail, bersama dengan beberapa rekomendasi tentang bagaimana Anda dapat menggunakannya untuk kebutuhan bisnis Anda sendiri.

Optimalisasi harga

Bisnis suka menggunakan berbagai pengungkit untuk mendapatkan hasil terbaik. Misalnya, harga suatu produk atau layanan adalah pengungkit yang dapat dikendalikan oleh bisnis. Pertanyaannya adalah bagaimana memutuskan berapa harga untuk menetapkan produk atau layanan, untuk memaksimalkan tujuan bisnis seperti keuntungan atau pendapatan.

Solusi ini menyediakan model ML yang dapat disesuaikan untuk membantu Anda membuat keputusan optimal untuk menetapkan harga produk atau layanan Anda guna mencapai tujuan Anda, seperti memaksimalkan pendapatan, laba, atau metrik khusus lainnya. Solusinya menggunakan pendekatan ML dan inferensi kausal untuk mempelajari hubungan harga-volume dari data historis, dan mampu membuat rekomendasi harga dinamis secara real time untuk mengoptimalkan metrik tujuan kustom.

Tangkapan layar berikut menunjukkan contoh data masukan.

Solusinya mencakup tiga bagian:

  • Estimasi elastisitas harga โ€“ Ini diperkirakan dengan inferensi kausal melalui algoritma ML ganda
  • Perkiraan volume โ€“ Ini diperkirakan menggunakan algoritma Nabi
  • Optimalisasi harga โ€“ Ini dicapai dengan simulasi bagaimana-jika melalui skenario harga yang berbeda

Solusinya memberikan harga yang direkomendasikan untuk hari berikutnya untuk memaksimalkan pendapatan. Selain itu, keluarannya meliputi perkiraan elastisitas harga, yang merupakan nilai yang menunjukkan pengaruh harga terhadap volume, dan model prakiraan, yang mampu meramalkan volume hari berikutnya. Bagan berikut menunjukkan bagaimana model kausal yang menggabungkan elastisitas harga yang dihitung berkinerja jauh lebih baik di bawah analisis bagaimana-jika (dengan penyimpangan besar dari perilaku harga) daripada model prediktif yang menggunakan Nabi untuk meramalkan volume menggunakan data deret waktu.

Selesaikan masalah bisnis secara end-to-end melalui pembelajaran mesin di solusi Amazon SageMaker JumpStart PlatoBlockchain Data Intelligence. Pencarian Vertikal. Ai.

Anda dapat menerapkan solusi ini ke bisnis Anda untuk kasus penggunaan berikut:

  • Tentukan harga barang yang optimal untuk toko ritel
  • Perkirakan pengaruh kupon diskon pada pembelian pelanggan
  • Memprediksi pengaruh berbagai metode insentif dalam bisnis apa pun

Prediksi spesies burung

Ada beberapa aplikasi computer vision (CV) untuk bisnis saat ini. Salah satu aplikasi tersebut adalah deteksi objek, di mana algoritma ML mendeteksi lokasi objek dalam gambar dengan menggambar kotak pembatas di sekitarnya, dan mengidentifikasi jenis objeknya. Mempelajari cara menerapkan model deteksi objek dan menyempurnakannya dapat sangat bermanfaat bagi organisasi yang memiliki kebutuhan CV.

Solusi ini memberikan contoh cara menerjemahkan spesifikasi kotak pembatas saat memberikan gambar ke algoritme SageMaker. Solusi ini juga menunjukkan cara meningkatkan model deteksi objek dengan menambahkan gambar pelatihan yang dibalik secara horizontal (gambar cermin).

Buku catatan disediakan untuk bereksperimen dengan tantangan deteksi objek ketika ada banyak kelas (200 spesies burung). Buku catatan ini juga menunjukkan cara memetakan peningkatan akurasi yang terjadi di seluruh zaman pekerjaan pelatihan. Gambar berikut menunjukkan contoh gambar dari dataset burung.

Selesaikan masalah bisnis secara end-to-end melalui pembelajaran mesin di solusi Amazon SageMaker JumpStart PlatoBlockchain Data Intelligence. Pencarian Vertikal. Ai.

Solusi ini berisi lima langkah:

  1. Siapkan datanya, termasuk download dan RecordIO pembuatan file.
  2. Membuat dan melatih model deteksi objek.
  3. Terapkan titik akhir dan evaluasi kinerja model.
  4. Buat dan latih kembali model deteksi objek dengan kumpulan data yang diperluas.
  5. Terapkan titik akhir dan evaluasi kinerja model yang diperluas.

Anda mendapatkan yang berikut sebagai output:

  • Hasil deteksi objek dengan kotak ikatan terhadap gambar uji Anda
  • Model deteksi objek terlatih
  • Model deteksi objek terlatih dengan set data tambahan yang diperluas (dibalik)
  • Dua titik akhir terpisah dikerahkan dengan salah satu dari masing-masing model

Bagan berikut menunjukkan peningkatan model terhadap iterasi model (epoch) selama pelatihan.

Selesaikan masalah bisnis secara end-to-end melalui pembelajaran mesin di solusi Amazon SageMaker JumpStart PlatoBlockchain Data Intelligence. Pencarian Vertikal. Ai.

Contoh berikut adalah output dari dua gambar uji.

Selesaikan masalah bisnis secara end-to-end melalui pembelajaran mesin di solusi Amazon SageMaker JumpStart PlatoBlockchain Data Intelligence. Pencarian Vertikal. Ai.

Selesaikan masalah bisnis secara end-to-end melalui pembelajaran mesin di solusi Amazon SageMaker JumpStart PlatoBlockchain Data Intelligence. Pencarian Vertikal. Ai.

Anda dapat menerapkan solusi ini ke bisnis Anda untuk kasus penggunaan berikut:

  • Mendeteksi objek pada ban berjalan di industri pengemasan
  • Deteksi topping pada pizza
  • Menerapkan aplikasi operasional rantai pasokan yang melibatkan deteksi objek

Prediksi kelangsungan hidup kanker paru-paru

COVID-19 membawa lebih banyak perhatian pada tantangan medis terkait paru-paru. Ini juga memberi banyak tekanan pada rumah sakit, dokter, perawat, dan ahli radiologi. Bayangkan kemungkinan di mana Anda dapat menerapkan ML sebagai alat yang ampuh untuk membantu praktisi medis dan membantu mereka mempercepat pekerjaan mereka. Dalam solusi ini, kami menunjukkan bagaimana fitur radiomik 2D dan 3D serta demografi pasien dapat dimasukkan ke algoritme ML untuk memprediksi peluang kelangsungan hidup kanker paru-paru pasien. Hasil dari prediksi ini dapat membantu penyedia mengambil tindakan proaktif yang tepat.

Solusi ini mendemonstrasikan cara membangun pipeline ML yang dapat diskalakan untuk set data Radiogenomics Non-Small Cell Lung Cancer (NSCLC), yang terdiri dari data sekuensing RNA, data klinis (reflektif dari data EHR), dan citra medis. Menggunakan beberapa jenis data untuk membuat model mesin disebut sebagai multimodal ML. Solusi ini memprediksi hasil kelangsungan hidup pasien yang didiagnosis dengan kanker paru-paru non-sel kecil.

Gambar berikut menunjukkan contoh input data dari dataset Radiogenomics Non-Small Cell Lung Cancer (NSCLC).

Selesaikan masalah bisnis secara end-to-end melalui pembelajaran mesin di solusi Amazon SageMaker JumpStart PlatoBlockchain Data Intelligence. Pencarian Vertikal. Ai.

Sebagai bagian dari solusi, RNA total diekstraksi dari jaringan tumor dan dianalisis dengan teknologi sekuensing RNA. Meskipun data asli berisi lebih dari 22,000 gen, kami menyimpan 21 gen dari 10 kluster gen yang sangat terekspresikan (metagenes) yang diidentifikasi, divalidasi dalam kohort ekspresi gen yang tersedia untuk umum, dan berkorelasi dengan prognosis.

Catatan klinis disimpan dalam format CSV. Setiap baris sesuai dengan pasien, dan kolom berisi informasi tentang pasien, termasuk demografi, stadium tumor, dan status kelangsungan hidup.

Untuk data genom, kami menyimpan 21 gen dari 10 kluster gen (metagenes) yang sangat koekspresi yang diidentifikasi, divalidasi dalam kohort ekspresi gen yang tersedia untuk umum, dan berkorelasi dengan prognosis.

Untuk data pencitraan medis, kami membuat fitur radiomik 3D tingkat pasien yang menjelaskan ukuran, bentuk, dan atribut visual tumor yang diamati pada CT scan. Untuk setiap studi pasien, langkah-langkah berikut dilakukan:

  1. Baca file irisan DICOM 2D untuk CT scan dan segmentasi tumor, gabungkan ke volume 3D, simpan volume dalam format NIfTI.
  2. Sejajarkan volume CT dan segmentasi tumor sehingga kami dapat memfokuskan perhitungan di dalam tumor.
  3. Hitung fitur radiomik yang menggambarkan wilayah tumor menggunakan perpustakaan piradiomik.
  4. Ekstrak 120 fitur radiomik dari delapan kelas, seperti representasi statistik dari distribusi dan kejadian bersama dari intensitas dalam wilayah tumor yang diminati, dan pengukuran berbasis bentuk yang menggambarkan tumor secara morfologis.

Untuk membuat tampilan multi-modal pasien untuk pelatihan model, kami menggabungkan vektor fitur dari tiga modalitas. Kami kemudian memproses datanya. Pertama, kami menormalkan rentang fitur independen menggunakan penskalaan fitur. Kemudian kami melakukan analisis komponen utama (PCA) pada fitur untuk mengurangi dimensi dan mengidentifikasi fitur yang paling diskriminatif yang berkontribusi 95% varians dalam data.

Hal ini menghasilkan pengurangan dimensi dari 215 fitur menjadi 45 komponen utama, yang merupakan fitur untuk pelajar yang diawasi.

Solusi tersebut menghasilkan model ML yang memprediksi status kelangsungan hidup pasien NSCLC (mati atau hidup) dalam bentuk probabilitas. Selain model dan prediksi, kami juga menghasilkan laporan untuk menjelaskan model. Pipa pencitraan medis menghasilkan volume CT paru-paru 3D dan segmentasi tumor untuk tujuan visualisasi.

Anda dapat menerapkan solusi ini untuk kasus penggunaan kesehatan dan ilmu kehidupan.

Klasifikasi pembayaran finansial

Mengambil semua transaksi keuangan bisnis atau konsumen dan mengaturnya ke dalam berbagai kategori bisa sangat membantu. Ini dapat membantu pengguna mempelajari berapa banyak yang telah mereka belanjakan dalam kategori mana, dan juga dapat meningkatkan peringatan ketika transaksi atau pengeluaran dalam kategori tertentu naik atau turun secara tidak terduga.

Solusi ini menunjukkan cara melatih dan menerapkan model ML untuk mengklasifikasikan transaksi keuangan berdasarkan informasi transaksi. Banyak bank menyediakan ini sebagai layanan untuk memberikan gambaran umum kepada pengguna akhir tentang kebiasaan belanja mereka. Anda juga dapat menggunakan solusi ini sebagai langkah perantara dalam deteksi penipuan, personalisasi, atau deteksi anomali. Kami menggunakan SageMaker untuk melatih dan menerapkan model XGBoost dengan infrastruktur dasar yang diperlukan.

Dataset sintetis yang kami tunjukkan solusi ini memiliki fitur berikut:

  • kategori_transaksi โ€“ Kategori transaksi, dari 19 opsi berikut: Uncategorized, Entertainment, Education, Shopping, Personal Care, Health and Fitness, Food and Dining, Gifts and Donations, Investments, Bills and Utilities, Auto and Transport, Travel, Fees and Charges, Business Services, Personal Services, Taxes, Gambling, Home, dan Pension and insurances.
  • receiver_id โ€“ Pengidentifikasi untuk pihak penerima. Pengenal terdiri dari 16 angka.
  • ID pengirim โ€“ Pengidentifikasi untuk pihak pengirim. Pengenal terdiri dari 16 angka.
  • jumlah - Jumlah yang ditransfer.
  • timestamp โ€“ Stempel waktu transaksi dalam format YYYY-MM-DD HH:MM:SS.

Lima pengamatan pertama dari dataset adalah sebagai berikut:

Selesaikan masalah bisnis secara end-to-end melalui pembelajaran mesin di solusi Amazon SageMaker JumpStart PlatoBlockchain Data Intelligence. Pencarian Vertikal. Ai.

Untuk solusi ini, kami menggunakan XGBoost, implementasi sumber terbuka yang populer dan efisien dari algoritma pohon yang didorong gradien. Gradient boosting adalah algoritma pembelajaran terawasi yang mencoba memprediksi variabel target secara akurat dengan menggabungkan ansambel perkiraan dari serangkaian model yang lebih sederhana dan lebih lemah. Implementasinya tersedia dalam algoritme bawaan SageMaker.

Solusi klasifikasi pembayaran keuangan berisi empat langkah:

  1. Siapkan datanya.
  2. Bangun toko fitur.
  3. Buat dan latih model XGBoost.
  4. Terapkan titik akhir dan evaluasi kinerja model.

Kami mendapatkan output berikut:

  • Model XGBoost terlatih berdasarkan contoh dataset kami
  • Titik akhir SageMaker yang dapat memprediksi kategori transaksi

Setelah menjalankan solusi ini, Anda akan melihat laporan klasifikasi yang mirip dengan berikut ini.

Selesaikan masalah bisnis secara end-to-end melalui pembelajaran mesin di solusi Amazon SageMaker JumpStart PlatoBlockchain Data Intelligence. Pencarian Vertikal. Ai.

Kemungkinan aplikasi untuk bisnis Anda meliputi:

  • Berbagai aplikasi keuangan di perbankan ritel dan investasi
  • Ketika transaksi perlu diklasifikasikan dalam kasus penggunaan apa pun (bukan hanya keuangan)

Prediksi churn untuk pelanggan ponsel

Memprediksi churn pelanggan adalah kebutuhan bisnis yang sangat umum. Sejumlah penelitian menunjukkan bahwa biaya mempertahankan pelanggan yang sudah ada jauh lebih sedikit daripada memperoleh pelanggan baru. Tantangannya sering kali datang dari bisnis yang mengalami kesulitan memahami mengapa pelanggan berputar, atau membangun model yang memprediksi perubahan.

Dalam contoh ini, pengguna yang baru mengenal ML dapat merasakan bagaimana model prediksi churn dapat dikembangkan dengan cepat menggunakan kumpulan data transaksi panggilan seluler. Solusi ini menggunakan SageMaker untuk melatih dan menerapkan model XGBoost pada kumpulan data profil pelanggan untuk memprediksi apakah pelanggan kemungkinan akan meninggalkan operator telepon seluler.

Kumpulan data yang digunakan solusi ini tersedia untuk umum dan disebutkan dalam buku Discovering Knowledge in Data oleh Daniel T. Larose. Itu dikaitkan oleh penulis ke University of California Irvine Repository of Machine Learning Datasets.

Kumpulan data ini menggunakan 21 atribut berikut untuk menggambarkan profil pelanggan dari operator seluler AS yang tidak dikenal.

  • Negara bagian: negara bagian AS tempat pelanggan tinggal, ditunjukkan dengan singkatan dua huruf; misalnya, OH atau NJ
  • Panjang Akun: jumlah hari akun ini aktif
  • Kode Area: kode area tiga digit dari nomor telepon pelanggan yang sesuai
  • Telepon: nomor telepon tujuh digit yang tersisa
  • Paket Internasional: apakah pelanggan memiliki paket panggilan internasional: ya/tidak
  • Paket VMail: apakah pelanggan memiliki fitur pesan suara: ya/tidak
  • Pesan VMail: jumlah rata-rata pesan pesan suara per bulan
  • Day Mins: jumlah total menit panggilan yang digunakan sepanjang hari
  • Panggilan Harian: jumlah total panggilan yang dilakukan pada siang hari
  • Day Charge: biaya panggilan siang hari yang ditagih
  • Menit Malam, Panggilan Malam, Biaya Malam: biaya yang ditagih untuk panggilan yang dilakukan pada malam hari
  • Menit Malam, Panggilan Malam, Biaya Malam: biaya yang ditagih untuk panggilan yang dilakukan pada malam hari
  • Menit Intl, Panggilan Intl, Biaya Intl: biaya yang ditagih untuk panggilan internasional
  • Panggilan CustServ: jumlah panggilan yang dilakukan ke Layanan Pelanggan
  • Churn?: apakah pelanggan meninggalkan layanan: benar/salah

Solusi ini berisi tiga tahap:

  1. Siapkan datanya.
  2. Buat dan latih model XGBoost.
  3. Terapkan titik akhir dan evaluasi kinerja model.

Kami mendapatkan output berikut:

  • Model XGBoost terlatih berdasarkan contoh dataset kami untuk memprediksi churn pengguna
  • Titik akhir SageMaker yang dapat memprediksi churn pengguna

Model ini membantu memperkirakan berapa banyak dari 5,000 pelanggan telepon seluler yang cenderung berhenti menggunakan operator telepon seluler mereka saat ini.

Bagan berikut menunjukkan distribusi probabilitas churn sebagai output dari model.

Selesaikan masalah bisnis secara end-to-end melalui pembelajaran mesin di solusi Amazon SageMaker JumpStart PlatoBlockchain Data Intelligence. Pencarian Vertikal. Ai.

Anda dapat menerapkan ini ke bisnis Anda untuk kasus penggunaan berikut:

  • Memprediksi churn pelanggan dalam bisnis Anda sendiri
  • Klasifikasikan pelanggan mana yang dapat membuka email pemasaran Anda dan siapa yang tidak (klasifikasi biner)
  • Memprediksi siswa mana yang kemungkinan akan drop out dari suatu kursus

Bersihkan sumber daya

Setelah Anda selesai menjalankan solusi di JumpStart, pastikan untuk memilih Hapus semua sumber daya jadi semua sumber daya yang telah Anda buat dalam proses tersebut dihapus dan penagihan Anda dihentikan.

Selesaikan masalah bisnis secara end-to-end melalui pembelajaran mesin di solusi Amazon SageMaker JumpStart PlatoBlockchain Data Intelligence. Pencarian Vertikal. Ai.

Kesimpulan

Posting ini menunjukkan kepada Anda bagaimana menyelesaikan berbagai masalah bisnis dengan menerapkan ML, berdasarkan solusi JumpStart. Meskipun posting ini berfokus pada lima solusi baru yang baru saja ditambahkan ke JumpStart, ada total 23 solusi yang tersedia. Kami mendorong Anda untuk masuk ke Studio dan melihat sendiri solusi JumpStart dan mulai mendapatkan nilai langsung darinya. Untuk informasi lebih lanjut, lihat Studio Amazon SageMaker dan SageMaker JumpStart.

Catatan: Jika Anda tidak melihat kelima solusi di atas di konsol JumpStart wilayah AWS Anda, harap tunggu selama seminggu dan periksa lagi. Kami merilisnya ke berbagai daerah secara bertahap.


Tentang Penulis

Selesaikan masalah bisnis secara end-to-end melalui pembelajaran mesin di solusi Amazon SageMaker JumpStart PlatoBlockchain Data Intelligence. Pencarian Vertikal. Ai. Dr. Raju Penmatcha adalah Arsitek Solusi Spesialis AI/ML dalam Platform AI di AWS. Dia mengerjakan rangkaian layanan low-code/no-code di SageMaker yang membantu pelanggan dengan mudah membangun dan menerapkan model dan solusi machine learning. Saat tidak membantu pelanggan, dia suka bepergian ke tempat-tempat baru.

Selesaikan masalah bisnis secara end-to-end melalui pembelajaran mesin di solusi Amazon SageMaker JumpStart PlatoBlockchain Data Intelligence. Pencarian Vertikal. Ai.Manan Syah adalah Manajer Pengembangan Perangkat Lunak di Amazon Web Services. Dia adalah penggemar ML dan berfokus pada pembuatan produk AI/ML tanpa kode/kode rendah. Dia berusaha untuk memberdayakan orang-orang teknis berbakat lainnya untuk membangun perangkat lunak yang hebat.

Stempel Waktu:

Lebih dari Pembelajaran Mesin AWS