Memahami perilaku pelanggan adalah hal utama untuk setiap bisnis saat ini. Memperoleh wawasan tentang mengapa dan bagaimana pelanggan membeli dapat membantu meningkatkan pendapatan. Tetapi kehilangan pelanggan (juga disebut churn pelanggan) selalu merupakan risiko, dan wawasan tentang mengapa pelanggan pergi bisa sama pentingnya untuk mempertahankan pendapatan dan keuntungan. Pembelajaran mesin (ML) dapat membantu dengan wawasan, tetapi hingga saat ini Anda membutuhkan pakar ML untuk membangun model untuk memprediksi churn, kekurangannya dapat menunda tindakan yang didorong oleh wawasan oleh bisnis untuk mempertahankan pelanggan.
Dalam postingan ini, kami menunjukkan kepada Anda bagaimana analis bisnis dapat membangun model ML churn pelanggan dengan Kanvas Amazon SageMaker, tidak diperlukan kode. Canvas memberi analis bisnis antarmuka tunjuk dan klik visual yang memungkinkan Anda membuat model dan menghasilkan prediksi ML yang akurat sendiriโtanpa memerlukan pengalaman ML atau harus menulis satu baris kode pun.
Ikhtisar solusi
Untuk posting ini, kami mengambil peran sebagai analis pemasaran di departemen pemasaran operator telepon seluler. Kami telah ditugasi untuk mengidentifikasi pelanggan yang berpotensi berisiko mengalami churning. Kami memiliki akses ke penggunaan layanan dan data perilaku pelanggan lainnya, dan ingin tahu apakah data ini dapat membantu menjelaskan alasan pelanggan pergi. Jika kami dapat mengidentifikasi faktor yang menjelaskan churn, kami dapat mengambil tindakan korektif untuk mengubah perilaku yang diprediksi, seperti menjalankan kampanye retensi yang ditargetkan.
Untuk melakukan ini, kami menggunakan data yang kami miliki dalam file CSV, yang berisi informasi tentang penggunaan dan penghentian pelanggan. Kami menggunakan Canvas untuk melakukan langkah-langkah berikut:
- Impor kumpulan data churn dari Layanan Penyimpanan Sederhana Amazon (Amazon S3).
- Latih dan bangun model churn.
- Analisis hasil model.
- Uji prediksi terhadap model.
Untuk dataset kami, kami menggunakan a kumpulan data sintetis dari operator telepon seluler telekomunikasi. Kumpulan data sampel ini berisi 5,000 catatan, di mana setiap catatan menggunakan 21 atribut untuk menggambarkan profil pelanggan. Atributnya adalah sebagai berikut:
- Negara โ Negara bagian AS tempat pelanggan tinggal, ditunjukkan dengan singkatan dua huruf; misalnya, OH atau NJ
- Panjang Akun โ Jumlah hari akun ini aktif
- Kode area โ Kode area tiga digit nomor telepon pelanggan
- Nomor Hp / Telephone โ Nomor telepon tujuh digit yang tersisa
- Rencana Internasional โ Apakah pelanggan memiliki paket panggilan internasional (ya/tidak)
- Paket VMail โ Apakah pelanggan memiliki fitur pesan suara (ya/tidak)
- Pesan VMail โ Jumlah rata-rata pesan suara per bulan
- menit hari โ Jumlah total menit panggilan yang digunakan sepanjang hari
- Panggilan Siang โ Jumlah total panggilan yang dilakukan pada siang hari
- Biaya Harian โ Biaya panggilan siang hari yang ditagih
- Hawa Mins, Panggilan Malam, Biaya Malam โ Biaya yang ditagih untuk panggilan malam
- menit malam, Panggilan Malam, Pengisian Malam โ Biaya yang ditagih untuk panggilan malam hari
- Menit Internasional, Panggilan Internasional, Biaya Intl โ Biaya yang ditagih untuk panggilan internasional
- Panggilan CustServ โ Jumlah panggilan yang dilakukan ke layanan pelanggan
- Mengocok? โ Apakah pelanggan meninggalkan layanan (benar/salah)
Atribut terakhir, Churn?
, adalah atribut yang kita inginkan untuk diprediksi oleh model ML. Atribut target adalah biner, artinya model kami memprediksi output sebagai salah satu dari dua kategori (True
or False
).
Prasyarat
Admin cloud dengan Akun AWS dengan izin yang sesuai diperlukan untuk menyelesaikan prasyarat berikut:
- Terapkan file Amazon SageMaker Untuk instruksi, lihat Masuk ke Domain Amazon SageMaker.
- Menyebarkan Kanvas. Untuk petunjuk, lihat Menyiapkan dan mengelola Amazon SageMaker Canvas (untuk administrator TI).
- Mengonfigurasi kebijakan berbagi sumber daya lintas asal (CORS) untuk Canvas. Untuk petunjuk, lihat Berikan pengguna Anda kemampuan untuk mengunggah file lokal.
Buat model pergantian pelanggan
Pertama, mari kita unduh keluarkan kumpulan data dan tinjau file untuk memastikan semua data ada di sana. Kemudian selesaikan langkah-langkah berikut:
- Masuk ke Konsol Manajemen AWS, menggunakan akun dengan izin yang sesuai untuk mengakses Canvas.
- Masuk ke konsol Canvas.
Di sinilah kita dapat mengelola kumpulan data dan membuat model.
- Pilih impor.
- Pilih Unggah Dan pilih
churn.csv
file. - Pilih Impor data untuk mengunggahnya ke Canvas.
Proses impor memakan waktu sekitar 10 detik (ini dapat bervariasi tergantung pada ukuran set data). Setelah selesai, kita bisa melihat dataset ada di Ready
status.
- Untuk mempratinjau 100 baris pertama dari kumpulan data, arahkan mouse ke ikon mata.
Pratinjau kumpulan data muncul. Di sini kami dapat memverifikasi bahwa data kami benar.
Setelah kami mengonfirmasi bahwa dataset yang diimpor sudah siap, kami membuat model kami.
- Pilih Model baru.
- Pilih kumpulan data churn.csv dan pilih Pilih set data.
Sekarang kita mengkonfigurasi proses model build.
- Untuk Kolom target, memilih
Churn?
kolom.
Untuk Tipe model, Canvas secara otomatis merekomendasikan tipe model, dalam hal ini 2 kategori prediksi (apa yang disebut ilmuwan data sebagai klasifikasi biner). Ini cocok untuk kasus penggunaan kami karena kami hanya memiliki dua kemungkinan nilai prediksi: True
or False
, jadi kami mengikuti rekomendasi yang dibuat Canvas.
Kami sekarang memvalidasi beberapa asumsi. Kami ingin melihat sekilas apakah kolom target kami dapat diprediksi oleh kolom lain. Kita bisa mendapatkan pandangan cepat ke dalam perkiraan akurasi model dan dampak kolom (perkiraan pentingnya setiap kolom dalam memprediksi kolom target).
- Pilih semua 21 kolom dan pilih Pratinjau model.
Fitur ini menggunakan subset dari dataset kami dan hanya satu pass pada pemodelan. Untuk kasus penggunaan kami, pembuatan model pratinjau membutuhkan waktu sekitar 2 menit.
Seperti yang ditunjukkan pada tangkapan layar berikut, Phone
dan State
kolom memiliki dampak yang jauh lebih kecil pada prediksi kami. Kami ingin berhati-hati saat menghapus input teks karena dapat berisi fitur kategoris diskrit penting yang berkontribusi pada prediksi kami. Di sini, nomor telepon hanya setara dengan nomor akunโbukan nilai dalam memprediksi kemungkinan churn akun lain, dan status pelanggan tidak terlalu memengaruhi model kami.
- Kami menghapus kolom ini karena tidak memiliki fitur utama yang penting.
- Setelah kami menghapus
Phone
danState
kolom, mari jalankan pratinjau lagi.
Seperti yang ditunjukkan pada tangkapan layar berikut, akurasi model meningkat sebesar 0.1%. Model pratinjau kami memiliki perkiraan akurasi 95.9%, dan kolom dengan dampak terbesar adalah Night Calls
, Eve Mins
, dan Night Charge
. Ini memberi kami wawasan tentang kolom apa yang paling memengaruhi kinerja model kami. Di sini kita perlu berhati-hati saat melakukan pemilihan fitur karena jika satu fitur sangat berdampak pada hasil model, itu adalah indikator utama dari kebocoran target, dan fitur tersebut tidak akan tersedia pada saat prediksi. Dalam hal ini, beberapa kolom menunjukkan dampak yang sangat mirip, jadi kami terus membangun model kami.
Canvas menawarkan dua opsi build:
- bangunan standar โ Membangun model terbaik dari proses yang dioptimalkan yang didukung oleh ML Otomatis; kecepatan ditukar dengan akurasi terbesar
- Membangun cepat โ Membangun model dalam waktu singkat dibandingkan dengan build standar; akurasi potensial ditukar dengan kecepatan.
- Untuk posting ini, kami memilih bangunan standar pilihan karena kami ingin memiliki model terbaik dan kami bersedia menghabiskan waktu tambahan untuk menunggu hasilnya.
Proses pembuatan bisa memakan waktu 2โ4 jam. Selama waktu ini, Canvas menguji ratusan calon pipeline, memilih model terbaik untuk disajikan kepada kami. Pada tangkapan layar berikut, kita dapat melihat waktu dan kemajuan pembangunan yang diharapkan.
Evaluasi kinerja model
Ketika proses pembuatan model selesai, model memprediksi churn 97.9% dari waktu. Ini tampaknya baik-baik saja, tetapi sebagai analis kami ingin menyelam lebih dalam dan melihat apakah kami dapat mempercayai model untuk membuat keputusan berdasarkan itu. pada Scoring tab, kami dapat meninjau plot visual dari prediksi kami yang dipetakan ke hasil mereka. Hal ini memungkinkan kita wawasan yang lebih dalam model kami.
Canvas memisahkan set data menjadi set pelatihan dan pengujian. Dataset pelatihan adalah data yang digunakan Canvas untuk membangun model. Test set digunakan untuk melihat apakah model bekerja dengan baik dengan data baru. Diagram Sankey pada tangkapan layar berikut menunjukkan bagaimana model dilakukan pada set pengujian. Untuk mempelajari lebih lanjut, lihat Mengevaluasi Kinerja Model Anda di Kanvas Amazon SageMaker.
Untuk mendapatkan wawasan yang lebih mendetail di luar apa yang ditampilkan dalam diagram Sankey, analis bisnis dapat menggunakan a matriks kebingungan analisis untuk solusi bisnis mereka. Misalnya, kami ingin lebih memahami kemungkinan model membuat prediksi yang salah. Kita dapat melihat ini di diagram Sankey, tetapi ingin lebih banyak wawasan, jadi kami memilih Metrik lanjutan. Kami disajikan dengan matriks kebingungan, yang menampilkan kinerja model dalam format visual dengan nilai-nilai berikut, khusus untuk kelas positifโkami mengukur berdasarkan apakah mereka benar-benar akan churn, jadi kelas positif kami adalah True
dalam contoh ini:
- Benar Positif (TP) - Jumlah
True
hasil yang diprediksi dengan benar sebagaiTrue
- Negatif Benar (TN) - Jumlah
False
hasil yang diprediksi dengan benar sebagaiFalse
- Positif Palsu (FP) - Jumlah
False
hasil yang salah diprediksi sebagaiTrue
- Negatif Palsu (FN) - Jumlah
True
hasil yang salah diprediksi sebagaiFalse
Kita dapat menggunakan bagan matriks ini untuk menentukan tidak hanya seberapa akurat model kita, tetapi juga ketika salah, seberapa sering hal itu mungkin terjadi dan seberapa salahnya.
Metrik lanjutan terlihat bagus. Kita bisa mempercayai hasil modelnya. Kami melihat positif palsu dan negatif palsu yang sangat rendah. Ini adalah jika model berpikir pelanggan dalam kumpulan data akan churn dan sebenarnya tidak (positif palsu), atau jika model berpikir pelanggan akan churn dan mereka benar-benar melakukannya (negatif palsu). Angka yang tinggi untuk keduanya mungkin membuat kita berpikir lebih banyak jika kita dapat menggunakan model untuk membuat keputusan.
Ayo kembali ke Ringkasan tab, untuk meninjau dampak setiap kolom. Informasi ini dapat membantu tim pemasaran mendapatkan wawasan yang mengarah pada pengambilan tindakan untuk mengurangi churn pelanggan. Misalnya, kita dapat melihat bahwa keduanya rendah dan tinggi CustServ Calls
meningkatkan kemungkinan churn. Tim pemasaran dapat mengambil tindakan untuk mencegah churn pelanggan berdasarkan pembelajaran ini. Contohnya termasuk membuat FAQ mendetail di situs web untuk mengurangi panggilan layanan pelanggan, dan menjalankan kampanye pendidikan dengan pelanggan di FAQ yang dapat menjaga keterlibatan.
Model kami terlihat cukup akurat. Kita bisa langsung melakukan prediksi interaktif di Meramalkan tab, baik dalam prediksi batch atau tunggal (real-time). Dalam contoh ini, kami membuat beberapa perubahan pada nilai kolom tertentu dan melakukan prediksi waktu nyata. Kanvas menunjukkan kepada kita hasil prediksi beserta tingkat kepercayaannya.
Katakanlah kita memiliki pelanggan yang sudah ada yang memiliki penggunaan berikut: Night Mins
adalah 40 dan Eve Mins
adalah 40. Kami dapat menjalankan prediksi, dan model kami mengembalikan skor kepercayaan 93.2% bahwa pelanggan ini akan churn (True
). Kami sekarang mungkin memilih untuk memberikan diskon promosi untuk mempertahankan pelanggan ini.
Katakanlah kita memiliki pelanggan yang sudah ada yang memiliki penggunaan berikut: Night Mins
adalah 40 dan Eve Mins
adalah 40. Kami dapat menjalankan prediksi, dan model kami mengembalikan skor kepercayaan 93.2% bahwa pelanggan ini akan churn (True
). Kami sekarang mungkin memilih untuk memberikan diskon promosi untuk mempertahankan pelanggan ini.
Menjalankan satu prediksi sangat bagus untuk analisis bagaimana-jika individu, tetapi kita juga perlu menjalankan prediksi pada banyak record sekaligus. Kanvas mampu menjalankan prediksi batch, yang memungkinkan Anda menjalankan prediksi dalam skala besar.
Kesimpulan
Dalam posting ini, kami menunjukkan bagaimana seorang analis bisnis dapat membuat model churn pelanggan dengan SageMaker Canvas menggunakan data sampel. Canvas memungkinkan analis bisnis Anda membuat model ML yang akurat dan menghasilkan prediksi menggunakan antarmuka tanpa kode, visual, tunjuk dan klik. Seorang analis pemasaran sekarang dapat menggunakan informasi ini untuk menjalankan kampanye retensi yang ditargetkan dan menguji strategi kampanye baru lebih cepat, yang mengarah pada pengurangan churn pelanggan.
Analis dapat membawa ini ke tingkat berikutnya dengan berbagi model mereka dengan rekan ilmuwan data. Ilmuwan data dapat melihat model Canvas di Studio Amazon SageMaker, di mana mereka dapat menjelajahi pilihan yang dibuat Canvas AutoML, memvalidasi hasil model, dan bahkan membuat model dengan beberapa klik. Hal ini dapat mempercepat penciptaan nilai berbasis ML dan membantu meningkatkan hasil yang lebih cepat dengan lebih cepat.
Untuk mempelajari lebih lanjut tentang menggunakan Canvas, lihat Bangun, Bagikan, Terapkan: bagaimana analis bisnis dan ilmuwan data mencapai time-to-market yang lebih cepat menggunakan ML tanpa kode dan Amazon SageMaker Canvas. Untuk informasi selengkapnya tentang membuat model ML dengan solusi tanpa kode, lihat Mengumumkan Amazon SageMaker Canvas โ Kemampuan Machine Learning Visual, Tanpa Kode untuk Analis Bisnis.
tentang Penulis
Henry Robalino adalah Arsitek Solusi di AWS, berbasis di NJ. Dia bersemangat tentang cloud dan pembelajaran mesin, dan peran yang dapat mereka mainkan di masyarakat. Dia mencapai ini dengan bekerja dengan pelanggan untuk membantu mereka mencapai tujuan bisnis mereka menggunakan AWS Cloud. Di luar pekerjaan, Anda dapat menemukan Henry bepergian atau menjelajahi alam bebas dengan putri bulunya, Arly.
Chao Ran Wang adalah Arsitek Solusi di AWS, yang berbasis di Dallas, TX. Dia telah bekerja di AWS sejak lulus dari University of Texas di Dallas pada tahun 2016 dengan gelar master di bidang Ilmu Komputer. Chaoran membantu pelanggan membangun aplikasi yang skalabel, aman, dan hemat biaya serta menemukan solusi untuk memecahkan tantangan bisnis mereka di AWS Cloud. Di luar pekerjaan, Chaoran suka menghabiskan waktu bersama keluarga dan dua anjingnya, Biubiu dan Coco.
- Coinsmart. Pertukaran Bitcoin dan Crypto Terbaik Eropa.
- Platoblockchain. Intelijen Metaverse Web3. Pengetahuan Diperkuat. AKSES GRATIS.
- CryptoHawk. Radar Altcoin. Uji Coba Gratis.
- Sumber: https://aws.amazon.com/blogs/machine-learning/predicting-customer-churn-with-no-code-machine-learning-using-amazon-sagemaker-canvas/
- "
- 000
- 10
- 100
- 11
- 2016
- 7
- 9
- Tentang Kami
- mempercepat
- mengakses
- Akun
- tepat
- tindakan
- Tambahan
- admin
- administrator
- maju
- Semua
- Amazon
- analisis
- analis
- aplikasi
- sesuai
- sekitar
- DAERAH
- atribut
- tersedia
- rata-rata
- AWS
- TERBAIK
- Luar
- Terbesar
- batas
- membangun
- Bangunan
- membangun
- bisnis
- bisnis
- membeli
- panggilan
- Kampanye
- Kampanye
- Bisa Dapatkan
- calon
- kanvas
- Kategori
- tertentu
- tantangan
- perubahan
- biaya
- pilihan
- Pilih
- kelas
- klasifikasi
- awan
- kode
- rekan
- Kolom
- dibandingkan
- komputer
- Komputer Ilmu
- kepercayaan
- kebingungan
- konsul
- mengandung
- terus
- hemat biaya
- bisa
- membuat
- membuat
- penciptaan
- pelanggan
- Layanan Pelanggan
- pelanggan
- Dallas
- data
- ilmuwan data
- lebih dalam
- menunda
- Tergantung
- menyebarkan
- terperinci
- Menentukan
- langsung
- menampilkan
- Tidak
- Pendidikan
- interaksi
- Teknik
- diperkirakan
- contoh
- ada
- diharapkan
- pengalaman
- ahli
- menyelidiki
- mata
- faktor
- keluarga
- FAQ
- FAST
- lebih cepat
- Fitur
- Fitur
- akhir
- Pertama
- berikut
- format
- menghasilkan
- Anda
- baik
- besar
- terbesar
- Tumbuh
- memiliki
- membantu
- membantu
- di sini
- High
- Seterpercayaapakah Olymp Trade? Kesimpulan
- HTTPS
- Ratusan
- ICON
- mengenali
- mengidentifikasi
- Dampak
- berdampak
- pentingnya
- penting
- ditingkatkan
- memasukkan
- Meningkatkan
- Pada meningkat
- sendiri-sendiri
- informasi
- memasukkan
- wawasan
- interaktif
- Antarmuka
- Internasional
- IT
- memimpin
- terkemuka
- BELAJAR
- pengetahuan
- Meninggalkan
- Tingkat
- baris
- lokal
- mesin
- Mesin belajar
- terbuat
- utama
- Membuat
- mengelola
- pengelolaan
- pelaksana
- Marketing
- tuan
- Matriks
- makna
- Metrik
- keberatan
- ML
- mobil
- telepon genggam
- model
- model
- lebih
- paling
- negatif
- jumlah
- nomor
- Penawaran
- dioptimalkan
- pilihan
- Opsi
- Lainnya
- di luar rumah
- bergairah
- prestasi
- Bermain
- Kebijakan
- positif
- mungkin
- potensi
- meramalkan
- ramalan
- Prediksi
- menyajikan
- cukup
- Preview
- primer
- proses
- Profil
- keuntungan
- promosi
- promosional
- memberikan
- menyediakan
- Cepat
- real-time
- merekomendasikan
- catatan
- arsip
- menurunkan
- yang tersisa
- menghapus
- wajib
- sumber
- Hasil
- Pengembalian
- pendapatan
- ulasan
- Risiko
- Run
- berjalan
- terukur
- Skala
- Ilmu
- ilmuwan
- ilmuwan
- detik
- aman
- layanan
- set
- Share
- berbagi
- mirip
- Sederhana
- Ukuran
- So
- Masyarakat
- padat
- larutan
- Solusi
- MEMECAHKAN
- beberapa
- kecepatan
- menghabiskan
- Pengeluaran
- standar
- Negara
- Status
- penyimpanan
- strategi
- pengambilan
- target
- tim
- telekomunikasi
- uji
- tes
- texas
- waktu
- hari ini
- puncak
- Pelatihan
- Perjalanan
- Kepercayaan
- TX
- memahami
- universitas
- us
- menggunakan
- Pengguna
- nilai
- memeriksa
- View
- Suara
- situs web
- Apa
- Apa itu
- apakah
- SIAPA
- Wikipedia
- Kerja
- kerja
- akan