Müşteri davranışını anlamak bugün her işletme için en önemli konu. Müşterilerin neden ve nasıl satın aldığına ilişkin içgörüler edinmek, geliri artırmaya yardımcı olabilir. Ancak müşterileri kaybetmek (müşteri kaybı da denir) her zaman bir risktir ve müşterilerin neden ayrıldığına dair içgörüler, gelirleri ve kârları korumak için aynı derecede önemli olabilir. Makine öğrenimi (ML), içgörülere yardımcı olabilir, ancak şimdiye kadar, müşteri kaybını tahmin etmek için modeller oluşturmak için makine öğrenimi uzmanlarına ihtiyaç duyuyordunuz.
Bu gönderide, iş analistlerinin aşağıdakilerle nasıl bir müşteri kaybı ML modeli oluşturabileceğini gösteriyoruz. Amazon SageMaker Tuval, kod gerekmez. Canvas, iş analistlerine, herhangi bir ML deneyimi veya tek bir kod satırı yazmak zorunda kalmadan modeller oluşturmanıza ve doğru ML tahminleri oluşturmanıza olanak tanıyan görsel bir tıkla ve tıkla arabirimi sağlar.
Çözüme genel bakış
Bu gönderi için, bir cep telefonu operatörünün pazarlama departmanında bir pazarlama analisti rolünü üstleniyoruz. Potansiyel olarak çalkantı riski altında olan müşterileri belirlemekle görevlendirildik. Hizmet kullanımı ve diğer müşteri davranışı verilerine erişimimiz var ve bu verilerin bir müşterinin neden ayrıldığını açıklamaya yardımcı olup olmayacağını bilmek istiyoruz. Kaybı açıklayan faktörleri belirleyebilirsek, hedeflenen tutma kampanyaları yürütmek gibi öngörülen davranışı değiştirmek için düzeltici önlemler alabiliriz.
Bunu yapmak için, müşteri kullanımı ve müşteri kaybı hakkında bilgiler içeren bir CSV dosyasında sahip olduğumuz verileri kullanırız. Aşağıdaki adımları gerçekleştirmek için Canvas'ı kullanırız:
- Chun veri kümesini şuradan içe aktar: Amazon Basit Depolama Hizmeti (Amazon S3).
- Kayıp modelini eğitin ve oluşturun.
- Model sonuçlarını analiz edin.
- Modele karşı tahminleri test edin.
Veri kümemiz için bir sentetik veri seti bir telekomünikasyon cep telefonu operatöründen. Bu örnek veri kümesi, her kaydın müşteri profilini tanımlamak için 5,000 özniteliği kullandığı 21 kayıt içerir. Nitelikler aşağıdaki gibidir:
- Eyalet – İki harfli bir kısaltma ile belirtilen, müşterinin ikamet ettiği ABD eyaleti; örneğin, OH veya NJ
- Hesap Uzunluğu – Bu hesabın aktif olduğu gün sayısı
- Bölge kodu – Müşterinin telefon numarasının üç haneli alan kodu
- Telefon – Kalan yedi haneli telefon numarası
- Uluslararası Plan – Müşterinin uluslararası bir arama planı olup olmadığı (evet/hayır)
- VMail Planı – Müşterinin sesli mesaj özelliğinin olup olmadığı (evet/hayır)
- VMail Mesajı – Aylık ortalama sesli mesaj sayısı
- Gün Dakika – Gün boyunca kullanılan toplam arama dakikası sayısı
- Günlük Aramalar – Gün içinde yapılan toplam arama sayısı
- Gün Ücreti – Gündüz aramalarının faturalanan maliyeti
- Eve Dakika, arife aramaları, Havva Ücreti – Akşam aramaları için faturalanan ücret
- Gece Dakikası, Gece Aramaları, Gece Ücreti – Gece aramaları için faturalanan ücret
- Uluslararası Dakika, Uluslararası Aramalar, Uluslararası Ücretlendirme – Uluslararası aramalar için faturalanan ücret
- CustServ Çağrıları – Müşteri hizmetlerine yapılan arama sayısı
- Çalık mı? – Müşterinin hizmetten çıkıp çıkmadığı (doğru/yanlış)
Son nitelik, Churn?
, ML modelinin tahmin etmesini istediğimiz niteliktir. Hedef nitelik ikilidir, yani modelimiz çıktıyı iki kategoriden biri olarak tahmin eder (True
or False
).
Önkoşullar
Bir bulut yöneticisi AWS hesabı aşağıdaki ön koşulları tamamlamak için uygun izinlere sahip olmak gerekir:
- dağıtmak Amazon Adaçayı Yapıcı Talimatlar için bkz. Amazon SageMaker Etki Alanında Yerleşik.
- Canvas'ı dağıtın. Talimatlar için bkz. Amazon SageMaker Canvas'ı kurma ve yönetme (BT yöneticileri için).
- Canvas için çıkış noktaları arası kaynak paylaşımı (CORS) ilkelerini yapılandırın. Talimatlar için bkz. Kullanıcılarınıza yerel dosyalar yükleme olanağı verin.
Müşteri kaybı modeli oluşturun
Öncelikle şunu indirelim kayıp veri seti ve tüm verilerin orada olduğundan emin olmak için dosyayı inceleyin. Ardından aşağıdaki adımları tamamlayın:
- Adresinde oturum açın AWS Yönetim Konsolu, Canvas'a erişmek için uygun izinlere sahip bir hesap kullanarak.
- Canvas konsolunda oturum açın.
Burası veri kümelerimizi yönetebileceğimiz ve modeller oluşturabileceğimiz yerdir.
- Klinik ithalat.
- Klinik Foto Yükle Seçin ve
churn.csv
dosyası. - Klinik Tarihleri içe aktar Canvas'a yüklemek için.
İçe aktarma işlemi yaklaşık 10 saniye sürer (bu, veri kümesi boyutuna bağlı olarak değişebilir). Tamamlandığında, veri kümesinin içinde olduğunu görebiliriz. Ready
durumu.
- Veri kümesinin ilk 100 satırını önizlemek için farenizi göz simgesinin üzerine getirin.
Veri kümesinin bir önizlemesi görünür. Burada verilerimizin doğru olduğunu doğrulayabiliriz.
İçe aktarılan veri setinin hazır olduğunu onayladıktan sonra modelimizi oluşturuyoruz.
- Klinik Yeni model.
- churn.csv veri kümesini seçin ve Veri kümesini seçin.
Şimdi yapı modeli sürecini yapılandırıyoruz.
- İçin Hedef sütunlar, seç
Churn?
sütun.
İçin Model türü, Canvas bu durumda model türünü otomatik olarak önerir 2 kategori tahmini (bir veri bilimcisinin ikili sınıflandırma dediği şey). Bu, bizim kullanım durumumuz için uygundur çünkü elimizde yalnızca iki olası tahmin değeri vardır: True
or False
, bu yüzden Canvas'ın yaptığı öneriyle gidiyoruz.
Şimdi bazı varsayımları doğrularız. Hedef sütunumuzun diğer sütunlar tarafından tahmin edilip edilemeyeceğine hızlı bir şekilde bakmak istiyoruz. Modelin tahmini doğruluğunu ve sütun etkisini (hedef sütunu tahmin etmede her sütunun tahmini önemi) hızlı bir şekilde görebiliriz..
- 21 sütunun tümünü seçin ve Önizleme modeli.
Bu özellik, veri kümemizin bir alt kümesini ve modellemede yalnızca tek bir geçişi kullanır. Kullanım durumumuz için, önizleme modelinin oluşturulması yaklaşık 2 dakika sürer.
Aşağıdaki ekran görüntüsünde gösterildiği gibi, Phone
ve State
sütunların tahminimiz üzerinde çok daha az etkisi vardır. Tahminimize katkıda bulunan önemli ayrık, kategorik özellikler içerebileceğinden, metin girişini kaldırırken dikkatli olmak istiyoruz. Burada, telefon numarası sadece bir hesap numarasının eşdeğeridir - diğer hesapların kesinti olasılığını tahmin etmede değeri yoktur ve müşterinin durumu modelimizi fazla etkilemez.
- Bu sütunları, önemli bir özellik önemi olmadığı için kaldırıyoruz.
- kaldırdıktan sonra
Phone
veState
sütunlar, önizlemeyi tekrar çalıştıralım.
Aşağıdaki ekran görüntüsünde gösterildiği gibi, model doğruluğu %0.1 arttı. Önizleme modelimizin tahmini %95.9 doğruluğu vardır ve en büyük etkiye sahip sütunlar şunlardır: Night Calls
, Eve Mins
, ve Night Charge
. Bu bize, modelimizin performansını en çok hangi sütunların etkilediğine dair bir fikir verir. Burada özellik seçimi yaparken dikkatli olmamız gerekir çünkü tek bir özellik bir modelin sonucu üzerinde son derece etkiliyse, bu birincil göstergedir. hedef sızıntıve bu özellik tahmin sırasında kullanılamayacak. Bu durumda, birkaç sütun çok benzer etki gösterdi, bu yüzden modelimizi oluşturmaya devam ediyoruz.
Canvas iki yapı seçeneği sunar:
- Standart yapı – tarafından desteklenen optimize edilmiş bir süreçten en iyi modeli oluşturur. AutoML; hız, en yüksek doğrulukla değiştirilir
- Hızlı inşa – Standart bir yapıya kıyasla çok kısa sürede bir model oluşturur; potansiyel doğruluk, hız ile değiştirilir.
- Bu gönderi için seçiyoruz Standart yapı çünkü en iyi modele sahip olmak istiyoruz ve sonucu beklemek için fazladan zaman harcamaya hazırız.
Oluşturma işlemi 2-4 saat sürebilir. Bu süre zarfında Canvas, bize sunacak en iyi modeli seçerek yüzlerce aday boru hattını test eder. Aşağıdaki ekran görüntüsünde, beklenen yapım süresini ve ilerlemesini görebiliriz.
Model performansını değerlendirin
Model oluşturma süreci tamamlandığında, modelin zamanın %97.9'unu değiştireceği tahmin ediliyor. Bu iyi görünüyor, ancak analistler olarak daha derine dalmak ve ona dayalı kararlar almak için modele güvenip güvenemeyeceğimizi görmek istiyoruz. Üzerinde Puanlama sekmesinde, tahminlerimizin sonuçlarıyla eşleştirilmiş görsel bir planını gözden geçirebiliriz. Bu, modelimiz hakkında daha derin bir fikir edinmemizi sağlar.
Canvas, veri kümesini eğitim ve test kümelerine ayırır. Eğitim veri kümesi, Canvas'ın modeli oluşturmak için kullandığı verilerdir. Test seti, modelin yeni verilerle iyi performans gösterip göstermediğini görmek için kullanılır. Aşağıdaki ekran görüntüsündeki Sankey diyagramı, modelin test setinde nasıl performans gösterdiğini gösterir. Daha fazla bilgi edinmek için bkz. Amazon SageMaker Canvas'ta Modelinizin Performansını Değerlendirme.
İş analistleri, Sankey diyagramında gösterilenlerin ötesinde daha ayrıntılı bilgiler elde etmek için bir karışıklık matrisi iş çözümleri için analizler. Örneğin, modelin yanlış tahminler yapma olasılığını daha iyi anlamak istiyoruz. Bunu Sankey diyagramında görebiliriz, ancak daha fazla içgörü istiyoruz, bu yüzden seçiyoruz Gelişmiş metrikler. Bir modelin performansını, pozitif sınıfa özgü aşağıdaki değerlerle görsel bir biçimde görüntüleyen bir karışıklık matrisi ile karşı karşıyayız - bunların gerçekten çalkalanıp çalkalamayacağına bağlı olarak ölçüm yapıyoruz, dolayısıyla pozitif sınıfımız şudur: True
bu örnekte:
- Gerçek Pozitif (TP) - Sayısı
True
olarak doğru tahmin edilen sonuçlarTrue
- Gerçek Negatif (TN) - Sayısı
False
olarak doğru tahmin edilen sonuçlarFalse
- Yanlış Pozitif (FP) - Sayısı
False
yanlış tahmin edilen sonuçlarTrue
- Yanlış Negatif (FN) - Sayısı
True
yanlış tahmin edilen sonuçlarFalse
Bu matris grafiğini yalnızca modelimizin ne kadar doğru olduğunu değil, ne zaman yanlış olduğunu, bunun ne sıklıkta olabileceğini ve nasıl yanlış olduğunu belirlemek için kullanabiliriz.
Gelişmiş metrikler iyi görünüyor. Model sonucuna güvenebiliriz. Çok düşük yanlış pozitifler ve yanlış negatifler görüyoruz. Bunlar, modelin veri kümesindeki bir müşterinin duracağını düşünmesi ve gerçekte olmaması (yanlış pozitif) veya model müşterinin vazgeçeceğini düşünmesi ve gerçekten yapmasıdır (yanlış negatif). Her ikisi için de yüksek sayılar, modeli karar vermek için kullanıp kullanamayacağımız konusunda daha fazla düşünmemizi sağlayabilir.
geri dönelim Genel Bakış sekmesini tıklayın, her sütunun etkisini gözden geçirin. Bu bilgiler, pazarlama ekibinin müşteri kaybını azaltmak için harekete geçmesine yol açan öngörüler kazanmasına yardımcı olabilir. Örneğin, hem düşük hem de yüksek olduğunu görebiliriz. CustServ Calls
çıldırma olasılığını artırın. Pazarlama ekibi, bu öğrenmelere dayanarak müşteri kaybını önlemek için önlemler alabilir. Örnekler, müşteri hizmetleri çağrılarını azaltmak için web sitelerinde ayrıntılı bir SSS oluşturmayı ve SSS'de müşterilerle etkileşimi artırabilecek eğitim kampanyaları yürütmeyi içerir.
Modelimiz oldukça doğru görünüyor. üzerinde doğrudan etkileşimli bir tahmin gerçekleştirebiliriz. Tahmin sekmesi, toplu veya tek (gerçek zamanlı) tahminde. Bu örnekte, belirli sütun değerlerinde birkaç değişiklik yaptık ve gerçek zamanlı bir tahmin gerçekleştirdik. Kanvas bize güven düzeyi ile birlikte tahmin sonucunu gösterir.
Aşağıdaki kullanıma sahip mevcut bir müşterimiz olduğunu varsayalım: Night Mins
olduğunu 40 ve Eve Mins
40'tır. Bir tahmin yürütebiliriz ve modelimiz bu müşterinin vazgeçeceğine dair %93.2'lik bir güven puanı verir (True
). Artık bu müşteriyi elde tutmak için promosyon indirimleri sunmayı seçebiliriz.
Aşağıdaki kullanıma sahip mevcut bir müşterimiz olduğunu varsayalım: Night Mins
olduğunu 40 ve Eve Mins
40'tır. Bir tahmin yürütebiliriz ve modelimiz bu müşterinin vazgeçeceğine dair %93.2'lik bir güven puanı verir (True
). Artık bu müşteriyi elde tutmak için promosyon indirimleri sunmayı seçebiliriz.
Tek bir tahmin yürütmek, bireysel durum analizi için harikadır, ancak aynı anda birçok kayıt üzerinde tahmin yürütmemiz gerekir. Tuval yapabilir toplu tahminleri çalıştır, bu da tahminleri geniş ölçekte çalıştırmanıza olanak tanır.
Sonuç
Bu gönderide, bir iş analistinin örnek verileri kullanarak SageMaker Canvas ile nasıl müşteri kaybı modeli oluşturabileceğini gösterdik. Canvas, iş analistlerinizin doğru ML modelleri oluşturmasına ve kodsuz, görsel, tıkla ve tıkla arabirimi kullanarak tahminler oluşturmasına olanak tanır. Bir pazarlama analizcisi artık bu bilgileri, hedeflenen elde tutma kampanyaları yürütmek ve yeni kampanya stratejilerini daha hızlı test etmek için kullanabilir, bu da müşteri kaybında bir azalmaya yol açar.
Analistler, modellerini veri bilimcisi meslektaşlarıyla paylaşarak bunu bir sonraki seviyeye taşıyabilir. Veri bilimcileri Canvas modelini şurada görüntüleyebilir: Amazon SageMaker StüdyosuCanvas AutoML'nin yaptığı seçenekleri keşfedebilecekleri, model sonuçlarını doğrulayabilecekleri ve hatta modeli birkaç tıklamayla üretebilecekleri bir yer. Bu, makine öğrenimi tabanlı değer yaratmayı hızlandırabilir ve iyileştirilmiş sonuçların daha hızlı ölçeklenmesine yardımcı olabilir.
Canvas'ı kullanma hakkında daha fazla bilgi edinmek için bkz. Oluşturun, Paylaşın, Dağıtın: İş analistleri ve veri bilimcileri kodsuz ML ve Amazon SageMaker Canvas kullanarak nasıl daha hızlı pazara sunma süresi elde ediyor?. Kodsuz bir çözümle ML modelleri oluşturma hakkında daha fazla bilgi için bkz. Amazon SageMaker Canvas – İş Analistleri için Görsel, Kodsuz Makine Öğrenimi Yeteneği Duyurusu.
Yazar Hakkında
henry robalino AWS'de NJ merkezli bir Çözüm Mimarıdır. Bulut ve makine öğrenimi ve bunların toplumda oynayabileceği rol konusunda tutkulu. Bunu, AWS Cloud'u kullanarak iş hedeflerine ulaşmalarına yardımcı olmak için müşterilerle birlikte çalışarak başarır. İş dışında Henry'yi kürklü kızı Arly ile seyahat ederken veya açık havada keşfederken bulabilirsiniz.
Chaoran Wang Dallas, TX merkezli AWS'de Çözüm Mimarıdır. 2016 yılında Dallas'taki Texas Üniversitesi'nden Bilgisayar Bilimleri alanında yüksek lisans derecesi ile mezun olduğundan beri AWS'de çalışmaktadır. Chaoran, müşterilerin AWS Bulut üzerinde ölçeklenebilir, güvenli ve uygun maliyetli uygulamalar oluşturmasına ve iş zorluklarını çözmek için çözümler bulmasına yardımcı olur. Chaoran, iş dışında ailesi ve iki köpeği Biubiu ve Coco ile vakit geçirmeyi çok seviyor.
- Akıllı para. Avrupa'nın En İyi Bitcoin ve Kripto Borsası.
- Plato blok zinciri. Web3 Metaverse Zekası. Bilgi Güçlendirildi. SERBEST ERİŞİM.
- KriptoHawk. Altcoin Radarı. Ücretsiz deneme.
- Kaynak: https://aws.amazon.com/blogs/machine-learning/predicting-customer-churn-with-no-code-machine-learning-using-amazon-sagemaker-canvas/
- "
- 000
- 10
- 100
- 11
- 2016
- 7
- 9
- Hakkımızda
- hızlandırmak
- erişim
- Hesap
- doğru
- eylemler
- Ek
- Gizem
- yöneticiler
- ileri
- Türkiye
- Amazon
- analiz
- analist
- uygulamaları
- uygun
- yaklaşık olarak
- ALAN
- öznitelikleri
- mevcut
- ortalama
- AWS
- İYİ
- Ötesinde
- Biggest
- sınır
- inşa etmek
- bina
- inşa
- iş
- işletmeler
- satın almak
- çağrı
- Kampanya
- Kampanyalar
- Alabilirsin
- aday
- tuval
- Kategoriler
- belli
- zorluklar
- değişiklik
- ücret
- choices
- Klinik
- sınıf
- sınıflandırma
- bulut
- kod
- arkadaşları
- Sütun
- karşılaştırıldığında
- bilgisayar
- Bilgisayar Bilimleri
- güven
- karışıklık
- konsolos
- içeren
- devam etmek
- uygun maliyetli
- olabilir
- yaratmak
- Oluşturma
- oluşturma
- müşteri
- Müşteri Hizmetleri
- Müşteriler
- Dallas
- veri
- veri bilimcisi
- derin
- geciktirmek
- bağlı
- dağıtmak
- detaylı
- Belirlemek
- direkt olarak
- görüntüler
- Değil
- Eğitim
- nişan
- Mühendislik
- tahmini
- örnek
- mevcut
- beklenen
- deneyim
- uzmanlara göre
- keşfetmek
- göz
- faktörler
- aile
- SSS
- HIZLI
- Daha hızlı
- Özellikler(Hazırlık aşamasında)
- Özellikler
- ince
- Ad
- takip etme
- biçim
- oluşturmak
- Goller
- Tercih Etmenizin
- harika
- En büyük
- Büyümek
- sahip olan
- yardım et
- yardımcı olur
- okuyun
- Yüksek
- Ne kadar
- HTTPS
- Yüzlerce
- ICON
- belirlemek
- belirlenmesi
- darbe
- etkili
- önem
- önemli
- gelişmiş
- dahil
- Artırmak
- artmış
- bireysel
- bilgi
- giriş
- anlayışlar
- interaktif
- arayüzey
- Uluslararası
- IT
- öncülük etmek
- önemli
- ÖĞRENİN
- öğrenme
- Ayrılmak
- seviye
- çizgi
- yerel
- makine
- makine öğrenme
- yapılmış
- büyük
- Yapımı
- yönetmek
- yönetim
- yönetme
- Pazarlama
- yüksek lisans
- Matris
- anlam
- Metrikleri
- akla
- ML
- Telefon
- cep telefonu kullanıyor.
- model
- modelleri
- Daha
- çoğu
- negatif
- numara
- sayılar
- Teklifler
- optimize
- seçenek
- Opsiyonlar
- Diğer
- açık havada
- tutkulu
- performans
- OYNA
- politikaları
- pozitif
- mümkün
- potansiyel
- tahmin
- tahmin
- Tahminler
- mevcut
- güzel
- Önizleme
- birincil
- süreç
- Profil
- kar
- tanıtım
- promosyon
- sağlamak
- sağlar
- Hızlı
- gerçek zaman
- önerir
- kayıt
- kayıtlar
- azaltmak
- kalan
- kaldırma
- gereklidir
- kaynak
- Sonuçlar
- İade
- gelir
- yorum
- Risk
- koşmak
- koşu
- ölçeklenebilir
- ölçek
- Bilim
- bilim adamı
- bilim adamları
- saniye
- güvenli
- hizmet
- set
- paylaş
- paylaşımı
- benzer
- Basit
- beden
- So
- Toplum
- katı
- çözüm
- Çözümler
- ÇÖZMEK
- biraz
- hız
- geçirmek
- Harcama
- standart
- Eyalet
- Durum
- hafızası
- stratejileri
- alma
- Hedef
- takım
- telekomünikasyon
- test
- testleri
- Teksas
- zaman
- bugün
- üst
- Eğitim
- Seyahat
- Güven
- TX
- anlamak
- üniversite
- us
- kullanım
- kullanıcılar
- değer
- doğrulamak
- Görüntüle
- ses
- web siteleri
- Ne
- Nedir
- olup olmadığını
- DSÖ
- Vikipedi
- İş
- çalışma
- olur