Amazon SageMaker Canvas'ı Kullanarak Kodsuz Makine Öğrenimi ile Müşteri Kaybını Tahmin Edin

Plato tarafından yeniden yayınlandı

İzleyiciler: 0

Müşteri davranışını anlamak bugün her işletme için en önemli konu. Müşterilerin neden ve nasıl satın aldığına ilişkin içgörüler edinmek, geliri artırmaya yardımcı olabilir. Ancak müşterileri kaybetmek (müşteri kaybı da denir) her zaman bir risktir ve müşterilerin neden ayrıldığına dair içgörüler, gelirleri ve kârları korumak için aynı derecede önemli olabilir. Makine öğrenimi (ML), içgörülere yardımcı olabilir, ancak şimdiye kadar, müşteri kaybını tahmin etmek için modeller oluşturmak için makine öğrenimi uzmanlarına ihtiyaç duyuyordunuz.

Bu gönderide, iş analistlerinin aşağıdakilerle nasıl bir müşteri kaybı ML modeli oluşturabileceğini gösteriyoruz. Amazon SageMaker Tuval, kod gerekmez. Canvas, iş analistlerine, herhangi bir ML deneyimi veya tek bir kod satırı yazmak zorunda kalmadan modeller oluşturmanıza ve doğru ML tahminleri oluşturmanıza olanak tanıyan görsel bir tıkla ve tıkla arabirimi sağlar.

Çözüme genel bakış

Bu gönderi için, bir cep telefonu operatörünün pazarlama departmanında bir pazarlama analisti rolünü üstleniyoruz. Potansiyel olarak çalkantı riski altında olan müşterileri belirlemekle görevlendirildik. Hizmet kullanımı ve diğer müşteri davranışı verilerine erişimimiz var ve bu verilerin bir müşterinin neden ayrıldığını açıklamaya yardımcı olup olmayacağını bilmek istiyoruz. Kaybı açıklayan faktörleri belirleyebilirsek, hedeflenen tutma kampanyaları yürütmek gibi öngörülen davranışı değiştirmek için düzeltici önlemler alabiliriz.

Bunu yapmak için, müşteri kullanımı ve müşteri kaybı hakkında bilgiler içeren bir CSV dosyasında sahip olduğumuz verileri kullanırız. Aşağıdaki adımları gerçekleştirmek için Canvas'ı kullanırız:

Chun veri kümesini şuradan içe aktar: Amazon Basit Depolama Hizmeti (Amazon S3).
Kayıp modelini eğitin ve oluşturun.
Model sonuçlarını analiz edin.
Modele karşı tahminleri test edin.

Veri kümemiz için bir sentetik veri seti bir telekomünikasyon cep telefonu operatöründen. Bu örnek veri kümesi, her kaydın müşteri profilini tanımlamak için 5,000 özniteliği kullandığı 21 kayıt içerir. Nitelikler aşağıdaki gibidir:

Eyalet – İki harfli bir kısaltma ile belirtilen, müşterinin ikamet ettiği ABD eyaleti; örneğin, OH veya NJ
Hesap Uzunluğu – Bu hesabın aktif olduğu gün sayısı
Bölge kodu – Müşterinin telefon numarasının üç haneli alan kodu
Telefon – Kalan yedi haneli telefon numarası
Uluslararası Plan – Müşterinin uluslararası bir arama planı olup olmadığı (evet/hayır)
VMail Planı – Müşterinin sesli mesaj özelliğinin olup olmadığı (evet/hayır)
VMail Mesajı – Aylık ortalama sesli mesaj sayısı
Gün Dakika – Gün boyunca kullanılan toplam arama dakikası sayısı
Günlük Aramalar – Gün içinde yapılan toplam arama sayısı
Gün Ücreti – Gündüz aramalarının faturalanan maliyeti
Eve Dakika, arife aramaları, Havva Ücreti – Akşam aramaları için faturalanan ücret
Gece Dakikası, Gece Aramaları, Gece Ücreti – Gece aramaları için faturalanan ücret
Uluslararası Dakika, Uluslararası Aramalar, Uluslararası Ücretlendirme – Uluslararası aramalar için faturalanan ücret
CustServ Çağrıları – Müşteri hizmetlerine yapılan arama sayısı
Çalık mı? – Müşterinin hizmetten çıkıp çıkmadığı (doğru/yanlış)

Son nitelik, Churn?, ML modelinin tahmin etmesini istediğimiz niteliktir. Hedef nitelik ikilidir, yani modelimiz çıktıyı iki kategoriden biri olarak tahmin eder (True or False).

Önkoşullar

Bir bulut yöneticisi AWS hesabı aşağıdaki ön koşulları tamamlamak için uygun izinlere sahip olmak gerekir:

dağıtmak Amazon Adaçayı Yapıcı Talimatlar için bkz. Amazon SageMaker Etki Alanında Yerleşik.
Canvas'ı dağıtın. Talimatlar için bkz. Amazon SageMaker Canvas'ı kurma ve yönetme (BT yöneticileri için).
Canvas için çıkış noktaları arası kaynak paylaşımı (CORS) ilkelerini yapılandırın. Talimatlar için bkz. Kullanıcılarınıza yerel dosyalar yükleme olanağı verin.

Müşteri kaybı modeli oluşturun

Öncelikle şunu indirelim kayıp veri seti ve tüm verilerin orada olduğundan emin olmak için dosyayı inceleyin. Ardından aşağıdaki adımları tamamlayın:

Adresinde oturum açın AWS Yönetim Konsolu, Canvas'a erişmek için uygun izinlere sahip bir hesap kullanarak.
Canvas konsolunda oturum açın.

Burası veri kümelerimizi yönetebileceğimiz ve modeller oluşturabileceğimiz yerdir.

Klinik ithalat.

Tuval İçe Aktarma Düğmesi Seçimi

Klinik Foto Yükle Seçin ve churn.csv dosyası.
Klinik Tarihleri içe aktar Canvas'a yüklemek için.

S3'ten tuval seçme verileri

İçe aktarma işlemi yaklaşık 10 saniye sürer (bu, veri kümesi boyutuna bağlı olarak değişebilir). Tamamlandığında, veri kümesinin içinde olduğunu görebiliriz. Ready durumu.

Kanvas Hazır Veri Kümesi

Veri kümesinin ilk 100 satırını önizlemek için farenizi göz simgesinin üzerine getirin.

Tuval Görünümü Veri Kümesi

Veri kümesinin bir önizlemesi görünür. Burada verilerimizin doğru olduğunu doğrulayabiliriz.

Tuval Doğrulama Verileri

İçe aktarılan veri setinin hazır olduğunu onayladıktan sonra modelimizi oluşturuyoruz.

Klinik Yeni model.

Tuval Yeni Modeller

churn.csv veri kümesini seçin ve Veri kümesini seçin.

Tuval Seçimi Veri Kümesi

Şimdi yapı modeli sürecini yapılandırıyoruz.

İçin Hedef sütunlar, seç Churn? sütun.

İçin Model türü, Canvas bu durumda model türünü otomatik olarak önerir 2 kategori tahmini (bir veri bilimcisinin ikili sınıflandırma dediği şey). Bu, bizim kullanım durumumuz için uygundur çünkü elimizde yalnızca iki olası tahmin değeri vardır: True or False, bu yüzden Canvas'ın yaptığı öneriyle gidiyoruz.

Tuval Yapı Modeli

Şimdi bazı varsayımları doğrularız. Hedef sütunumuzun diğer sütunlar tarafından tahmin edilip edilemeyeceğine hızlı bir şekilde bakmak istiyoruz. Modelin tahmini doğruluğunu ve sütun etkisini (hedef sütunu tahmin etmede her sütunun tahmini önemi) hızlı bir şekilde görebiliriz..

21 sütunun tümünü seçin ve Önizleme modeli.

Bu özellik, veri kümemizin bir alt kümesini ve modellemede yalnızca tek bir geçişi kullanır. Kullanım durumumuz için, önizleme modelinin oluşturulması yaklaşık 2 dakika sürer.

Tuval Önizleme Modeli

Aşağıdaki ekran görüntüsünde gösterildiği gibi, Phone ve State sütunların tahminimiz üzerinde çok daha az etkisi vardır. Tahminimize katkıda bulunan önemli ayrık, kategorik özellikler içerebileceğinden, metin girişini kaldırırken dikkatli olmak istiyoruz. Burada, telefon numarası sadece bir hesap numarasının eşdeğeridir - diğer hesapların kesinti olasılığını tahmin etmede değeri yoktur ve müşterinin durumu modelimizi fazla etkilemez.

Bu sütunları, önemli bir özellik önemi olmadığı için kaldırıyoruz.
kaldırdıktan sonra Phone ve State sütunlar, önizlemeyi tekrar çalıştıralım.

Aşağıdaki ekran görüntüsünde gösterildiği gibi, model doğruluğu %0.1 arttı. Önizleme modelimizin tahmini %95.9 doğruluğu vardır ve en büyük etkiye sahip sütunlar şunlardır: Night Calls, Eve Mins, ve Night Charge. Bu bize, modelimizin performansını en çok hangi sütunların etkilediğine dair bir fikir verir. Burada özellik seçimi yaparken dikkatli olmamız gerekir çünkü tek bir özellik bir modelin sonucu üzerinde son derece etkiliyse, bu birincil göstergedir. hedef sızıntıve bu özellik tahmin sırasında kullanılamayacak. Bu durumda, birkaç sütun çok benzer etki gösterdi, bu yüzden modelimizi oluşturmaya devam ediyoruz.

Kanvas Özellik Mühendisliği Sonrası

Canvas iki yapı seçeneği sunar:

Standart yapı – tarafından desteklenen optimize edilmiş bir süreçten en iyi modeli oluşturur. AutoML; hız, en yüksek doğrulukla değiştirilir
Hızlı inşa – Standart bir yapıya kıyasla çok kısa sürede bir model oluşturur; potansiyel doğruluk, hız ile değiştirilir.

Bu gönderi için seçiyoruz Standart yapı çünkü en iyi modele sahip olmak istiyoruz ve sonucu beklemek için fazladan zaman harcamaya hazırız.

Kanvas Standart Yapı

Oluşturma işlemi 2-4 saat sürebilir. Bu süre zarfında Canvas, bize sunacak en iyi modeli seçerek yüzlerce aday boru hattını test eder. Aşağıdaki ekran görüntüsünde, beklenen yapım süresini ve ilerlemesini görebiliriz.

Kanvas Analiz Modeli

Model performansını değerlendirin

Model oluşturma süreci tamamlandığında, modelin zamanın %97.9'unu değiştireceği tahmin ediliyor. Bu iyi görünüyor, ancak analistler olarak daha derine dalmak ve ona dayalı kararlar almak için modele güvenip güvenemeyeceğimizi görmek istiyoruz. Üzerinde Puanlama sekmesinde, tahminlerimizin sonuçlarıyla eşleştirilmiş görsel bir planını gözden geçirebiliriz. Bu, modelimiz hakkında daha derin bir fikir edinmemizi sağlar.

Canvas, veri kümesini eğitim ve test kümelerine ayırır. Eğitim veri kümesi, Canvas'ın modeli oluşturmak için kullandığı verilerdir. Test seti, modelin yeni verilerle iyi performans gösterip göstermediğini görmek için kullanılır. Aşağıdaki ekran görüntüsündeki Sankey diyagramı, modelin test setinde nasıl performans gösterdiğini gösterir. Daha fazla bilgi edinmek için bkz. Amazon SageMaker Canvas'ta Modelinizin Performansını Değerlendirme.

İş analistleri, Sankey diyagramında gösterilenlerin ötesinde daha ayrıntılı bilgiler elde etmek için bir karışıklık matrisi iş çözümleri için analizler. Örneğin, modelin yanlış tahminler yapma olasılığını daha iyi anlamak istiyoruz. Bunu Sankey diyagramında görebiliriz, ancak daha fazla içgörü istiyoruz, bu yüzden seçiyoruz Gelişmiş metrikler. Bir modelin performansını, pozitif sınıfa özgü aşağıdaki değerlerle görsel bir biçimde görüntüleyen bir karışıklık matrisi ile karşı karşıyayız - bunların gerçekten çalkalanıp çalkalamayacağına bağlı olarak ölçüm yapıyoruz, dolayısıyla pozitif sınıfımız şudur: True bu örnekte:

Gerçek Pozitif (TP) - Sayısı True olarak doğru tahmin edilen sonuçlar True
Gerçek Negatif (TN) - Sayısı False olarak doğru tahmin edilen sonuçlar False
Yanlış Pozitif (FP) - Sayısı False yanlış tahmin edilen sonuçlar True
Yanlış Negatif (FN) - Sayısı True yanlış tahmin edilen sonuçlar False

Bu matris grafiğini yalnızca modelimizin ne kadar doğru olduğunu değil, ne zaman yanlış olduğunu, bunun ne sıklıkta olabileceğini ve nasıl yanlış olduğunu belirlemek için kullanabiliriz.

Kanvas F1 Matrisi

Gelişmiş metrikler iyi görünüyor. Model sonucuna güvenebiliriz. Çok düşük yanlış pozitifler ve yanlış negatifler görüyoruz. Bunlar, modelin veri kümesindeki bir müşterinin duracağını düşünmesi ve gerçekte olmaması (yanlış pozitif) veya model müşterinin vazgeçeceğini düşünmesi ve gerçekten yapmasıdır (yanlış negatif). Her ikisi için de yüksek sayılar, modeli karar vermek için kullanıp kullanamayacağımız konusunda daha fazla düşünmemizi sağlayabilir.

geri dönelim Genel Bakış sekmesini tıklayın, her sütunun etkisini gözden geçirin. Bu bilgiler, pazarlama ekibinin müşteri kaybını azaltmak için harekete geçmesine yol açan öngörüler kazanmasına yardımcı olabilir. Örneğin, hem düşük hem de yüksek olduğunu görebiliriz. CustServ Calls çıldırma olasılığını artırın. Pazarlama ekibi, bu öğrenmelere dayanarak müşteri kaybını önlemek için önlemler alabilir. Örnekler, müşteri hizmetleri çağrılarını azaltmak için web sitelerinde ayrıntılı bir SSS oluşturmayı ve SSS'de müşterilerle etkileşimi artırabilecek eğitim kampanyaları yürütmeyi içerir.

Modelimiz oldukça doğru görünüyor. üzerinde doğrudan etkileşimli bir tahmin gerçekleştirebiliriz. Tahmin sekmesi, toplu veya tek (gerçek zamanlı) tahminde. Bu örnekte, belirli sütun değerlerinde birkaç değişiklik yaptık ve gerçek zamanlı bir tahmin gerçekleştirdik. Kanvas bize güven düzeyi ile birlikte tahmin sonucunu gösterir.

Tuval Tahmini Çıkarım

Aşağıdaki kullanıma sahip mevcut bir müşterimiz olduğunu varsayalım: Night Mins olduğunu 40 ve Eve Mins 40'tır. Bir tahmin yürütebiliriz ve modelimiz bu müşterinin vazgeçeceğine dair %93.2'lik bir güven puanı verir (True). Artık bu müşteriyi elde tutmak için promosyon indirimleri sunmayı seçebiliriz.

Tek bir tahmin yürütmek, bireysel durum analizi için harikadır, ancak aynı anda birçok kayıt üzerinde tahmin yürütmemiz gerekir. Tuval yapabilir toplu tahminleri çalıştır, bu da tahminleri geniş ölçekte çalıştırmanıza olanak tanır.

Sonuç

Bu gönderide, bir iş analistinin örnek verileri kullanarak SageMaker Canvas ile nasıl müşteri kaybı modeli oluşturabileceğini gösterdik. Canvas, iş analistlerinizin doğru ML modelleri oluşturmasına ve kodsuz, görsel, tıkla ve tıkla arabirimi kullanarak tahminler oluşturmasına olanak tanır. Bir pazarlama analizcisi artık bu bilgileri, hedeflenen elde tutma kampanyaları yürütmek ve yeni kampanya stratejilerini daha hızlı test etmek için kullanabilir, bu da müşteri kaybında bir azalmaya yol açar.

Analistler, modellerini veri bilimcisi meslektaşlarıyla paylaşarak bunu bir sonraki seviyeye taşıyabilir. Veri bilimcileri Canvas modelini şurada görüntüleyebilir: Amazon SageMaker StüdyosuCanvas AutoML'nin yaptığı seçenekleri keşfedebilecekleri, model sonuçlarını doğrulayabilecekleri ve hatta modeli birkaç tıklamayla üretebilecekleri bir yer. Bu, makine öğrenimi tabanlı değer yaratmayı hızlandırabilir ve iyileştirilmiş sonuçların daha hızlı ölçeklenmesine yardımcı olabilir.

Canvas'ı kullanma hakkında daha fazla bilgi edinmek için bkz. Oluşturun, Paylaşın, Dağıtın: İş analistleri ve veri bilimcileri kodsuz ML ve Amazon SageMaker Canvas kullanarak nasıl daha hızlı pazara sunma süresi elde ediyor?. Kodsuz bir çözümle ML modelleri oluşturma hakkında daha fazla bilgi için bkz. Amazon SageMaker Canvas – İş Analistleri için Görsel, Kodsuz Makine Öğrenimi Yeteneği Duyurusu.

Yazar Hakkında

henry robalino AWS'de NJ merkezli bir Çözüm Mimarıdır. Bulut ve makine öğrenimi ve bunların toplumda oynayabileceği rol konusunda tutkulu. Bunu, AWS Cloud'u kullanarak iş hedeflerine ulaşmalarına yardımcı olmak için müşterilerle birlikte çalışarak başarır. İş dışında Henry'yi kürklü kızı Arly ile seyahat ederken veya açık havada keşfederken bulabilirsiniz.

Amazon SageMaker Canvas PlatoBlockchain Veri Zekasını kullanarak kodsuz makine öğrenimi ile müşteri kaybını tahmin edin. Dikey Arama. Ai. Chaoran Wang Dallas, TX merkezli AWS'de Çözüm Mimarıdır. 2016 yılında Dallas'taki Texas Üniversitesi'nden Bilgisayar Bilimleri alanında yüksek lisans derecesi ile mezun olduğundan beri AWS'de çalışmaktadır. Chaoran, müşterilerin AWS Bulut üzerinde ölçeklenebilir, güvenli ve uygun maliyetli uygulamalar oluşturmasına ve iş zorluklarını çözmek için çözümler bulmasına yardımcı olur. Chaoran, iş dışında ailesi ve iki köpeği Biubiu ve Coco ile vakit geçirmeyi çok seviyor.

Zaman Damgası: Mayıs 5, 2022

Zaman Damgası: Nisan 13, 2023

Plato tarafından yeniden yayınlandı

Protopia AI ile kurumsal Yüksek Lisans hızlandırma için temel veri koruması | Amazon Web Hizmetleri

Konuşmayı metinden metne analize otomatikleştirerek nitel araştırmayı dönüştürmek

Sophos, Amazon SageMaker ile güçlü, hafif bir PDF kötü amaçlı yazılım dedektörünü ultra ölçekte nasıl eğitiyor?

Amazon Comprehend özel sınıflandırıcı ile BT hizmeti isteklerinin sınıflandırılmasını otomatikleştirin

Hakkımızda

Dikey Arama ve Ai

Platform

Bağlı Kal

Hesap