Endüstriyel ekipman bakımı, ticari izleme, filo yönetimi ve rota optimizasyonu amaçlı birçok uygulama, verileri yüksek hızlarda ve düşük gecikmede işlemek için açık kaynaklı Cassandra API'leri ve sürücüleri kullanılarak oluşturulmuştur. Cassandra tablolarını kendiniz yönetmek zaman alıcı ve pahalı olabilir. Amazon Anahtar Alanları (Apache Cassandra için) AWS Cloud'da ek altyapıyı yönetmeden Cassandra tablolarını kurmanıza, güvenli hale getirmenize ve ölçeklendirmenize olanak tanır.
Bu gönderide, Amazon Keyspaces'i yüksek düzeyde kullanan makine öğrenimi (ML) modellerinin eğitimiyle ilgili AWS Hizmetlerinde size yol göstereceğiz ve Amazon Keyspaces'ten veri almak için adım adım talimatlar sağlayacağız. Amazon Adaçayı Yapıcı ve belirli bir müşteri segmentasyonu kullanım durumu için kullanılabilecek bir modelin eğitimi.
AWS, işletmelerin bulutta makine öğrenimi süreçlerini uygulamalarına yardımcı olacak birden çok hizmete sahiptir.
AWS ML Stack'in üç katmanı vardır. Orta katmanda ise SageMaker, geliştiricilere, veri bilimcilerine ve makine öğrenimi mühendislerine ML modellerini uygun ölçekte oluşturma, eğitme ve dağıtma becerisi sağlar. Makine öğrenimi kullanım senaryolarınızı daha kolay dağıtabilmeniz için makine öğrenimi iş akışının her adımındaki karmaşıklığı ortadan kaldırır. Bu, tahmine dayalı bakımdan bilgisayar vizyonuna ve müşteri davranışlarını tahmin etmeye kadar her şeyi içerir. Müşteriler, SageMaker ile veri bilimcilerinin üretkenliğinde 10 kata kadar iyileşme elde ediyor.
Apache Cassandra, yapılandırılmamış veya yarı yapılandırılmış verilere sahip okuma ağırlıklı kullanım durumları için popüler bir seçimdir. Örneğin, popüler bir gıda dağıtım şirketi teslimat süresini tahmin eder ve perakende müşterisi Apache Cassandra Veritabanındaki ürün katalog bilgilerini sık sık kullanmaya devam edebilir. Amazon Anahtar Alanları ölçeklenebilir, yüksek düzeyde kullanılabilir ve yönetilen sunucusuz Apache Cassandra uyumlu bir veritabanı hizmetidir. Sunucuları sağlamanız, düzeltme eki oluşturmanız veya yönetmeniz gerekmez ve yazılım yüklemeniz, bakımını yapmanız veya çalıştırmanız gerekmez. Tablolar otomatik olarak yukarı ve aşağı ölçeklenebilir ve yalnızca kullandığınız kaynaklar için ödeme yaparsınız. Amazon Keyspaces, bugün kullandığınız Cassandra uygulama kodunu ve geliştirici araçlarını kullanarak Cassandra iş yüklerinizi AWS'de çalıştırmanıza olanak tanır.
SageMaker bir paket sağlar yerleşik algoritmalar veri bilimcilerin ve makine öğrenimi uygulayıcılarının makine öğrenimi modellerini hızla eğitmeye ve dağıtmaya başlamalarına yardımcı olmak. Bu gönderide, bir perakende müşterinin Keyspaces Veritabanındaki müşteri satın alma geçmişini nasıl kullanabileceğini ve pazarlama kampanyaları için farklı müşteri segmentlerini nasıl hedefleyebileceğini göstereceğiz.
K-anlamı denetimsiz bir öğrenme algoritmasıdır. Bir grubun üyelerinin mümkün olduğunca birbirine benzer ve diğer grupların üyelerinden mümkün olduğunca farklı olduğu, veriler içinde ayrı gruplamalar bulmaya çalışır. Algoritmanın benzerliği belirlemek için kullanmasını istediğiniz nitelikleri tanımlarsınız. SageMaker, değiştirilmiş bir sürümünü kullanır. web ölçeğinde k-araç kümeleme algoritması. Algoritmanın orijinal sürümüyle karşılaştırıldığında, SageMaker tarafından kullanılan sürüm daha doğrudur. Ancak, orijinal algoritma gibi, çok büyük veri kümelerine ölçeklenir ve eğitim süresinde iyileştirmeler sağlar.
Çözüme genel bakış
Talimatlar, kodu çalıştırmak için SageMaker Studio'yu kullanacağınızı varsayar. İlişkili kod şurada paylaşıldı: AWS Örneği GitHub. Laboratuvardaki talimatları izleyerek aşağıdakileri yapabilirsiniz:
- Gerekli bağımlılıkları yükleyin.
- Amazon Keyspaces'e bağlanın, bir Tablo oluşturun ve örnek verileri alın.
- Amazon Keyspaces'teki verileri kullanarak bir sınıflandırma ML modeli oluşturun.
- Model sonuçlarını keşfedin.
- Yeni oluşturulan kaynakları temizleyin.
Tamamlandığında, aşağıdaki resimde gösterildiği gibi ML modellerini eğitmek için SageMaker'ı Amazon Keyspaces ile entegre edeceksiniz.
Şimdi takip edebilirsiniz adım adım talimatlar Bu gönderide, SageMaker kullanarak Amazon Keyspaces'te depolanan ham verileri ve böylece ML işleme için alınan verileri almak için.
Önkoşullar
İlk önce SageMaker'a gidin.
Ardından, SageMaker'ı ilk kez kullanıyorsanız, Şimdi Başlayın.
Sonra seçin SageMaker Etki Alanı Kurulumu.
Ardından, Ad ile yeni bir kullanıcı profili oluşturun – bilge kullanıcıSeçin ve Yeni Rol Oluştur içinde Varsayılan Yürütme Rolü alt bölüm.
Ardından, açılan ekranda herhangi birini seçin. Amazon Basit Depolama Hizmeti (Amazon S3) kova ve Rol oluştur'u seçin.
Bu rol, SageMaker'ın roldeki geçici kimlik bilgilerini kullanarak Keyspaces Tablosuna erişmesine izin vermek için aşağıdaki adımlarda kullanılacaktır. Bu, not defterinde bir kullanıcı adı ve parola saklama ihtiyacını ortadan kaldırır.
Ardından, ilgili rolü alın bilge kullanıcı Özet bölümünden önceki adımda oluşturulan.
Ardından, şuraya gidin: AWS Konsolu ve yukarı bak AWS Kimlik ve Erişim Yönetimi (IAM). IAM içinde Roller'e gidin. Roller içinde, önceki adımda tanımlanan yürütme rolünü arayın.
Ardından, önceki adımda tanımlanan rolü seçin ve İzin Ekle'yi seçin. Görüntülenen açılır menüde Satır İçi İlke Oluştur'u seçin. SageMaker, iş gereksinimlerine göre bir kullanıcının/uygulamanın gerçekleştirebileceği eylemleri kısıtlayan ayrıntılı bir erişim düzeyi sağlamanıza olanak tanır.
Ardından, JSON sekmesini seçin ve Github'un Not bölümünden politikayı kopyalayın. Kanal. Bu politika, SageMaker not defterinin Keyspaces'e bağlanmasına ve daha sonraki işlemler için veri almasına izin verir.
Ardından, tekrar ve açılır menüden İzin ekle'yi seçin ve İlke Ekle'yi seçin.
AmazonKeyspacesFullAccess ilkesini arayın ve eşleşen sonucun yanındaki onay kutusunu seçin ve İlkeleri Ekle'yi seçin.
İzin ilkeleri bölümünün şunları içerdiğini doğrulayın: AmazonS3FullAccess
, AmazonSageMakerFullAccess
, AmazonKeyspacesFullAccess
, ayrıca yeni eklenen satır içi politika.
Ardından, AWS Konsolunu kullanarak SageMaker Studio'ya gidin ve SageMaker Studio'yu seçin. Bir kez orada, Uygulamayı Başlat'ı seçin ve Studio'yu seçin.
Dizüstü bilgisayar kılavuzu
SageMaker Notebook'tan Keyspaces'e bağlanmanın tercih edilen yolu, AWS Signature Sürüm 4 süreci (SigV4) merkezli Geçici Kimlik Bilgileri kimlik doğrulama için. Bu senaryoda, Keyspaces kimlik bilgilerini oluşturmamız veya saklamamız GEREKMEZ ve kimlik bilgilerini SigV4 eklentisi ile kimlik doğrulaması yapmak için kullanabiliriz. Geçici güvenlik kimlik bilgileri, bir erişim anahtarı kimliğinden ve bir gizli erişim anahtarından oluşur. Ancak, kimlik bilgilerinin ne zaman sona ereceğini gösteren bir güvenlik belirteci de içerirler. Bu gönderide, bir IAM rolü oluşturacağız ve geçici güvenlik kimlik bilgileri oluşturacağız.
İlk önce bir sürücü (cassandra-sigv4) kuruyoruz. Bu sürücü, AWS Signature Sürüm 4 İşlemini (SigV4) kullanarak API isteklerinize kimlik doğrulama bilgileri eklemenizi sağlar. Eklentiyi kullanarak, kullanıcılara ve uygulamalara IAM kullanıcıları ve rollerini kullanarak Amazon Keyspaces'e (Apache Cassandra için) erişmek için kısa vadeli kimlik bilgileri sağlayabilirsiniz. Bunu takiben, ek paket bağımlılıklarıyla birlikte gerekli bir sertifikayı içe aktaracaksınız. Sonunda, notebook'un Keyspaces ile konuşma rolünü üstlenmesine izin vereceksiniz.
Ardından, Amazon Keyspaces'e bağlanın ve bağlantıyı doğrulamak için Keyspaces'teki sistem verilerini Pandas DataFrame'e okuyun.
Ardından, ham veri setinde eğitim için verileri hazırlayın. Bu gönderiyle ilişkili python not defterinde, şu adresten indirilen bir perakende veri seti kullanın: okuyun, ve işleyin. Veri seti verilen iş hedefimiz, müşterileri belirli bir metrik çağrı RFM'si kullanarak kümelemektir. RFM modeli üç nicel faktöre dayanmaktadır:
- Yenilik: Bir müşterinin satın alma işlemini ne kadar yakın zamanda yaptığı.
- Sıklık: Bir müşterinin satın alma işlemini ne sıklıkta yaptığı.
- Parasal Değer: Bir müşterinin satın alma işlemlerine ne kadar para harcadığı.
RFM analizi, bir müşteriyi bu üç kategorinin her birinde, genellikle 1'den 5'e kadar bir ölçekte sayısal olarak sıralar (sayı ne kadar yüksekse, sonuç o kadar iyidir). "En iyi" müşteri, her kategoride en yüksek puanı alacaktır. Pandaların Nicelik tabanlı ayrıklaştırma işlevini (qcut) kullanacağız. Değerlerin, numune niceliklerine dayalı veya bunlara dayalı olarak eşit boyutlu kovalara ayrılmasına yardımcı olacaktır.
Bu örnekte, Keyspace tablosundaki kayıtları okumak için CQL kullanıyoruz. Bazı makine öğrenimi kullanım durumlarında, aynı Keyspaces tablosundaki aynı verileri birden çok kez okumanız gerekebilir. Bu durumda, ek masraflardan kaçınmak için verilerinizi bir Amazon S3 klasörüne kaydetmenizi öneririz. maliyetAmazon Keyspaces'ten okuyor. Senaryonuza bağlı olarak, ayrıca kullanabilirsiniz Amazon EMR'si için yutmak çok büyük bir Amazon S3 dosyasını SageMaker'a aktarın.
Ardından, KMeans algoritmasını kullanarak bir ML modeli eğitiyor ve kümelerin oluşturulduğundan emin oluyoruz. Bu özel senaryoda, oluşturulan kümelerin yazdırıldığını ve ham veri kümesindeki müşterilerin veri kümesindeki çeşitli özniteliklere göre birlikte gruplandırıldığını gösterirsiniz. Bu küme bilgisi, hedeflenen pazarlama kampanyaları için kullanılabilir.
(İsteğe bağlı) Ardından, ML modeli tarafından tanımlanan müşteri segmentlerini hedeflenen pazarlama için bir Amazon Keyspaces tablosuna kaydederiz. Bir toplu iş, bu verileri okuyabilir ve belirli segmentlerdeki müşterilere hedefli kampanyalar yürütebilir.
Sonunda biz kaynakları temizlemek ek ücret ödememek için bu eğitim sırasında oluşturulmuştur.
Anahtar alanı ve tabloların silinmesinin tamamlanması birkaç saniye ile bir dakika arasında sürebilir. Bir anahtar alanı sildiğinizde, anahtar alanı ve tüm tabloları silinir ve bunlardan ücret alınmasını durdurursunuz.
Sonuç
Bu gönderi, Amazon Keyspaces'teki müşteri verilerini SageMaker'a nasıl alacağınızı ve müşterileri segmentlere ayırmanıza olanak tanıyan bir kümeleme modelini nasıl eğiteceğinizi gösterdi. Bu bilgileri hedeflenen pazarlama için kullanabilir, böylece işletmenizin KPI'sını büyük ölçüde iyileştirebilirsiniz. Amazon Anahtar Alanları hakkında daha fazla bilgi edinmek için aşağıdaki kaynakları inceleyin:
- Veri Kaynağı Olarak Amazon Anahtar Alanlarını Kullanarak Makine Öğrenimi Modellerini Eğitin (SageMaker Not Defteri)
- IntelliJ, PyCharm veya DataGrip IDE'leri kullanarak masaüstünüzden Amazon Keyspaces'e bağlanın
- Amazon Keyspaces için CQL Dil Referansı (Apache Cassandra için)
- Yeni geliştirici araç seti Docker görüntüsünü kullanarak Amazon Keyspaces'e (Apache Cassandra için) komut satırı erişimi nasıl kurulur?
- Amazon Keyspaces için Kimlik ve Erişim Yönetimi (Apache Cassandra için)
- SageMaker ile Amazon Keyspaces'e Bağlanma hizmete özgü kimlik bilgileri
- Yenilik, Sıklık, Parasal Değer (RFM)
- Kaggle kod referansı
Yazarlar Hakkında
Vadim Lyakhovich San Francisco Körfez Bölgesi'ndeki AWS'de, müşterilerin AWS'ye geçişine yardımcı olan Kıdemli Çözüm Mimarıdır. Yeniliklerini desteklemek için büyük işletmelerden küçük girişimlere kadar çeşitli kuruluşlarla çalışıyor. Ayrıca müşterilerin AWS'de ölçeklenebilir, güvenli ve uygun maliyetli çözümler tasarlamasına yardımcı oluyor.
Parth Patel San Francisco Körfez Bölgesi'ndeki AWS'de Çözüm Mimarıdır. Parth, müşterilere bulut yolculuklarını hızlandırmaları için rehberlik eder ve AWS bulutunu başarılı bir şekilde benimsemelerine yardımcı olur. Makine Öğrenimi ve Uygulama Modernizasyonuna odaklanmaktadır.
Ram Patangi San Francisco Körfez Bölgesi'ndeki AWS'de Çözüm Mimarıdır. Tarım, Sigorta, Bankacılık, Perakende, Sağlık ve Yaşam Bilimleri, Otelcilik ve Yüksek Teknoloji sektörlerindeki müşterilerin işlerini AWS bulutunda başarılı bir şekilde yürütmelerine yardımcı oldu. Veritabanları, Analitikler ve Makine Öğrenimi konularında uzmanlaşmıştır.
- Akıllı para. Avrupa'nın En İyi Bitcoin ve Kripto Borsası.
- Plato blok zinciri. Web3 Metaverse Zekası. Bilgi Güçlendirildi. SERBEST ERİŞİM.
- KriptoHawk. Altcoin Radarı. Ücretsiz deneme.
- Kaynak: https://aws.amazon.com/blogs/machine-learning/train-machine-learning-models-using-amazon-keyspaces-as-a-data-source/
- '
- "
- &
- 10
- 100
- 9
- kabiliyet
- Hakkımızda
- hızlandırmak
- erişim
- doğru
- Başarmak
- eylemler
- Ek
- tarım
- önde
- algoritma
- Türkiye
- Amazon
- analiz
- analytics
- Başka
- api
- API'ler
- uygulamayı yükleyeceğiz
- Uygulama
- uygulamaları
- ALAN
- Dikkat
- öznitelikleri
- Doğrulama
- otomatik olarak
- mevcut
- AWS
- Bankacılık
- Defne
- Blog
- sınır
- inşa etmek
- iş
- işletmeler
- çağrı
- Kampanyalar
- hangi
- durumlarda
- Kategoriler
- sertifika
- yükler
- seçim
- sınıflandırma
- bulut
- kod
- karşılaştırıldığında
- bilgisayar
- Sosyal medya
- bağ
- konsolos
- uygun maliyetli
- olabilir
- ülke
- yaratmak
- çevrimiçi kurslar düzenliyorlar.
- Tanıtım
- müşteri
- Müşteriler
- veri
- veri seti
- veritabanı
- veritabanları
- sağlıyor
- teslim
- bağlı
- dağıtmak
- dağıtma
- masaüstü
- Belirlemek
- Geliştirici
- geliştiriciler
- farklı
- liman işçisi
- aşağı
- sürücü
- Damla
- sırasında
- kolayca
- Mühendisler
- işletmelerin
- ekipman
- tahminleri
- örnek
- infaz
- faktörler
- Ad
- ilk kez
- FİLO
- odaklanır
- takip et
- takip etme
- Gıda
- Francisco
- işlev
- daha fazla
- genellikle
- oluşturmak
- alma
- GitHub
- çok
- grup
- Grubun
- Rehberler
- Sağlık
- Sağlık Hizmetleri
- yardım et
- yardım
- Yüksek
- daha yüksek
- büyük ölçüde
- tarih
- Ne kadar
- Nasıl Yapılır
- Ancak
- HTTPS
- Kimlik
- görüntü
- uygulamak
- iyileşme
- geliştirme
- dahil
- içerir
- indeks
- Sanayi
- bilgi
- Altyapı
- yenilikler
- kurmak
- sigorta
- entegre
- IT
- İş
- seyahat
- anahtar
- laboratuvar
- dil
- büyük
- başlatmak
- tabaka
- ÖĞRENİN
- öğrenme
- seviye
- Yaşam Bilimleri
- Bakın
- sadık
- makine
- makine öğrenme
- yapılmış
- korumak
- YAPAR
- yönetmek
- yönetilen
- yönetim
- yönetme
- Pazarlama
- masif
- uygun
- Üyeler
- ML
- model
- modelleri
- parasal
- para
- izleme
- Daha
- çoğu
- çoklu
- gerekli
- defter
- numara
- işletmek
- optimizasyon
- organizasyonlar
- Diğer
- paket
- belirli
- Şifre
- Patch
- fişe takmak
- politikaları
- politika
- Popüler
- mümkün
- potansiyel
- tahmin
- Hazırlamak
- önceki
- fiyat
- birincil
- süreç
- Süreçler
- işleme
- PLATFORM
- verimlilik
- Profil
- umut verici
- sağlamak
- sağlar
- satın alma
- alımları
- nicel
- hızla
- değişen
- Çiğ
- Okuma
- teslim almak
- geçenlerde
- tavsiye etmek
- kayıtlar
- isteklerinizi
- gereklidir
- Yer Alan Kurallar
- Kaynaklar
- Sonuçlar
- perakende
- yorum
- Risk
- Rol
- Rota
- koşmak
- San
- San Francisco
- SC
- ölçeklenebilir
- ölçek
- BİLİMLERİ
- bilim adamları
- Ekran
- Ara
- saniye
- güvenli
- güvenlik
- güvenlik belirteci
- bölüm
- bölünme
- segmentler
- Serverless
- hizmet
- Hizmetler
- set
- Paylaşılan
- kısa dönem
- gösterilen
- benzer
- Basit
- uyku
- küçük
- So
- Yazılım
- katı
- Çözümler
- biraz
- uzmanlaşmış
- yığın
- başladı
- Startups
- hafızası
- mağaza
- stüdyo
- Başarılı olarak
- destek
- sistem
- Sistemler
- Konuşmak
- Hedef
- Hedeflenen
- geçici
- The
- İçinden
- zaman
- zamanlar
- bugün
- birlikte
- simge
- araç
- araçlar
- üst
- Ticaret
- Eğitim
- kullanım
- kullanımın söz
- kullanıcılar
- değer
- çeşitli
- versiyon
- sektörler
- vizyonumuz
- Ne
- içinde
- olmadan
- çalışma
- olur