Amazon SageMaker Canvas'ta kodsuz makine öğrenimi çözümleri oluşturmak için Amazon DocumentDB'yi kullanın | Amazon Web Hizmetleri

Amazon SageMaker Canvas'ta kodsuz makine öğrenimi çözümleri oluşturmak için Amazon DocumentDB'yi kullanın | Amazon Web Hizmetleri

Lansmanını duyurmaktan heyecan duyuyoruz Amazon DocumentDB (MongoDB uyumluluğu ile) ile entegrasyon Amazon SageMaker TuvalAmazon DocumentDB müşterilerinin kod yazmadan üretken yapay zeka ve makine öğrenimi (ML) çözümleri oluşturmasına ve kullanmasına olanak tanır. Amazon DocumentDB, altyapıyı yönetmeye gerek kalmadan kritik belge iş yüklerini neredeyse her ölçekte çalıştırmayı basit ve uygun maliyetli hale getiren, tam olarak yönetilen bir yerel JSON belge veritabanıdır. Amazon SageMaker Canvas, temel modeller de dahil olmak üzere kullanıma hazır modeller ve veri hazırlama ve özel modeller oluşturup dağıtma olanağı sunan, kodsuz bir makine öğrenimi çalışma alanıdır.

Bu yazıda Amazon DocumentDB'de depolanan verileri SageMaker Canvas'a nasıl taşıyacağımızı ve bu verileri tahmine dayalı analizler için makine öğrenimi modelleri oluşturmak amacıyla nasıl kullanacağımızı tartışıyoruz. Veri işlem hatları oluşturup bakımını yapmadan, Amazon DocumentDB'de depolanan yapılandırılmamış verilerinizle makine öğrenimi modellerini güçlendirebileceksiniz.

Çözüme genel bakış

Bir yemek dağıtım şirketinde iş analisti rolünü üstlenelim. Mobil uygulamanız, ölçeklenebilirliği ve esnek şema özellikleri nedeniyle restoranlar hakkındaki bilgileri Amazon DocumentDB'de depolar. Yeni restoranların nasıl derecelendirileceğini tahmin etmek için bu verilerle ilgili öngörü toplamak ve bir makine öğrenimi modeli oluşturmak istiyorsunuz, ancak yapılandırılmamış veriler üzerinde analiz gerçekleştirmeyi zor buluyorsunuz. Bu hedeflere ulaşmak için veri mühendisliği ve veri bilimi ekiplerine güvenmeniz gerektiğinden darboğazlarla karşılaşırsınız.

Bu yeni entegrasyon, Amazon DocumentDB verilerini SageMaker Canvas'a taşımayı ve verileri makine öğrenimi için hazırlamaya ve analiz etmeye hemen başlamayı basitleştirerek bu sorunları çözüyor. Ayrıca SageMaker Canvas, yüksek kaliteli modeller oluşturmak ve tahminler oluşturmak için makine öğrenimi uzmanlığına olan bağımlılığı ortadan kaldırır.

SageMaker Canvas'ta makine öğrenimi modelleri oluşturmak için Amazon DocumentDB verilerinin nasıl kullanılacağını aşağıdaki adımlarda gösteriyoruz:

  1. SageMaker Canvas'ta bir Amazon DocumentDB bağlayıcısı oluşturun.
  2. Üretken yapay zekayı kullanarak verileri analiz edin.
  3. Verileri makine öğrenimi için hazırlayın.
  4. Bir model oluşturun ve tahminler oluşturun.

Önkoşullar

Bu çözümü uygulamak için aşağıdaki önkoşulları tamamlayın:

  1. AWS Cloud yönetici erişimine sahip olun AWS Kimlik ve Erişim Yönetimi (BEN) kullanıcı Entegrasyonu tamamlamak için gerekli izinlere sahip.
  2. kullanarak ortam kurulumunu tamamlayın. AWS CloudFormation aşağıdaki seçeneklerden herhangi birini kullanarak:
    1. CloudFormation şablonunu yeni bir VPC'ye dağıtın – Bu seçenek, VPC, özel alt ağlar, güvenlik grupları, IAM yürütme rollerinden oluşan yeni bir AWS ortamı oluşturur. Amazon Bulut9, gerekli VPC uç noktaları, ve SageMaker etki alanı. Daha sonra Amazon DocumentDB'yi bu yeni VPC'ye dağıtır. İndir şablon veya CloudFormation yığınını seçerek hızlı bir şekilde başlatın. Yığını Başlat:
      CloudFormation yığınını başlat
    2. CloudFormation şablonunu mevcut bir VPC'ye dağıtın – Bu seçenek, özel alt ağlara sahip mevcut bir VPC'de gerekli VPC uç noktalarını, IAM yürütme rollerini ve SageMaker etki alanını oluşturur. İndir şablon veya CloudFormation yığınını seçerek hızlı bir şekilde başlatın. Yığını Başlat:
      CloudFormation yığınını başlat

Yeni bir SageMaker etki alanı oluşturuyorsanız bağlayıcıyı Amazon DocumentDB'ye ekleyebilmek için etki alanını internet erişimi olmayan özel bir VPC'de olacak şekilde yapılandırmanız gerektiğini unutmayın. Daha fazla bilgi edinmek için bkz. Amazon SageMaker Canvas'ı internet erişimi olmayan bir VPC'de yapılandırma.

  1. Izleyin öğretici Örnek restoran verilerini Amazon DocumentDB'ye yüklemek için.
  2. Amazon Bedrock'a ve içindeki Antropik Claude modeline erişim ekleyin. Daha fazla bilgi için bakınız Model erişimi ekle.

SageMaker Canvas'ta bir Amazon DocumentDB bağlayıcısı oluşturun

SageMaker alan adınızı oluşturduktan sonra aşağıdaki adımları tamamlayın:

  1. Amazon DocumentDB konsolunda şunu seçin: Kodsuz makine öğrenimi Gezinti bölmesinde.
  2. Altında Bir alan adı ve profil seçin¸ SageMaker alanınızı ve kullanıcı profilinizi seçin.
  3. Klinik Tuvali Başlat SageMaker Canvas'ı yeni bir sekmede başlatmak için.
    Amazon SageMaker Canvas'ta kodsuz makine öğrenimi çözümleri oluşturmak için Amazon DocumentDB'yi kullanın | Amazon Web Hizmetleri PlatoBlockchain Veri Zekası. Dikey Arama. Ai.

SageMaker Canvas yüklemeyi tamamladığında, Veri akışları sekmesi.

  1. Klinik oluşturmak yeni bir veri akışı oluşturmak için.
    Amazon SageMaker Canvas'ta kodsuz makine öğrenimi çözümleri oluşturmak için Amazon DocumentDB'yi kullanın | Amazon Web Hizmetleri PlatoBlockchain Veri Zekası. Dikey Arama. Ai.
  2. Veri akışınız için bir ad girin ve oluşturmak.
  3. seçeneğini belirleyerek yeni bir Amazon DocumentDB bağlantısı ekleyin Tarihleri ​​içe aktar, Daha sonra seçmek çizelge halinde için Veri kümesi türü.
  4. Üzerinde Tarihleri ​​içe aktar sayfası, için Veri kaynağı, seçmek DocumentDB ve Bağlantı Ekle.
    Amazon SageMaker Canvas'ta kodsuz makine öğrenimi çözümleri oluşturmak için Amazon DocumentDB'yi kullanın | Amazon Web Hizmetleri PlatoBlockchain Veri Zekası. Dikey Arama. Ai.
  5. Demo gibi bir bağlantı adı girin ve istediğiniz Amazon DocumentDB kümesini seçin.

SageMaker Canvas'ın açılır menüyü, SageMaker alanınızla aynı VPC'deki kümelerle önceden dolduracağını unutmayın.

  1. Bir kullanıcı adı, parola ve veritabanı adı girin.
  2. Son olarak okuma tercihinizi seçin.

Birincil örneklerin performansını korumak için SageMaker Canvas varsayılan olarak ikincilBu, yalnızca ikincil örneklerden okuyacağı anlamına gelir. Okuma tercihi olduğunda İkincil tercih, SageMaker Canvas mevcut ikincil örneklerden okur, ancak ikincil bir örnek mevcut değilse birincil örnekten okur. Amazon DocumentDB bağlantısının nasıl yapılandırılacağı hakkında daha fazla bilgi için bkz. AWS'de depolanan bir veritabanına bağlanın.

  1. Klinik Bağlantı ekle.
    Amazon SageMaker Canvas'ta kodsuz makine öğrenimi çözümleri oluşturmak için Amazon DocumentDB'yi kullanın | Amazon Web Hizmetleri PlatoBlockchain Veri Zekası. Dikey Arama. Ai.

Bağlantı başarılı olursa Amazon DocumentDB veritabanınızdaki koleksiyonların tablolar halinde gösterildiğini göreceksiniz.

  1. Seçtiğiniz tabloyu boş tuvale sürükleyin. Bu gönderi için restoran verilerimizi ekliyoruz.

İlk 100 satır önizleme olarak görüntülenir.

  1. Verilerinizi analiz etmeye ve hazırlamaya başlamak için Tarihleri ​​içe aktar.
    Amazon SageMaker Canvas'ta kodsuz makine öğrenimi çözümleri oluşturmak için Amazon DocumentDB'yi kullanın | Amazon Web Hizmetleri PlatoBlockchain Veri Zekası. Dikey Arama. Ai.
  2. Bir veri kümesi adı girin ve seçin Tarihleri ​​içe aktar.

Üretken yapay zeka kullanarak verileri analiz edin

Daha sonra, verilerimiz hakkında bazı bilgiler edinmek ve kalıplar aramak istiyoruz. SageMaker Canvas, verileri analiz etmek ve hazırlamak için doğal bir dil arayüzü sağlar. Ne zaman Veri sekme yüklendiğinde, aşağıdaki adımlarla verilerinizle sohbet etmeye başlayabilirsiniz:

  1. Klinik Veri hazırlığı için sohbet edin.
    Amazon SageMaker Canvas'ta kodsuz makine öğrenimi çözümleri oluşturmak için Amazon DocumentDB'yi kullanın | Amazon Web Hizmetleri PlatoBlockchain Veri Zekası. Dikey Arama. Ai.
  2. Aşağıdaki ekran görüntülerinde gösterilen örneklere benzer sorular sorarak verileriniz hakkında bilgi toplayın.
    Amazon SageMaker Canvas'ta kodsuz makine öğrenimi çözümleri oluşturmak için Amazon DocumentDB'yi kullanın | Amazon Web Hizmetleri PlatoBlockchain Veri Zekası. Dikey Arama. Ai.

Verileri keşfetmek ve hazırlamak için doğal dilin nasıl kullanılacağı hakkında daha fazla bilgi edinmek için bkz. Amazon SageMaker Canvas'ın yeni özelliğiyle verileri keşfetmek ve hazırlamak için doğal dili kullanın.

Veri kalitesini otomatik olarak değerlendiren ve anormallikleri tespit eden SageMaker Canvas Veri Kalitesi ve Öngörüler Raporunu kullanarak veri kalitemiz hakkında daha derin bir fikir edinelim.

  1. Üzerinde analizler sekmesini seçin Veri Kalitesi ve Öngörüler Raporu.
  2. Klinik rating hedef sütun olarak ve Gerileme sorun türü olarak seçin, ardından oluşturmak.

Bu, model eğitimini simüle edecek ve makine öğrenimi için verilerimizi nasıl geliştirebileceğimize dair bilgiler sağlayacaktır. Raporun tamamı birkaç dakika içinde oluşturulur.

Raporumuz, hedefimizdeki satırların %2.47'sinin eksik değerlere sahip olduğunu gösteriyor; bunu bir sonraki adımda ele alacağız. Ek olarak, analiz şunu gösteriyor: address line 2, name, ve type_of_food özellikler verilerimizde en fazla tahmin gücüne sahiptir. Bu, konum ve mutfak gibi temel restoran bilgilerinin derecelendirmeler üzerinde çok büyük bir etkiye sahip olabileceğini gösteriyor.

Amazon SageMaker Canvas'ta kodsuz makine öğrenimi çözümleri oluşturmak için Amazon DocumentDB'yi kullanın | Amazon Web Hizmetleri PlatoBlockchain Veri Zekası. Dikey Arama. Ai.

Verileri makine öğrenimi için hazırlama

SageMaker Canvas, içe aktarılan verilerinizi hazırlamak için 300'den fazla yerleşik dönüşüm sunar. SageMaker Canvas'ın dönüştürme özellikleri hakkında daha fazla bilgi için bkz. Gelişmiş dönüşümlerle verileri hazırlayın. Verilerimizi bir ML modelini eğitmeye hazır hale getirmek için bazı dönüşümler ekleyelim.

  1. Geri gidin Veri akışı sayfanın üst kısmında veri akışınızın adını seçerek sayfa.
  2. yanındaki artı işaretini seçin Veri tipleri Ve seç Dönüşüm ekle.
    Amazon SageMaker Canvas'ta kodsuz makine öğrenimi çözümleri oluşturmak için Amazon DocumentDB'yi kullanın | Amazon Web Hizmetleri PlatoBlockchain Veri Zekası. Dikey Arama. Ai.
  3. Klinik Adım ekle.
  4. yeniden adlandıralım address line 2 sütun cities.
    1. Klinik Sütunları yönet.
    2. Klinik Sütunu yeniden adlandır için Dönüştürmek.
    3. Klinik address line 2 için Giriş sütunu, girmek cities için Yeni isim, ve Seç Ekle.
      Amazon SageMaker Canvas'ta kodsuz makine öğrenimi çözümleri oluşturmak için Amazon DocumentDB'yi kullanın | Amazon Web Hizmetleri PlatoBlockchain Veri Zekası. Dikey Arama. Ai.
  5. Ek olarak, bazı gereksiz sütunları da bırakalım.
    1. Yeni bir dönüşüm ekleyin.
    2. İçin Dönüştürmek, seçmek Sütunu bırak.
    3. İçin Bırakılacak sütunlar, seçmek URL ve restaurant_id.
    4. Klinik Ekle.
      Amazon SageMaker Canvas'ta kodsuz makine öğrenimi çözümleri oluşturmak için Amazon DocumentDB'yi kullanın | Amazon Web Hizmetleri PlatoBlockchain Veri Zekası. Dikey Arama. Ai.[
  6. nen rating özellik sütununda bazı eksik değerler var, bu nedenle bu satırları bu sütunun ortalama değeriyle dolduralım.
    1. Yeni bir dönüşüm ekleyin.
    2. İçin Dönüştürmek, seçmek Atfetmek.
    3. İçin Sütun türü, seçmek Sayısal.
    4. İçin Giriş sütunları, seç rating sütun.
    5. İçin Yükleme stratejisi, seçmek Anlamına gelmek.
    6. İçin Çıktı sütunu, girmek rating_avg_filled.
    7. Klinik Ekle.
      Amazon SageMaker Canvas'ta kodsuz makine öğrenimi çözümleri oluşturmak için Amazon DocumentDB'yi kullanın | Amazon Web Hizmetleri PlatoBlockchain Veri Zekası. Dikey Arama. Ai.
  7. bırakabiliriz rating sütun çünkü doldurulmuş değerlere sahip yeni bir sütunumuz var.
  8. Çünkü type_of_food doğası gereği kategorik olduğundan, onu sayısal olarak kodlamak isteyeceğiz. Bu özelliği one-hot kodlama tekniğini kullanarak kodlayalım.
    1. Yeni bir dönüşüm ekleyin.
    2. İçin Dönüştürmek, seçmek Tek sıcak kodlama.
    3. Giriş sütunları için şunu seçin: type_of_food.
    4. İçin Geçersiz işleme stratejisiSeç tutmak.
    5. İçin Çıktı stiliSeç Sütunlar.
    6. İçin Çıktı sütunu, girmek encoded.
    7. Klinik Ekle.
      Amazon SageMaker Canvas'ta kodsuz makine öğrenimi çözümleri oluşturmak için Amazon DocumentDB'yi kullanın | Amazon Web Hizmetleri PlatoBlockchain Veri Zekası. Dikey Arama. Ai.

Bir model oluşturun ve tahminler oluşturun

Artık verilerimizi dönüştürdüğümüze göre, restoranların derecelendirmelerini tahmin etmek için sayısal bir makine öğrenimi modeli eğitelim.

  1. Klinik Model oluştur.
  2. İçin Veri kümesi adıveri kümesi dışa aktarımı için bir ad girin.
  3. Klinik Ihracat ve dönüştürülen verilerin dışa aktarılmasını bekleyin.
    Amazon SageMaker Canvas'ta kodsuz makine öğrenimi çözümleri oluşturmak için Amazon DocumentDB'yi kullanın | Amazon Web Hizmetleri PlatoBlockchain Veri Zekası. Dikey Arama. Ai.
  4. Seçin Model oluştur sayfanın sol alt köşesindeki bağlantı.

Veri kümesini sayfanın solundaki Veri Wrangler özelliğinden de seçebilirsiniz.

Amazon SageMaker Canvas'ta kodsuz makine öğrenimi çözümleri oluşturmak için Amazon DocumentDB'yi kullanın | Amazon Web Hizmetleri PlatoBlockchain Veri Zekası. Dikey Arama. Ai.

  1. Bir model adı girin.
  2. Klinik Tahmine dayalı analiz, Daha sonra seçmek oluşturmak.
  3. Klinik rating_avg_filled hedef sütun olarak

SageMaker Canvas uygun bir model tipini otomatik olarak seçer.

  1. Klinik Önizleme modeli Veri kalitesi sorunları olmadığından emin olmak için.
  2. Klinik Hızlı inşa modeli oluşturmak için.
    Amazon SageMaker Canvas'ta kodsuz makine öğrenimi çözümleri oluşturmak için Amazon DocumentDB'yi kullanın | Amazon Web Hizmetleri PlatoBlockchain Veri Zekası. Dikey Arama. Ai.

Model oluşturmanın tamamlanması yaklaşık 2-15 dakika sürecektir.

Model eğitimi tamamladıktan sonra model durumunu görüntüleyebilirsiniz. Modelimizin RSME'si 0.422'dir; bu, modelin genellikle bir restoranın derecelendirmesini gerçek değerin +/- 0.422'si dahilinde tahmin ettiği anlamına gelir; bu, 1-6 arası derecelendirme ölçeği için sağlam bir yaklaşımdır.

Amazon SageMaker Canvas'ta kodsuz makine öğrenimi çözümleri oluşturmak için Amazon DocumentDB'yi kullanın | Amazon Web Hizmetleri PlatoBlockchain Veri Zekası. Dikey Arama. Ai.

  1. Son olarak şuraya giderek örnek tahminler oluşturabilirsiniz: Tahmin sekmesi.
    Amazon SageMaker Canvas'ta kodsuz makine öğrenimi çözümleri oluşturmak için Amazon DocumentDB'yi kullanın | Amazon Web Hizmetleri PlatoBlockchain Veri Zekası. Dikey Arama. Ai.

Temizlemek

Gelecekte masraf oluşmasını önlemek için bu gönderiyi takip ederken oluşturduğunuz kaynakları silin. SageMaker Canvas, oturum süresi boyunca size fatura keser ve kullanmadığınız zamanlarda SageMaker Canvas'tan çıkış yapmanızı öneririz. Bakınız Amazon SageMaker Canvas oturumunu kapatma daha fazla ayrıntı için.

Sonuç

Bu yazıda, Amazon DocumentDB'de depolanan verilerle üretken yapay zeka ve makine öğrenimi için SageMaker Canvas'ı nasıl kullanabileceğinizi tartıştık. Örneğimizde, bir analistin örnek bir restoran veri kümesini kullanarak nasıl hızlı bir şekilde yüksek kaliteli bir makine öğrenimi modeli oluşturabileceğini gösterdik.

Amazon DocumentDB'den veri içe aktarmaktan SageMaker Canvas'ta makine öğrenimi modeli oluşturmaya kadar çözümü uygulamaya yönelik adımları gösterdik. Tüm süreç görsel bir arayüz üzerinden tek satır kod yazılmadan tamamlandı.

Düşük kodlu/kodsuz makine öğrenimi yolculuğunuza başlamak için bkz. Amazon SageMaker Tuval.


yazarlar hakkında

Amazon SageMaker Canvas'ta kodsuz makine öğrenimi çözümleri oluşturmak için Amazon DocumentDB'yi kullanın | Amazon Web Hizmetleri PlatoBlockchain Veri Zekası. Dikey Arama. Ai.Adeleke Çoker AWS'li bir Global Çözüm Mimarıdır. AWS'de üretim iş yüklerini uygun ölçekte dağıtma konusunda rehberlik ve teknik yardım sağlamak için dünya çapındaki müşterilerle birlikte çalışır. Boş zamanlarında öğrenmekten, okumaktan, oyun oynamaktan ve spor müsabakalarını izlemekten hoşlanır.

Amazon SageMaker Canvas'ta kodsuz makine öğrenimi çözümleri oluşturmak için Amazon DocumentDB'yi kullanın | Amazon Web Hizmetleri PlatoBlockchain Veri Zekası. Dikey Arama. Ai. Gururaj S Bayari AWS'de Kıdemli DocumentDB Uzman Çözüm Mimarıdır. Müşterilerin Amazon'un amaca yönelik olarak oluşturulmuş veritabanlarını benimsemelerine yardımcı olmaktan hoşlanıyor. Müşterilerin NoSQL ve/veya İlişkisel veritabanları tarafından desteklenen internet ölçeklerini ve yüksek performanslı iş yüklerini tasarlamalarına, değerlendirmelerine ve optimize etmelerine yardımcı olur.

Amazon SageMaker Canvas'ta kodsuz makine öğrenimi çözümleri oluşturmak için Amazon DocumentDB'yi kullanın | Amazon Web Hizmetleri PlatoBlockchain Veri Zekası. Dikey Arama. Ai.Tim Pusateri AWS'de Kıdemli Ürün Yöneticisidir ve Amazon SageMaker Canvas üzerinde çalışmaktadır. Amacı, müşterilerin AI/ML'den hızlı bir şekilde değer elde etmesine yardımcı olmaktır. İş dışında dışarıda olmayı, gitar çalmayı, canlı müzik izlemeyi, ailesi ve arkadaşlarıyla vakit geçirmeyi seviyor.

Amazon SageMaker Canvas'ta kodsuz makine öğrenimi çözümleri oluşturmak için Amazon DocumentDB'yi kullanın | Amazon Web Hizmetleri PlatoBlockchain Veri Zekası. Dikey Arama. Ai.Pratik Das AWS'de Ürün Yöneticisidir. Bulutta dayanıklı iş yükleri ve güçlü veri temelleri oluşturmak isteyen müşterilerle çalışmaktan hoşlanıyor. Modernizasyon, analitik ve veri dönüşümü girişimleri konusunda işletmelerle çalışarak uzmanlığını getiriyor.

Amazon SageMaker Canvas'ta kodsuz makine öğrenimi çözümleri oluşturmak için Amazon DocumentDB'yi kullanın | Amazon Web Hizmetleri PlatoBlockchain Veri Zekası. Dikey Arama. Ai.Varma Gottumukkala Dallas Fort Worth merkezli AWS'de Kıdemli Veritabanı Uzmanı Çözüm Mimarıdır. Varma, müşterilerle birlikte veritabanı stratejileri üzerinde çalışıyor ve AWS'nin amacına uygun olarak oluşturulmuş veritabanlarını kullanarak iş yüklerinin mimarisini oluşturuyor. AWS'ye katılmadan önce son 22 yıldır ilişkisel veritabanları, NOSQL veritabanları ve birden fazla programlama dili üzerinde yoğun bir şekilde çalıştı.

Zaman Damgası:

Den fazla AWS Makine Öğrenimi