Geliştirici üretkenliğini artırma: Deloitte, kodsuz/az kodlu makine öğrenimi için Amazon SageMaker Canvas'ı nasıl kullanıyor | Amazon Web Hizmetleri

Geliştirici üretkenliğini artırma: Deloitte, kodsuz/az kodlu makine öğrenimi için Amazon SageMaker Canvas'ı nasıl kullanıyor | Amazon Web Hizmetleri

Makine öğrenimi (ML) modellerini hızlı bir şekilde oluşturma ve dağıtma yeteneği, günümüzün veri odaklı dünyasında giderek daha önemli hale geliyor. Ancak makine öğrenimi modellerinin oluşturulması önemli ölçüde zaman, çaba ve özel uzmanlık gerektirir. Veri toplama ve temizlemeden özellik mühendisliğine, model oluşturmaya, ayarlamaya ve devreye almaya kadar, ML projelerinin geliştiricilerin tamamlanması genellikle aylar alır. Ve deneyimli veri bilimcilerine ulaşmak zor olabilir.

AWS'nin az kodlu ve kodsuz makine öğrenimi hizmetleri paketinin önemli bir araç haline geldiği yer burasıdır. Yalnızca birkaç tıklamayla Amazon SageMaker TuvalML'nin gücünden herhangi bir kod yazmanıza gerek kalmadan yararlanabilirsiniz.

Derin makine öğrenimi deneyimine sahip bir stratejik sistem entegratörü olarak Deloitte, Deloitte'un müşterileri ve dahili varlıklar için makine öğrenimi modellerini verimli bir şekilde oluşturmak ve dağıtmak amacıyla AWS'nin kodsuz ve az kodlu makine öğrenimi araçlarını kullanır. Bu araçlar, Deloitte'un modelleri ve işlem hatlarını elle kodlamaya gerek kalmadan makine öğrenimi çözümleri geliştirmesine olanak tanır. Bu, proje teslim sürelerinin hızlandırılmasına yardımcı olabilir ve Deloitte'un daha fazla müşteri işi üstlenmesini sağlayabilir.

Deloitte'un bu araçları kullanmasının bazı özel nedenleri şunlardır:

  • Programcı olmayanlar için erişilebilirlik – Kodsuz araçlar, makine öğrenimi modeli oluşturmaya programcı olmayanların da kapısını açar. Yalnızca etki alanı uzmanlığına ve çok az kodlama becerisine sahip ekip üyeleri, makine öğrenimi modelleri geliştirebilir.
  • Yeni teknolojinin hızla benimsenmesi – Kullanıma hazır modellerde ve AutoML'de kullanılabilirlik ve sürekli iyileştirme, kullanıcıların sürekli olarak lider sınıf teknolojiyi kullanmasını sağlamaya yardımcı olur.
  • Uygun maliyetli geliştirme – Kod gerektirmeyen araçlar, makine öğrenimi modeli geliştirme için gereken maliyet ve sürenin azaltılmasına yardımcı olarak modeli müşteriler için daha erişilebilir hale getirir ve bu da onların daha yüksek bir yatırım getirisi elde etmelerine yardımcı olabilir.

Ayrıca bu araçlar, daha hızlı iş akışları için kapsamlı bir çözüm sağlayarak aşağıdakileri sağlar:

  • Daha hızlı veri hazırlama – SageMaker Canvas, veri hazırlamayı hızlandırabilen ve verileri model oluşturmaya hazır hale getirebilen 300'den fazla yerleşik dönüşüme ve doğal dil kullanma yeteneğine sahiptir.
  • Daha hızlı model oluşturma – SageMaker Canvas kullanıma hazır modeller sunar veya Amazon AutoML Yalnızca birkaç tıklamayla kurumsal veriler üzerinde özel modeller oluşturmanıza olanak tanıyan teknoloji. Bu, modellerin sıfırdan kodlanmasıyla karşılaştırıldığında sürecin hızlandırılmasına yardımcı olur.
  • Daha kolay dağıtım – SageMaker Canvas, üretime hazır modelleri bir Amazon Sagmaker birkaç tıklamayla uç noktayı kaydederken aynı zamanda Amazon SageMaker Model Kaydı.

Vishveshwara Vasa, Deloitte için Bulut CTO'su, diyor:

"AWS'nin SageMaker Canvas ve SageMaker Data Wrangler gibi kodsuz makine öğrenimi hizmetleri aracılığıyla, Deloitte Consulting olarak biz, müşteriye yönelik ve dahili projelerimizde geliştirme hızını ve dağıtım üretkenliğini %30-40 oranında artırarak yeni verimliliklerin kilidini açtık."

Bu yazıda, bir müşterinin kredisinde temerrüde düşüp düşmeyeceğini tahmin etmek için bir sınıflandırma modelinin nasıl oluşturulacağını göstererek SageMaker Canvas'ı kullanarak kodsuz uçtan uca bir makine öğrenimi modeli oluşturmanın gücünü gösteriyoruz. Model, kredi temerrütlerini daha doğru tahmin ederek bir finansal hizmetler şirketinin riski yönetmesine, kredileri uygun şekilde fiyatlandırmasına, operasyonlarını iyileştirmesine, ek hizmetler sağlamasına ve rekabet avantajı kazanmasına yardımcı olabilir. SageMaker Canvas'ın, kredi temerrüdü tahmini için ham verilerden konuşlandırılmış ikili sınıflandırma modeline hızlı bir şekilde geçmenize nasıl yardımcı olabileceğini gösteriyoruz.

SageMaker Canvas, aşağıdakilerle desteklenen kapsamlı veri hazırlama yetenekleri sunar: Amazon SageMaker Veri Düzenleyicisi SageMaker Canvas çalışma alanında. Bu, veri hazırlamadan model oluşturmaya ve devreye almaya kadar standart bir makine öğrenimi iş akışının tüm aşamalarını tek bir platformda gerçekleştirmenize olanak tanır.

Veri hazırlama, genellikle makine öğrenimi iş akışının en fazla zaman alan aşamasıdır. Veri hazırlığına harcanan zamanı azaltmak için SageMaker Canvas, 300'den fazla yerleşik dönüşümü kullanarak verilerinizi hazırlamanıza olanak tanır. Alternatif olarak, doğal dil istemleri yazabilirsiniz, örneğin "c sütununun aykırı değerleri olan satırlarını bırakın" ve bu veri hazırlama adımı için gerekli kod pasajı sunulur. Daha sonra bunu birkaç tıklamayla veri hazırlama iş akışınıza ekleyebilirsiniz. Bu yazımızda bunu nasıl kullanacağınızı da göstereceğiz.

Çözüme genel bakış

Aşağıdaki diyagram, SageMaker düşük kodlu ve kodsuz araçlarını kullanan bir kredi temerrüdü sınıflandırma modelinin mimarisini açıklamaktadır.

Geliştirici üretkenliğini artırma: Deloitte, kodsuz/az kodlu makine öğrenimi için Amazon SageMaker Canvas'ı nasıl kullanıyor | Amazon Web Hizmetleri PlatoBlockchain Veri Zekası. Dikey Arama. Ai.

Kredi temerrüdü verileriyle ilgili ayrıntıları içeren bir veri kümesiyle başlayarak Amazon Basit Depolama Hizmeti (Amazon S3), veriler hakkında bilgi edinmek için SageMaker Canvas'ı kullanıyoruz. Daha sonra kategorik özelliklerin kodlanması, ihtiyaç duyulmayan özelliklerin çıkarılması ve daha fazlası gibi dönüşümleri uygulamak için özellik mühendisliği gerçekleştiriyoruz. Daha sonra temizlenen verileri Amazon S3'te saklıyoruz. Kredi temerrütlerini tahmin etmek amacıyla bir sınıflandırma modeli oluşturmak için temizlenmiş veri kümesini kullanıyoruz. Daha sonra çıkarım için üretime hazır bir modelimiz var.

Önkoşullar

Aşağıdakilerden emin olun önkoşullar tamamlandığından ve etkinleştirdiğinizden Kanvas Kullanıma hazır modeller SageMaker etki alanını ayarlarken bu seçenek. Alanınızı zaten ayarladıysanız, alan adı ayarlarınızı düzenleyin Ve git Tuval ayarları etkinleştirmek için Canvas Kullanıma Hazır modelleri etkinleştirin seçenek. Ayrıca kurulum ve SageMaker Canvas uygulamasını oluşturun, ardından istekte bulunun ve etkinleştirin Antropik Claude modeli erişimi on Amazon Ana Kayası.

Veri kümesi

Herkese açık bir veri kümesi kullanıyoruz kaggle Finansal krediler hakkında bilgi içerir. Veri kümesindeki her satır tek bir krediyi temsil eder ve sütunlar her işlemle ilgili ayrıntıları sağlar. Bu veri kümesini indirin ve bunu seçtiğiniz bir S3 klasöründe saklayın. Aşağıdaki tabloda veri kümesindeki alanlar listelenmektedir.

Sütun adı Veri tipi Açıklama
Person_age Tamsayı Kredi alan kişinin yaşı
Person_income Tamsayı Borçlunun geliri
Person_home_ownership dizi Evin mülkiyet durumu (kendi veya kiralık)
Person_emp_length Ondalık Çalıştıkları yıl sayısı
Loan_intent dizi Kredinin nedeni (kişisel, tıbbi, eğitimsel vb.)
Loan_grade dizi Kredi notu (A–E)
Loan_int_rate Ondalık Faiz oranı
Loan_amnt Tamsayı Kredinin toplam tutarı
Loan_status Tamsayı Hedef (temerrüde düşüp düşmediklerine bakılmaksızın)
Loan_percent_income Ondalık Gelir yüzdesine göre kredi tutarı
Cb_person_default_on_file Tamsayı Önceki varsayılanlar (varsa)
Cb_person_credit_history_length dizi Kredi geçmişlerinin uzunluğu

SageMaker Canvas ile veri hazırlamayı basitleştirin

Veri hazırlama, makine öğrenimi projelerinde harcanan çabanın %80'ine kadarını gerektirebilir. Doğru veri hazırlığı, daha iyi model performansına ve daha doğru tahminlere yol açar. SageMaker Canvas, herhangi bir SQL veya Python kodu yazmaya gerek kalmadan etkileşimli veri keşfine, dönüşümüne ve hazırlanmasına olanak tanır.

Verilerinizi hazırlamak için aşağıdaki adımları tamamlayın:

  1. SageMaker Canvas konsolunda, Veri Hazırlama Gezinti bölmesinde.
  2. Üzerinde oluşturmak menü seç belge.
  3. İçin Veri kümesi adı, veri kümeniz için bir ad girin.
  4. Klinik oluşturmak.
    Geliştirici üretkenliğini artırma: Deloitte, kodsuz/az kodlu makine öğrenimi için Amazon SageMaker Canvas'ı nasıl kullanıyor | Amazon Web Hizmetleri PlatoBlockchain Veri Zekası. Dikey Arama. Ai.
  5. Veri kaynağı olarak Amazon S3'ü seçin ve onu veri kümesine bağlayın.
  6. Veri kümesi yüklendikten sonra bu veri kümesini kullanarak bir veri akışı oluşturun.
    Geliştirici üretkenliğini artırma: Deloitte, kodsuz/az kodlu makine öğrenimi için Amazon SageMaker Canvas'ı nasıl kullanıyor | Amazon Web Hizmetleri PlatoBlockchain Veri Zekası. Dikey Arama. Ai.
  7. Analizler sekmesine geçin ve bir Veri Kalitesi ve Öngörüler Raporu.

Bu, giriş veri kümesinin kalitesini analiz etmek için önerilen bir adımdır. Bu raporun çıktısı, veri çarpıklığı, verilerdeki kopyalar, eksik değerler ve çok daha fazlası gibi anında ML destekli içgörüler üretir. Aşağıdaki ekran görüntüsü kredi veri kümesi için oluşturulan raporun bir örneğini göstermektedir.

Geliştirici üretkenliğini artırma: Deloitte, kodsuz/az kodlu makine öğrenimi için Amazon SageMaker Canvas'ı nasıl kullanıyor | Amazon Web Hizmetleri PlatoBlockchain Veri Zekası. Dikey Arama. Ai.

Geliştirici üretkenliğini artırma: Deloitte, kodsuz/az kodlu makine öğrenimi için Amazon SageMaker Canvas'ı nasıl kullanıyor | Amazon Web Hizmetleri PlatoBlockchain Veri Zekası. Dikey Arama. Ai.

SageMaker Canvas, bu içgörüleri sizin adınıza oluşturarak, veri hazırlama aşamasında iyileştirilmesi gereken verilerdeki bir dizi sorunu size sunar. SageMaker Canvas tarafından belirlenen en önemli iki sorunu seçmek için kategorik özellikleri kodlamanız ve yinelenen satırları kaldırarak model kalitenizin yüksek olmasını sağlamanız gerekir. Bunların ikisini de ve daha fazlasını SageMaker Canvas ile görsel bir iş akışında yapabilirsiniz.

  1. İlk olarak, one-hot kodlayın loan_intent, loan_grade, ve person_home_ownership
  2. bırakabilirsin cb_person_cred_history_length çünkü bu sütun, Veri Kalitesi ve Analizler Raporu'nda gösterildiği gibi en az tahmin gücüne sahiptir.
    Geliştirici üretkenliğini artırma: Deloitte, kodsuz/az kodlu makine öğrenimi için Amazon SageMaker Canvas'ı nasıl kullanıyor | Amazon Web Hizmetleri PlatoBlockchain Veri Zekası. Dikey Arama. Ai.
    SageMaker Canvas kısa süre önce şunu ekledi: Verilerle sohbet edin seçenek. Bu özellik, doğal dil sorgularını yorumlamak ve özellik mühendisliği dönüşümlerini uygulamak için Python tabanlı kod oluşturmak için temel modellerin gücünü kullanır. Bu özellik Amazon Bedrock tarafından desteklenmektedir ve verilerin ortamınızdan asla ayrılmaması için tamamen VPC'nizde çalışacak şekilde yapılandırılabilir.
  3. Yinelenen satırları kaldırmak amacıyla bu özelliği kullanmak için, yanındaki artı işaretini seçin. Sütunu bırak dönüştürün, ardından seçin Verilerle sohbet edin.
    Geliştirici üretkenliğini artırma: Deloitte, kodsuz/az kodlu makine öğrenimi için Amazon SageMaker Canvas'ı nasıl kullanıyor | Amazon Web Hizmetleri PlatoBlockchain Veri Zekası. Dikey Arama. Ai.
  4. Sorgunuzu doğal dilde girin (örneğin, "Veri kümesinden yinelenen satırları kaldırın").
  5. Oluşturulan dönüşümü inceleyin ve seçin Adımlara ekle Dönüşümü akışa eklemek için.
    Geliştirici üretkenliğini artırma: Deloitte, kodsuz/az kodlu makine öğrenimi için Amazon SageMaker Canvas'ı nasıl kullanıyor | Amazon Web Hizmetleri PlatoBlockchain Veri Zekası. Dikey Arama. Ai.
  6. Son olarak bu dönüşümlerin çıktısını Amazon S3'e veya isteğe bağlı olarak dışa aktarın Amazon SageMaker Özellik Mağazası Bu özellikleri birden fazla projede kullanmak için.

Büyük bir veri kümesi için iş akışını ölçeklendirmek amacıyla veri kümesi için bir Amazon S3 hedefi oluşturmak üzere başka bir adım da ekleyebilirsiniz. Aşağıdaki şemada görsel dönüşümler eklendikten sonra SageMaker Canvas veri akışı gösterilmektedir.

Geliştirici üretkenliğini artırma: Deloitte, kodsuz/az kodlu makine öğrenimi için Amazon SageMaker Canvas'ı nasıl kullanıyor | Amazon Web Hizmetleri PlatoBlockchain Veri Zekası. Dikey Arama. Ai.

SageMaker Canvas'taki görsel iş akışlarını kullanarak tüm veri işleme ve özellik mühendisliği adımını tamamladınız. Bu, bir veri mühendisinin temizleme ve verileri model geliştirmeye hazır hale getirme için harcadığı süreyi haftalardan günlere indirmeye yardımcı olur. Bir sonraki adım ML modelini oluşturmaktır.

SageMaker Canvas ile bir model oluşturun

Amazon SageMaker Canvas, bu ikili sınıflandırma modelini oluşturmak, analiz etmek, test etmek ve dağıtmak için kodsuz, uçtan uca bir iş akışı sağlar. Aşağıdaki adımları tamamlayın:

  1. SageMaker Canvas'ta bir veri kümesi oluşturun.
  2. Verileri dışa aktarmak için kullanılan S3 konumunu veya SageMaker Canvas işinin hedefindeki S3 konumunu belirtin.
    Geliştirici üretkenliğini artırma: Deloitte, kodsuz/az kodlu makine öğrenimi için Amazon SageMaker Canvas'ı nasıl kullanıyor | Amazon Web Hizmetleri PlatoBlockchain Veri Zekası. Dikey Arama. Ai.
    Artık modeli oluşturmaya hazırsınız.
  3. Klinik Modeller gezinme bölmesinde seçin ve Yeni model.
  4. Modeli adlandırın ve seçin Tahmine dayalı analiz model tipi olarak.
  5. Önceki adımda oluşturulan veri kümesini seçin.
    Geliştirici üretkenliğini artırma: Deloitte, kodsuz/az kodlu makine öğrenimi için Amazon SageMaker Canvas'ı nasıl kullanıyor | Amazon Web Hizmetleri PlatoBlockchain Veri Zekası. Dikey Arama. Ai.
    Bir sonraki adım model tipini yapılandırmaktır.
  6. Hedef sütunu seçtiğinizde model türü otomatik olarak şu şekilde ayarlanacaktır: 2 kategori tahmini.
  7. Yapı türünüzü seçin, Standart yapı or Hızlı inşa.
    Geliştirici üretkenliğini artırma: Deloitte, kodsuz/az kodlu makine öğrenimi için Amazon SageMaker Canvas'ı nasıl kullanıyor | Amazon Web Hizmetleri PlatoBlockchain Veri Zekası. Dikey Arama. Ai.
    SageMaker Canvas, modeli oluşturmaya başladığınız anda beklenen yapım süresini görüntüler. Standart oluşturma genellikle 2-4 saat sürer; Daha küçük veri kümeleri için yalnızca 2-15 dakika süren Hızlı oluşturma seçeneğini kullanabilirsiniz. Bu özel veri kümesi için model oluşturmanın tamamlanması yaklaşık 45 dakika sürmelidir. SageMaker Canvas, oluşturma sürecinin ilerleyişi hakkında sizi bilgilendirir.
  8. Model oluşturulduktan sonra model performansına bakabilirsiniz.
    Geliştirici üretkenliğini artırma: Deloitte, kodsuz/az kodlu makine öğrenimi için Amazon SageMaker Canvas'ı nasıl kullanıyor | Amazon Web Hizmetleri PlatoBlockchain Veri Zekası. Dikey Arama. Ai.
    SageMaker Canvas, modelin türüne bağlı olarak doğruluk, hassasiyet ve F1 puanı gibi çeşitli ölçümler sağlar. Aşağıdaki ekran görüntüsü bu ikili sınıflandırma modelinin doğruluğunu ve diğer birkaç gelişmiş ölçümünü göstermektedir.
  9. Bir sonraki adım test tahminleri yapmaktır.
    SageMaker Canvas, model kalitesini hızlı bir şekilde doğrulamak için birden fazla giriş veya tek bir tahmin üzerinde toplu tahminler yapmanızı sağlar. Aşağıdaki ekran görüntüsü örnek bir çıkarımı göstermektedir.
    Geliştirici üretkenliğini artırma: Deloitte, kodsuz/az kodlu makine öğrenimi için Amazon SageMaker Canvas'ı nasıl kullanıyor | Amazon Web Hizmetleri PlatoBlockchain Veri Zekası. Dikey Arama. Ai.
  10. Son adım, eğitilen modeli dağıtmaktır.
    SageMaker Canvas, modeli SageMaker uç noktalarına dağıtır ve artık çıkarım için hazır bir üretim modeline sahipsiniz. Aşağıdaki ekran görüntüsü dağıtılan uç noktayı gösterir.
    Geliştirici üretkenliğini artırma: Deloitte, kodsuz/az kodlu makine öğrenimi için Amazon SageMaker Canvas'ı nasıl kullanıyor | Amazon Web Hizmetleri PlatoBlockchain Veri Zekası. Dikey Arama. Ai.

Model dağıtıldıktan sonra onu AWS SDK aracılığıyla arayabilirsiniz veya AWS Komut Satırı Arayüzü (AWS CLI) veya potansiyel bir borçlunun riskini güvenle tahmin etmek için seçtiğiniz herhangi bir uygulamaya API çağrıları yapın. Modelinizi test etme hakkında daha fazla bilgi için bkz. Gerçek zamanlı uç noktaları çağırın.

Temizlemek

Ek masraflardan kaçınmak için, SageMaker Canvas'tan çıkış yapın or SageMaker alanını sil bu yaratıldı. Bunlara ek olarak, SageMaker modeli uç noktasını silin ve Amazon S3'e yüklenen veri kümesini silin.

Sonuç

Kodsuz makine öğrenimi geliştirmeyi hızlandırır, dağıtımı basitleştirir, programlama becerileri gerektirmez, standardizasyonu artırır ve maliyeti azaltır. Bu avantajlar, kodsuz makine öğrenimini, makine öğrenimi hizmet tekliflerini iyileştirme konusunda Deloitte için çekici hale getirdi ve makine öğrenimi modeli oluşturma zaman çizelgelerini %30-40 oranında kısalttı.

Deloitte, dünya çapında 17,000'den fazla sertifikalı AWS uygulayıcısına sahip stratejik bir küresel sistem entegratörüdür. AWS Yetkinlik Programına katılarak çıtayı yükseltmeye devam ediyor Makine Öğrenimi dahil 25 yetkinlik. Deloitte'a bağlanın Kuruluşunuzda AWS'nin kodsuz ve az kodlu çözümlerini kullanmaya başlamak için.


yazarlar hakkında

Geliştirici üretkenliğini artırma: Deloitte, kodsuz/az kodlu makine öğrenimi için Amazon SageMaker Canvas'ı nasıl kullanıyor | Amazon Web Hizmetleri PlatoBlockchain Veri Zekası. Dikey Arama. Ai.Chida Sadayappan Deloitte'un Bulut Yapay Zeka/Makine Öğrenimi uygulamasını yönetmektedir. Görevlere güçlü düşünce liderliği deneyimi katıyor ve yönetici paydaşların AI/ML kullanan sektörlerde performans iyileştirme ve modernizasyon hedeflerine ulaşmalarına destek olma konusunda başarılı oluyor. Chida, seri teknoloji girişimcisi ve startup ve geliştirici ekosistemlerinde hevesli bir topluluk oluşturucudur.

Geliştirici üretkenliğini artırma: Deloitte, kodsuz/az kodlu makine öğrenimi için Amazon SageMaker Canvas'ı nasıl kullanıyor | Amazon Web Hizmetleri PlatoBlockchain Veri Zekası. Dikey Arama. Ai.Kuldeep SinghAWS'de 20 yılı aşkın teknoloji deneyimine sahip, Küresel Yapay Zeka/Makine Öğrenimi lideri olan , satış ve girişimcilik uzmanlığını derin yapay zeka, makine öğrenimi ve siber güvenlik anlayışıyla ustaca birleştiriyor. Üretken yapay zeka ve GSI'lara odaklanarak çeşitli endüstrilerde stratejik küresel ortaklıklar kurma, dönüştürücü çözümler ve stratejiler geliştirme konusunda uzmandır.

Geliştirici üretkenliğini artırma: Deloitte, kodsuz/az kodlu makine öğrenimi için Amazon SageMaker Canvas'ı nasıl kullanıyor | Amazon Web Hizmetleri PlatoBlockchain Veri Zekası. Dikey Arama. Ai.Kasi Muthu Houston, Teksas merkezli AWS'de veri ve AI/ML'ye odaklanan kıdemli iş ortağı çözüm mimarıdır. İş ortaklarının ve müşterilerin bulut veri yolculuklarını hızlandırmalarına yardımcı olma konusunda tutkulu. Kendisi bu alanda güvenilir bir danışmandır ve bulutta ölçeklenebilir, dayanıklı ve performanslı iş yükleri tasarlama ve oluşturma konusunda oldukça fazla deneyime sahiptir. İş dışında ailesiyle vakit geçirmekten hoşlanıyor.

Zaman Damgası:

Den fazla AWS Makine Öğrenimi