AWS'de bir veri ağı mimarisini kullanarak makine öğrenimi modelleri oluşturun ve eğitin: Bölüm 1 PlatoBlockchain Veri Zekası. Dikey Arama. Ai.

AWS'de bir veri ağı mimarisi kullanarak makine öğrenimi modelleri oluşturun ve eğitin: 1. Bölüm

Çeşitli sektörlerdeki kuruluşlar, kendi sektörlerine özgü iş zorluklarını çözmek için yapay zeka (AI) ve makine öğrenimini (ML) kullanıyor. Örneğin, finansal hizmetler sektöründe dolandırıcılık tespiti, kredi riski tahmini, doğrudan pazarlama ve diğer birçok alandaki zorlukları çözmek için yapay zeka ve makine öğrenimini kullanabilirsiniz.

Büyük işletmeler bazen yenilikçi analizler ve makine öğrenimi projeleriyle farklı iş kollarının (LoB'ler) ihtiyaçlarını karşılamak için bir mükemmeliyet merkezi (CoE) kurarlar.

Geniş ölçekte yüksek kaliteli ve performanslı makine öğrenimi modelleri oluşturmak için aşağıdakileri yapmaları gerekir:

  • Analitiklerine ve ML CoE'ye ilgili verilere erişmenin kolay bir yolunu sağlayın
  • Keşfedilebilir, anlaşılabilir, birlikte çalışılabilir ve güvenilir olan seçilmiş veri varlıklarını paylaşmak için bireysel LoB'lardan veri sağlayıcılar üzerinde hesap verebilirlik oluşturun

Bu, makine öğrenimi kullanım durumlarını denemeden üretime dönüştürmek için gereken uzun döngü süresini azaltabilir ve kuruluş genelinde iş değeri oluşturabilir.

Veri ağı mimarisi, karmaşık ve büyük ölçekli ortamlarda (kuruluşların içinde veya arasında) verileri paylaşmak, bunlara erişmek ve yönetmek için merkezi olmayan bir sosyo-teknik yaklaşım sunarak bu teknik ve organizasyonel zorlukları çözmeye çalışır. Veri ağı tasarım modeli, veri ekiplerine, süreçlere ve teknolojiye yapılan iş yatırımlarının getirisini artırma nihai hedefine ulaşmak için kurumsal büyümeyle uyumlu, sorumlu bir veri paylaşım modeli oluşturur.

Bu iki bölümlü seride, kuruluşların AWS'de bir veri ağı tasarım modelini kullanarak modern bir veri mimarisini nasıl oluşturabilecekleri ve bir analitiğin ve ML CoE'nin birden fazla LoB'deki verilerle ML modelleri oluşturup eğitmesini nasıl sağlayabilecekleri konusunda rehberlik sağlıyoruz. Bu serinin bağlamını ve kullanım senaryosunu belirlemek için bir finansal hizmet kuruluşu örneğini kullanıyoruz.

Bu ilk gönderide, birden fazla AWS veri üreticisi ve tüketici hesabıyla bir veri ağı mimarisi kurma prosedürlerini gösteriyoruz. Daha sonra, finansal kuruluş içindeki bir LoB'ye ait olan bir veri ürününe ve diğer LoB'lerin bu veri ürününü tüketmesine ve kullanmasına olanak sağlamak için bunun bir veri ağı ortamında nasıl paylaşılabileceğine odaklanıyoruz. Bu, esas olarak, veri üreticileri ve tüketicileri arasında veri paylaşımı sürecini kolaylaştırmak ve standartlaştırmaktan ve veri yönetişimi kurallarına uygunluğu sağlamaktan sorumlu olan veri sorumlusu kişiliğini hedef alıyor.

İkinci gönderide, bir analizin ve ML CoE'nin, risk tahmini kullanım senaryosu için veri ürününü nasıl kullanabileceğine dair bir örnek gösteriyoruz. Bu, esas olarak, finansal hizmet müşterilerinin deneyimini geliştirmek için iş öngörülerini ortaya çıkaran makine öğrenimi modelleri oluşturmak ve eğitmek için hem kuruluş çapında hem de üçüncü taraf veri varlıklarını kullanmaktan sorumlu olan veri bilimci kişiliğini hedefliyor.

Veri ağına genel bakış

Veri ağı modelinin kurucusu Zhamak Dehghani kitabında Veriye Dayalı Değeri Geniş Ölçekte Sunan Veri Ağı, veri ağının amacına yönelik dört ilkeyi tanımladı:

  • Dağıtılmış etki alanı sahipliği – Veri platformu teknolojilerini çalıştıran uzmanların merkezi veri sahipliğinden, merkezi olmayan bir veri mülkiyeti modeline doğru organizasyonel bir değişimin takip edilmesi, verilerin sahipliğini ve hesap verebilirliğini, verilerin üretildiği (kaynağa hizalanmış alanlar) veya tüketildiği LoB'lara geri itmek ( tüketime yönelik alanlar).
  • Ürün olarak veri – Seçilmiş, yüksek kaliteli, birlikte çalışabilir ve güvenli veri varlıklarını paylaşma sorumluluğunu üst düzeye taşımak. Bu nedenle, farklı LoB'lerdeki veri üreticileri, verileri kaynağında tüketilebilir bir biçimde yapmaktan sorumludur.
  • Self servis analitik – Analitik ve ML veri kullanıcılarının deneyimini, tercih ettikleri araçlarla veri ürünlerini keşfedebilmeleri, erişebilmeleri ve kullanabilmeleri için kolaylaştırmak. Ek olarak, LoB veri sağlayıcılarının veri ürünlerini tarifler ve yeniden kullanılabilir bileşenler ve şablonlar aracılığıyla oluşturma, dağıtma ve sürdürme deneyimini kolaylaştırmak.
  • Birleşik hesaplamalı yönetişim – Veri erişimini yönetme ve kontrol etmeyle ilgili karar alma süreçlerini, farklı LoB'lerdeki veri sahipleri düzeyinde olacak şekilde birleştirmek ve otomatikleştirmek; bu, hâlâ daha geniş kuruluşun nihai olarak uygulanan yasal, uyumluluk ve güvenlik politikalarıyla uyumludur. ağ.

AWS, çeşitli gönderilerde AWS'nin üzerinde bir veri ağı oluşturma vizyonunu açıkladı:

  • İlk olarak, ürün ilkeleri olarak dağıtılmış etki alanı sahipliği ve verilerle ilgili organizasyonel kısma odaklandık. Yazarlar, kuruluş genelinde birden fazla iş kolunu, tüketime uygun alanlara ihtiyaç duydukları verileri bulmaları ve elde etmeleri için araçlar sağlayan bir veri ürünü stratejisine doğru hizalama vizyonunu tanımladı ve aynı zamanda bu verilerin kullanımı konusunda gerekli kontrolü garanti altına alarak hesap verebilirliği sağladı. Doğrudan kaynakta kullanılmaya hazır veri ürünleri sağlamak için kaynağa hizalanmış alanlar. Daha fazla bilgi için bkz. JPMorgan Chase, kurumsal veri platformunu geliştirmek amacıyla önemli değer yaratmak için nasıl bir veri ağı mimarisi oluşturdu?.
  • Daha sonra veri ürünleri oluşturma, self-servis analitik ve birleşik hesaplamalı yönetişim ilkeleriyle ilgili teknik kısma odaklandık. Yazarlar, kaynağa göre hizalanmış etki alanlarının veri ürünleri oluşturmasını ve paylaşmasını sağlayan temel AWS hizmetlerini, tüketiciye uygun etki alanlarının, tercih ettikleri araçlara ve kullandıkları kullanım örneklerine göre veri ürünlerini farklı şekillerde tüketmelerine olanak tanıyan çok çeşitli hizmetleri açıkladılar. ve son olarak veri erişim politikalarını uygulayarak veri paylaşım prosedürünü yöneten AWS hizmetleri üzerinde çalışıyoruz. Daha fazla bilgi için bkz. AWS Lake Formation ve AWS Glue kullanarak bir veri ağı mimarisi tasarlayın.
  • Ayrıca merkezi bir veri ağı kullanıcı arayüzü aracılığıyla veri keşfini ve erişim kontrolünü otomatikleştirmeye yönelik bir çözüm gösterdik. Daha fazla ayrıntı için bkz. Veri ağınız için AWS Lake Formation ile bir veri paylaşımı iş akışı oluşturun.

Finansal hizmetlerin kullanım örneği

Tipik olarak, büyük finansal hizmet kuruluşlarında tüketici bankacılığı, yatırım bankacılığı ve varlık yönetimi gibi birden fazla LoB'nin yanı sıra bir veya daha fazla analiz ve ML CoE ekibi bulunur. Her LoB farklı hizmetler sağlar:

  • Tüketici bankacılığı LoB, tüketicilere ve işletmelere kredi ve ipotek, nakit yönetimi, ödeme çözümleri, mevduat ve yatırım ürünleri ve daha fazlası dahil olmak üzere çeşitli hizmetler sunmaktadır.
  • Ticari veya yatırım bankacılığı LoB'si, küçük işletmeler, orta ölçekli şirketler ve büyük şirketler de dahil olmak üzere müşterilere kredi verme, iflas riski ve toptan ödemeler gibi kapsamlı finansal çözümler sunar
  • Varlık yönetimi LoB, tüm varlık sınıflarında emeklilik ürünleri ve yatırım hizmetleri sağlar

Her LoB, verileri anlayan ve onu kimin kullanma yetkisine sahip olduğunu ve nasıl kullanılabileceğini belirlemek için en uygun kişiler tarafından seçilen kendi veri ürünlerini tanımlar. Buna karşılık, analitik ve ML CoE gibi diğer LoB'lar ve uygulama alanları, nitelikli veri ürünlerini keşfedip tüketmek, içgörü oluşturmak için bunları bir araya getirmek ve veriye dayalı kararlar almakla ilgileniyor.

Aşağıdaki çizimde bazı LoB'ler ve paylaşabilecekleri veri ürünleri örnekleri gösterilmektedir. Aynı zamanda, son müşterinin deneyimini daha da geliştirmek için müşteriye yönelik uygulamalara dağıtılabilecek ML modelleri oluşturan analitik ve ML CoE gibi veri ürünleri tüketicilerini de gösterir.

Veri ağı sosyo-teknik konseptini takiben, aşağıdaki gibi bir dizi organizasyonel adımla sosyal boyutla başlıyoruz:

  • Her veri ürününün belirli bir alanla eşlenebilmesi için her alan için sınırları tanımlamak üzere alan uzmanlarından faydalanma
  • Her alandan sağlanan veri ürünlerinin sahiplerini belirleme, böylece her veri ürününün, sahipleri tarafından tanımlanan bir stratejiye sahip olması
  • Veri tüketicileri belirli bir veri ürününe eriştiğinde, ürünle ilişkili erişim politikasının merkezi bir veri yönetişim katmanı aracılığıyla otomatik olarak uygulanabilmesi için küresel ve yerel veya federal teşviklerden yönetişim politikalarının belirlenmesi

Daha sonra, önceki diyagramda tanımlanan aşağıdaki uçtan uca senaryoyu içeren teknik boyuta geçiyoruz:

  1. Kullanıma hazır bir tüketici kredisi profili veri ürünü oluşturmaya yönelik araçlarla tüketici bankacılığı LoB'unu güçlendirin.
  2. Tüketici bankacılığı LoB'unun veri ürünlerini merkezi yönetişim katmanıyla paylaşmasına izin verin.
  3. Merkezi veri yönetimi aracılığıyla tüketici kredisi profili veri ürününe erişirken uygulanması gereken veri erişim politikalarının küresel ve birleştirilmiş tanımlarını ekleyin.
  4. Analitiklerin ve ML CoE'nin merkezi yönetişim katmanı aracılığıyla veri ürününü keşfetmesine ve erişmesine izin verin.
  5. Bir kredi riski tahmin modeli oluşturmak ve eğitmek için veri ürününü kullanmak üzere analitiği ve ML CoE'yi araçlarla güçlendirin. Bu seride son adımları (önceki diyagramda 6 ve 7) ele almıyoruz. Ancak böyle bir makine öğrenimi modelinin uçtan uca bir senaryoda kuruluşa sağlayabileceği iş değerini göstermek için aşağıdakileri gösteriyoruz:
  6. Bu model daha sonra tüketici bankacılığı web portalı veya mobil uygulama gibi müşteriye yönelik sistemlere yeniden dağıtılabilir.
  7. Kredi ve ipotek taleplerinin risk profilini değerlendirmek için özellikle kredi başvurusunda kullanılabilir.

Daha sonra her bir bileşenin teknik ihtiyaçlarını açıklıyoruz.

Teknik ihtiyaçlara derinlemesine dalın

Veri ürünlerini herkesin kullanımına sunmak için kuruluşların, kuruluş genelindeki farklı kuruluşlar arasında veri paylaşımını kolaylaştırırken aynı zamanda veri üzerinde uygun kontrolü sürdürmesi veya başka bir deyişle çeviklik ile uygun yönetim arasında denge kurması gerekir.

Veri tüketicisi: Analytics ve ML CoE

Analitik ve ML CoE'deki veri bilimcileri gibi veri tüketicilerinin aşağıdakileri yapabilmesi gerekir:

  • Belirli bir kullanım senaryosu için ilgili veri kümelerini keşfedin ve bunlara erişin
  • Erişmek istedikleri veri kümelerinin önceden seçilmiş, güncel olduğundan ve sağlam açıklamalara sahip olduğundan emin olun
  • İş vakalarıyla ilgili veri kümelerine erişim talep etme
  • Verileri orijinal uzak konumdan kopyalamaya gerek kalmadan veya uzak bir sitede fiziksel olarak depolanan verilerin işlenmesiyle ilişkili mühendislik veya altyapı karmaşıklıkları konusunda endişelenmeye gerek kalmadan, makine öğrenimi için bu tür veri kümelerini kendi ortamlarında sorgulamak ve işlemek üzere tercih ettikleri araçları kullanın.
  • Veri sahipleri tarafından yapılan veri güncellemelerinden haberdar olun

Veri üreticisi: Alan adı sahipliği

Finansal hizmetler organizasyonundaki farklı LoB'lerden etki alanı ekipleri gibi veri üreticilerinin, aşağıdakileri içeren seçilmiş veri kümelerini kaydetmesi ve paylaşması gerekir:

  • Veritabanı ve tablo adları ve boyutları, sütun şemaları ve anahtarlar gibi teknik ve operasyonel meta veriler
  • Veri açıklaması, sınıflandırma ve hassasiyet gibi iş meta verileri
  • Kaynaktan hedef forma ve ara formlara kadar şema gelişimi gibi meta verileri izleme
  • Doğruluk ve tamlık oranları ve veri yanlılığı gibi veri kalitesi meta verileri
  • Erişim politikaları ve prosedürleri

Veri tüketicilerinin, manuel prosedürlere dayanmadan veya verinin anlamı ve ona nasıl erişilebileceği hakkında daha fazla bilgi edinmek için veri ürününün alan uzmanlarıyla iletişime geçmek zorunda kalmadan verileri keşfetmesine ve erişmesine olanak sağlamak için bunlara ihtiyaç vardır.

Veri yönetimi: Keşfedilebilirlik, erişilebilirlik ve denetlenebilirlik

Kuruluşların, daha önce gösterilen çeviklikleri veri sızıntılarıyla ilişkili risklerin uygun şekilde azaltılmasıyla dengelemesi gerekir. Özellikle finansal hizmetler gibi düzenlemeye tabi sektörlerde, aynı verilerin farklı konumlarda birden fazla kopyalanmasını önleyerek depolama alanını azaltırken genel veri erişimi ve denetim kontrolü sağlamak için merkezi veri yönetimini sürdürmeye ihtiyaç vardır.

Geleneksel merkezi veri gölü mimarilerinde, veri üreticileri genellikle ham verileri yayınlar ve veri iyileştirme, veri kalitesi yönetimi ve erişim kontrolünün sorumluluğunu merkezi bir veri platformu ekibindeki veri ve altyapı mühendislerine devreder. Bununla birlikte, bu veri platformu ekipleri çeşitli veri alanlarına daha az aşina olabilir ve her veri alanında uygulanan politikalara göre verilere erişimi uygun şekilde düzenleyebilmek ve yönetebilmek için yine de veri üreticilerinin desteğine güvenebilir. Buna karşılık, veri üreticilerinin kendileri seçilmiş, nitelikli veri varlıkları sağlamak için en iyi konumdadır ve veri varlıklarına erişirken uygulanması gereken alana özgü erişim politikalarının farkındadır.

Çözüme genel bakış

Aşağıdaki diyagram önerilen çözümün üst düzey mimarisini göstermektedir.

AWS'de bir veri ağı mimarisini kullanarak makine öğrenimi modelleri oluşturun ve eğitin: Bölüm 1 PlatoBlockchain Veri Zekası. Dikey Arama. Ai.

Analitik ve ML CoE'nin veri tüketimini şu şekilde ele alıyoruz: Amazon Atina ve Amazon Adaçayı Yapıcı in parçası 2 bu serinin.

Bu yazıda veri ağına veri ekleme sürecine odaklanıyoruz ve tüketici bankacılığı etki alanı veri ekibi gibi bireysel bir LoB'nin aşağıdaki gibi AWS araçlarını nasıl kullanabileceğini açıklıyoruz: AWS Tutkal ve AWS Tutkal DataBrew Veri ürünlerinin kalitesini hazırlamak, düzenlemek ve geliştirmek ve ardından bu veri ürünlerini merkezi veri yönetişimi hesabına kaydetmek. AWS Göl Oluşumu.

Tüketici bankacılığı LoB (veri üreticisi)

Veri ağının temel ilkelerinden biri, verinin bir ürün olarak kavramıdır. Bireysel bankacılık alanı veri ekibinin, veri tüketicilerinin kullanımına hazır veri ürünleri hazırlama konusunda çalışması çok önemlidir. Bu, üzerinde toplanan ham verileri işlemek için AWS Glue gibi AWS ayıklama, dönüştürme ve yükleme (ETL) araçları kullanılarak yapılabilir. Amazon Basit Depolama Hizmeti (Amazon S3) veya alternatif olarak verilerin üretildiği operasyonel veri depolarına bağlanın. Ayrıca kullanabilirsin VeriBrewVerilerin temizlenmesini ve normalleştirilmesini kolaylaştıran kodsuz görsel veri hazırlama aracıdır.

Örneğin, tüketici kredi profili veri ürününü hazırlarken tüketici bankacılığı alanı veri ekibi, açık kaynak veri kümesinden alınan ham verilerin nitelik adlarını Almancadan İngilizceye çevirmek için basit bir düzenleme yapabilir. Statlog Alman kredi verileri20 özellik ve 1,000 satırdan oluşur.

AWS'de bir veri ağı mimarisini kullanarak makine öğrenimi modelleri oluşturun ve eğitin: Bölüm 1 PlatoBlockchain Veri Zekası. Dikey Arama. Ai.

Veri yönetimi

Veri ağı yönetimini etkinleştirmeye yönelik temel AWS hizmeti Lake Formation'dır. Lake Formation, verilerin kolayca keşfedilebilir ve güvenli olmasını sağlamak için her veri etki alanı içinde ve etki alanları arasında veri yönetimini uygulama yeteneği sunar. Veri keşfi, güvenlik ve uyumluluk için en iyi uygulamalarla merkezi olarak yönetilebilen birleştirilmiş bir güvenlik modeli sağlarken her etki alanında yüksek çevikliğe olanak tanır.

Lake Formation, verilerinizin korunması için satır düzeyinde güvenliğin yanı sıra verilerin alınmasını, saklanmasını ve yönetilmesini basitleştiren bir API sunar. Ayrıca ayrıntılı erişim kontrolü, yönetilen tablolar ve depolama optimizasyonu gibi işlevler de sağlar.

Ayrıca Göl Formasyonları şunları sunmaktadır: Veri Paylaşımı API'si Verileri paylaşmak için kullanabileceğiniz farklı hesaplarda. Bu, analizlerin ve ML CoE tüketicisinin, birden fazla hesaptaki tabloları sorgulayan ve birleştiren Athena sorgularını çalıştırmasına olanak tanır. Daha fazla bilgi için bkz. AWS Lake Formation Geliştirici Kılavuzu.

AWS Kaynak Erişim Yöneticisi (AWS RAM), kaynakları paylaşmanın güvenli bir yolunu sağlar. AWS Kimlik ve Erişim Yöneticisi Bir kuruluş veya kuruluş birimlerindeki (OU'lar) AWS hesaplarındaki (IAM) rolleri ve kullanıcılar AWS Kuruluşları.

Lake Formation, AWS RAM ile birlikte AWS hesapları arasında veri paylaşımını ve erişimi yönetmenin bir yolunu sağlar. Bu yaklaşımı şu şekilde adlandırıyoruz: RAM tabanlı erişim kontrolü. Bu yaklaşım hakkında daha fazla ayrıntı için bkz. Veri ağınız için AWS Lake Formation ile bir veri paylaşımı iş akışı oluşturun.

Lake Formation ayrıca veri paylaşımını ve erişimini yönetmenin başka bir yolunu da sunuyor. Göl Oluşumu etiketleri. Bu yaklaşımı şu şekilde adlandırıyoruz: etiket tabanlı erişim kontrolü. Daha fazla ayrıntı için bkz. AWS Lake Formation etiket tabanlı erişim denetimini kullanarak uygun ölçekte modern bir veri mimarisi ve veri ağı modeli oluşturun.

Bu yazı boyunca etiket tabanlı erişim kontrolü yaklaşımını kullanıyoruz çünkü bu yaklaşım, altyapı düzeyinde adlandırılmış kaynaklar üzerinde politikalar belirlemek yerine, farklı LoB'lerde yaygın olarak bulunan daha az sayıda mantıksal etiket üzerinde politikaların oluşturulmasını basitleştirir.

Önkoşullar

Bir veri ağı mimarisi kurmak için en az üç AWS hesabına ihtiyacınız vardır: bir üretici hesabı, bir merkezi hesap ve bir tüketici hesabı.

Veri ağı ortamını dağıtın

Bir veri ağı ortamını dağıtmak için aşağıdakileri kullanabilirsiniz GitHub deposu. Bu depoda üç tane var AWS CloudFormation Hesapların her birini (üretici, merkezi ve tüketici) içeren bir veri ağı ortamını dağıtan şablonlar. Her hesapta ilgili CloudFormation şablonunu çalıştırabilirsiniz.

Merkezi hesap

Merkezi hesapta aşağıdaki adımları tamamlayın:

  1. CloudFormation yığınını başlatın:
    AWS'de bir veri ağı mimarisini kullanarak makine öğrenimi modelleri oluşturun ve eğitin: Bölüm 1 PlatoBlockchain Veri Zekası. Dikey Arama. Ai.
  2. İki IAM kullanıcısı oluşturun:
    1. DataMeshOwner
    2. ProducerSteward
  3. Hibe DataMeshOwner Göl Oluşumu yöneticisi olarak.
  4. Bir IAM rolü oluşturun:
    1. LFRegisterLocationServiceRole
  5. İki IAM politikası oluşturun:
    1. ProducerStewardPolicy
    2. S3DataLakePolicy
  6. Şunun için veritabanı kredi kartını oluşturun: ProducerSteward yapımcı hesabında.
  7. Veri konumu iznini yapımcı hesabıyla paylaşın.

Üretici hesabı

Üretici hesabında aşağıdaki adımları tamamlayın:

  1. CloudFormation yığınını başlatın:
    AWS'de bir veri ağı mimarisini kullanarak makine öğrenimi modelleri oluşturun ve eğitin: Bölüm 1 PlatoBlockchain Veri Zekası. Dikey Arama. Ai.
  2. S3 paketini oluşturun credit-cardmasayı tutan credit_card.
  3. Merkezi hesap Lake Formation hizmet rolü için S3 paketi erişimine izin verin.
  4. AWS Glue tarayıcısını oluşturun creditCrawler-<ProducerAccountID>.
  5. Bir AWS Glue tarayıcı hizmeti rolü oluşturun.
  6. S3 klasörü konumunda izin verme credit-card-<ProducerAccountID>-<aws-region> AWS Glue tarayıcısı rolüne.
  7. Üretici temsilcisi IAM kullanıcısı oluşturun.

tüketici hesabı

Tüketici hesabında aşağıdaki adımları tamamlayın:

  1. CloudFormation yığınını başlatın:
    AWS'de bir veri ağı mimarisini kullanarak makine öğrenimi modelleri oluşturun ve eğitin: Bölüm 1 PlatoBlockchain Veri Zekası. Dikey Arama. Ai.
  2. S3 paketini oluşturun <AWS Account ID>-<aws-region>-athena-logs.
  3. Athena çalışma grubunu oluşturun consumer-workgroup.
  4. IAM kullanıcısını oluşturun ConsumerAdmin.

Bir veritabanı ekleyin ve tüketici hesabına abone olun

Şablonları çalıştırdıktan sonra, adım adım kılavuz veri kataloğuna bir ürün eklemek ve tüketicinin bu ürüne abone olmasını sağlamak. Kılavuz, üreticinin ürünlerini yerleştirebileceği bir veri tabanı oluşturarak başlıyor ve ardından tüketicinin bu veri tabanına nasıl abone olabileceğini ve verilere nasıl ulaşabileceğini anlatıyor. Bütün bunlar kullanılırken gerçekleştirilir. LF etiketleri, hangisi etiket tabanlı erişim kontrolü Göl Oluşumu için.

Veri ürünü kaydı

Aşağıdaki mimari, veri üreticileri olarak hareket eden tüketici bankacılığı LoB ekibinin veri ürünlerini merkezi veri yönetişimi hesabına (yerleşik veri ürünlerini kuruluşun veri ağına) nasıl kaydedebileceğine ilişkin ayrıntılı adımları açıklamaktadır.

AWS'de bir veri ağı mimarisini kullanarak makine öğrenimi modelleri oluşturun ve eğitin: Bölüm 1 PlatoBlockchain Veri Zekası. Dikey Arama. Ai.

Bir veri ürününü kaydetmenin genel adımları aşağıdaki gibidir:

  1. Merkezi yönetişim hesabındaki veri ürünü için bir hedef veritabanı oluşturun. Örnek olarak, merkezi hesaptaki CloudFormation şablonu zaten hedef veritabanını oluşturuyor credit-card.
  2. Oluşturulan hedef veritabanını üretici hesabındaki Origin ile paylaşın.
  3. Üretici hesabında paylaşılan veritabanının kaynak bağlantısını oluşturun. Aşağıdaki ekran görüntüsünde yapımcı hesabındaki Lake Formation konsolunda şunu görüyoruz: rl_credit-card kaynak bağlantısıdır credit-card veri tabanı.
    AWS'de bir veri ağı mimarisini kullanarak makine öğrenimi modelleri oluşturun ve eğitin: Bölüm 1 PlatoBlockchain Veri Zekası. Dikey Arama. Ai.
  4. Kaynak bağlantı veritabanındaki tabloları (üretici hesabında seçilen verilerle) doldurun (rl_credit-card) üretici hesabında bir AWS Glue tarayıcısı kullanarak.
    AWS'de bir veri ağı mimarisini kullanarak makine öğrenimi modelleri oluşturun ve eğitin: Bölüm 1 PlatoBlockchain Veri Zekası. Dikey Arama. Ai.

Oluşturulan tablo otomatik olarak merkezi yönetim hesabında görünür. Aşağıdaki ekran görüntüsünde merkezi hesaptaki Lake Formasyonu'ndaki tablonun bir örneği gösterilmektedir. Bu, kaynak bağlantı veritabanını doldurmak için önceki adımları uyguladıktan sonradır. rl_credit-card yapımcı hesabında.

AWS'de bir veri ağı mimarisini kullanarak makine öğrenimi modelleri oluşturun ve eğitin: Bölüm 1 PlatoBlockchain Veri Zekası. Dikey Arama. Ai.

Sonuç

Bu serinin 1. bölümünde, finansal hizmet kuruluşlarının analiz ve makine öğrenimi ekipleri için daha fazla çeviklik elde etme ve verilerden içgörülere geçiş süresini kısaltma hedeflerini tartıştık. Ayrıca AWS Glue, DataBrew ve Lake Formation gibi kullanımı kolay, ölçeklenebilir ve uygun maliyetli AWS hizmetlerini sunduğumuz AWS'de bir veri ağı mimarisi oluşturmaya da odaklandık. Veri üreten ekipler, farklı veri tüketicileri tarafından analitik amaçlarla kullanıma hazır, seçilmiş, yüksek kaliteli, birlikte çalışılabilen ve güvenli veri ürünleri oluşturmak ve paylaşmak için bu hizmetleri kullanabilir.

In parçası 2, Athena ve SageMaker gibi AWS hizmetlerini kullanarak bir kredi riski tahmin modeli oluşturmak için tüketici bankacılığı LoB'si tarafından paylaşılan veri ürünlerini kullanan analitik ve ML CoE ekiplerine odaklanıyoruz.


yazarlar hakkında

AWS'de bir veri ağı mimarisini kullanarak makine öğrenimi modelleri oluşturun ve eğitin: Bölüm 1 PlatoBlockchain Veri Zekası. Dikey Arama. Ai.Karim Hammouda AWS'de veri entegrasyonu, veri analizi ve BI tutkusu ile Analitik için Uzman Çözüm Mimarıdır. İşlerinin büyümesine katkıda bulunan analitik çözümleri tasarlamak ve oluşturmak için AWS müşterileriyle birlikte çalışır. Boş zamanlarında oğluyla televizyonda belgesel izlemeyi ve video oyunları oynamayı seviyor.

AWS'de bir veri ağı mimarisini kullanarak makine öğrenimi modelleri oluşturun ve eğitin: Bölüm 1 PlatoBlockchain Veri Zekası. Dikey Arama. Ai.Hasan Poonawala AWS'de Kıdemli AI/ML Uzman Çözüm Mimarı olan Hasan, müşterilerin AWS'de üretimde makine öğrenimi uygulamaları tasarlamasına ve dağıtmasına yardımcı olur. Veri bilimcisi, makine öğrenimi uygulayıcısı ve yazılım geliştiricisi olarak 12 yılı aşkın iş tecrübesine sahiptir. Hasan boş zamanlarında doğayı keşfetmeyi, arkadaşları ve ailesiyle vakit geçirmeyi sever.

AWS'de bir veri ağı mimarisini kullanarak makine öğrenimi modelleri oluşturun ve eğitin: Bölüm 1 PlatoBlockchain Veri Zekası. Dikey Arama. Ai.Benoit de Patoul AWS'de AI/ML Uzman Çözüm Mimarıdır. AWS'yi kullanarak AI/ML ile ilgili çözümler oluşturma konusunda rehberlik ve teknik destek sağlayarak müşterilere yardımcı oluyor. Boş zamanlarında piyano çalmayı ve arkadaşlarıyla vakit geçirmeyi seviyor.

Zaman Damgası:

Den fazla AWS Makine Öğrenimi