Bu yazı SIGNAL IDUNA'dan Jan Paul Assendorp, Thomas Lietzow, Christopher Masch, Alexander Meinert, Dr. Lars Palzer ve Jan Schillemans ile birlikte yazılmıştır.
Büyük bir Alman sigorta şirketi olan SIGNAL IDUNA'da, daha da müşteri odaklı olmak için şu anda VISION2023 dönüşüm programımızla kendimizi yeniden keşfediyoruz. Bu dönüşümün merkezinde iki husus yer alıyor: İş gücünün büyük bir bölümünün çapraz işlevli ve çevik ekipler halinde yeniden düzenlenmesi ve gerçek anlamda veri odaklı bir şirket haline gelmek. Burada "Siz inşa edin, siz çalıştırın" sloganı, bir veri veya makine öğrenimi (ML) ürünü geliştiren işlevler arası bir ekip için önemli bir gerekliliktir. Bu, ekibin bir ürünü üretmek ve çalıştırmak için ne kadar harcayabileceği konusunda sıkı kısıtlamalar getiriyor.
Bu gönderi, SIGNAL IDUNA'nın bu zorluğun üstesinden nasıl geldiğini ve AWS Bulut işlevler arası ekiplerin kendi makine öğrenimi ürünlerini oluşturmasını ve operasyonel hale getirmesini sağlamak. Bu amaçla öncelikle bir ürünü geliştirmek ve çalıştırmak için kullanılan bulut altyapısının merkezi gereksinimlerini belirleyen çevik ekiplerin organizasyon yapısını tanıtıyoruz. Daha sonra, SIGNAL IDUNA'daki üç merkezi ekibin, kolayca kullanılabilen ve uyarlanabilen uygun bir iş akışı ve altyapı çözümleri sağlayarak, işlevler arası ekiplerin AWS Cloud'da minimum yardımla veri ürünleri oluşturmasına nasıl olanak tanıdığını gösteriyoruz. Son olarak yaklaşımımızı gözden geçirip geliştirme ve işleyişin daha kesin bir şekilde ayrıldığı daha klasik bir yaklaşımla karşılaştırıyoruz.
Agile@SI – Organizasyonel Değişimin Temeli
2021'in başından bu yana SIGNAL IDUNA, Agile@SI stratejisini eyleme geçirmeye ve tüm şirket genelinde müşteri odaklı çözümler geliştirmek için çevik yöntemler oluşturmaya başladı [1]. Önceki görevler ve hedefler artık çapraz işlevli ekipler tarafından üstleniliyor. mangaları. Bu ekipler çevik yöntemler (Scrum çerçevesi gibi) kullanır, kendi kararlarını verir ve müşteri odaklı ürünler geliştirir. Tipik olarak ekipler, pazarlama gibi iş bölümlerinde bulunur ve çoğu, veri odaklı ve makine öğrenimi destekli ürünler oluşturmaya güçlü bir vurgu yapar. Örnek olarak sigortadaki tipik kullanım durumları müşteri kaybı tahmini ve ürün tavsiyesidir.
ML'nin karmaşıklığı nedeniyle, tek bir ekip tarafından ML çözümü oluşturmak zordur ve bu nedenle farklı ekiplerin işbirliğini gerektirir.
SIGNAL IDUNA'nın makine öğrenimi çözümleri oluşturmayı destekleyen üç temel ekibi vardır. Bu üç ekip, makine öğrenimi çözümünün geliştirilmesinden, uzun vadeli operasyonundan ve sorumluluğundan sorumlu olan ekiple çevrilidir. Bu yaklaşım AWS paylaşılan sorumluluk modelini takip etmektedir [2].
Yukarıdaki resimde tüm takımlar genel bir görünümde temsil edilmektedir.
Bulut Etkinleştirme
Tüm kuruluşun temel bulut altyapısı, Bulut Etkinleştirme ekibi tarafından sağlanmaktadır. Ekiplerin kendi başlarına bulut teknolojileri üzerine ürünler geliştirmelerini sağlamak onların görevidir. Bu, makine öğrenimi gibi yeni ürünlerin pazara sunulma süresini kısaltır ve "Siz inşa edin, siz çalıştırın" ilkesini takip eder.
Veri Ofisi/Veri Gölü
Verilerin buluta taşınması ve doğru veri kümesinin bulunması, Veri Ofisi/Veri Gölü ekibi tarafından desteklenmektedir. Gerekli veri kümelerini aramak ve seçmek için kullanılabilecek bir veri kataloğu oluştururlar. Amaçları veri şeffaflığını ve yönetimini sağlamaktır. Ayrıca ekiplerin ilgili verilere erişmesine ve bunları işlemesine yardımcı olan bir Veri Gölü'nün kurulmasından ve işletilmesinden de sorumludurlar.
Veri Analitiği Platformu
Ekibimiz Veri Analitiği Platformu (DAP), SIGNAL IDUNA'da makine öğrenimi mühendisliği, veri mühendisliği ve veri bilimi konularında uzman, bulut ve makine öğrenimi odaklı bir ekiptir. Altyapı bileşenleri ve bilgileri sağlayarak şirket içi ekiplerin makine öğrenimi için genel bulutu kullanmasını sağlıyoruz. Ürün ve hizmetlerimiz aşağıdaki bölümde detaylı olarak sunulmaktadır.
Çapraz Fonksiyonlu Ekiplerin ML Çözümleri Oluşturmasını Etkinleştirme
SIGNAL IDUNA'daki işlevler arası ekiplerin makine öğrenimi çözümleri oluşturmasını sağlamak için, yeniden kullanılabilir bulut altyapısı sağlamanın hızlı ve çok yönlü bir yolunun yanı sıra, ekiplerin bulut yeteneklerini kullanması için verimli bir iş akışına ihtiyacımız var.
Bu amaçla standartlaştırılmış bir katılım ve destek süreci oluşturduk ve Kod Olarak Altyapı (IaC) olarak modüler altyapı şablonları sağladık. Bu şablonlar, belirli bir kullanım senaryosunun gereksinimlerine göre kolayca uyarlanabilecek yaygın makine öğrenimi kullanım senaryoları için tasarlanmış altyapı bileşenlerini içerir.
ML Çözümleri Oluşturmanın İş Akışı
ML çözümlerinin oluşturulmasında ve işletilmesinde üç ana teknik rol vardır: Veri bilimcisi, ML mühendisi ve veri mühendisi. Her rol, işlevler arası ekibin bir parçasıdır ve farklı sorumluluklara sahiptir. Veri bilimci, kullanım senaryosunun teknik gereksinimlerinin yanı sıra işlevsel gerekli alan bilgisine de sahiptir. ML mühendisi, otomatik ML çözümleri oluşturma ve model dağıtımı konusunda uzmanlaşmıştır. Ve veri mühendisi, verilerin şirket içinden ve bulut içinden akmasını sağlar.
Platformu sağlama süreci aşağıdaki gibidir:
Özel kullanım senaryosunun altyapısı IaC'de tanımlanır ve merkezi bir proje deposunda versiyonlanır. Bu aynı zamanda model eğitimi ve devreye alma işlemlerinin yanı sıra veri bilimi ile ilgili diğer kod yapıtlarını da içerir. Veri bilimcileri, ML mühendisleri ve veri mühendisleri proje havuzuna erişebilir ve tüm altyapı kodunu bağımsız olarak yapılandırıp güncelleyebilir. Bu, ekibin gerektiğinde altyapıyı hızla değiştirmesine olanak tanır. Ancak ML mühendisi, altyapının veya ML modellerinin geliştirilmesine ve güncellenmesine her zaman destek olabilir.
Yeniden Kullanılabilir ve Modüler Altyapı Bileşenleri
Hiyerarşik ve modüler IaC kaynakları şu şekilde uygulanır: Terraform ve ortak veri bilimi ve ETL kullanım senaryolarına yönelik altyapıyı içerir. Bu, altyapı kodunu yeniden kullanmamıza ve aşağıdakiler gibi gerekli güvenlik ve uyumluluk politikalarını uygulamamıza olanak tanır: AWS Anahtar Yönetimi Hizmeti (KMS) veriler için şifrelemenin yanı sıra altyapının kapsüllenmesi Amazon Sanal Özel Bulut (VPC) Doğrudan internet erişimi olmayan ortamlar.
Hiyerarşik IaC yapısı aşağıdaki gibidir:
- Modüller temel AWS hizmetlerini güvenlik ve erişim yönetimi için gerekli yapılandırmayla kapsüller. Bu, kamu erişiminin engellenmesi gibi en iyi uygulama yapılandırmalarını içerir. Amazon Basit Depolama Hizmeti (S3) kovalar veya depolanan tüm dosyalar için şifrelemeyi zorunlu kılmak.
- Bazı durumlarda, süreçleri otomatikleştirmek için ML modellerini farklı aşamalarda dağıtmak gibi çeşitli hizmetlere ihtiyaç duyarsınız. Bu nedenle tanımladık Çözümler Farklı görev türleri için ortak bir konfigürasyonda farklı modüllerden oluşan bir paket olarak.
- Ayrıca eksiksiz olarak sunuyoruz blueprints Bir projenin birçok potansiyel ihtiyacını karşılamak için farklı ortamlardaki çözümleri birleştiren. MLOps planımızda, AWS hesaplarına entegre edilen ve dağıtılan ML modellerinin eğitimi, sağlanması ve izlenmesi için dağıtılabilir bir altyapı tanımlıyoruz. Bir sonraki bölümde daha fazla ayrıntıyı tartışacağız.
Bu ürünlerin versiyonları DAP ekibi tarafından merkezi bir depoda bulunur. Bu, IaC'mizi sürekli iyileştirmemize ve AWS'nin aşağıdaki gibi yeni özelliklerini değerlendirmemize olanak tanır: Amazon Adaçayı Yapıcı Modeli Kayıt Defteri. Her ekip bu kaynaklara başvurabilir, bunları gerektiği gibi parametrelendirebilir ve son olarak bunları kendi AWS hesaplarına dağıtabilir.
MLOps Mimarisi
MLOps sürecinin tamamını kapsayacak özel çözümler içeren, kullanıma hazır bir plan sunuyoruz. Plan, makine öğrenimi modellerinin oluşturulması ve dağıtılması için dört AWS hesabına dağıtılan altyapıyı içerir. Bu, MLOps sürecindeki farklı adımlar için kaynakları ve iş akışlarını izole etmemizi sağlar. Aşağıdaki şekil çoklu hesap mimarisini göstermektedir ve sürecin belirli adımlarına ilişkin sorumluluğun farklı teknik roller arasında nasıl bölündüğünü açıklıyoruz.
The Modelleme hesap, ML modellerinin geliştirilmesine yönelik hizmetleri içerir. İlk olarak veri mühendisi, AWS Cloud'daki veri odaklı iş akışları için merkezi ağ geçidi olan SIGNAL IDUNA data lake'ten ilgili verileri sağlamak için bir ETL süreci kullanır. Daha sonra veri seti, veri bilimci tarafından model adaylarını eğitmek ve değerlendirmek için kullanılabilir. Kapsamlı deneylere hazır olan bir model adayı, makine öğrenimi mühendisi tarafından otomatikleştirilmiş bir eğitim hattına entegre edilir. Eğitimi, hiper parametre ayarlamayı ve model değerlendirmeyi geniş ölçekte otomatikleştirmek için Amazon SageMaker Pipelines'ı kullanıyoruz. Bu aynı zamanda model kökenini ve üretime dağıtılmak üzere hazırlanacak modellere yönelik standartlaştırılmış bir onay mekanizmasını da içerir. Otomatik birim testleri ve kod analizi, veri ön işleme, model eğitimi ve değerlendirme gibi ardışık düzenin her adımı için kodun kalitesini ve güvenilirliğini sağlar. Bir model değerlendirilip onaylandıktan sonra, eğitilen modele ve ilgili meta verilere yönelik bir arayüz olarak Amazon SageMaker ModelPackages'ı kullanırız.
The takım hesap, eğitilmiş modellerin test edilmesi ve dağıtılması için farklı aşamalara sahip otomatik CI/CD işlem hatlarını içerir. Test aşamasında modeller uygulamaya yerleştirilir. hizmet-nonprod hesap. Her ne kadar modelin kalitesi, model üretim için hazırlanmadan önce eğitim hattında değerlendirilse de, burada performans ve entegrasyon testlerini izole bir test ortamında yürütüyoruz. Test aşamasını geçtikten sonra modeller uygulamaya yerleştirilir. servis ürünü hesabın üretim iş akışlarına entegre edilmesi.
MLOps iş akışının aşamalarını farklı AWS hesaplarına ayırmak, geliştirme ve testleri üretimden ayırmamıza olanak tanır. Bu nedenle sıkı bir erişim ve güvenlik politikası uygulayabiliriz. Ayrıca, özelleştirilmiş IAM rolleri, belirli hizmetlerin yalnızca kendi kapsamı için gereken verilere ve diğer hizmetlere erişebilmesini sağlar. en az ayrıcalık ilkesi. Hizmet ortamlarındaki hizmetler ayrıca harici iş süreçlerinin erişimine de açılabilir. Örneğin, bir iş süreci, model tahminleri için hizmet veren ürün ortamındaki bir uç noktayı sorgulayabilir.
Yaklaşımımızın Faydaları
Bu sürecin, hem ML modelleri hem de gerekli altyapı için geliştirme ve operasyonun katı bir şekilde ayrılmasıyla karşılaştırıldığında birçok avantajı vardır:
- Izolasyon: Her takım, diğer ekiplerin ortamlarından tamamen izole edilmiş, kendi AWS hesaplarını alır. Bu, erişim haklarını yönetmeyi ve verileri, üzerinde çalışma hakkına sahip olan kişilere özel tutmayı kolaylaştırır.
- Bulut etkinleştirme: Bulut DevOps konusunda önceden çok az deneyimi olan ekip üyeleri (birçok veri bilimci gibi), merkezi bir hizmetin arkasında (neredeyse) hiçbir şey onlardan gizli olmadığından, altyapı tasarlama ve yönetme sürecinin tamamını kolayca izleyebilir. Bu, altyapının daha iyi anlaşılmasını sağlar ve bu da veri bilimi ürünlerini daha verimli bir şekilde oluşturmalarına yardımcı olabilir.
- Ürün Sahipliği: Önceden yapılandırılmış altyapı çözümlerinin ve yönetilen hizmetlerin kullanımı, üretimdeki bir makine öğrenimi ürününü yönetmenin önündeki engelleri çok düşük tutar. Dolayısıyla bir veri bilimci, üretime alınan bir modelin sahipliğini kolaylıkla üstlenebilir. Bu, geliştirme sonrasında bir modelin üretime koyulamamasına ilişkin iyi bilinen riski en aza indirir.
- Yenilikçilik: ML mühendisleri, bir modelin üretime hazır hale gelmesinden çok önce dahil olduklarından, veri bilimcileri bir ML modeli geliştirirken yeni kullanım senaryolarına uygun altyapı çözümleri oluşturabilirler.
- Adapte olabilirlik: DAP tarafından geliştirilen IaC çözümü ücretsiz olarak mevcut olduğundan, herhangi bir ekip bunları kendi kullanım senaryosunun belirli bir ihtiyacını karşılayacak şekilde kolayca uyarlayabilir.
- Açık kaynak: Tüm yeni altyapı çözümleri, merkezi DAP kod deposu üzerinden kolaylıkla diğer ekiplerin kullanımına sunulabilir. Zamanla bu, farklı kullanım senaryolarına göre uyarlanmış altyapı bileşenlerine sahip zengin bir kod tabanı oluşturacaktır.
Özet
Bu yazıda, SIGNAL IDUNA'daki işlevler arası ekiplerin AWS'de makine öğrenimi ürünleri oluşturup çalıştırmasının nasıl mümkün kılındığını gösterdik. Yaklaşımımızın merkezinde, her ekip için özel bir dizi AWS hesabının, özel IaC planları ve çözümleri ile birlikte kullanılması yer alır. Bu iki bileşen, işlevler arası bir ekibin üretim kalitesi altyapısını oluşturmasına ve işletmesine olanak tanır. Buna karşılık, makine öğrenimi ürünlerinin uçtan uca tam sahipliğini alabilirler.
Bakın Amazon SageMaker Model Oluşturma İşlem Hatları – Amazon SageMaker daha fazla öğrenmek için.
Hakkında daha fazla bilgi bul AWS'de makine öğrenimi resmi sayfamızda.
Referanslar
[1] https://www.handelsblatt.com/finanzen/versicherungsbranche-vorbild-spotify-signal-iduna-wird-von-einer-handwerker-versicherung-zum-agilen-konzern/27381902.html
[2] https://blog.crisp.se/wp-content/uploads/2012/11/SpotifyScaling.pdf
[3] https://aws.amazon.com/compliance/shared-responsibility-model/
Yazarlar Hakkında
Jan Paul Assendorp güçlü bir veri bilimi odağına sahip bir makine öğrenimi mühendisidir. ML modelleri oluşturuyor ve model eğitimini ve üretim ortamlarına dağıtımı otomatikleştiriyor.
Thomas Lietzow takımın Veri Analitiği Platformunun Scrum Master'ıdır.
Christopher Masch'ın veri mühendisliği, veri bilimi ve makine öğrenimi mühendisliği konularında bilgi sahibi olan Squad Veri Analitiği Platformu'nun Ürün Sahibidir.
Alexander Meinert Veri Analitiği Platformu ekibinin bir parçası olup ML mühendisi olarak çalışmaktadır. İstatistikle başladı, veri bilimi projeleriyle büyüdü, makine öğrenimi yöntemlerine ve mimarisine tutku duydu.
Dr. Lars Palzer veri bilimcidir ve Veri Analitiği Platformu ekibinin bir parçasıdır. MLOps mimarisi bileşenlerinin oluşturulmasına yardım ettikten sonra bunları artık ML ürünleri oluşturmak için kullanıyor.
Jan Schillemans yazılım mühendisliği geçmişine sahip bir makine öğrenimi mühendisidir. Yazılım mühendisliğinin en iyi uygulamalarını ML ortamlarına (MLOps) uygulamaya odaklanıyor.
- Akıllı para. Avrupa'nın En İyi Bitcoin ve Kripto Borsası.
- Plato blok zinciri. Web3 Metaverse Zekası. Bilgi Güçlendirildi. SERBEST ERİŞİM.
- KriptoHawk. Altcoin Radarı. Ücretsiz deneme.
- Kaynak: https://aws.amazon.com/blogs/machine-learning/how-signal-iduna-operationalizes-machine-learning-projects-on-aws/
- "
- 100
- 2021
- erişim
- Hesap
- karşısında
- Action
- avantajları
- çevik
- Türkiye
- Rağmen
- Amazon
- analiz
- analytics
- Uygulanması
- yaklaşım
- mimari
- Otomatik
- mevcut
- AWS
- olmak
- İYİ
- en iyi uygulamalar
- inşa etmek
- bina
- demet
- iş
- yetenekleri
- durumlarda
- meydan okuma
- bulut
- bulut altyapısı
- kod
- işbirliği
- kombinasyon
- ortak
- şirket
- karşılaştırıldığında
- uyma
- yapılandırma
- içeren
- Oluşturma
- veri
- Veri Analizi
- veri bilimi
- veri bilimcisi
- adanmış
- dağıtmak
- dağıtma
- açılma
- tasarım
- ayrıntı
- geliştirmek
- gelişmiş
- gelişen
- gelişme
- farklı
- tartışmak
- dağıtıldı
- domain
- kolayca
- şifreleme
- Son nokta
- mühendis
- Mühendislik
- Mühendisler
- çevre
- gerekli
- kurmak
- örnek
- deneyim
- HIZLI
- Özellikler
- şekil
- Nihayet
- Ad
- odak
- odaklanmış
- takip etme
- bulundu
- vakıf
- iskelet
- tam
- Goller
- yönetim
- yardım et
- yardımcı olur
- okuyun
- Ne kadar
- HTTPS
- görüntü
- uygulanan
- önemli
- iyileştirmek
- dahil
- bilgi
- Altyapı
- sigorta
- entegre
- bütünleşme
- arayüzey
- Internet
- ilgili
- IT
- anahtar
- bilgi
- büyük
- ÖĞRENİN
- öğrenme
- küçük
- Uzun
- makine
- makine öğrenme
- yönetim
- yönetme
- pazar
- Pazarlama
- Maç
- Üyeler
- Meta
- ML
- model
- modelleri
- modüler
- izleme
- Yeni Özellikler
- Yeni ürünler
- teklif
- resmi
- Onboarding
- işletme
- kuruluşlar
- Diğer
- sahip
- performans
- platform
- politikaları
- politika
- tahmin
- Tahminler
- Önleme
- özel
- süreç
- Süreçler
- PLATFORM
- üretim
- Ürünler
- Programı
- proje
- Projeler
- sağlamak
- halka açık
- Genel bulut
- kalite
- Depo
- gereklidir
- Yer Alan Kurallar
- Kaynaklar
- sorumlu
- yorum
- Risk
- koşmak
- ölçek
- Bilim
- bilim adamı
- bilim adamları
- Ara
- güvenlik
- hizmet
- Hizmetler
- servis
- set
- Paylaşılan
- Basit
- Yazılım
- yazılım Mühendisliği
- Çözümler
- uzmanlaşmış
- geçirmek
- Aşama
- başlama
- başladı
- istatistik
- hafızası
- Stratejileri
- güçlü
- Daha sonra
- destek
- destekli
- çevrili
- görevleri
- takım
- Teknik
- Teknolojileri
- test
- Test yapmak
- testleri
- zaman
- Eğitim
- Dönüşüm
- Şeffaflık
- Güncelleme
- us
- kullanım
- kullanmak
- Sanal
- İzle
- DSÖ
- içinde
- olmadan
- İş
- işgücü
- çalışır