Selle postituse autoriteks on SIGNAL IDUNA Jan Paul Assendorp, Thomas Lietzow, Christopher Masch, Alexander Meinert, dr Lars Palzer ja Jan Schillemans.
SIGNAL IDUNA, suur Saksamaa kindlustusandja, leiutame praegu ümber oma ümberkujundamisprogrammi VISION2023, et muutuda veelgi kliendikesksemaks. Selle ümberkujundamise kesksel kohal on kaks aspekti: suure osa tööjõu ümberkorraldamine funktsionaalseteks ja agiilseteks meeskondadeks ning tõeliselt andmepõhiseks ettevõtteks saamine. Siin on moto "Te loote selle, juhite seda" oluline nõue ristfunktsionaalsele meeskonnale, kes loob andmete või masinõppe (ML) toote. See seab ranged piirangud sellele, kui palju töörühm võib kulutada toote tootmiseks ja käitamiseks.
See postitus näitab, kuidas SIGNAL IDUNA selle väljakutsega toime tuleb ja seda kasutab AWS Cloud võimaldada erinevatel funktsioonidel töötavatel meeskondadel luua ja kasutusele võtta oma ML-tooted. Selleks tutvustame esmalt agiilsete meeskondade organisatsioonilist ülesehitust, mis seab kesksed nõuded toote arendamiseks ja käitamiseks kasutatavale pilvetaristule. Järgmisena näitame, kuidas SIGNAL IDUNA kolm keskset meeskonda võimaldavad ristfunktsionaalsetel meeskondadel luua AWS-pilvesse andmetooteid minimaalse abiga, pakkudes sobivat töövoogu ja taristulahendusi, mida saab hõlpsasti kasutada ja kohandada. Lõpuks vaatame üle oma lähenemise ja võrdleme seda klassikalisema lähenemisega, kus arendus ja toimimine on rangemalt eraldatud.
Agile@SI – organisatsiooniliste muutuste sihtasutus
Alates 2021. aasta algusest on SIGNAL IDUNA asunud ellu viima oma strateegiat Agile@SI ning looma agiilseid meetodeid kliendikesksete lahenduste arendamiseks kogu ettevõtte ulatuses [1]. Varasemaid ülesandeid ja eesmärke täidavad nüüd funktsiooniülesed meeskonnad, nn salgad. Need meeskonnad kasutavad paindlikke meetodeid (nt Scrumi raamistik), teevad ise otsuseid ja loovad kliendile orienteeritud tooteid. Tavaliselt asuvad meeskonnad äriosakondades, näiteks turunduses, ja paljudel on suur rõhk andmepõhiste ja ML-toega toodete loomisel. Näiteks tüüpilisteks kasutusjuhtudeks kindlustuses on klientide vähenemise ennustus ja tootesoovitused.
ML-i keerukuse tõttu on ML-lahenduse loomine ühe meeskonna poolt keeruline ja nõuab seetõttu erinevate rühmade koostööd.
SIGNAL IDUNAL on kolm olulist meeskonda, kes toetavad ML-lahenduste loomist. Nende kolme meeskonna ümber on meeskond, kes vastutab ML-lahenduse arendamise ja pikaajalise toimimise eest. See lähenemisviis järgib AWS jagatud vastutuse mudelit [2].
Ülaltoodud pildil on kõik meeskonnad esindatud ülevaates.
Pilve lubamine
Kogu organisatsiooni pilvepõhise infrastruktuuri tagab meeskond Cloud Enablement. Nende ülesanne on võimaldada meeskondadel iseseisvalt pilvetehnoloogiate baasil tooteid ehitada. See pikendab uute toodete (nt ML) turuletoomiseks kuluvat aega ja järgib põhimõtet „Sa ehitad selle, juhid seda”.
Andmebüroo/Data Lake
Andmete pilve teisaldamist ja õige andmestiku leidmist toetab meeskond Data Office/Data Lake. Nad loovad andmekataloogi, mida saab kasutada vajalike andmekogumite otsimiseks ja valimiseks. Nende eesmärk on luua andmete läbipaistvus ja juhtimine. Lisaks vastutavad nad Data Lake'i loomise ja käitamise eest, mis aitab meeskondadel asjakohastele andmetele juurde pääseda ja neid töödelda.
Andmeanalüüsi platvorm
Meie meeskonna andmeanalüüsi platvorm (DAP) on SIGNAL IDUNA pilvele ja ML-le keskendunud meeskond, kes valdab nii ML-i inseneri, andmetehnika kui ka andmeteadust. Võimaldame sisemised meeskonnad kasutada avalikku pilve ML jaoks, pakkudes infrastruktuuri komponente ja teadmisi. Meie tooteid ja teenuseid tutvustatakse üksikasjalikult järgmises jaotises.
Funktsionaalsete meeskondade võimaldamine ML-lahenduste loomiseks
Selleks, et SIGNAL IDUNA ristfunktsionaalsed meeskonnad saaksid luua ML-lahendusi, vajame kiiret ja mitmekülgset viisi korduvkasutatava pilveinfrastruktuuri pakkumiseks ning tõhusat töövoogu liitumismeeskondadele pilvevõimaluste kasutamiseks.
Selleks lõime standardiseeritud liitumis- ja tugiprotsessi ning pakkusime modulaarseid infrastruktuurimalle nimega Infrastructure as Code (IaC). Need mallid sisaldavad tavaliste ML-i kasutusjuhtude jaoks loodud infrastruktuuri komponente, mida saab hõlpsasti kohandada konkreetse kasutusjuhtumi nõuetega.
ML-lahenduste ehitamise töövoog
ML-lahenduste loomisel ja käitamisel on kolm peamist tehnilist rolli: andmeteadlane, ML-insener ja andmeinsener. Iga roll on osa funktsionaalsest meeskonnast ja sellel on erinevad kohustused. Andmeteadlasel on vajalikud valdkonnateadmised kasutusjuhtumi funktsionaalsete ja tehniliste nõuete kohta. ML-i insener on spetsialiseerunud automatiseeritud ML-lahenduste loomisele ja mudelite juurutamisele. Andmeinsener hoolitseb selle eest, et andmed liiguksid kohapeal ja pilves.
Platvormi pakkumise protsess on järgmine:
Konkreetse kasutusjuhtumi infrastruktuur on määratletud IaC-s ja versioonid keskses projektihoidlas. See hõlmab ka mudelite väljaõppe ja juurutamise torujuhtmeid ning muid andmeteadusega seotud koodiartefakte. Andmeteadlastel, ML-i inseneridel ja andmeinseneridel on juurdepääs projektihoidlale ning nad saavad kogu infrastruktuuri koodi autonoomselt konfigureerida ja värskendada. See võimaldab meeskonnal vajadusel infrastruktuuri kiiresti muuta. ML-i insener saab aga alati toetada infrastruktuuri või ML-mudelite arendamist ja uuendamist.
Korduvkasutatavad ja modulaarsed infrastruktuuri komponendid
Hierarhilised ja modulaarsed IaC-ressursid on rakendatud Terraform ning hõlmab tavapäraste andmeteaduse ja ETL-i kasutusjuhtude infrastruktuuri. See võimaldab meil infrastruktuuri koodi uuesti kasutada ning jõustada nõutavad turbe- ja vastavuspoliitikad, näiteks kasutamine AWS-i võtmehaldusteenus (KMS) andmete krüpteerimine ja infrastruktuuri kapseldamine Amazoni virtuaalne privaatpilv (VPC) ilma otsese Interneti-juurdepääsuta keskkondades.
IaC hierarhiline struktuur on järgmine:
- Moodulid kapseldada AWS-i põhiteenused vajaliku konfiguratsiooniga turvalisuse ja juurdepääsu haldamiseks. See hõlmab parimate tavade konfiguratsioone, näiteks avalikkuse juurdepääsu takistamist Amazon Simple Storage Service (S3) ämbritesse või kõigi salvestatud failide krüptimise jõustamine.
- Mõnel juhul vajate protsesside automatiseerimiseks mitmesuguseid teenuseid, näiteks ML-mudelite juurutamiseks erinevates etappides. Seetõttu määratlesime Lahendused erinevate moodulite kogumina ühises konfiguratsioonis erinevat tüüpi ülesannete jaoks.
- Lisaks pakume komplektset joonised mis ühendavad lahendusi erinevates keskkondades, et rahuldada projekti paljusid potentsiaalseid vajadusi. Meie MLOpsi kavandis määratleme juurutatava infrastruktuuri koolituse, varustamise ja ML-mudelite jälgimiseks, mis on integreeritud ja levitatud AWS-i kontodele. Lisateavet käsitleme järgmises jaotises.
Nende toodete versioonid on keskses hoidlas DAP meeskonna poolt. See võimaldab meil oma IaC-d pidevalt täiustada ja kaaluda AWS-i uusi funktsioone, nagu Amazon SageMaker Mudeli register. Iga meeskond saab nendele ressurssidele viidata, neid vastavalt vajadusele parameetreid määrata ja lõpuks oma AWS-i kontodele juurutada.
MLOps arhitektuur
Pakume kasutusvalmis konkreetsete lahendustega kavandit, mis katab kogu MLOps-protsessi. Plaan sisaldab infrastruktuuri, mis on jagatud nelja AWS-konto vahel ML-mudelite loomiseks ja juurutamiseks. See võimaldab meil eraldada ressursid ja töövood MLOps-protsessi erinevate etappide jaoks. Järgmisel joonisel on kujutatud mitme konto arhitektuur ja me kirjeldame, kuidas vastutus protsessi konkreetsete etappide eest jaguneb erinevate tehniliste rollide vahel.
. modelleerimine konto sisaldab teenuseid ML mudelite arendamiseks. Esiteks kasutab andmeinsener ETL-protsessi, et pakkuda asjakohaseid andmeid SIGNAL IDUNA andmejärvest, mis on AWS-i pilve andmepõhiste töövoogude tsentraliseeritud lüüs. Seejärel saab andmeteadlane andmestikku kasutada mudelikandidaatide koolitamiseks ja hindamiseks. Olles valmis ulatuslikeks katseteks, integreerib ML-i insener mudelikandidaadi automatiseeritud koolitustorusse. Kasutame Amazon SageMakeri torujuhtmeid koolituse, hüperparameetrite häälestamise ja mudeli hindamise mastaabis automatiseerimiseks. See hõlmab ka mudelite päritolu ja standardiseeritud heakskiitmismehhanismi mudelitele, mis tuleb tootmisse kasutusele võtta. Automatiseeritud ühikutestid ja koodianalüüs tagavad koodi kvaliteedi ja usaldusväärsuse konveieri iga etapi jaoks, nagu andmete eeltöötlus, mudelikoolitus ja hindamine. Kui mudel on hinnatud ja heaks kiidetud, kasutame Amazon SageMaker ModelPackagesi liidesena koolitatud mudeli ja asjakohaste metaandmetega.
. instrumentaarium konto sisaldab erinevate etappidega automatiseeritud CI/CD torujuhtmeid koolitatud mudelite testimiseks ja juurutamiseks. Katsefaasis võetakse mudelid kasutusele teenindav-mittetoodetav konto. Kuigi mudeli kvaliteeti hinnatakse koolituse käigus enne mudeli tootmist lavale toomist, teostame siin jõudlus- ja integratsiooniteste isoleeritud testimiskeskkonnas. Pärast testimisetapi läbimist võetakse mudelid kasutusele serveerimistoode konto integreerida tootmise töövoogudesse.
MLOps-i töövoo etappide eraldamine erinevateks AWS-i kontodeks võimaldab meil eraldada arenduse ja testimise tootmisest. Seetõttu saame jõustada range juurdepääsu- ja turvapoliitika. Lisaks tagavad kohandatud IAM-rollid, et konkreetsed teenused pääsevad juurde ainult andmetele ja muudele teenustele, mis on nende ulatuse jaoks vajalikud, järgides vähima privileegi põhimõte. Teeninduskeskkondades olevad teenused saab lisaks teha juurdepääsetavaks välistele äriprotsessidele. Näiteks võib äriprotsess teha mudeliprognooside jaoks päringu serving-produkti keskkonna lõpp-punktist.
Meie lähenemisviisi eelised
Sellel protsessil on palju eeliseid, võrreldes nii ML-mudelite kui ka vajaliku infrastruktuuri arendamise ja kasutamise range eraldamisega:
- Isolatsioon: iga meeskond saab oma AWS-i kontode komplekti, mis on täielikult isoleeritud teiste meeskondade keskkondadest. See muudab juurdepääsuõiguste haldamise ja andmete privaatsuse hoidmise lihtsaks neile, kellel on õigus nendega töötada.
- Pilve lubamine: Meeskonnaliikmed, kellel on vähe varasemaid pilve DevOpsi kogemusi (näiteks paljud andmeteadlased), saavad hõlpsalt jälgida kogu infrastruktuuri kavandamise ja haldamise protsessi, kuna keskteenuse taga pole nende eest (peaaegu) midagi peidus. See loob parema arusaama infrastruktuurist, mis omakorda võib aidata neil tõhusamalt luua andmeteaduslikke tooteid.
- Toote omandiõigus: Eelkonfigureeritud taristulahenduste ja hallatavate teenuste kasutamine hoiab ML-toote haldamise takistuse tootmises väga madalal. Seetõttu saab andmeteadlane hõlpsasti tootmisse pandud mudeli omanikuks saada. See minimeerib teadaoleva riski, et mudelit ei õnnestu pärast arendust tootmisse viia.
- Innovatsioon: Kuna ML-insenerid on kaasatud juba ammu enne, kui mudel on tootmisse valmis, saavad nad luua uuteks kasutusjuhtudeks sobivaid taristulahendusi, samal ajal kui andmeteadlased arendavad ML-mudelit.
- Kohanemisvõime: Kuna DAP-i väljatöötatud IaC-lahendus on vabalt saadaval, saab iga meeskond neid hõlpsalt kohandada vastavalt nende kasutusjuhtumitele.
- Avatud lähtekoodiga: Kõik uued taristulahendused saab hõlpsasti kättesaadavaks teha keskse DAP-koodi repo kaudu, et seda saaksid kasutada teised meeskonnad. Aja jooksul loob see rikkaliku koodibaasi infrastruktuurikomponentidega, mis on kohandatud erinevatele kasutusjuhtudele.
kokkuvõte
Selles postituses illustreerisime, kuidas SIGNAL IDUNA ristfunktsionaalsetel meeskondadel lubatakse AWS-is ML-tooteid luua ja käitada. Meie lähenemisviisi keskmes on iga meeskonna jaoks spetsiaalse AWS-kontode komplekti kasutamine koos kohandatud IaC-plaanide ja lahendustega. Need kaks komponenti võimaldavad ristfunktsionaalsel meeskonnal luua ja kasutada tootmiskvaliteedi infrastruktuuri. Nad võivad omakorda võtta oma ML-toodete täieliku omandiõiguse.
Viitama Amazon SageMakeri mudeli ehitamise torujuhtmed – Amazon SageMaker rohkem teada saada.
Lisainformatsiooni leiad siit ML AWS-is meie ametlikul lehel.
viited
[1] https://www.handelsblatt.com/finanzen/versicherungsbranche-vorbild-spotify-signal-iduna-wird-von-einer-handwerker-versicherung-zum-agilen-konzern/27381902.html
[2] https://blog.crisp.se/wp-content/uploads/2012/11/SpotifyScaling.pdf
[3] https://aws.amazon.com/compliance/shared-responsibility-model/
Autoritest
Jan Paul Assendorp on ML-i insener, kellel on tugev andmeteaduse fookus. Ta ehitab ML-mudeleid ning automatiseerib mudelikoolitust ja tootmiskeskkondadesse juurutamist.
Thomas Lietzow on meeskonna andmeanalüüsi platvormi Scrum Master.
Christopher Masch on andmeanalüüsi platvormi tooteomanik, kellel on teadmised andmetehnika, andmeteaduse ja ML-inseneri alal.
Aleksander Meinert on osa Data Analytics Platformi meeskonnast ja töötab ML-insenerina. Alustas statistikaga, kasvas välja andmeteaduse projektidega, leidis kirge ML meetodite ja arhitektuuri vastu.
Dr Lars Palzer on andmeteadlane ja osa Data Analytics Platformi meeskonnast. Pärast MLOps-i arhitektuurikomponentide loomisel abistamist kasutab ta neid nüüd ML-toodete ehitamiseks.
Jan Schillemans on tarkvarainseneri taustaga ML-insener. Ta keskendub tarkvaratehnika parimate tavade rakendamisele ML keskkondades (MLOps).
- Münditark. Euroopa parim Bitcoini ja krüptobörs.
- Platoblockchain. Web3 metaversiooni intelligentsus. Täiustatud teadmised. TASUTA PÄÄS.
- CryptoHawk. Altcoini radar. Tasuta prooviversioon.
- Allikas: https://aws.amazon.com/blogs/machine-learning/how-signal-iduna-operationalizes-machine-learning-projects-on-aws/
- "
- 100
- 2021
- juurdepääs
- konto
- üle
- tegevus
- eelised
- väle
- Materjal: BPA ja flataatide vaba plastik
- Kuigi
- Amazon
- analüüs
- analytics
- Rakendades
- lähenemine
- arhitektuur
- Automatiseeritud
- saadaval
- AWS
- on
- BEST
- parimaid tavasid
- ehitama
- Ehitus
- Kimp
- äri
- võimeid
- juhtudel
- väljakutse
- Cloud
- pilve infrastruktuur
- kood
- koostöö
- kombinatsioon
- ühine
- ettevõte
- võrreldes
- Vastavus
- konfiguratsioon
- sisaldab
- loomine
- andmed
- Andmete analüüs
- andmeteadus
- andmeteadlane
- pühendunud
- juurutada
- juurutamine
- kasutuselevõtu
- projekteerimine
- detail
- arendama
- arenenud
- arenev
- & Tarkvaraarendus
- erinev
- arutama
- jagatud
- domeen
- kergesti
- krüpteerimist
- Lõpp-punkt
- insener
- Inseneriteadus
- Inseneride
- keskkond
- oluline
- looma
- näide
- kogemus
- KIIRE
- FUNKTSIOONID
- Joonis
- Lõpuks
- esimene
- Keskenduma
- keskendunud
- Järel
- avastatud
- Sihtasutus
- Raamistik
- täis
- Eesmärgid
- valitsemistava
- aitama
- aitab
- siin
- Kuidas
- HTTPS
- pilt
- rakendatud
- oluline
- parandama
- sisaldama
- info
- Infrastruktuur
- kindlustus
- integreeritud
- integratsioon
- Interface
- Internet
- seotud
- IT
- Võti
- teadmised
- suur
- Õppida
- õppimine
- vähe
- Pikk
- masin
- masinõpe
- juhtimine
- juhtiv
- Turg
- Turundus
- Vastama
- liikmed
- Meta
- ML
- mudel
- mudelid
- modulaarne
- järelevalve
- Uued funktsioonid
- uute toodete
- pakkuma
- ametlik
- Pardal
- tegutsevad
- organisatsioon
- Muu
- omanik
- jõudlus
- inimesele
- Poliitika
- poliitika
- ennustus
- Ennustused
- Ennetamine
- era-
- protsess
- Protsessid
- Toode
- Produktsioon
- Toodet
- Programm
- projekt
- projektid
- anda
- avalik
- Avalik pilv
- kvaliteet
- Hoidla
- nõutav
- Nõuded
- Vahendid
- vastutav
- läbi
- Oht
- jooks
- Skaala
- teadus
- teadlane
- teadlased
- Otsing
- turvalisus
- teenus
- Teenused
- teenindavad
- komplekt
- jagatud
- lihtne
- tarkvara
- tarkvaraarendus
- Lahendused
- spetsialiseerunud
- kulutama
- Stage
- algus
- alustatud
- statistika
- ladustamine
- Strateegia
- tugev
- Järgnevalt
- toetama
- Toetatud
- ümbritsetud
- ülesanded
- meeskond
- Tehniline
- Tehnoloogiad
- test
- Testimine
- testid
- aeg
- koolitus
- Transformation
- läbipaistvus
- Värskendused
- us
- kasutama
- ära kasutama
- virtuaalne
- Watch
- WHO
- jooksul
- ilma
- Töö
- Tööjõud
- töötab