چگونه SIGNAL IDUNA پروژه های یادگیری ماشین را در AWS عملیاتی می کند

بازنشر افلاطون

دنبال: 0

این پست با یان پل آسندورپ، توماس لیتزو، کریستوفر ماش، الکساندر ماینرت، دکتر لارس پالزر، یان شیلمنز از SIGNAL IDUNA نوشته شده است.

در SIGNAL IDUNA، یک شرکت بیمه بزرگ آلمانی، ما در حال حاضر با برنامه تحول VISION2023 خود را دوباره اختراع می کنیم تا حتی بیشتر مشتری مدار شویم. دو جنبه برای این تحول مهم است: سازماندهی مجدد بخش های بزرگی از نیروی کار به تیم های متقابل عملکردی و چابک و تبدیل شدن به یک شرکت واقعاً مبتنی بر داده. در اینجا، شعار "شما آن را می سازید، شما آن را اجرا می کنید" یک نیاز مهم برای یک تیم متقابل است که یک محصول داده یا یادگیری ماشین (ML) می سازد. این محدودیت‌های شدیدی را در مورد میزان هزینه‌های تیم کاری برای تولید و اجرای یک محصول ایجاد می‌کند.

این پست نشان می دهد که چگونه SIGNAL IDUNA با این چالش مقابله می کند و از آن استفاده می کند AWS ابر برای فعال کردن تیم های متقابل برای ساخت و عملیاتی کردن محصولات ML خود. برای این منظور، ابتدا ساختار سازمانی تیم‌های چابک را معرفی می‌کنیم که الزامات اصلی زیرساخت ابری مورد استفاده برای توسعه و اجرای یک محصول را تعیین می‌کند. در مرحله بعد، نشان می‌دهیم که چگونه سه تیم مرکزی در SIGNAL IDUNA، با ارائه یک گردش کار مناسب و راه‌حل‌های زیرساختی که به راحتی قابل استفاده و تطبیق است، به تیم‌های متقابل امکان می‌دهند تا محصولات داده را در AWS Cloud با حداقل کمک بسازند. در نهایت، ما رویکرد خود را بررسی می‌کنیم و آن را با رویکرد کلاسیک‌تری مقایسه می‌کنیم که در آن توسعه و بهره‌برداری دقیق‌تر از هم جدا شده‌اند.

Agile@SI - بنیاد تغییر سازمانی

از آغاز سال 2021، SIGNAL IDUNA شروع به اجرای استراتژی Agile@SI و ایجاد روش های چابک برای توسعه راه حل های مشتری مدار در کل شرکت کرده است [1]. وظایف و اهداف قبلی اکنون توسط تیم های متقابل انجام می شود که نامیده می شود جوخه ها. این گروه‌ها از روش‌های چابک (مانند چارچوب اسکرام) استفاده می‌کنند، تصمیمات خود را می‌گیرند و محصولات مشتری‌مدار می‌سازند. به طور معمول، جوخه ها در بخش های تجاری مانند بازاریابی قرار دارند و بسیاری از آنها تاکید زیادی بر ساخت محصولات مبتنی بر داده و ML دارند. به عنوان مثال، موارد استفاده معمول در بیمه، پیش‌بینی ریزش مشتری و توصیه محصول است.

با توجه به پیچیدگی ML، ایجاد یک راه حل ML توسط یک تیم چالش برانگیز است و بنابراین نیاز به همکاری گروه های مختلف دارد.

SIGNAL IDUNA دارای سه تیم ضروری است که از ایجاد راه حل های ML پشتیبانی می کنند. احاطه شده توسط این سه تیم تیمی است که مسئولیت توسعه و عملیات طولانی مدت و راه حل ML را بر عهده دارد. این رویکرد از مدل مسئولیت مشترک AWS پیروی می کند [2].

در تصویر بالا، تمام تیم‌ها به صورت کلی نشان داده شده‌اند.

فعال سازی ابر

زیرساخت ابری زیربنایی برای کل سازمان توسط Squad Cloud Enablement ارائه می شود. وظیفه آنها این است که تیم ها را قادر سازند تا محصولات خود را بر اساس فناوری های ابری بسازند. این باعث بهبود زمان برای بازاریابی ساخت محصولات جدید مانند ML می شود و از اصل "شما آن را می سازید، اجرا می کنید" پیروی می کند.

دفتر داده / دریاچه داده

انتقال داده ها به فضای ابری و همچنین یافتن مجموعه داده مناسب، توسط گروه Data Office/Data Lake پشتیبانی می شود. آنها یک کاتالوگ داده تنظیم می کنند که می تواند برای جستجو و انتخاب مجموعه داده های مورد نیاز استفاده شود. هدف آنها ایجاد شفافیت داده ها و حاکمیت است. علاوه بر این، آنها مسئول ایجاد و راه اندازی یک دریاچه داده هستند که به تیم ها برای دسترسی و پردازش داده های مربوطه کمک می کند.

پلتفرم تجزیه و تحلیل داده ها

پلتفرم تجزیه و تحلیل داده های تیم ما (DAP) یک تیم متمرکز بر ابر و ML در SIGNAL IDUNA است که در مهندسی ML، مهندسی داده و همچنین علم داده مهارت دارد. ما با ارائه مؤلفه‌های زیرساخت و دانش، تیم‌های داخلی را با استفاده از ابر عمومی برای ML فعال می‌کنیم. محصولات و خدمات ما به تفصیل در بخش زیر ارائه شده است.

توانمندسازی تیم های متقابل برای ایجاد راه حل های ML

برای فعال کردن تیم‌های متقابل در SIGNAL IDUNA برای ساخت راه‌حل‌های ML، ما به یک راه سریع و همه‌کاره برای ارائه زیرساخت ابری قابل استفاده مجدد و همچنین یک گردش کار کارآمد برای تیم‌های سوارکار برای استفاده از قابلیت‌های ابری نیاز داریم.

برای این منظور، ما یک فرآیند نصب و پشتیبانی استاندارد ایجاد کردیم و الگوهای زیرساخت مدولار را به عنوان Infrastructure as Code (IaC) ارائه کردیم. این الگوها شامل اجزای زیرساختی هستند که برای موارد استفاده رایج ML طراحی شده‌اند که می‌توانند به راحتی با نیازهای یک مورد خاص سازگار شوند.

گردش کار ساخت راه حل های ML

سه نقش فنی اصلی در ساخت و اجرای راه حل های ML وجود دارد: دانشمند داده، مهندس ML و مهندس داده. هر نقش بخشی از تیم متقابل است و مسئولیت های متفاوتی دارد. دانشمند داده دانش حوزه مورد نیاز در مورد الزامات کاربردی و همچنین فنی مورد استفاده را دارد. مهندس ML در ساخت راه حل های خودکار ML و استقرار مدل تخصص دارد. و مهندس داده اطمینان حاصل می کند که داده ها از داخل محل و در فضای ابری جریان دارند.

روند تهیه پلتفرم به شرح زیر است:

زیرساخت مورد استفاده خاص در IaC تعریف شده و در یک مخزن پروژه مرکزی نسخه شده است. این همچنین شامل خطوط لوله برای آموزش و استقرار مدل، و همچنین سایر مصنوعات کد مرتبط با علم داده است. دانشمندان داده، مهندسان ML و مهندسان داده به مخزن پروژه دسترسی دارند و می توانند تمام کد زیرساخت را به طور مستقل پیکربندی و به روز کنند. این تیم را قادر می سازد تا در صورت نیاز به سرعت زیرساخت را تغییر دهد. با این حال، مهندس ML همیشه می تواند در توسعه و به روز رسانی زیرساخت ها یا مدل های ML پشتیبانی کند.

اجزای زیرساخت قابل استفاده مجدد و مدولار

منابع IaC سلسله مراتبی و مدولار در پیاده سازی می شوند Terraform و شامل زیرساخت های رایج علوم داده و موارد استفاده ETL می شود. این به ما امکان می دهد از کد زیرساخت مجدد استفاده کنیم و سیاست های امنیتی و انطباق مورد نیاز مانند استفاده را اعمال کنیم سرویس مدیریت کلید AWS (KMS) رمزگذاری برای داده ها، و همچنین کپسوله کردن زیرساخت در ابر خصوصی مجازی آمازون (VPC) محیط های بدون دسترسی مستقیم به اینترنت

ساختار IaC سلسله مراتبی به شرح زیر است:

ماژول ها خدمات پایه AWS را با پیکربندی مورد نیاز برای مدیریت امنیت و دسترسی محصور کنید. این شامل پیکربندی‌های بهترین عملکرد مانند جلوگیری از دسترسی عمومی به آن می‌شود سرویس ذخیره سازی ساده آمازون (S3) سطل، یا اعمال رمزگذاری برای همه فایل های ذخیره شده.
در برخی موارد، برای خودکارسازی فرآیندها به خدمات مختلفی نیاز دارید، مانند استقرار مدل‌های ML در مراحل مختلف. بنابراین ما تعریف کردیم مزایا به عنوان بسته ای از ماژول های مختلف در یک پیکربندی مشترک برای انواع مختلف وظایف.
علاوه بر این، ما کامل ارائه می دهیم نقشه که ترکیبی از راه حل ها در محیط های مختلف برای پاسخگویی به بسیاری از نیازهای بالقوه یک پروژه است. در طرح MLOps خود، یک زیرساخت قابل استقرار برای آموزش، تهیه و نظارت بر مدل‌های ML تعریف می‌کنیم که در حساب‌های AWS یکپارچه و توزیع می‌شوند. جزئیات بیشتر را در بخش بعدی مورد بحث قرار می دهیم.

این محصولات در یک مخزن مرکزی توسط تیم DAP نسخه شده اند. این به ما امکان می دهد به طور مداوم IaC خود را بهبود بخشیم و ویژگی های جدید AWS را در نظر بگیریم، مانند آمازون SageMaker رجیستری مدل هر تیم می تواند به این منابع رجوع کند، آنها را در صورت نیاز پارامتربندی کند و در نهایت آنها را در حساب های AWS خود مستقر کند.

معماری MLOps

ما یک طرح اولیه آماده با راه حل های خاص برای پوشش کل فرآیند MLOps ارائه می دهیم. طرح شامل زیرساختی است که در چهار حساب AWS برای ساخت و استقرار مدل‌های ML توزیع شده است. این به ما امکان می دهد منابع و گردش کار را برای مراحل مختلف در فرآیند MLOps جدا کنیم. شکل زیر معماری چند حسابی را نشان می‌دهد و توضیح می‌دهیم که چگونه مسئولیت مراحل خاص فرآیند بین نقش‌های فنی مختلف تقسیم می‌شود.

La مدل سازی حساب شامل خدماتی برای توسعه مدل های ML می شود. ابتدا، مهندس داده از یک فرآیند ETL برای ارائه داده های مرتبط از دریاچه داده SIGNAL IDUNA، دروازه متمرکز برای گردش های کاری مبتنی بر داده در AWS Cloud استفاده می کند. متعاقباً، مجموعه داده می تواند توسط دانشمند داده برای آموزش و ارزیابی نامزدهای مدل مورد استفاده قرار گیرد. پس از آماده شدن برای آزمایش‌های گسترده، یک نامزد مدل توسط مهندس ML در یک خط لوله آموزشی خودکار ادغام می‌شود. ما از Amazon SageMaker Pipelines برای خودکارسازی آموزش، تنظیم فراپارامتر و ارزیابی مدل در مقیاس استفاده می کنیم. این همچنین شامل اصل و نسب مدل و مکانیزم تأیید استاندارد برای مدل‌هایی است که باید برای استقرار در تولید مرحله‌بندی شوند. تست های واحد خودکار و تجزیه و تحلیل کد، کیفیت و قابلیت اطمینان کد را برای هر مرحله از خط لوله، مانند پیش پردازش داده ها، آموزش مدل، و ارزیابی تضمین می کند. هنگامی که یک مدل ارزیابی و تایید شد، ما از Amazon SageMaker ModelPackages به عنوان رابطی برای مدل آموزش دیده و متا داده های مربوطه استفاده می کنیم.

La تجهیز حساب شامل خطوط لوله CI/CD خودکار با مراحل مختلف برای آزمایش و استقرار مدل های آموزش دیده است. در مرحله آزمایش، مدل‌ها در خدمت-غیر تولیدی حساب. اگرچه کیفیت مدل در خط لوله آموزشی قبل از مرحله‌بندی مدل برای تولید ارزیابی می‌شود، در اینجا ما تست‌های عملکرد و یکپارچه‌سازی را در یک محیط آزمایش ایزوله اجرا می‌کنیم. پس از گذراندن مرحله آزمایش، مدل‌ها در داخل آن مستقر می‌شوند خدمت- تولید حساب باید در جریان کار تولید ادغام شود.

جداسازی مراحل گردش کار MLOps به حساب های مختلف AWS به ما امکان می دهد توسعه و آزمایش را از تولید جدا کنیم. بنابراین، ما می توانیم یک سیاست دسترسی و امنیت سختگیرانه را اعمال کنیم. علاوه بر این، نقش‌های اختصاصی IAM تضمین می‌کند که سرویس‌های خاص فقط می‌توانند به داده‌ها و سایر خدمات مورد نیاز برای محدوده آن دسترسی داشته باشند، به دنبال اصل حداقل امتیاز. علاوه بر این، خدمات در محیط‌های خدماتی می‌توانند برای فرآیندهای تجاری خارجی قابل دسترسی باشند. به عنوان مثال، یک فرآیند تجاری می تواند یک نقطه پایانی را در محیط سرویس-prod برای پیش بینی مدل جستجو کند.

مزایای رویکرد ما

این فرآیند در مقایسه با جداسازی دقیق توسعه و عملیات برای هر دو مدل ML و همچنین زیرساخت مورد نیاز، مزایای زیادی دارد:

انزوا: هر تیم مجموعه ای از حساب های AWS خود را دریافت می کند که کاملاً از محیط های تیم های دیگر جدا شده است. این امر مدیریت حقوق دسترسی و خصوصی نگه داشتن داده ها را برای کسانی که حق کار با آن را دارند آسان می کند.
فعال سازی ابر: اعضای تیم با تجربه قبلی کمی در توسعه‌دهندگان ابری (مانند بسیاری از دانشمندان داده) می‌توانند به راحتی کل فرآیند طراحی و مدیریت زیرساخت را تماشا کنند زیرا (تقریباً) هیچ چیز از آنها در پشت یک سرویس مرکزی پنهان نیست. این امر درک بهتری از زیرساخت ایجاد می کند، که به نوبه خود می تواند به آنها کمک کند تا محصولات علم داده را کارآمدتر ایجاد کنند.
مالکیت محصول: استفاده از راه حل های زیرساختی از پیش پیکربندی شده و خدمات مدیریت شده مانع مدیریت یک محصول ML در تولید را بسیار کم نگه می دارد. بنابراین، یک دانشمند داده می‌تواند به راحتی مالکیت مدلی را که در مرحله تولید قرار می‌گیرد، در اختیار بگیرد. این امر خطر شناخته شده شکست در تولید یک مدل پس از توسعه را به حداقل می رساند.
ابداع: از آنجایی که مهندسان ML مدت ها قبل از آماده شدن یک مدل برای تولید درگیر هستند، می توانند راه حل های زیرساختی مناسب برای موارد استفاده جدید ایجاد کنند در حالی که دانشمندان داده یک مدل ML را توسعه می دهند.
سازگاری: از آنجایی که راه حل های IaC توسعه یافته توسط DAP به صورت رایگان در دسترس هستند، هر تیمی می تواند به راحتی آنها را برای مطابقت با یک نیاز خاص برای مورد استفاده خود تطبیق دهد.
منبع باز: تمام راه حل های زیرساختی جدید را می توان به راحتی از طریق مخزن کد DAP مرکزی برای استفاده توسط سایر تیم ها در دسترس قرار داد. با گذشت زمان، این یک پایگاه کد غنی با اجزای زیرساختی متناسب با موارد استفاده مختلف ایجاد می کند.

خلاصه

در این پست، ما نشان دادیم که چگونه تیم‌های چندکاره در SIGNAL IDUNA برای ساخت و اجرای محصولات ML در AWS فعال می‌شوند. مرکز رویکرد ما، استفاده از مجموعه ای اختصاصی از حساب های AWS برای هر تیم در ترکیب با طرح ها و راه حل های سفارشی IaC است. این دو مولفه یک تیم متقابل را قادر می سازد تا زیرساخت کیفیت تولید را ایجاد و راه اندازی کند. به نوبه خود، آنها می توانند مالکیت کامل انتها به انتها محصولات ML خود را در اختیار بگیرند.

به مراجعه خطوط لوله ساختمان مدل SageMaker Amazon – Amazon SageMaker برای کسب اطلاعات بیشتر.

اطلاعات بیشتر در مورد ML در AWS در صفحه رسمی ما

منابع

[1] https://www.handelsblatt.com/finanzen/versicherungsbranche-vorbild-spotify-signal-iduna-wird-von-einer-handwerker-versicherung-zum-agilen-konzern/27381902.html

[2] https://blog.crisp.se/wp-content/uploads/2012/11/SpotifyScaling.pdf

[3] https://aws.amazon.com/compliance/shared-responsibility-model/

درباره نویسنده

یان پل آسندورپ یک مهندس ML با تمرکز قوی در علم داده است. او مدل‌های ML را می‌سازد و آموزش مدل و استقرار در محیط‌های تولید را خودکار می‌کند.

توماس لیتزو اسکرام مستر پلتفرم تجزیه و تحلیل داده های تیم است.

کریستوفر ماش مالک محصول پلتفرم تجزیه و تحلیل داده های تیم با دانش در مهندسی داده، علم داده و مهندسی ML است.

الکساندر ماینرت بخشی از تیم Data Analytics Platform است و به عنوان مهندس ML کار می کند. با آمار شروع شد، در پروژه های علم داده رشد کرد، اشتیاق به روش ها و معماری ML پیدا کرد.

دکتر لارس پالزر یک دانشمند داده و بخشی از تیم Data Analytics Platform است. او پس از کمک به ساخت اجزای معماری MLOps، اکنون از آنها برای ساخت محصولات ML استفاده می کند.

یان شیلمانز یک مهندس ML با سابقه مهندسی نرم افزار است. او بر روی استفاده از بهترین شیوه های مهندسی نرم افزار در محیط های ML (MLOps) تمرکز می کند.

تمبر زمان: فوریه 16، 2022

تمبر زمان: اکتبر 14، 2022

چگونه JPMorgan Chase & Co از رویدادهای AWS DeepRacer برای هدایت پذیرش جهانی ابر استفاده می کند

خوشه منبع:

آموزش ماشین AWS

گره منبع: 1761091

تمبر زمان: نوامبر 23، 2022

با استفاده از Amazon SageMaker JumpStart، تصاویر را با Stable Diffusion نقاشی کنید

خوشه منبع:

آموزش ماشین AWS

گره منبع: 1823628

تمبر زمان: آوریل 10، 2023

چگونه SIGNAL IDUNA پروژه های یادگیری ماشین را در AWS عملیاتی می کند

بازنشر افلاطون

Agile@SI - بنیاد تغییر سازمانی

فعال سازی ابر

دفتر داده / دریاچه داده

پلتفرم تجزیه و تحلیل داده ها

توانمندسازی تیم های متقابل برای ایجاد راه حل های ML

گردش کار ساخت راه حل های ML

اجزای زیرساخت قابل استفاده مجدد و مدولار

معماری MLOps

مزایای رویکرد ما

خلاصه

منابع

درباره نویسنده

بیشتر از آموزش ماشین AWS

محتوای Dropbox خود را با استفاده از رابط Dropbox برای Amazon Kendra فهرست کنید

توصیه های خود را با تبلیغ موارد خاص با استفاده از قوانین تجاری با Amazon Personalize سفارشی کنید

Amazon SageMaker Automatic Model Tuning اکنون تا سه برابر سریع‌تر تنظیم Hyperparameter را با Hyperband ارائه می‌کند

ویژگی های متن چند زبانه را در آمازون نپتون برای آموزش مدل های پیش بینی کدگذاری کنید

چگونه JPMorgan Chase & Co از رویدادهای AWS DeepRacer برای هدایت پذیرش جهانی ابر استفاده می کند

درباره‌ ما

جستجوی عمودی و هوش مصنوعی

سکو

همیشه در ارتباط ماندن

حساب