این پست با یان پل آسندورپ، توماس لیتزو، کریستوفر ماش، الکساندر ماینرت، دکتر لارس پالزر، یان شیلمنز از SIGNAL IDUNA نوشته شده است.
در SIGNAL IDUNA، یک شرکت بیمه بزرگ آلمانی، ما در حال حاضر با برنامه تحول VISION2023 خود را دوباره اختراع می کنیم تا حتی بیشتر مشتری مدار شویم. دو جنبه برای این تحول مهم است: سازماندهی مجدد بخش های بزرگی از نیروی کار به تیم های متقابل عملکردی و چابک و تبدیل شدن به یک شرکت واقعاً مبتنی بر داده. در اینجا، شعار "شما آن را می سازید، شما آن را اجرا می کنید" یک نیاز مهم برای یک تیم متقابل است که یک محصول داده یا یادگیری ماشین (ML) می سازد. این محدودیتهای شدیدی را در مورد میزان هزینههای تیم کاری برای تولید و اجرای یک محصول ایجاد میکند.
این پست نشان می دهد که چگونه SIGNAL IDUNA با این چالش مقابله می کند و از آن استفاده می کند AWS ابر برای فعال کردن تیم های متقابل برای ساخت و عملیاتی کردن محصولات ML خود. برای این منظور، ابتدا ساختار سازمانی تیمهای چابک را معرفی میکنیم که الزامات اصلی زیرساخت ابری مورد استفاده برای توسعه و اجرای یک محصول را تعیین میکند. در مرحله بعد، نشان میدهیم که چگونه سه تیم مرکزی در SIGNAL IDUNA، با ارائه یک گردش کار مناسب و راهحلهای زیرساختی که به راحتی قابل استفاده و تطبیق است، به تیمهای متقابل امکان میدهند تا محصولات داده را در AWS Cloud با حداقل کمک بسازند. در نهایت، ما رویکرد خود را بررسی میکنیم و آن را با رویکرد کلاسیکتری مقایسه میکنیم که در آن توسعه و بهرهبرداری دقیقتر از هم جدا شدهاند.
Agile@SI - بنیاد تغییر سازمانی
از آغاز سال 2021، SIGNAL IDUNA شروع به اجرای استراتژی Agile@SI و ایجاد روش های چابک برای توسعه راه حل های مشتری مدار در کل شرکت کرده است [1]. وظایف و اهداف قبلی اکنون توسط تیم های متقابل انجام می شود که نامیده می شود جوخه ها. این گروهها از روشهای چابک (مانند چارچوب اسکرام) استفاده میکنند، تصمیمات خود را میگیرند و محصولات مشتریمدار میسازند. به طور معمول، جوخه ها در بخش های تجاری مانند بازاریابی قرار دارند و بسیاری از آنها تاکید زیادی بر ساخت محصولات مبتنی بر داده و ML دارند. به عنوان مثال، موارد استفاده معمول در بیمه، پیشبینی ریزش مشتری و توصیه محصول است.
با توجه به پیچیدگی ML، ایجاد یک راه حل ML توسط یک تیم چالش برانگیز است و بنابراین نیاز به همکاری گروه های مختلف دارد.
SIGNAL IDUNA دارای سه تیم ضروری است که از ایجاد راه حل های ML پشتیبانی می کنند. احاطه شده توسط این سه تیم تیمی است که مسئولیت توسعه و عملیات طولانی مدت و راه حل ML را بر عهده دارد. این رویکرد از مدل مسئولیت مشترک AWS پیروی می کند [2].
در تصویر بالا، تمام تیمها به صورت کلی نشان داده شدهاند.
فعال سازی ابر
زیرساخت ابری زیربنایی برای کل سازمان توسط Squad Cloud Enablement ارائه می شود. وظیفه آنها این است که تیم ها را قادر سازند تا محصولات خود را بر اساس فناوری های ابری بسازند. این باعث بهبود زمان برای بازاریابی ساخت محصولات جدید مانند ML می شود و از اصل "شما آن را می سازید، اجرا می کنید" پیروی می کند.
دفتر داده / دریاچه داده
انتقال داده ها به فضای ابری و همچنین یافتن مجموعه داده مناسب، توسط گروه Data Office/Data Lake پشتیبانی می شود. آنها یک کاتالوگ داده تنظیم می کنند که می تواند برای جستجو و انتخاب مجموعه داده های مورد نیاز استفاده شود. هدف آنها ایجاد شفافیت داده ها و حاکمیت است. علاوه بر این، آنها مسئول ایجاد و راه اندازی یک دریاچه داده هستند که به تیم ها برای دسترسی و پردازش داده های مربوطه کمک می کند.
پلتفرم تجزیه و تحلیل داده ها
پلتفرم تجزیه و تحلیل داده های تیم ما (DAP) یک تیم متمرکز بر ابر و ML در SIGNAL IDUNA است که در مهندسی ML، مهندسی داده و همچنین علم داده مهارت دارد. ما با ارائه مؤلفههای زیرساخت و دانش، تیمهای داخلی را با استفاده از ابر عمومی برای ML فعال میکنیم. محصولات و خدمات ما به تفصیل در بخش زیر ارائه شده است.
توانمندسازی تیم های متقابل برای ایجاد راه حل های ML
برای فعال کردن تیمهای متقابل در SIGNAL IDUNA برای ساخت راهحلهای ML، ما به یک راه سریع و همهکاره برای ارائه زیرساخت ابری قابل استفاده مجدد و همچنین یک گردش کار کارآمد برای تیمهای سوارکار برای استفاده از قابلیتهای ابری نیاز داریم.
برای این منظور، ما یک فرآیند نصب و پشتیبانی استاندارد ایجاد کردیم و الگوهای زیرساخت مدولار را به عنوان Infrastructure as Code (IaC) ارائه کردیم. این الگوها شامل اجزای زیرساختی هستند که برای موارد استفاده رایج ML طراحی شدهاند که میتوانند به راحتی با نیازهای یک مورد خاص سازگار شوند.
گردش کار ساخت راه حل های ML
سه نقش فنی اصلی در ساخت و اجرای راه حل های ML وجود دارد: دانشمند داده، مهندس ML و مهندس داده. هر نقش بخشی از تیم متقابل است و مسئولیت های متفاوتی دارد. دانشمند داده دانش حوزه مورد نیاز در مورد الزامات کاربردی و همچنین فنی مورد استفاده را دارد. مهندس ML در ساخت راه حل های خودکار ML و استقرار مدل تخصص دارد. و مهندس داده اطمینان حاصل می کند که داده ها از داخل محل و در فضای ابری جریان دارند.
روند تهیه پلتفرم به شرح زیر است:
زیرساخت مورد استفاده خاص در IaC تعریف شده و در یک مخزن پروژه مرکزی نسخه شده است. این همچنین شامل خطوط لوله برای آموزش و استقرار مدل، و همچنین سایر مصنوعات کد مرتبط با علم داده است. دانشمندان داده، مهندسان ML و مهندسان داده به مخزن پروژه دسترسی دارند و می توانند تمام کد زیرساخت را به طور مستقل پیکربندی و به روز کنند. این تیم را قادر می سازد تا در صورت نیاز به سرعت زیرساخت را تغییر دهد. با این حال، مهندس ML همیشه می تواند در توسعه و به روز رسانی زیرساخت ها یا مدل های ML پشتیبانی کند.
اجزای زیرساخت قابل استفاده مجدد و مدولار
منابع IaC سلسله مراتبی و مدولار در پیاده سازی می شوند Terraform و شامل زیرساخت های رایج علوم داده و موارد استفاده ETL می شود. این به ما امکان می دهد از کد زیرساخت مجدد استفاده کنیم و سیاست های امنیتی و انطباق مورد نیاز مانند استفاده را اعمال کنیم سرویس مدیریت کلید AWS (KMS) رمزگذاری برای داده ها، و همچنین کپسوله کردن زیرساخت در ابر خصوصی مجازی آمازون (VPC) محیط های بدون دسترسی مستقیم به اینترنت
ساختار IaC سلسله مراتبی به شرح زیر است:
- ماژول ها خدمات پایه AWS را با پیکربندی مورد نیاز برای مدیریت امنیت و دسترسی محصور کنید. این شامل پیکربندیهای بهترین عملکرد مانند جلوگیری از دسترسی عمومی به آن میشود سرویس ذخیره سازی ساده آمازون (S3) سطل، یا اعمال رمزگذاری برای همه فایل های ذخیره شده.
- در برخی موارد، برای خودکارسازی فرآیندها به خدمات مختلفی نیاز دارید، مانند استقرار مدلهای ML در مراحل مختلف. بنابراین ما تعریف کردیم مزایا به عنوان بسته ای از ماژول های مختلف در یک پیکربندی مشترک برای انواع مختلف وظایف.
- علاوه بر این، ما کامل ارائه می دهیم نقشه که ترکیبی از راه حل ها در محیط های مختلف برای پاسخگویی به بسیاری از نیازهای بالقوه یک پروژه است. در طرح MLOps خود، یک زیرساخت قابل استقرار برای آموزش، تهیه و نظارت بر مدلهای ML تعریف میکنیم که در حسابهای AWS یکپارچه و توزیع میشوند. جزئیات بیشتر را در بخش بعدی مورد بحث قرار می دهیم.
این محصولات در یک مخزن مرکزی توسط تیم DAP نسخه شده اند. این به ما امکان می دهد به طور مداوم IaC خود را بهبود بخشیم و ویژگی های جدید AWS را در نظر بگیریم، مانند آمازون SageMaker رجیستری مدل هر تیم می تواند به این منابع رجوع کند، آنها را در صورت نیاز پارامتربندی کند و در نهایت آنها را در حساب های AWS خود مستقر کند.
معماری MLOps
ما یک طرح اولیه آماده با راه حل های خاص برای پوشش کل فرآیند MLOps ارائه می دهیم. طرح شامل زیرساختی است که در چهار حساب AWS برای ساخت و استقرار مدلهای ML توزیع شده است. این به ما امکان می دهد منابع و گردش کار را برای مراحل مختلف در فرآیند MLOps جدا کنیم. شکل زیر معماری چند حسابی را نشان میدهد و توضیح میدهیم که چگونه مسئولیت مراحل خاص فرآیند بین نقشهای فنی مختلف تقسیم میشود.
La مدل سازی حساب شامل خدماتی برای توسعه مدل های ML می شود. ابتدا، مهندس داده از یک فرآیند ETL برای ارائه داده های مرتبط از دریاچه داده SIGNAL IDUNA، دروازه متمرکز برای گردش های کاری مبتنی بر داده در AWS Cloud استفاده می کند. متعاقباً، مجموعه داده می تواند توسط دانشمند داده برای آموزش و ارزیابی نامزدهای مدل مورد استفاده قرار گیرد. پس از آماده شدن برای آزمایشهای گسترده، یک نامزد مدل توسط مهندس ML در یک خط لوله آموزشی خودکار ادغام میشود. ما از Amazon SageMaker Pipelines برای خودکارسازی آموزش، تنظیم فراپارامتر و ارزیابی مدل در مقیاس استفاده می کنیم. این همچنین شامل اصل و نسب مدل و مکانیزم تأیید استاندارد برای مدلهایی است که باید برای استقرار در تولید مرحلهبندی شوند. تست های واحد خودکار و تجزیه و تحلیل کد، کیفیت و قابلیت اطمینان کد را برای هر مرحله از خط لوله، مانند پیش پردازش داده ها، آموزش مدل، و ارزیابی تضمین می کند. هنگامی که یک مدل ارزیابی و تایید شد، ما از Amazon SageMaker ModelPackages به عنوان رابطی برای مدل آموزش دیده و متا داده های مربوطه استفاده می کنیم.
La تجهیز حساب شامل خطوط لوله CI/CD خودکار با مراحل مختلف برای آزمایش و استقرار مدل های آموزش دیده است. در مرحله آزمایش، مدلها در خدمت-غیر تولیدی حساب. اگرچه کیفیت مدل در خط لوله آموزشی قبل از مرحلهبندی مدل برای تولید ارزیابی میشود، در اینجا ما تستهای عملکرد و یکپارچهسازی را در یک محیط آزمایش ایزوله اجرا میکنیم. پس از گذراندن مرحله آزمایش، مدلها در داخل آن مستقر میشوند خدمت- تولید حساب باید در جریان کار تولید ادغام شود.
جداسازی مراحل گردش کار MLOps به حساب های مختلف AWS به ما امکان می دهد توسعه و آزمایش را از تولید جدا کنیم. بنابراین، ما می توانیم یک سیاست دسترسی و امنیت سختگیرانه را اعمال کنیم. علاوه بر این، نقشهای اختصاصی IAM تضمین میکند که سرویسهای خاص فقط میتوانند به دادهها و سایر خدمات مورد نیاز برای محدوده آن دسترسی داشته باشند، به دنبال اصل حداقل امتیاز. علاوه بر این، خدمات در محیطهای خدماتی میتوانند برای فرآیندهای تجاری خارجی قابل دسترسی باشند. به عنوان مثال، یک فرآیند تجاری می تواند یک نقطه پایانی را در محیط سرویس-prod برای پیش بینی مدل جستجو کند.
مزایای رویکرد ما
این فرآیند در مقایسه با جداسازی دقیق توسعه و عملیات برای هر دو مدل ML و همچنین زیرساخت مورد نیاز، مزایای زیادی دارد:
- انزوا: هر تیم مجموعه ای از حساب های AWS خود را دریافت می کند که کاملاً از محیط های تیم های دیگر جدا شده است. این امر مدیریت حقوق دسترسی و خصوصی نگه داشتن داده ها را برای کسانی که حق کار با آن را دارند آسان می کند.
- فعال سازی ابر: اعضای تیم با تجربه قبلی کمی در توسعهدهندگان ابری (مانند بسیاری از دانشمندان داده) میتوانند به راحتی کل فرآیند طراحی و مدیریت زیرساخت را تماشا کنند زیرا (تقریباً) هیچ چیز از آنها در پشت یک سرویس مرکزی پنهان نیست. این امر درک بهتری از زیرساخت ایجاد می کند، که به نوبه خود می تواند به آنها کمک کند تا محصولات علم داده را کارآمدتر ایجاد کنند.
- مالکیت محصول: استفاده از راه حل های زیرساختی از پیش پیکربندی شده و خدمات مدیریت شده مانع مدیریت یک محصول ML در تولید را بسیار کم نگه می دارد. بنابراین، یک دانشمند داده میتواند به راحتی مالکیت مدلی را که در مرحله تولید قرار میگیرد، در اختیار بگیرد. این امر خطر شناخته شده شکست در تولید یک مدل پس از توسعه را به حداقل می رساند.
- ابداع: از آنجایی که مهندسان ML مدت ها قبل از آماده شدن یک مدل برای تولید درگیر هستند، می توانند راه حل های زیرساختی مناسب برای موارد استفاده جدید ایجاد کنند در حالی که دانشمندان داده یک مدل ML را توسعه می دهند.
- سازگاری: از آنجایی که راه حل های IaC توسعه یافته توسط DAP به صورت رایگان در دسترس هستند، هر تیمی می تواند به راحتی آنها را برای مطابقت با یک نیاز خاص برای مورد استفاده خود تطبیق دهد.
- منبع باز: تمام راه حل های زیرساختی جدید را می توان به راحتی از طریق مخزن کد DAP مرکزی برای استفاده توسط سایر تیم ها در دسترس قرار داد. با گذشت زمان، این یک پایگاه کد غنی با اجزای زیرساختی متناسب با موارد استفاده مختلف ایجاد می کند.
خلاصه
در این پست، ما نشان دادیم که چگونه تیمهای چندکاره در SIGNAL IDUNA برای ساخت و اجرای محصولات ML در AWS فعال میشوند. مرکز رویکرد ما، استفاده از مجموعه ای اختصاصی از حساب های AWS برای هر تیم در ترکیب با طرح ها و راه حل های سفارشی IaC است. این دو مولفه یک تیم متقابل را قادر می سازد تا زیرساخت کیفیت تولید را ایجاد و راه اندازی کند. به نوبه خود، آنها می توانند مالکیت کامل انتها به انتها محصولات ML خود را در اختیار بگیرند.
به مراجعه خطوط لوله ساختمان مدل SageMaker Amazon – Amazon SageMaker برای کسب اطلاعات بیشتر.
اطلاعات بیشتر در مورد ML در AWS در صفحه رسمی ما
منابع
[1] https://www.handelsblatt.com/finanzen/versicherungsbranche-vorbild-spotify-signal-iduna-wird-von-einer-handwerker-versicherung-zum-agilen-konzern/27381902.html
[2] https://blog.crisp.se/wp-content/uploads/2012/11/SpotifyScaling.pdf
[3] https://aws.amazon.com/compliance/shared-responsibility-model/
درباره نویسنده
یان پل آسندورپ یک مهندس ML با تمرکز قوی در علم داده است. او مدلهای ML را میسازد و آموزش مدل و استقرار در محیطهای تولید را خودکار میکند.
توماس لیتزو اسکرام مستر پلتفرم تجزیه و تحلیل داده های تیم است.
کریستوفر ماش مالک محصول پلتفرم تجزیه و تحلیل داده های تیم با دانش در مهندسی داده، علم داده و مهندسی ML است.
الکساندر ماینرت بخشی از تیم Data Analytics Platform است و به عنوان مهندس ML کار می کند. با آمار شروع شد، در پروژه های علم داده رشد کرد، اشتیاق به روش ها و معماری ML پیدا کرد.
دکتر لارس پالزر یک دانشمند داده و بخشی از تیم Data Analytics Platform است. او پس از کمک به ساخت اجزای معماری MLOps، اکنون از آنها برای ساخت محصولات ML استفاده می کند.
یان شیلمانز یک مهندس ML با سابقه مهندسی نرم افزار است. او بر روی استفاده از بهترین شیوه های مهندسی نرم افزار در محیط های ML (MLOps) تمرکز می کند.
- "
- 100
- 2021
- دسترسی
- حساب
- در میان
- عمل
- مزایای
- فرز
- معرفی
- هر چند
- آمازون
- تحلیل
- علم تجزیه و تحلیل
- با استفاده از
- روش
- معماری
- خودکار
- در دسترس
- AWS
- بودن
- بهترین
- بهترین شیوه
- ساختن
- بنا
- بسته
- کسب و کار
- قابلیت های
- موارد
- به چالش
- ابر
- زیرساخت های ابری
- رمز
- همکاری
- ترکیب
- مشترک
- شرکت
- مقایسه
- انطباق
- پیکر بندی
- شامل
- ایجاد
- داده ها
- تجزیه و تحلیل داده ها
- علم اطلاعات
- دانشمند داده
- اختصاصی
- گسترش
- استقرار
- گسترش
- طراحی
- جزئیات
- توسعه
- توسعه
- در حال توسعه
- پروژه
- مختلف
- بحث و تبادل نظر
- توزیع شده
- دامنه
- به آسانی
- رمزگذاری
- نقطه پایانی
- مهندس
- مهندسی
- مورد تأیید
- محیط
- ضروری است
- ایجاد
- مثال
- تجربه
- FAST
- امکانات
- شکل
- سرانجام
- نام خانوادگی
- تمرکز
- متمرکز شده است
- پیروی
- یافت
- پایه
- چارچوب
- کامل
- اهداف
- حکومت
- کمک
- کمک می کند
- اینجا کلیک نمایید
- چگونه
- HTTPS
- تصویر
- اجرا
- مهم
- بهبود
- شامل
- اطلاعات
- شالوده
- بیمه
- یکپارچه
- ادغام
- رابط
- اینترنت
- گرفتار
- IT
- کلید
- دانش
- بزرگ
- یاد گرفتن
- یادگیری
- کوچک
- طولانی
- دستگاه
- فراگیری ماشین
- مدیریت
- مدیریت
- بازار
- بازار یابی (Marketing)
- مسابقه
- اعضا
- متا
- ML
- مدل
- مدل
- پیمانهای
- نظارت بر
- ویژگی های جدید
- محصولات جدید
- ارائه
- رسمی
- شبانه روزی
- عملیاتی
- کدام سازمان ها
- دیگر
- مالک
- کارایی
- سکو
- سیاست
- سیاست
- پیش گویی
- پیش بینی
- پیشگیری
- خصوصی
- روند
- فرآیندهای
- محصول
- تولید
- محصولات
- برنامه
- پروژه
- پروژه ها
- ارائه
- عمومی
- ابر عمومی
- کیفیت
- مخزن
- ضروری
- مورد نیاز
- منابع
- مسئوليت
- این فایل نقد می نویسید:
- خطر
- دویدن
- مقیاس
- علم
- دانشمند
- دانشمندان
- جستجو
- تیم امنیت لاتاری
- سرویس
- خدمات
- خدمت
- تنظیم
- به اشتراک گذاشته شده
- ساده
- نرم افزار
- مهندسی نرم افزار
- مزایا
- تخصص دارد
- خرج کردن
- صحنه
- شروع
- آغاز شده
- ارقام
- ذخیره سازی
- استراتژی
- قوی
- متعاقبا
- پشتیبانی
- پشتیبانی
- احاطه شده
- وظایف
- تیم
- فنی
- فن آوری
- آزمون
- تست
- تست
- زمان
- آموزش
- دگرگونی
- شفافیت
- بروزرسانی
- us
- استفاده کنید
- استفاده کنید
- مجازی
- تماشا کردن
- WHO
- در داخل
- بدون
- مهاجرت کاری
- نیروی کار
- با این نسخهها کار