Bài đăng này được đồng tác giả với Jan Paul Assendorp, Thomas Loizow, Christopher Masch, Alexander Meinert, Tiến sĩ Lars Palzer, Jan Schillemans của SIGNAL IDUNA.
Tại SIGNAL IDUNA, một công ty bảo hiểm lớn của Đức, chúng tôi hiện đang tự đổi mới chính mình với chương trình chuyển đổi VISION2023 để hướng tới khách hàng nhiều hơn nữa. Hai khía cạnh là trọng tâm của sự chuyển đổi này: việc tổ chức lại các bộ phận lớn của lực lượng lao động thành các nhóm chức năng và nhanh nhẹn, và trở thành một công ty thực sự dựa trên dữ liệu. Ở đây, phương châm “Bạn xây dựng nó, bạn điều hành nó” là một yêu cầu quan trọng đối với một nhóm đa chức năng xây dựng sản phẩm dữ liệu hoặc máy học (ML). Điều này đặt ra những ràng buộc chặt chẽ về số tiền mà nhóm làm việc có thể chi tiêu để sản xuất và chạy một sản phẩm.
Bài đăng này cho thấy cách SIGNAL IDUNA giải quyết thách thức này và sử dụng AWS Cloud để cho phép các nhóm chức năng chéo xây dựng và vận hành các sản phẩm ML của riêng họ. Để đạt được mục tiêu này, trước tiên chúng tôi giới thiệu cơ cấu tổ chức của các nhóm nhanh nhẹn, đặt ra các yêu cầu trọng tâm đối với cơ sở hạ tầng đám mây được sử dụng để phát triển và chạy một sản phẩm. Tiếp theo, chúng tôi chỉ ra cách ba nhóm trung tâm tại SIGNAL IDUNA cho phép các nhóm chức năng chéo xây dựng các sản phẩm dữ liệu trong Đám mây AWS với sự hỗ trợ tối thiểu, bằng cách cung cấp quy trình làm việc và giải pháp cơ sở hạ tầng phù hợp có thể dễ dàng sử dụng và điều chỉnh. Cuối cùng, chúng tôi xem xét cách tiếp cận của mình và so sánh nó với một cách tiếp cận cổ điển hơn, nơi sự phát triển và hoạt động được tách biệt chặt chẽ hơn.
Agile @ SI - Nền tảng của Thay đổi Tổ chức
Kể từ đầu năm 2021, SIGNAL IDUNA đã bắt đầu áp dụng chiến lược Agile @ SI và thiết lập các phương pháp linh hoạt để phát triển các giải pháp hướng đến khách hàng trong toàn bộ công ty [1]. Các nhiệm vụ và mục tiêu trước đây hiện do các nhóm chức năng chéo đảm nhận, được gọi là đội. Các nhóm này sử dụng các phương pháp linh hoạt (chẳng hạn như khung Scrum), đưa ra quyết định của riêng họ và xây dựng các sản phẩm hướng đến khách hàng. Thông thường, các nhóm nằm trong các bộ phận kinh doanh, chẳng hạn như tiếp thị, và nhiều nhóm tập trung mạnh vào việc xây dựng các sản phẩm dựa trên dữ liệu và hỗ trợ ML. Ví dụ, các trường hợp sử dụng điển hình trong bảo hiểm là dự đoán tình trạng không hoạt động của khách hàng và đề xuất sản phẩm.
Do sự phức tạp của ML, việc tạo ra một giải pháp ML cho một đội duy nhất là một thách thức, và do đó đòi hỏi sự hợp tác của các đội khác nhau.
SIGNAL IDUNA có ba nhóm thiết yếu hỗ trợ tạo các giải pháp ML. Được bao quanh bởi ba đội này là đội chịu trách nhiệm về sự phát triển và hoạt động lâu dài cũng như giải pháp ML. Cách tiếp cận này tuân theo mô hình chia sẻ trách nhiệm của AWS [2].
Trong hình trên, tất cả các đội được thể hiện một cách tổng quan.
Hỗ trợ đám mây
Cơ sở hạ tầng đám mây cơ bản cho toàn bộ tổ chức được cung cấp bởi nhóm Cloud Enablement. Nhiệm vụ của họ là cho phép các nhóm tự xây dựng sản phẩm dựa trên công nghệ đám mây. Điều này cải thiện thời gian tiếp thị xây dựng các sản phẩm mới như ML và nó tuân theo nguyên tắc “Bạn xây dựng nó, bạn điều hành nó”.
Văn phòng dữ liệu / Hồ dữ liệu
Di chuyển dữ liệu vào đám mây, cũng như tìm tập dữ liệu phù hợp, được hỗ trợ bởi Văn phòng Dữ liệu / Hồ dữ liệu của đội. Họ thiết lập một danh mục dữ liệu có thể được sử dụng để tìm kiếm và lựa chọn các tập dữ liệu cần thiết. Mục đích của họ là thiết lập tính minh bạch và quản trị dữ liệu. Ngoài ra, họ chịu trách nhiệm thiết lập và vận hành Hồ dữ liệu giúp các nhóm truy cập và xử lý dữ liệu có liên quan.
Nền tảng phân tích dữ liệu
Nhóm của chúng tôi Nền tảng phân tích dữ liệu (DAP) là một nhóm tập trung vào đám mây và ML tại SIGNAL IDUNA thành thạo về kỹ thuật ML, kỹ thuật dữ liệu cũng như khoa học dữ liệu. Chúng tôi cho phép các nhóm nội bộ sử dụng đám mây công cộng cho ML bằng cách cung cấp các thành phần và kiến thức cơ sở hạ tầng. Các sản phẩm và dịch vụ của chúng tôi được trình bày chi tiết trong phần sau.
Cho phép các nhóm đa chức năng xây dựng các giải pháp ML
Để cho phép các nhóm chức năng chéo tại SIGNAL IDUNA xây dựng các giải pháp ML, chúng tôi cần một cách nhanh chóng và linh hoạt để cung cấp cơ sở hạ tầng đám mây có thể tái sử dụng cũng như quy trình làm việc hiệu quả cho các nhóm tích hợp để sử dụng các khả năng của đám mây.
Để đạt được mục tiêu này, chúng tôi đã tạo ra một quy trình giới thiệu và hỗ trợ được tiêu chuẩn hóa, đồng thời cung cấp các mẫu cơ sở hạ tầng mô-đun dưới dạng Cơ sở hạ tầng dưới dạng mã (IaC). Các mẫu này chứa các thành phần cơ sở hạ tầng được thiết kế cho các trường hợp sử dụng ML phổ biến có thể dễ dàng điều chỉnh cho phù hợp với các yêu cầu của một trường hợp sử dụng cụ thể.
Quy trình xây dựng các giải pháp ML
Có ba vai trò kỹ thuật chính liên quan đến việc xây dựng và vận hành các giải pháp ML: Nhà khoa học dữ liệu, kỹ sư ML và kỹ sư dữ liệu. Mỗi vai trò là một phần của nhóm chức năng chéo và có các trách nhiệm khác nhau. Nhà khoa học dữ liệu có kiến thức miền bắt buộc về các yêu cầu chức năng cũng như kỹ thuật của trường hợp sử dụng. Kỹ sư ML chuyên về xây dựng các giải pháp ML tự động và triển khai mô hình. Và kỹ sư dữ liệu đảm bảo rằng dữ liệu chảy từ tại chỗ và trong đám mây.
Quá trình cung cấp nền tảng như sau:
Cơ sở hạ tầng của trường hợp sử dụng cụ thể được xác định trong IaC và được tạo phiên bản trong kho lưu trữ dự án trung tâm. Điều này cũng bao gồm các đường ống để đào tạo và triển khai mô hình, cũng như các tạo tác mã liên quan đến khoa học dữ liệu khác. Các nhà khoa học dữ liệu, kỹ sư ML và kỹ sư dữ liệu có quyền truy cập vào kho lưu trữ dự án và có thể định cấu hình và cập nhật tất cả mã cơ sở hạ tầng một cách độc lập. Điều này cho phép nhóm nhanh chóng thay đổi cơ sở hạ tầng nếu cần. Tuy nhiên, kỹ sư ML luôn có thể hỗ trợ phát triển và cập nhật cơ sở hạ tầng hoặc mô hình ML.
Các thành phần cơ sở hạ tầng có thể tái sử dụng và mô-đun
Các tài nguyên IaC phân cấp và mô-đun được triển khai trong Terraform và bao gồm cơ sở hạ tầng cho các trường hợp sử dụng ETL và khoa học dữ liệu chung. Điều này cho phép chúng tôi sử dụng lại mã cơ sở hạ tầng và thực thi các chính sách tuân thủ và bảo mật được yêu cầu, chẳng hạn như sử dụng Dịch vụ quản lý khóa AWS (KMS) mã hóa cho dữ liệu, cũng như đóng gói cơ sở hạ tầng trong Đám mây riêng ảo Amazon (VPC) môi trường không có truy cập internet trực tiếp.
Cấu trúc IaC phân cấp như sau:
- Modules đóng gói các dịch vụ AWS cơ bản với cấu hình cần thiết để quản lý bảo mật và truy cập. Điều này bao gồm các cấu hình thực tiễn tốt nhất, chẳng hạn như ngăn chặn sự truy cập của công chúng vào Dịch vụ lưu trữ đơn giản của Amazon (S3) nhóm hoặc thực thi mã hóa cho tất cả các tệp được lưu trữ.
- Trong một số trường hợp, bạn cần nhiều dịch vụ khác nhau để tự động hóa các quy trình, chẳng hạn như để triển khai các mô hình ML trong các giai đoạn khác nhau. Do đó, chúng tôi đã xác định Giải pháp dưới dạng một nhóm các mô-đun khác nhau trong một cấu hình chung cho các loại nhiệm vụ khác nhau.
- Ngoài ra, chúng tôi cung cấp đầy đủ bản thiết kế kết hợp các giải pháp trong các môi trường khác nhau để đáp ứng nhiều nhu cầu tiềm năng của một dự án. Trong kế hoạch chi tiết MLOps của mình, chúng tôi xác định cơ sở hạ tầng có thể triển khai để đào tạo, cung cấp và giám sát các mô hình ML được tích hợp và phân phối trong tài khoản AWS. Chúng tôi thảo luận chi tiết hơn trong phần tiếp theo.
Các sản phẩm này được tạo phiên bản trong kho lưu trữ trung tâm của nhóm DAP. Điều này cho phép chúng tôi liên tục cải thiện IaC của mình và xem xét các tính năng mới từ AWS, chẳng hạn như Amazon SageMaker Đăng ký mô hình. Mỗi đội có thể tham chiếu các tài nguyên này, tham số hóa chúng khi cần và cuối cùng triển khai chúng trong tài khoản AWS của riêng họ.
Kiến trúc MLOps
Chúng tôi cung cấp một bản thiết kế sẵn sàng sử dụng với các giải pháp cụ thể để bao gồm toàn bộ quy trình MLOps. Bản thiết kế chứa cơ sở hạ tầng được phân phối trên bốn tài khoản AWS để xây dựng và triển khai các mô hình ML. Điều này cho phép chúng tôi tách biệt tài nguyên và quy trình làm việc cho các bước khác nhau trong quy trình MLOps. Hình dưới đây cho thấy kiến trúc nhiều tài khoản và chúng tôi mô tả cách phân chia trách nhiệm đối với các bước cụ thể của quy trình giữa các vai trò kỹ thuật khác nhau.
Sản phẩm người mẫu tài khoản bao gồm các dịch vụ để phát triển các mô hình ML. Đầu tiên, kỹ sư dữ liệu sử dụng quy trình ETL để cung cấp dữ liệu có liên quan từ hồ dữ liệu SIGNAL IDUNA, cổng tập trung cho quy trình làm việc theo hướng dữ liệu trong Đám mây AWS. Sau đó, bộ dữ liệu có thể được nhà khoa học dữ liệu sử dụng để đào tạo và đánh giá các ứng viên mô hình. Sau khi sẵn sàng cho các thử nghiệm mở rộng, một ứng viên mô hình được kỹ sư ML tích hợp vào một quy trình đào tạo tự động. Chúng tôi sử dụng Amazon SageMaker Pipelines để tự động hóa việc đào tạo, điều chỉnh siêu thông số và đánh giá mô hình trên quy mô lớn. Điều này cũng bao gồm truyền thừa mô hình và cơ chế phê duyệt tiêu chuẩn cho các mô hình được tổ chức để triển khai vào sản xuất. Kiểm tra đơn vị tự động và phân tích mã đảm bảo chất lượng và độ tin cậy của mã cho mỗi bước của quy trình, chẳng hạn như tiền xử lý dữ liệu, đào tạo mô hình và đánh giá. Sau khi mô hình được đánh giá và phê duyệt, chúng tôi sử dụng Amazon SageMaker ModelPackages làm giao diện cho mô hình được đào tạo và dữ liệu meta có liên quan.
Sản phẩm dụng cụ tài khoản chứa các đường ống CI / CD tự động với các giai đoạn khác nhau để thử nghiệm và triển khai các mô hình được đào tạo. Trong giai đoạn thử nghiệm, các mô hình được triển khai vào phục vụ phi lợi nhuận tài khoản. Mặc dù chất lượng mô hình được đánh giá trong quá trình đào tạo trước khi mô hình được tổ chức để sản xuất, ở đây chúng tôi chạy các bài kiểm tra hiệu suất và tích hợp trong một môi trường thử nghiệm biệt lập. Sau khi vượt qua giai đoạn thử nghiệm, các mô hình được triển khai vào phục vụ tài khoản để được tích hợp vào quy trình sản xuất.
Việc tách các giai đoạn của quy trình MLOps thành các tài khoản AWS khác nhau cho phép chúng tôi tách biệt việc phát triển và thử nghiệm khỏi quá trình sản xuất. Do đó, chúng tôi có thể thực thi chính sách truy cập và bảo mật nghiêm ngặt. Hơn nữa, các vai trò IAM được điều chỉnh phù hợp đảm bảo rằng các dịch vụ cụ thể chỉ có thể truy cập dữ liệu và các dịch vụ khác cần thiết cho phạm vi của nó, sau nguyên tắc đặc quyền ít nhất. Ngoài ra, các dịch vụ trong môi trường phục vụ có thể được cung cấp cho các quy trình nghiệp vụ bên ngoài. Ví dụ: một quy trình nghiệp vụ có thể truy vấn một điểm cuối trong môi trường sản xuất phục vụ cho các dự đoán mô hình.
Lợi ích của Phương pháp tiếp cận của chúng tôi
Quá trình này có nhiều lợi thế so với sự tách biệt chặt chẽ giữa phát triển và vận hành cho cả mô hình ML, cũng như cơ sở hạ tầng cần thiết:
- Cô lập: Mỗi đội đều nhận được bộ tài khoản AWS của riêng mình, hoàn toàn cách biệt với môi trường của các đội khác. Điều này giúp dễ dàng quản lý quyền truy cập và giữ dữ liệu riêng tư cho những người có quyền làm việc với nó.
- Hỗ trợ đám mây: Các thành viên trong nhóm có ít kinh nghiệm về đám mây DevOps (chẳng hạn như nhiều nhà khoa học dữ liệu) có thể dễ dàng theo dõi toàn bộ quá trình thiết kế và quản lý cơ sở hạ tầng vì (hầu như) không có gì bị che giấu bởi họ đằng sau một dịch vụ trung tâm. Điều này giúp họ hiểu rõ hơn về cơ sở hạ tầng, từ đó có thể giúp họ tạo ra các sản phẩm khoa học dữ liệu hiệu quả hơn.
- Quyền sở hữu sản phẩm: Việc sử dụng các giải pháp cơ sở hạ tầng được cấu hình sẵn và các dịch vụ được quản lý khiến rào cản đối với việc quản lý một sản phẩm ML trong sản xuất là rất thấp. Do đó, một nhà khoa học dữ liệu có thể dễ dàng nắm quyền sở hữu một mô hình được đưa vào sản xuất. Điều này giảm thiểu rủi ro nổi tiếng về việc không đưa một mô hình vào sản xuất sau khi phát triển.
- sự đổi mới: Vì các kỹ sư ML đã tham gia rất lâu trước khi một mô hình sẵn sàng đưa vào sản xuất, họ có thể tạo ra các giải pháp cơ sở hạ tầng phù hợp với các trường hợp sử dụng mới trong khi các nhà khoa học dữ liệu phát triển mô hình ML.
- Khả năng thích ứng: Vì giải pháp IaC do DAP phát triển được cung cấp miễn phí, bất kỳ nhóm nào cũng có thể dễ dàng điều chỉnh những giải pháp này để phù hợp với nhu cầu cụ thể cho trường hợp sử dụng của họ.
- Mã nguồn mở: Tất cả các giải pháp cơ sở hạ tầng mới có thể dễ dàng được cung cấp thông qua kho mã DAP trung tâm để các nhóm khác sử dụng. Theo thời gian, điều này sẽ tạo ra một cơ sở mã phong phú với các thành phần cơ sở hạ tầng phù hợp với các trường hợp sử dụng khác nhau.
Tổng kết
Trong bài đăng này, chúng tôi đã minh họa cách các nhóm chức năng chéo tại SIGNAL IDUNA đang được kích hoạt để xây dựng và chạy các sản phẩm ML trên AWS. Trọng tâm trong cách tiếp cận của chúng tôi là việc sử dụng một tập hợp các tài khoản AWS dành riêng cho mỗi nhóm kết hợp với các giải pháp và bản thiết kế IaC riêng biệt. Hai thành phần này cho phép một nhóm đa chức năng tạo ra và vận hành cơ sở hạ tầng chất lượng sản xuất. Đổi lại, họ có thể có toàn quyền sở hữu đầu cuối đối với các sản phẩm ML của mình.
Tham khảo Đường ống xây dựng mô hình Amazon SageMaker - Amazon SageMaker để tìm hiểu thêm.
Tìm thêm thông tin về ML trên AWS trên trang chính thức của chúng tôi.
dự án
[1] https://www.handelsblatt.com/finanzen/versicherungsbranche-vorbild-spotify-signal-iduna-wird-von-einer-handwerker-versicherung-zum-agilen-konzern/27381902.html
[2] https://blog.crisp.se/wp-content/uploads/2012/11/SpotifyScaling.pdf
[3] https://aws.amazon.com/compliance/shared-responsibility-model/
Về các tác giả
Jan Paul Assendorp là một kỹ sư ML có trọng tâm về khoa học dữ liệu. Anh ấy xây dựng các mô hình ML và tự động hóa việc đào tạo mô hình và việc triển khai vào môi trường sản xuất.
Thomas Liệtzow là Scrum Master của Nền tảng phân tích dữ liệu nhóm.
Christopher Masch là Chủ sở hữu sản phẩm của Nền tảng phân tích dữ liệu nhóm với kiến thức về kỹ thuật dữ liệu, khoa học dữ liệu và kỹ thuật ML.
Alexander Meinert là một phần của nhóm Nền tảng phân tích dữ liệu và hoạt động như một kỹ sư ML. Bắt đầu với thống kê, phát triển trên các dự án khoa học dữ liệu, tìm thấy niềm đam mê với các phương pháp và kiến trúc ML.
Tiến sĩ Lars Palzer là nhà khoa học dữ liệu và là thành viên của nhóm Nền tảng phân tích dữ liệu. Sau khi giúp xây dựng các thành phần kiến trúc MLOps, anh ấy hiện đang sử dụng chúng để xây dựng các sản phẩm ML.
Jan Schillemans là một kỹ sư ML với nền tảng kỹ thuật phần mềm. Ông tập trung vào việc áp dụng các phương pháp hay nhất về kỹ thuật phần mềm vào môi trường ML (MLOps).
- Coinsmart. Sàn giao dịch Bitcoin và tiền điện tử tốt nhất Châu Âu.
- Platoblockchain. Web3 Metaverse Intelligence. Khuếch đại kiến thức. TRUY CẬP MIỄN PHÍ.
- CryptoHawk. Radar Altcoin. Dùng thử miễn phí.
- Nguồn: https://aws.amazon.com/blogs/machine-learning/how-signal-iduna-operationalizes-machine-learning-projects-on-aws/
- "
- 100
- 2021
- truy cập
- Tài khoản
- ngang qua
- Hoạt động
- lợi thế
- nhanh nhẹn
- Tất cả
- Mặc dù
- đàn bà gan dạ
- phân tích
- phân tích
- Nộp đơn
- phương pháp tiếp cận
- kiến trúc
- Tự động
- có sẵn
- AWS
- được
- BEST
- thực hành tốt nhất
- xây dựng
- Xây dựng
- Bó lại
- kinh doanh
- khả năng
- trường hợp
- thách thức
- đám mây
- cơ sở hạ tầng đám mây
- mã
- hợp tác
- kết hợp
- Chung
- công ty
- so
- tuân thủ
- Cấu hình
- chứa
- Tạo
- dữ liệu
- Phân tích dữ liệu
- khoa học dữ liệu
- nhà khoa học dữ liệu
- dành riêng
- triển khai
- triển khai
- triển khai
- thiết kế
- chi tiết
- phát triển
- phát triển
- phát triển
- Phát triển
- khác nhau
- thảo luận
- phân phối
- miền
- dễ dàng
- mã hóa
- Điểm cuối
- ky sư
- Kỹ Sư
- Kỹ sư
- Môi trường
- thiết yếu
- thành lập
- ví dụ
- kinh nghiệm
- NHANH
- Tính năng
- Hình
- Cuối cùng
- Tên
- Tập trung
- tập trung
- tiếp theo
- tìm thấy
- Nền tảng
- Khung
- Full
- Các mục tiêu
- quản trị
- giúp đỡ
- giúp
- tại đây
- Độ đáng tin của
- HTTPS
- hình ảnh
- thực hiện
- quan trọng
- nâng cao
- bao gồm
- thông tin
- Cơ sở hạ tầng
- bảo hiểm
- tích hợp
- hội nhập
- Giao thức
- Internet
- tham gia
- IT
- Key
- kiến thức
- lớn
- LEARN
- học tập
- ít
- dài
- máy
- học máy
- quản lý
- quản lý
- thị trường
- Marketing
- Trận đấu
- Các thành viên
- Siêu dữ liệu
- ML
- kiểu mẫu
- mô hình
- mô-đun
- giám sát
- Các tính năng mới
- sản phẩm mới
- cung cấp
- chính thức
- Tiếp nhận nhận việc
- hoạt động
- cơ quan
- Nền tảng khác
- chủ sở hữu
- hiệu suất
- nền tảng
- Chính sách
- điều luật
- dự đoán
- Dự đoán
- Phòng chống
- riêng
- quá trình
- Quy trình
- Sản phẩm
- Sản lượng
- Sản phẩm
- chương trình
- dự án
- dự án
- cho
- công khai
- Đám mây công cộng
- chất lượng
- kho
- cần phải
- Yêu cầu
- Thông tin
- chịu trách nhiệm
- xem xét
- Nguy cơ
- chạy
- Quy mô
- Khoa học
- Nhà khoa học
- các nhà khoa học
- Tìm kiếm
- an ninh
- dịch vụ
- DỊCH VỤ
- phục vụ
- định
- chia sẻ
- Đơn giản
- Phần mềm
- kỹ thuật phần mềm
- Giải pháp
- chuyên
- tiêu
- Traineeship
- Bắt đầu
- bắt đầu
- số liệu thống kê
- là gắn
- Chiến lược
- mạnh mẽ
- Sau đó
- hỗ trợ
- Hỗ trợ
- bao quanh
- nhiệm vụ
- nhóm
- Kỹ thuật
- Công nghệ
- thử nghiệm
- Kiểm tra
- kiểm tra
- thời gian
- Hội thảo
- Chuyển đổi
- Minh bạch
- Cập nhật
- us
- sử dụng
- sử dụng
- ảo
- Đồng hồ đeo tay
- CHÚNG TÔI LÀ
- ở trong
- không có
- Công việc
- Lực lượng lao động
- công trinh