この投稿は、SIGNAL IDUNA の Jan Paul Assendorp、Thomas Lietzow、Christopher Masch、Alexander Meinert、Lars Palzer 博士、Jan Schillemans との共著です。
ドイツの大手保険会社である SIGNAL IDUNA では、現在、さらに顧客志向になるために、変革プログラム VISION2023 に基づいて自らを再発明しています。 この変革の中心となるのは XNUMX つの側面です。それは、従業員の大部分を機能横断型の機敏なチームに再編成すること、もう XNUMX つは真のデータドリブンな企業になることです。 ここでは、「自分で構築し、自分で実行する」というモットーが、データまたは機械学習 (ML) 製品を構築する部門横断的なチームにとって重要な要件です。 これにより、チームが製品の生産と実行に費やすことができる作業量に厳しい制限が課されます。
この投稿では、SIGNAL IDUNA がどのようにこの課題に取り組み、 AWSクラウド 部門を超えたチームが独自の ML 製品を構築して運用できるようにします。 この目的を達成するために、まずアジャイル チームの組織構造を紹介します。これにより、製品の開発と実行に使用されるクラウド インフラストラクチャの中心的な要件が設定されます。 次に、SIGNAL IDUNA の XNUMX つの中央チームが、簡単に使用および適応できる適切なワークフローとインフラストラクチャ ソリューションを提供することで、機能横断的なチームが最小限の支援で AWS クラウドでデータ製品を構築できるようにする方法を示します。 最後に、私たちのアプローチを見直し、開発と運用がより厳密に分離されているより古典的なアプローチと比較します。
Agile@SI – 組織変革の基盤
2021 年の初め以来、SIGNAL IDUNA は戦略 Agile@SI を実行に移し、顧客志向のソリューションを開発するためのアジャイル手法を全社的に確立し始めました [1]。 以前のタスクと目標は現在、と呼ばれる部門横断的なチームによって引き受けられています。 分隊。 これらのチームはアジャイル手法 (スクラム フレームワークなど) を採用し、独自の意思決定を行い、顧客志向の製品を構築します。 通常、チームはマーケティングなどのビジネス部門に所属しており、多くはデータドリブンで ML を活用した製品の構築に重点を置いています。 一例として、保険における典型的なユースケースは、顧客離れの予測と製品の推奨です。
ML は複雑であるため、単一チームで ML ソリューションを作成することは困難であり、さまざまなチームの協力が必要です。
SIGNAL IDUNA には、ML ソリューションの作成をサポートする 2 つの重要なチームがあります。 これら XNUMX つの分隊に囲まれているのが、ML ソリューションの開発と長期的な運用を担当するチームです。 このアプローチは、AWS 責任共有モデル [XNUMX] に従っています。
上の画像では、すべての分隊が概要で表示されています。
クラウドの実現
組織全体の基盤となるクラウド インフラストラクチャは、Cloud Enablement 部門によって提供されます。 彼らの任務は、チームが独自にクラウド テクノロジーに基づいて製品を構築できるようにすることです。 これにより、ML のような新製品を開発して市場に出すまでの時間が短縮され、「自分で構築し、自分で実行する」という原則に従います。
データオフィス/データレイク
データのクラウドへの移動と適切なデータセットの検索は、チームのデータ オフィス/データ レイクによってサポートされています。 彼らは、必要なデータセットを検索して選択するために使用できるデータ カタログをセットアップします。 彼らの目的は、データの透明性とガバナンスを確立することです。 さらに、チームが関連データにアクセスして処理できるようにするデータ レイクの確立と運用も担当します。
データ分析プラットフォーム
私たちのデータ分析プラットフォーム (DAP) は、SIGNAL IDUNA のクラウドと ML に重点を置いたチームであり、ML エンジニアリング、データ エンジニアリング、データ サイエンスに精通しています。 インフラストラクチャ コンポーネントとナレッジを提供することで、内部チームが ML にパブリック クラウドを使用できるようにします。 当社の製品とサービスについては、次のセクションで詳しく説明します。
部門横断的なチームによる ML ソリューションの構築を可能にする
SIGNAL IDUNA の部門横断的なチームが ML ソリューションを構築できるようにするには、再利用可能なクラウド インフラストラクチャをプロビジョニングするための迅速かつ多用途な方法と、クラウド機能を活用するためのオンボーディング チームのための効率的なワークフローが必要です。
この目的を達成するために、標準化されたオンボーディングとサポートのプロセスを作成し、モジュール式のインフラストラクチャ テンプレートをコードとしてのインフラストラクチャ (IaC) として提供しました。 これらのテンプレートには、一般的な ML ユース ケース向けに設計されたインフラストラクチャ コンポーネントが含まれており、特定のユース ケースの要件に合わせて簡単に調整できます。
ML ソリューション構築のワークフロー
ML ソリューションの構築と運用には、データ サイエンティスト、ML エンジニア、データ エンジニアの XNUMX つの主な技術的役割が関係します。 各役割は部門横断的なチームの一部であり、異なる責任を負っています。 データ サイエンティストは、ユースケースの機能要件と技術要件について必要な専門知識を持っています。 ML エンジニアは、自動化された ML ソリューションの構築とモデルのデプロイを専門としています。 そして、データ エンジニアは、オンプレミスとクラウド内からデータが流れることを確認します。
プラットフォームの提供プロセスは次のとおりです。
特定のユースケースのインフラストラクチャは IaC で定義され、中央のプロジェクト リポジトリでバージョン管理されます。 これには、モデルのトレーニングとデプロイのためのパイプラインや、その他のデータ サイエンス関連のコード アーティファクトも含まれます。 データ サイエンティスト、ML エンジニア、データ エンジニアはプロジェクト リポジトリにアクセスでき、すべてのインフラストラクチャ コードを自律的に構成および更新できます。 これにより、チームは必要に応じてインフラストラクチャを迅速に変更できるようになります。 ただし、ML エンジニアは、インフラストラクチャまたは ML モデルの開発と更新をいつでもサポートできます。
再利用可能なモジュール式インフラストラクチャ コンポーネント
階層型およびモジュール型の IaC リソースは次のように実装されています。 テラフォーム 一般的なデータ サイエンスと ETL のユースケースのためのインフラストラクチャが含まれます。 これにより、インフラストラクチャ コードを再利用し、必要なセキュリティおよびコンプライアンス ポリシーを適用できます。 AWS キー管理サービス (KMS)) データの暗号化、およびインフラストラクチャのカプセル化 Amazon Virtual Private Cloud(VPC) インターネットに直接アクセスできない環境。
IaC の階層構造は次のとおりです。
- モジュール セキュリティとアクセス管理に必要な構成を備えた基本的な AWS サービスをカプセル化します。 これには、へのパブリック アクセスの防止などのベスト プラクティス構成が含まれます。 Amazon Simple Storage Service(S3) バケットを削除したり、保存されているすべてのファイルの暗号化を強制したりできます。
- 場合によっては、さまざまな段階で ML モデルをデプロイするなど、プロセスを自動化するためにさまざまなサービスが必要になります。 したがって、次のように定義しました。 ソリューション さまざまなタイプのタスク用の共同構成内のさまざまなモジュールのバンドルとして。
- さらに、完全な 設計図 さまざまな環境のソリューションを組み合わせて、プロジェクトの多くの潜在的なニーズに対応します。 MLOps ブループリントでは、AWS アカウントに統合および分散される ML モデルのトレーニング、プロビジョニング、モニタリングのためのデプロイ可能なインフラストラクチャを定義します。 詳細については次のセクションで説明します。
これらの製品は、DAP チームによって中央リポジトリでバージョン管理されます。 これにより、IaC を継続的に改善し、AWS の新機能を検討できるようになります。 アマゾンセージメーカー モデルレジストリ。 各分隊はこれらのリソースを参照し、必要に応じてパラメータ化し、最終的に独自の AWS アカウントにデプロイできます。
MLOps アーキテクチャ
MLOps プロセス全体をカバーする特定のソリューションを備えた、すぐに使用できるブループリントを提供します。 ブループリントには、ML モデルを構築およびデプロイするための XNUMX つの AWS アカウントに分散されたインフラストラクチャが含まれています。 これにより、MLOps プロセスのさまざまなステップのリソースとワークフローを分離できます。 次の図はマルチアカウント アーキテクチャを示しており、プロセスの特定のステップに対する責任がさまざまな技術的役割間でどのように分割されるかを説明します。
モデリング アカウントには、ML モデルの開発のためのサービスが含まれています。 まず、データ エンジニアは ETL プロセスを使用して、AWS クラウドのデータ駆動型ワークフローの一元化ゲートウェイである SIGNAL IDUNA データ レイクから関連データを提供します。 その後、データ サイエンティストはこのデータセットを利用して、モデル候補をトレーニングおよび評価できます。 大規模な実験の準備が完了すると、モデル候補は ML エンジニアによって自動トレーニング パイプラインに統合されます。 Amazon SageMaker Pipelines を使用して、トレーニング、ハイパーパラメータ調整、大規模なモデル評価を自動化します。 これには、モデルの系統と、本番環境へのデプロイメントのためにステージングされるモデルの標準化された承認メカニズムも含まれます。 自動化された単体テストとコード分析により、データの前処理、モデルのトレーニング、評価など、パイプラインの各ステップのコードの品質と信頼性が保証されます。 モデルが評価され承認されると、トレーニングされたモデルと関連するメタデータへのインターフェイスとして Amazon SageMaker ModelPackage を使用します。
ツーリング アカウントには、トレーニングされたモデルのテストとデプロイのためのさまざまな段階を備えた自動化された CI/CD パイプラインが含まれています。 テスト段階では、モデルが サービス非製品 アカウント。 モデルの品質は、モデルが実稼働用にステージングされる前にトレーニング パイプラインで評価されますが、ここでは分離されたテスト環境でパフォーマンス テストと統合テストを実行します。 テスト段階を通過した後、モデルは サービング製品 アカウントを運用ワークフローに統合します。
MLOps ワークフローのステージをさまざまな AWS アカウントに分離することで、開発とテストを本番環境から分離できます。 したがって、厳格なアクセスおよびセキュリティ ポリシーを適用できます。 さらに、カスタマイズされた IAM ロールにより、特定のサービスがその範囲に必要なデータおよびその他のサービスにのみアクセスできるようになります。 最小特権の原則。 さらに、サービス環境内のサービスに外部のビジネス プロセスからアクセスできるようにすることもできます。 たとえば、ビジネス プロセスは、モデル予測のためにサービス提供環境内のエンドポイントをクエリできます。
私たちのアプローチの利点
このプロセスには、ML モデルと必要なインフラストラクチャの両方の開発と運用を厳密に分離するのと比較して、多くの利点があります。
- 分離: すべてのチームは、他のチームの環境から完全に分離された独自の AWS アカウントのセットを受け取ります。 これにより、アクセス権の管理が容易になり、データを扱う資格のあるユーザーに対してデータを非公開に保つことができます。
- クラウドの有効化: クラウド DevOps の経験がほとんどないチーム メンバー (多くのデータ サイエンティストなど) は、中央サービスの背後に (ほとんど) 何も隠されていないため、インフラストラクチャの設計と管理のプロセス全体を簡単に見ることができます。 これによりインフラストラクチャへの理解が深まり、データ サイエンス製品をより効率的に作成できるようになります。
- 製品の所有権: 事前構成されたインフラストラクチャ ソリューションとマネージド サービスを使用することで、実稼働環境で ML 製品を管理する障壁が非常に低くなります。 したがって、データ サイエンティストは、実稼働環境に導入されるモデルの所有権を簡単に取得できます。 これにより、開発後にモデルを実稼働環境に導入できないというよく知られたリスクが最小限に抑えられます。
- 革新的手法: ML エンジニアは、モデルが本番環境に導入されるかなり前から関与するため、データ サイエンティストが ML モデルを開発している間に、新しいユースケースに適したインフラストラクチャ ソリューションを作成できます。
- 適応性: DAP が開発した IaC ソリューションは無料で利用できるため、どのチームでもユースケースの特定のニーズに合わせてこれらを簡単に適応させることができます。
- オープンソース: 新しいインフラストラクチャ ソリューションはすべて、中央の DAP コード リポジトリを介して簡単に利用できるようになり、他のチームが使用できるようになります。 時間の経過とともに、これにより、さまざまなユースケースに合わせて調整されたインフラストラクチャ コンポーネントを備えた豊富なコード ベースが作成されます。
まとめ
この投稿では、SIGNAL IDUNA の部門横断的なチームが AWS 上で ML 製品を構築および実行できるようにする方法を説明しました。 私たちのアプローチの中心となるのは、各チームの専用の AWS アカウントのセットを、オーダーメイドの IaC ブループリントやソリューションと組み合わせて使用することです。 これら XNUMX つのコンポーネントにより、部門を超えたチームが実稼働品質のインフラストラクチャを作成および運用できるようになります。 さらに、自社の ML 製品のエンドツーエンドの完全な所有権を取得できます。
参照する Amazon SageMaker モデル構築パイプライン – Amazon SageMaker to learn more.
より詳しい情報を探す AWS 上の ML 公式ページにあります。
参考文献
[1] https://www.handelsblatt.com/finanzen/versicherungsbranche-vorbild-spotify-signal-iduna-wird-von-einer-handwerker-versicherung-zum-agilen-konzern/27381902.html
[2] https://blog.crisp.se/wp-content/uploads/2012/11/SpotifyScaling.pdf
[3] https://aws.amazon.com/compliance/shared-responsibility-model/
著者について
ヤン・ポール・アセンドルプ データ サイエンスに重点を置く ML エンジニアです。 彼は ML モデルを構築し、モデルのトレーニングと運用環境への展開を自動化します。
トーマス・リーツォー チーム データ分析プラットフォームのスクラム マスターです。
クリストファー・マッシュ データ分析プラットフォーム部門のプロダクト オーナーであり、データ エンジニアリング、データ サイエンス、ML エンジニアリングの知識を持っています。
アレクサンダー・マイナート データ分析プラットフォーム チームの一員で、ML エンジニアとして働いています。 統計から始めて、データ サイエンス プロジェクトで成長し、ML メソッドとアーキテクチャに情熱を感じました。
ラース・パルツァー博士 データサイエンティストであり、データ分析プラットフォームチームの一員です。 MLOps アーキテクチャ コンポーネントの構築を支援した後、現在はそれらを使用して ML 製品を構築しています。
ヤン・シレマンス ソフトウェア エンジニアリングの背景を持つ ML エンジニアです。 彼は、ソフトウェア エンジニアリングのベスト プラクティスを ML 環境 (MLOps) に適用することに重点を置いています。
- "
- 100
- 2021
- アクセス
- 越えて
- Action
- 利点
- 使い勝手のいい
- すべて
- しかし
- Amazon
- 分析
- 分析論
- 適用
- アプローチ
- 建築
- 自動化
- 利用できます
- AWS
- さ
- BEST
- ベストプラクティス
- ビルド
- 建物
- 一式販売
- ビジネス
- 機能
- 例
- 挑戦する
- クラウド
- クラウドインフラ
- コード
- 環境、テクノロジーを推奨
- 組み合わせ
- コマンドと
- 会社
- 比べ
- コンプライアンス
- 含まれています
- 作成
- データ
- データ分析
- データサイエンス
- データサイエンティスト
- 専用の
- 展開します
- 展開する
- 展開
- 設計
- 詳細
- 開発する
- 発展した
- 開発
- 開発
- 異なります
- 話し合います
- 配布
- ドメイン
- 簡単に
- 暗号化
- エンドポイント
- エンジニア
- エンジニアリング
- エンジニア
- 環境
- 本質的な
- 確立する
- 例
- 体験
- スピーディー
- 特徴
- フィギュア
- 最後に
- 名
- フォーカス
- 焦点を当て
- フォロー中
- 発見
- Foundation
- フレームワーク
- フル
- 目標
- ガバナンス
- 助けます
- ことができます
- こちら
- 認定条件
- HTTPS
- 画像
- 実装
- 重要
- 改善します
- include
- 情報
- インフラ
- 保険
- 統合された
- 統合
- インタフェース
- インターネット
- 関係する
- IT
- キー
- 知識
- 大
- LEARN
- 学習
- 少し
- 長い
- 機械
- 機械学習
- 管理
- 管理する
- 市場
- マーケティング
- 一致
- メンバー
- Meta
- ML
- モデル
- モジュラー
- モニタリング
- 新しい特徴
- 新製品
- 提供
- 公式
- 新人研修
- オペレーティング
- 組織
- その他
- 所有者
- パフォーマンス
- プラットフォーム
- ポリシー
- 方針
- 予測
- 予測
- 防止
- プライベート
- プロセス
- ラボレーション
- プロダクト
- 生産
- 製品
- 演奏曲目
- プロジェクト
- プロジェクト(実績作品)
- 提供します
- 公共
- パブリッククラウド
- 品質
- 倉庫
- の提出が必要です
- 要件
- リソース
- 責任
- レビュー
- リスク
- ラン
- 規模
- 科学
- 科学者
- 科学者たち
- を検索
- セキュリティ
- サービス
- サービス
- サービング
- セッションに
- shared
- 簡単な拡張で
- ソフトウェア
- ソフトウェア工学
- ソリューション
- 専門にする
- 過ごす
- ステージ
- start
- 開始
- 統計
- ストレージ利用料
- 戦略
- 強い
- 続いて
- サポート
- サポート
- 囲まれた
- タスク
- チーム
- 技術的
- テクノロジー
- test
- テスト
- テスト
- 時間
- トレーニング
- 変換
- 透明性
- アップデイト
- us
- つかいます
- 活用する
- バーチャル
- よく見る
- 誰
- 以内
- 無し
- 仕事
- 労働人口
- 作品