これは、Modulate の CTO 兼共同設立者である Carter Huffman によるゲスト投稿です。
変調 ボストンを拠点とするスタートアップ企業で、すべての人に、より豊かで、より安全で、より包括的なオンライン ゲーム体験を構築することを使命としています。 私たちは、より良いオンライン ワールドを構築し、すべてのプレイヤーにとってボイス チャットをより安全なものにすることを熱望している、世界クラスのオーディオ エキスパート、ゲーマー、味方、未来派のチームです。 私たちは、プロアクティブな音声ネイティブ モデレーション プラットフォームである ToxMod を使用して、まさにそれを行っています。 ゲームのパブリッシャーと開発者は、ToxMod を使用して、独自のコンテンツ ポリシー、行動規範、およびコミュニティ ガイドラインに従って、ゲーム内のボイス チャットを積極的に管理しています。
アプリケーションに必要なスケーラビリティと弾力性、およびそれが提供する優れた顧客サービスのために、AWS を選択しました。 使用する アマゾン エラスティック コンピューティング クラウド (Amazon EC2) G5g インスタンス ToxMod のインフラストラクチャとして NVIDIA T4G Tensor コア GPU を採用することで、スループットとレイテンシの目標を達成しながら、コストを 5 分の 4 (GXNUMXdn インスタンスと比較して) 削減することができました。 機敏なスタートアップとして、私たちはこれらのコスト削減をさらなるイノベーションに再投資して、私たちの使命を果たすことができます. この投稿では、ユースケース、課題、代替パス、および AWS を使用したソリューションの簡単な概要について説明します。
変化するメタバースと ToxMod の必要性
最新のオンライン ゲームとメタバース プラットフォームは、以前よりもはるかにソーシャルになっています。 歴史的に、ゲームは特定の厳選された体験をプレイヤーに提供することに重点を置いてきました。 今日では、プレイヤーとその友人が集まり、参加するさまざまな経験を選択できる共同スペースへと進化しています。
実際には、 最近の研究 名誉毀損防止組合、ゲームにおける有害性はかつてないほど悪化しています。ゲームでの白人至上主義のイデオロギーへの露出は、2022 年に 17 倍以上になりました。成人ゲーマーの XNUMX 分の XNUMX 以上が、オンライン ゲームで深刻な嫌がらせを経験したと報告しています。 過去 XNUMX 年間で、XNUMX 万人を超える若いゲーマーが危害や嫌がらせにさらされました。 問題は悪化するばかりで、 今後の規制 これにより、スタジオは毒性の管理と報告においてより積極的な役割を果たす必要があり、積極的な音声モデレーションの必要性はこれまで以上に緊急になっています。
ToxMod は、ゲーム パブリッシャーとプラットフォームが独自のポリシーとガイドラインに従ってボイス チャットを積極的にモデレートし、コミュニティを安全かつ前向きに保つのに役立ちます。 ToxMod は、一連の機械学習 (ML) モデルを実行して、音声会話の感情、テキスト、および会話の側面を分析し、パブリッシャーまたはプラットフォームのコンテンツ ポリシーに違反がないかどうかを判断します。 違反は人間のモデレーターに報告され、モデレーターは悪意のある人物に対して行動を起こすことができます。 当社の ML モデルには、違反を分類し、違反が発生したことの確信度を判断するランク スコアを提供する、感情検出、文字起こし、および NLP を利用した会話分析が含まれます。 これらの検出はリアルタイムで行われ、ゲームのパブリッシャーは、毒性が発生しているときに積極的にコミュニティをモデレートし、プレイヤーへの危害や危険な会話がエスカレートするのを防ぐことができます。
経済的および技術的な考慮事項
経済的制約と技術的制約という XNUMX 種類の制約があります。 経済面での問題は、変動する需要と、必要なコンピューティング インフラストラクチャの不確実な規模です。 ゲーム業界では、開発者やパブリッシャーは最小限のマージンでゲームを立ち上げ、ゲームが成功するにつれて規模を拡大します。 この成功は、最大規模の顧客が毎月数百万時間のボイス チャットを処理していることを意味します。 ToxMod のコストは、オーディオ処理の時間数に比例します。これは、プレイヤーの行動やゲームの人気に影響を与える外的要因に基づいて非常に動的です。 ToxMod に電力を供給するために独自のサーバーを運用することは、コストとチームの帯域幅の両方の点で法外に高くつきます。 オンプレミス サーバーにはこのスケーラビリティが欠けており、十分に活用されないことが多いため、ToxMod の正しい選択はクラウドです。 AWS を使用すると、コストを最小限に抑えながら、顧客の需要に合わせて動的にスケーリングできます。
技術面では、あらゆる音声処理アプリケーションの構築と同様に、レイテンシとスループットのバランスを取る必要があります。 一部のユーザーは、コミュニティで発生する可能性のある状況に 2、5 分以内に対処する機能を望んでいます。 レイテンシの予算を満たすために、可能な限り低レベルにします。 多くの場合、ARM プロセッサで実行されるクライアント側デバイスで ToxMod コード ベースが実行されるため、私たちは ARM デバイスで多くの経験を積んでいます。 NVIDIA T4G Tensor コア GPU を搭載した ECXNUMX GXNUMXg インスタンスと、 AWS グラビトン 2 プロセッサは、クライアント側で使用するために開発されたカスタム ニューラル ネットワーク推論コードの一部に自然に適合しました。
コスト効率と AWS の信頼性のための EC2 G5g インスタンス
これらの考慮事項により、G5g インスタンスを ToxMod のインフラストラクチャとして使用することにしました。これは、費用対効果が高く、モデルをテストおよびデプロイするための使い慣れた環境を提供するためです。 この選択により、最終的にコストを 5 分の 4 に削減することができました (G5dn インスタンスと比較して)。 迅速に反復できるようにするには、データ サイエンティストと ML エンジニアが使い慣れたコンピューティング環境が必要でした。 G4g インスタンスで実行されているすべての関連ドライバー、ライブラリ、環境変数を含むマシン イメージを 5 日で取得できました。 G40dn インスタンスで開始し、GXNUMXg での最初のテストにより、コストを XNUMX% 削減することができました。 実行するのに最も高価なモデルの多くは GPU バウンドであるため、単一の GPU にアクセスしながら CPU 使用率を最大化できるインスタンス サイズに適切なサイズにすることで、コストをさらに最適化することができました。
G5g インスタンスが私たちの構成で特にうまく機能するだけでなく、AWS のテクニカル サポートとアカウント管理を頼りにして、問題を迅速に解決し、負荷が非常に変動しやすい状況でも非常に高いアップタイムを維持できることを知っていました。 私たちが始めたとき、私たちは XNUMX か月あたり XNUMX 桁未満の支出でしたが、実際の人が私たちのユースケースについて学ぶために連絡を取り、人々のチームが私たちと協力して、アプリケーションを機能させるだけでなく、最もコストをかけずに機能させました。効率的な方法。
ソリューションの概要
ToxMod のソリューションは、音声の取り込みから始まります。これは、当社の SDK をゲームまたはプラットフォームのボイス チャット インフラストラクチャに統合することによって実現されます。 オーディオを処理するときは、リソースを非常に効率的に使用する必要があるため、(API またはその他のインターフェイスを介して) SDK を使用することは非常に重要です。 単一の音声ストリームについては、それを処理してシステムの残りの部分に迅速に戻す必要があります。そうしないと、顧客が音声の不具合に遭遇することになります。これは、何としても避けたいことです。 メモリ割り当て、ガベージ コレクション、システム コールなど、さまざまな原因で不具合が発生する可能性があるため、ToxMod SDK を開発して、オーディオ処理を可能な限りスムーズに行えるようにしました。
SDK から、ボイス チャットは短いバッファでエンコードされ、インターネット経由で送信されます。 取り込み側では、数秒間のオーディオをバッファリングし、パッケージを AWS クラウドに送信する前に音声会話の自然なブレークポイントを見つけようとします。AWS クラウドでは、受信データを保存します。 AWSラムダ 機能。 そこから、さまざまな ML オーディオ モデルを実行する G5g インスタンスでの処理を通じて、音声会話の分析が行われます。 受信したすべてのパケットをまとめて G5g インスタンスの GPU に送信することで、オーバーヘッドを最小限に抑えます。 G5g インスタンスは、処理するオーディオ クリップのキューを介して供給されます。これは、XNUMX 日のトラフィックの変化に応じて効率的にスケールアップまたはスケールダウンする自動スケーリング グループに接続されています。
今後
ToxMod は、小規模なインディー開発チームから AAA、複数チームの開発者、パブリッシャーまで、あらゆる規模のスタジオ向けに構築されています。 現在、私たちは、最大規模のスタジオのエンタープライズ チームがソフトウェア パートナーに期待するレベルのサポート、製品開発、および堅牢な機能を提供する上で、これまで以上に優れた立場にあります。 18 言語の多言語サポート、24 時間年中無休のエンタープライズ レベルのサポート、複数のゲームを含むスタジオ向けのシングルテナント ライセンス、および AWS が提供するスケーラブルな ML インフラストラクチャのサポートにより、AAA スタジオがボイスチャットを安全にするのを支援します。彼らのプレーヤーのために。
EC2 G5g インスタンスが ML ワークロードを費用対効果の高い方法でデプロイするのにどのように役立つかについて詳しく知りたい場合は、以下を参照してください。 Amazon EC2 G5g インスタンス.
著者について
カーター・ハフマン Modulate の CTO 兼共同設立者である Modulate は、オンラインの毒性と戦い、ゲームでの音声コミュニケーションを強化することを目的とした音声技術の新興企業です。 彼は物理学、機械学習、データ分析のバックグラウンドを持ち、以前は NASA のジェット推進研究所で働いていました。 彼は、ディープ ニューラル ネットワークを使用して人間の音声を理解し、操作することに情熱を注いでいます。 MIT を卒業し、物理学の学士号を取得しました。
シュルティ・コパーカー AWS のシニア プロダクト マーケティング マネージャーです。 彼女は、顧客が機械学習のニーズに合わせて EC2 アクセラレーテッド コンピューティング インフラストラクチャを調査、評価、採用するのを支援しています。
- SEO を活用したコンテンツと PR 配信。 今日増幅されます。
- Platoblockchain。 Web3メタバースインテリジェンス。 知識の増幅。 こちらからアクセスしてください。
- 情報源: https://aws.amazon.com/blogs/machine-learning/modulate-makes-voice-chat-safer-while-reducing-infrastructure-costs-by-a-factor-of-5-with-amazon-ec2-g5g-instances/
- :は
- $UP
- 100
- 1億1000万人
- 2022
- 7
- a
- 単4
- 能力
- できる
- 私たちについて
- 虐待
- 加速された
- アクセス
- 熟達した
- 従った
- アカウント管理
- 達成する
- Action
- アクティブ
- 俳優
- 住所
- 採用
- 成人
- 影響
- に対して
- 目指して
- すべて
- 配分
- 代替案
- Amazon
- Amazon EC2
- 分析
- 分析します
- および
- API
- 申し込み
- です
- ARM
- AS
- 側面
- At
- オーディオ
- オート
- 利用できます
- AWS
- バック
- 背景
- 悪い
- 帯域幅
- ベース
- ベース
- BE
- なぜなら
- になる
- になる
- より良いです
- の間に
- ブレーク
- 予算
- バッファ
- ビルド
- 建物
- 内蔵
- by
- 缶
- 場合
- 原因となる
- 課題
- 変化
- 選択
- 選択する
- 選んだ
- クリップ
- クラウド
- 共同創設者
- コード
- コードベース
- コレクション
- コミュニケーション
- コミュニティ
- コミュニティ
- 比べ
- 計算
- コンピューティング
- プロフェッショナルな方法で
- 確信して
- 検討事項
- 制約
- コンテンツ
- 会話
- 会話
- 会話
- 基本
- 費用
- コスト削減
- コスト効率の良い
- コスト
- 可能性
- カップル
- カバー
- 重大な
- CTO
- キュレーション
- カスタム
- 顧客
- 顧客サービス
- Customers
- 危険な
- データ
- データ分析
- 中
- 決定しました
- 深いです
- 需要
- 展開します
- 検出
- 決定する
- デベロッパー
- 発展した
- 開発者
- 開発
- Devices
- 数字
- すること
- 二桁
- 倍増
- ダウン
- ドライバー
- ダイナミック
- 動的に
- 経済
- 効率良く
- enable
- 使用可能
- エンジニア
- 確保
- Enterprise
- エンタープライズグレード
- 環境
- 環境
- 評価する
- EVER
- 誰も
- 進化
- 進化
- 期待する
- 高価な
- 体験
- エクスペリエンス
- 体験
- 専門家
- 探る
- 露出した
- 暴露
- 外部
- 非常に
- 要因
- おなじみの
- 特徴
- 特色
- FRBは
- 戦い
- もう完成させ、ワークスペースに掲示しましたか?
- フィット
- フラグが立てられた
- 焦点を当て
- 友達
- から
- 機能
- さらに
- ゲーム
- ゲーマー
- Games
- ゲーム業界
- 賭博
- 取得する
- 受け
- Go
- 目標
- GPU
- GPU
- 素晴らしい
- グループの
- ゲスト
- ゲストのポスト
- ガイドライン
- ハンド
- 起こる
- 出来事
- 持ってる
- 持って
- 助けます
- 助けました
- ことができます
- こちら
- ハイ
- 非常に
- 歴史的に
- HOURS
- 認定条件
- HTTP
- HTTPS
- 人間
- イデオロギー
- 画像
- in
- include
- 包括的
- 入ってくる
- 産業を変えます
- インフラ関連事業
- 初期
- 革新的手法
- 統合
- インタフェース
- インターネット
- 問題
- IT
- JPG
- 保管
- 実験室
- 欠如
- ESL, ビジネスESL <br> 中国語/フランス語、その他
- 最大の
- レイテンシ
- 起動する
- LEARN
- 学習
- レベル
- ライブラリ
- ライセンス
- ような
- 負荷
- たくさん
- ロー
- 機械
- 機械学習
- 維持する
- make
- 作る
- 管理
- マネージャー
- 管理する
- 操作する
- 方法
- 多くの
- 余白
- マーケティング
- 一致
- 最大化します
- 五月..
- 意味
- 大会
- メモリ
- メタバース
- メタバースプラットフォーム
- 百万
- 何百万
- 最小限の
- 最小
- 分
- ミッション
- マサチューセッツ工科大学(MIT)
- ML
- モデル
- 節度
- 月
- 他には?
- 最も
- の試合に
- 複数のゲーム
- ナチュラル
- 必要
- ニーズ
- ネットワーク
- ネットワーク
- ニューラルネットワーク
- ニューラルネットワーク
- 数
- Nvidia
- 発生した
- of
- オファー
- on
- オンライン
- オンラインゲーム
- オペレーティング
- 最適化
- その他
- さもないと
- 概要
- 自分の
- パッケージ
- パケット
- 特に
- パートナー
- 情熱的な
- 過去
- のワークプ
- 人
- 物理学
- プラットフォーム
- プラットフォーム
- プラトン
- プラトンデータインテリジェンス
- プラトデータ
- プレーヤー
- ポイント
- ポリシー
- 人気
- 配置された
- 正の
- 可能
- ポスト
- 電力
- パワード
- 予防
- 前に
- 先を見越した
- 問題
- プロセス
- 処理済み
- 処理
- プロセッサ
- プロセッサ
- プロダクト
- 製品開発
- 推進
- 提供します
- は、大阪で
- 提供
- 出版社
- すぐに
- 達した
- リアル
- への
- 受け取ります
- 縮小
- 再投資
- 関連した
- 報告
- 各種レポート作成
- 必要とする
- の提出が必要です
- REST
- 堅牢な
- 職種
- 台無しにする
- ラン
- ランニング
- 安全な
- より安全な
- Save
- 貯蓄
- スケーラビリティ
- ド電源のデ
- 規模
- スケーリング
- 科学
- 科学者たち
- スコア
- SDDK
- 秒
- 送信
- シニア
- シリーズ
- 役立つ
- サーバー
- サービス
- 厳しい
- ショート
- 側
- 状況
- サイズ
- サイズ
- 小さい
- So
- 社会
- ソフトウェア
- 溶液
- 一部
- 何か
- スペース
- 特定の
- スピーチ
- 支出
- 開始
- スタートアップ
- まだ
- 流れ
- ストライキ
- スタジオ
- 成功
- 成功した
- サポート
- 取る
- チーム
- チーム
- 技術的
- テクノロジー
- 条件
- test
- テスト
- それ
- アプリ環境に合わせて
- それら
- ボーマン
- 物事
- 介して
- 全体
- スループット
- 時間
- 〜へ
- 今日
- トラフィック
- 最終的に
- 不確かな
- 理解する
- uptime
- 緊急
- us
- 使用法
- つかいます
- 使用事例
- users
- 多様
- 、
- 違反
- 違反
- ボイス
- WELL
- which
- while
- 白
- 誰
- 意志
- 以内
- 仕事
- 働いていました
- ワーキング
- 世界
- ワールドクラス
- でしょう
- 年
- You
- 若い
- あなたの
- ゼファーネット