総合的なメンタルモデルを使用して AI 製品を構築する

総合的なメンタルモデルを使用して AI 製品を構築する

AI 製品の構築

注: この記事は、AI システムのメンタル モデルを紹介する「AI アプリケーションの解剖」シリーズの最初の記事です。 このモデルは、専門分野を超えた AI チームと製品チームによる AI 製品の議論、計画、定義、およびビジネス部門との連携のためのツールとして機能します。 プロダクト マネージャー、UX デザイナー、データ サイエンティスト、エンジニア、その他のチーム メンバーの視点を結集することを目的としています。 この記事ではメンタル モデルを紹介しますが、今後の記事ではそれを特定の AI 製品や機能に適用する方法を説明します。

多くの企業は、自社のサービスに AI を組み込むために必要なのは、AI の専門家を雇って、彼らに技術的な魔法を演じてもらうことだけだと考えています。 このアプローチは、彼らを統合の誤謬に直接導きます。たとえこれらの専門家やエンジニアが優れたモデルやアルゴリズムを作成したとしても、その成果物は多くの場合、プレイグラウンド、サンドボックス、デモのレベルに留まり、実際には製品の本格的な部分にはなりません。 私は長年にわたり、技術的に優れた AI 実装がユーザー向け製品に導入されていないデータ サイエンティストやエンジニアからの多大な不満を見てきました。 むしろ、彼らは社内の関係者に AI の波に乗っているという印象を与える最先端の実験という名誉ある地位を持っていました。 2022 年に ChatGPT が公開されて以来、AI が至る所で普及した現在、企業はもはや AI を自社の技術的洞察力を誇示するための「灯台」機能として使用する余裕はありません。

AI の統合はなぜこれほど難しいのでしょうか? 理由はいくつかあります。

  • 多くの場合、チームは AI システムの XNUMX つの側面に焦点を当てます。 これにより、データ中心の AI、モデル中心の AI、人間中心の AI など、個別の陣営の出現にさえつながりました。 それぞれが研究に刺激的な視点を提供しますが、実際の製品では、データ、モデル、および人間とマシンの相互作用を一貫したシステムに結合する必要があります。
  • AI 開発は高度に協力的な事業です。 従来のソフトウェア開発では、バックエンド コンポーネントとフロントエンド コンポーネントからなる比較的明確な二分法で作業します。 AI では、より多様な役割とスキルをチームに追加するだけでなく、さまざまな関係者間の緊密な協力を確保する必要があります。 AI システムのさまざまなコンポーネントは、密接な方法で相互作用します。 たとえば、仮想アシスタントに取り組んでいる場合、UX デザイナーは自然なユーザー フローを作成するためのプロンプト エンジニアリングを理解する必要があります。 データ アノテーターは、一貫性があり、ポジショニングに合わせたトレーニング データを作成するために、ブランドと仮想アシスタントの「キャラクター特性」を認識する必要があり、プロダクト マネージャーは、データ パイプラインのアーキテクチャを把握して精査して、ユーザーのガバナンス上の懸念を満たします。
  • AI を構築する際、企業は設計の重要性を過小評価することがよくあります。 AI はバックエンドから始まりますが、本番環境でそれを輝かせるには優れた設計が不可欠です。 AI デザインは、従来の UX の限界を押し広げます。 あなたが提供する機能の多くは、それ自体インターフェイスには表示されず、モデル内に「隠されている」ため、これらの利点を最大限に活用できるようにユーザーを教育し、ガイドする必要があります。 さらに、最新の基礎モデルは有毒で間違った有害な出力を生成する可能性がある荒々しいものであるため、これらのリスクを軽減するために追加のガードレールを設定することになります。 これらすべてを行うには、プロンプト エンジニアリングや会話型デザインなど、チームに新しいスキルが必要になる場合があります。 場合によっては、ユーザーの期待を管理するために価値を控えめにしたり、ユーザーのコントロールと透明性を高めるために摩擦を加えたりするなど、直感に反することを行うことも意味します。
  • AI の誇大宣伝はプレッシャーを生み出します。 多くの企業は、顧客や市場のニーズによって検証されていない実装に飛びつくことで本末転倒です。 時折、AI のバズワードを投入することは、マーケティングを行い、進歩的で革新的なビジネスとしての地位を確立するのに役立ちますが、長期的には、そのバズワードや実験を実際の機会で裏付ける必要があります。 これは、市場側の機会と技術的可能性の明確なマッピングに基づいた、ビジネスとテクノロジー間の緊密な調整によって達成できます。

この記事では、これらのさまざまな側面を統合する AI システムのメンタル モデルを構築します (図 1 参照)。 これにより、ビルダーは総合的に考え、対象製品を明確に理解し、その過程で新しい洞察やインプットで製品を更新することができます。 このモデルは、コラボレーションを容易にし、AI チーム内外の多様な視点を調整し、共有のビジョンに基づいて成功する製品を構築するためのツールとして使用できます。 AIを活用した新しい製品だけでなく、既存の製品に組み込まれているAI機能にも適用できます。

AI 製品の構築
図 1: AI システムのメンタル モデル

次のセクションでは、AI 製品に特有の部分に焦点を当てて、各コンポーネントについて簡単に説明します。 まずビジネスの視点、つまり市場側の機会と価値から始めて、次に UX とテクノロジーについて詳しく説明します。 モデルを説明するために、マーケティング コンテンツを生成するための副操縦士の実行例を使用します。

この詳細な教育コンテンツが役立つ場合は、次のことができます。 AIリサーチメーリングリストに登録する 新しい素材がリリースされたときに警告が表示されます。 

1。 チャンス

AI を使ってさまざまなことができるようになったので、実際に手を動かして構築を始めたいと焦るかもしれません。 ただし、ユーザーが必要とし、気に入ったものを構築するには、市場機会を利用して開発を支援する必要があります。 理想的な世界では、何が必要か、何を望んでいるのかを私たちに伝える顧客からチャンスがもたらされます。[1] これらは、満たされていないニーズ、問題点、または欲求である可能性があります。 この情報は、製品レビューや営業チームや成功チームからのメモなど、既存の顧客からのフィードバックから見つけることができます。 また、自分自身が製品の潜在的なユーザーであることを忘れないでください。自分自身が経験した問題をターゲットにしている場合、この情報の利点がさらなる利点となります。 これに加えて、アンケートやインタビューなどのツールを使用して、積極的な顧客調査を実施することもできます。

たとえば、スタートアップ企業だけでなく、大企業のコンテンツ マーケティングの苦労も、あまり遠くに目を向ける必要はありません。 私自身もそれを経験しました。競争が激化するにつれ、差別化のためには、個人的で定期的な (!) 高品質のコンテンツによるソート リーダーシップの開発がますます重要になります。 一方、小規模で多忙なチームでは、その週のブログ投稿を書くことよりも重要と思われる事柄が常にテーブルの上にあります。 また、私のネットワーク内では、コンテンツ マーケティングの一貫したルーチンを確立するのに苦労している人々にもよく会います。 これらの「ローカル」で潜在的に偏った観察は、ネットワークを超えてソリューションに対するより広範な市場を確認する調査によって検証できます。

現実の世界はもう少し曖昧で、顧客は常に新しく、適切に計画された機会を提示しに来るとは限りません。 むしろ、アンテナを張っていれば、次のようなさまざまな方向からチャンスが舞い込んできます。

  • 市場ポジショニング: AI はトレンドです。確立されたビジネスの場合、革新的、ハイテク、将来性があるなどのビジネスのイメージを強化するために AI を使用できます。たとえば、既存のマーケティング代理店を AI を活用したサービスに昇格させることができます。競合他社との差別化を図ります。 ただし、AI のために AI を行うのはやめてください。 ポジショニングのコツは、他の機会と組み合わせて慎重に適用する必要があります。そうしないと、信頼を失う危険があります。
  • 競合他社: 競合他社が動き出すときは、基礎的な調査と検証をすでに行っている可能性があります。 しばらくしてからそれらを見てください - 開発は成功しましたか? この情報を使用して、独自のソリューションを最適化し、成功した部分を採用し、間違いを修正します。 たとえば、マーケティング コンテンツを完全に自動生成するサービスを提供している競合他社を観察しているとします。 ユーザーが「大きな赤いボタン」をクリックすると、AI がコンテンツを作成して公開します。 調査を行った結果、ユーザーはプロセスをより詳細に制御し、自分の専門知識や個性を文章に貢献したいため、この製品の使用をためらっていることがわかりました。 結局のところ、書くことは自己表現と個人の創造性に関するものでもあります。 今こそ、コンテンツを形成するための豊富な機能と構成を提供する多用途ツールの導入を進める時期です。 これにより、ユーザーはいつでも好きなときにプロセスに自分自身を「注入」できるようになり、ユーザーの効率が向上します。
  • 法規制:技術的破壊やグローバリゼーションなどのメガトレンドにより、規制当局は要件の強化を余儀なくされています。 規制はプレッシャーを生み出すと同時に、完璧なチャンスの源でもあります。 たとえば、AI によって生成されたコンテンツをそれ自体として宣伝することをすべての人に厳しく義務付ける規制が施行されたと想像してください。 すでに AI コンテンツ生成ツールを使用している企業は、これを望むかどうかについての社内議論のために姿を消すことになります。 彼らの多くは、AI によって生成された目に見える定型文を作成するのではなく、真のソート リーダーシップのイメージを維持したいため、控えるでしょう。 あなたが賢明で、ユーザーがテキストの正式な「作成者」であり続けることができるように、ユーザーに十分な制御を与える拡張ソリューションを選択したとします。 新しい制限が導入されても、貴社は影響を受けず、規制を利用するために猛ダッシュできますが、完全に自動化されたソリューションを使用する競合他社は後退から立ち直るのに時間がかかるでしょう。
  • テクノロジーの実現: 2022 年から 23 年にかけての生成 AI の波など、新興テクノロジーや既存テクノロジーの大きな飛躍は、新しいやり方を切り開いたり、既存のアプリケーションを新しいレベルに押し上げたりする可能性があります。 過去 XNUMX 年間、従来のマーケティング代理店を経営しているとします。 AI ハックとソリューションをビジネスに導入し始めて、従業員の効率を高め、既存のリソースでより多くのクライアントにサービスを提供し、利益を増やすことができます。 あなたは既存の専門知識、評判、そして(できれば善意の)顧客ベースを基盤に構築しているため、AI 拡張機能の導入は、新人の場合よりもはるかにスムーズでリスクが少ない可能性があります。

最後に、現代の製品の世界では、機会はあまり明示的かつ形式的ではないことが多く、実験で直接検証できるため、開発がスピードアップされます。 したがって、製品主導の成長では、チームメンバーは厳密なデータ主導の議論を行わなくても、独自の仮説を立てることができます。 これらの仮説は、プロンプトの変更や一部の UX 要素のローカル レイアウトの変更など、部分的な方法で定式化できるため、実装、展開、テストが容易になります。 提供しなければというプレッシャーを取り除くことで、 アプリオリ 新しい提案ごとにデータを収集するこのアプローチでは、チーム メンバー全員の直感と想像力を活用しながら、提案を直接検証します。 コンテンツの生成はスムーズに行われていますが、AI の透明性と説明可能性が全体的に欠如しているという苦情を聞くことが増えているとします。 追加の透明性レベルを実装し、コンテンツの生成に使用された特定のドキュメントをユーザーに表示することにしました。 あなたのチームは、この機能をユーザー集団でテストしたところ、元の情報ソースを追跡するためにこの機能を喜んで使用していることがわかりました。 そこで、使用率と満足度を高めるために、これをコア製品に確立することにしました。

2。 値

AI 製品や機能の価値を理解し、伝えるには、まずそれをユースケース (それが解決する特定のビジネス上の問題) にマッピングし、ROI (投資収益率) を把握する必要があります。 そのため、テクノロジから意識を移し、ソリューションのユーザー側の利点に焦点を当てる必要があります。 ROI はさまざまな次元に沿って測定できます。 AI の場合、次のようなものがあります。

  • 効率の向上: AI は、個人、チーム、企業全体の生産性を向上させることができます。 たとえば、コンテンツ生成の場合、ブログ投稿 [4] を書くのに通常 5 ~ 2 時間かかるところを、1 ~ 2 時間で完了し、節約した時間を他のタスクに費やすことができるかもしれません。 同じ量の作業を実行するのに必要な人間の労力が少なくなるため、効率の向上とコストの削減が同時に行われることがよくあります。 したがって、ビジネスの文脈では、この利点はユーザーとリーダーの両方にとって魅力的です。
  • よりパーソナライズされたエクスペリエンス: たとえば、コンテンツ生成ツールは、ブランド属性、用語、製品の利点などの会社のパラメーターを設定するようにユーザーに求めることができます。さらに、特定のライターによって行われた編集を追跡し、その世代を独自の文章に適応させることもできます。このユーザーの時間の経過に伴うスタイル。
  • 楽しさと喜び: ここでは、ドン ノーマン [3] によって「内臓」レベルとも呼ばれる、製品使用の感情的な側面に入ります。 B2C キャンプには、ゲームや拡張現実など、楽しみやエンターテイメントを目的とした製品のカテゴリ全体が存在します。 B2B についてはどうでしょうか。B2B 製品は無菌の専門的な真空の中に存在すると思いませんか? 実際には、このカテゴリは B2C よりもさらに強い感情的反応を引き起こす可能性があります。[4] たとえば、書くことは自己表現の満足のいく行為として認識されることもあれば、書き手の行き詰まりやその他の問題との内なる葛藤として認識されることもあります。 あなたの製品がどのようにしてタスクのポジティブな感情を強化し、その苦痛な側面を軽減、さらには変革できるかを考えてください。
  • 利便性: AI の魔法の力を活用するには、ユーザーは何をする必要がありますか? コンテンツ生成コパイロットを MS Office、Google Docs、Notion などの一般的なコラボレーション ツールに統合することを想像してください。 ユーザーは、快適なデジタル「ホーム」から離れることなく、製品のインテリジェンスと効率性にアクセスできるようになります。 したがって、ユーザーが製品の価値を体験し、使い続けるために必要な労力を最小限に抑えることができ、結果的にユーザーの獲得と採用が促進されます。

AI の利点の一部 (効率など) は、ROI として直接定量化できます。 利便性や楽しさなどの目に見えにくい利益については、ユーザー満足度などの代替指標について考える必要があります。 エンドユーザーの価値の観点から考えることは、ユーザーと製品の間のギャップを埋めるだけではないことに留意してください。 歓迎すべき副作用として、公開コミュニケーションにおける技術的な詳細が削減される可能性があります。 これにより、望ましくない競合相手を誤ってパーティーに招待することを防ぐことができます。

最後に、早い段階で考慮すべき価値の基本的な側面は持続可能性です。 あなたのソリューションは社会や環境にどのような影響を与えますか? この例では、自動化または強化されたコンテンツ生成により、大規模な人間のワークロードが置き換えられ、排除されます。 おそらく、職種全体の将来の殺人者として知られることは望まないでしょう。結局のところ、これは倫理的な問題を引き起こすだけでなく、あなたが脅している仕事に就いているユーザー側の抵抗を呼び起こすことになります。 これらの恐怖にどう対処できるかを考えてください。 たとえば、新しい自由時間を効率的に活用して、さらに洗練されたマーケティング戦略を策定する方法についてユーザーを教育できます。 これらは、他の競合他社が自動コンテンツ生成に追いついたとしても、防御可能な堀を提供できます。

3。 データ

どのような種類の AI や機械学習でも、現実の入力を反映し、モデルに十分な学習信号を提供できるように、データを収集して準備する必要があります。 現在、データ中心の AI への傾向が見られます。これは、モデルの際限のない微調整や最適化から離れ、これらのモデルに供給されるデータの多数の問題を修正することに重点を置く AI 哲学です。 開始時に適切なデータセットを入手するには、さまざまな方法があります。

  • また、ご購読はいつでも停止することが可能です 既存のデータセットを使用する。 これは、標準的な機械学習データセット、またはタスクに適応させた異なる初期目的を持つデータセットのいずれかです。 データセットには、次のような古典的なデータセットがあります。 IMDB 映画レビュー データセット 感情分析と MNISTデータセット 手書き文字認識に。 もっとエキゾチックで刺激的な選択肢があります。 違法漁業の捕獲 および 犬の品種の識別、Kaggle などのデータ ハブ上にあるユーザーが厳選した無数のデータセット。 特定のタスク用に作成され、要件を完全に満たすデータセットが見つかる可能性はかなり低く、ほとんどの場合、データを強化するには他の方法も使用する必要があります。
  • また、ご購読はいつでも停止することが可能です データに手動で注釈を付けるか作成する 適切な学習シグナルを作成します。 手動のデータ アノテーション (センチメント スコアによるテキストのアノテーションなど) は、機械学習の初期には主力の方法でした。 最近、ChatGPTの秘伝のソースの主成分として再注目されています。 人間の好みを反映するモデルの応答の作成とランク付けには、多大な手作業が費やされました。 この手法は、ヒューマン フィードバックからの強化学習 (RLHF) とも呼ばれます。 必要なリソースがある場合は、それらを使用して、マーケティング コンテンツの生成など、より具体的なタスク用の高品質のデータを作成できます。 アノテーションは、内部で行うことも、外部プロバイダーや Amazon Mechanical Turk などのクラウドソーシング サービスを使用して行うこともできます。 いずれにせよ、ほとんどの企業は、RLHF データの手動作成に必要な膨大なリソースを費やしたくないため、データの作成を自動化するためのいくつかのトリックを検討します。
  • したがって、次を使用して既存のデータセットにさらにサンプルを追加できます。 データ増強。 センチメント分析などの単純なタスクの場合は、テキストに追加のノイズを導入したり、いくつかの単語を入れ替えたりすることができます。よりオープン世代のタスクについては、自動化された大規模なモデル (基礎モデルなど) を使用することに現在非常に熱心です。トレーニングデータの生成。 データを増強する最適な方法を特定したら、必要なデータセット サイズに達するまで簡単に拡張できます。

データを作成するときは、質と量の間のトレードオフに直面します。 より少ないデータに高品質で手動でアノテーションを付けることも、追加のノイズをもたらす自動データ拡張のためのハックやトリックの開発に予算を費やすこともできます。 手動のアノテーションを使用する場合は、社内でそれを行って詳細と品質の文化を形成することも、匿名の人々に作業をクラウドソーシングすることもできます。 クラウドソーシングは通常、品質が低いため、ノイズを補うためにさらに注釈を付ける必要がある場合があります。 理想的なバランスはどうやって見つけますか? ここには既成のレシピはありません。最終的には、データのトレーニングと強化を絶えず行ったり来たりすることで、理想的なデータ構成を見つけることができます。 一般に、モデルを事前トレーニングするときは、知識を最初から取得する必要がありますが、これは大量のデータでのみ発生します。 一方、既存の大規模モデルを微調整して特殊化の最後の仕上げをしたい場合は、量よりも品質を重視する可能性があります。 この場合、詳細なガイドラインを使用して小規模なデータセットに制御された手動アノテーションを付けることが最適なソリューションとなる可能性があります。

4。 アルゴリズム

データはモデルが学習するための原材料であり、代表的な高品質のデータセットをコンパイルできることが期待されます。 さて、AI システムの実際の超能力、つまり既存のデータから学習して新しいデータに一般化する能力は、アルゴリズムにあります。 コア AI モデルに関しては、使用できる主なオプションが XNUMX つあります。

  • 既存のモデルにプロンプ​​トを表示します。 ChatGPT や GPT-4 などの GPT ファミリの高度な LLM (大規模言語モデル) や、Anthropic や AI21 Labs などの他のプロバイダーも API 経由で推論できます。 プロンプトを使用すると、タスクに必要なすべてのドメインおよびタスク固有の情報をプロンプトに含めて、これらのモデルと直接対話できます。 これには、使用する特定のコンテンツ、類似タスクの例 (数ショットのプロンプト)、およびモデルが従うべき指示が含まれる場合があります。 たとえば、ユーザーが新しい製品機能についてのブログ投稿を作成したい場合、その機能に関する重要な情報 (その利点と使用例、使用方法、発売日など) を提供するようユーザーに依頼できます。次に、製品はこの情報を慎重に作成されたプロンプト テンプレートに入力し、LLM にテキストの生成を依頼します。 プロンプトは、事前トレーニングされたモデルを有利にスタートするのに最適です。 ただし、プロンプトを使用して構築できる堀は、時間の経過とともにすぐに薄くなります。中期的には、競争力を維持するために、より防御可能なモデル戦略が必要になります。
  • 事前トレーニングされたモデルを微調整します。 このアプローチにより、ここ数年で AI が非常に普及しました。 利用可能な事前トレーニング済みモデルがますます増え、Huggingface などのポータルがモデル リポジトリとモデルを操作するための標準コードを提供するにつれて、微調整が試行および実装するための頼りになる方法になりつつあります。 事前トレーニングされたモデルを使用すると、誰かがすでに言語と世界について多くのことを「知っている」モデルのデータ、トレーニング、評価に行った投資から利益を得ることができます。 必要なのは、タスク固有のデータセットを使用してモデルを微調整することだけです。これは、事前トレーニングに最初に使用されたデータセットよりもはるかに小さい可能性があります。 たとえば、マーケティング コンテンツを生成する場合、エンゲージメントの点で優れた一連のブログ投稿を収集し、その手順をリバース エンジニアリングできます。 このデータから、モデルは成功した記事の構造、フロー、スタイルについて学習します。 オープンソース モデルを使用する場合は微調整が最適ですが、OpenAI や Cohere などの LLM API プロバイダーも微調整機能を提供することが増えています。 特にオープンソース トラックの場合は、モデルの選択、大規模なモデルのトレーニングとデプロイにかかるコストのオーバーヘッド、モデルのメンテナンスと更新のスケジュールの問題を考慮する必要があります。
  • ML モデルを最初からトレーニングします。 一般に、このアプローチは、特定のノウハウや適切なデータセットがある、単純ではあるが非常に具体的な問題に適しています。 コンテンツの生成は、正確にはこのカテゴリに当てはまりません。出発するには高度な言語能力が必要ですが、これらは途方もなく大量のデータでトレーニングした後にのみ習得できます。 特定の種類のテキストに対するセンチメント分析などの単純な問題は、多くの場合、ロジスティック回帰などの確立された機械学習手法を使用して解決できます。この手法は、派手な深層学習手法よりも計算コストが低くなります。 もちろん、特定のドメインの概念抽出など、かなり複雑な問題の中間点もあります。この問題については、ディープ ニューラル ネットワークを最初からトレーニングすることを検討することもできます。

機械学習を効果的に使用するには、トレーニング以外にも評価が最も重要です。 適切な評価指標と方法は、AI 機能を自信を持って立ち上げるために重要であるだけでなく、さらなる最適化のための明確な目標として、また内部の議論や意思決定の共通の基盤としても機能します。 精度、再現率、精度などの技術的な指標は良い出発点となりますが、最終的には、AI がユーザーに提供する実際の価値を反映する指標を探す必要があります。

5.ユーザーエクスペリエンス

AI 製品のユーザー エクスペリエンスは魅力的なテーマです。結局のところ、ユーザーは高い期待を抱いていますが、知能を大幅に強化し、潜在的に出し抜く可能性がある AI との「提携」に対して不安も抱いています。 この人間と AI のパートナーシップの設計には、思慮深く賢明な発見と設計のプロセスが必要です。 重要な考慮事項の XNUMX つは、製品でどの程度の自動化を実現するかです。完全な自動化が常に理想的なソリューションであるとは限らないことを念頭に置いてください。 次の図は、自動化の連続性を示しています。

AI 製品の構築
図 2: AI システムの自動化の連続体

これらの各レベルを見てみましょう。

  • 最初の段階では人間がすべての作業を行い、自動化は行われません。 AI に関する誇大宣伝にもかかわらず、現代の企業における知識集約型タスクのほとんどは依然としてこのレベルで実行されており、自動化の大きなチャンスをもたらしています。 たとえば、AI 主導のツールに抵抗し、ライティングは非常に手作業で特殊な作業であると信じ込まされているコンテンツ ライターがここで働いています。
  • 支援 AI の第 XNUMX 段階では、ユーザーはタスクの実行を完全に制御し、作業の大部分を手動で行いますが、AI ツールは時間を節約し、弱点を補うのに役立ちます。 たとえば、締め切りが迫っているブログ投稿を書く場合、Grammarly または同様のツールを使用して最終的な言語チェックを行うと、ありがたい時間の節約になります。 これにより、手作業での修正作業が不要になります。手動修正には多くの限られた時間と注意力が必要であり、依然として間違いや見落としが残る可能性があります。結局のところ、間違いを犯すのは人間の常です。
  • 拡張知能を備えた AI は、人間の知能を拡張するパートナーとなり、両方の強みを活用します。 支援型 AI と比較して、マシンはプロセス内で伝えるべきことがはるかに多く、アイデア出し、生成、草案の編集、最終的な言語チェックなど、より広範囲の責任をカバーします。 ユーザーは引き続き作業に参加し、決定を下し、タスクの一部を実行する必要があります。 ユーザー インターフェイスは、人間と AI の間の作業配分を明確に示し、エラーの可能性を強調し、AI が実行するステップの透明性を提供する必要があります。 つまり、「拡張された」エクスペリエンスは、反復と改良を通じてユーザーを望ましい結果に導きます。
  • そして最後に、完全な自動化があります。これは AI オタク、哲学者、専門家にとっては興味深いアイデアですが、多くの場合、現実の製品には最適な選択ではありません。 完全自動化とは、プロセスを開始する「大きな赤いボタン」を XNUMX つ提供することを意味します。 AI が完了すると、ユーザーは最終出力に直面し、それを受け入れるか離れるかのどちらかになります。 その間に何が起こっても、彼らはコントロールできません。 ご想像のとおり、実質的に対話性がないため、ここでの UX オプションはかなり限られています。 成功に対する責任の大部分は、非常に高い品質の出力を保証する必要がある技術同僚の肩にかかっています。

AI 製品は、設計に関して特別な扱いが必要です。 標準のグラフィカル インターフェイスは決定論的であり、ユーザーがたどる可能性のあるすべてのパスを予測できます。 対照的に、大規模な AI モデルは確率的で不確実であり、さまざまな驚くべき機能を備えていますが、毒性、誤った、有害な出力などのリスクもさらしています。 製品の機能の多くはモデル内に直接存在するため、外部から見ると、AI インターフェイスはシンプルに見えるかもしれません。 たとえば、LLM は、プロンプトの解釈、テキストの生成、情報の検索、要約、特定のスタイルと用語の採用、指示の実行などを行うことができます。たとえ UI が単純なチャットまたはプロンプト インターフェイスであったとしても、この潜在的な可能性を無視しないでください。 — ユーザーを成功に導くためには、明確かつ現実的である必要があります。 ユーザーに AI モデルの機能と制限を認識させ、AI によるエラーを簡単に発見して修正できるようにし、最適な出力を得るために反復する方法を教えます。 信頼、透明性、ユーザー教育を重視することで、ユーザーが AI と共同作業できるようになります。 AI 設計という新たな分野についての深い掘り下げはこの記事の範囲外ですが、他の AI 企業だけでなく、人間とマシンのインタラクションなどの他の設計分野からもインスピレーションを探すことを強くお勧めします。 オートコンプリート、プロンプト提案、AI 通知など、繰り返し発生するさまざまなデザイン パターンをすぐに特定し、これらを独自のインターフェイスに統合してデータとモデルを最大限に活用できるようになります。

さらに、本当に優れたデザインを実現するには、チームに新しいデザイン スキルを追加する必要がある場合があります。 たとえば、マーケティング コンテンツを改良するためにチャット アプリケーションを構築している場合は、会話の流れとチャットボットの「個性」を担当する会話デザイナーと協力することになります。 利用可能なオプションを徹底的にユーザーに教育し、ガイドする必要がある機能豊富な拡張製品を構築している場合、コンテンツ デザイナーは、適切な種類の情報アーキテクチャの構築を支援し、ユーザーに適切な量のナッジやプロンプトを追加できます。

そして最後に、驚きを受け入れてください。 AI デザインは、ユーザー エクスペリエンスに関する当初の概念を再考させることができます。 たとえば、多くの UX デザイナーやプロダクト マネージャーは、ユーザー エクスペリエンスをスムーズにするために、遅延と摩擦を最小限に抑えるよう訓練を受けてきました。 AI 製品では、この戦いを一時停止して、両方を有利に利用することができます。 レイテンシーと待機時間は、AI が現在何を行っているかを説明し、ユーザー側で考えられる次のステップを示すなど、ユーザーを教育するのに最適です。 ダイアログや通知ポップアップなどの休憩は、人間と AI のパートナーシップを強化し、ユーザーの透明性と制御を高めるために摩擦を引き起こす可能性があります。

6.非機能要件

特定の機能の実装を可能にするデータ、アルゴリズム、UX だけでなく、精度、遅延、スケーラビリティ、信頼性、データ ガバナンスなどのいわゆる非機能要件 (NFR) によって、ユーザーが想定した価値を実際に得られることが保証されます。 NFR の概念はソフトウェア開発から生まれましたが、AI の領域ではまだ体系的に説明されていません。 多くの場合、これらの要件は、ユーザーの調査、アイデア出し、開発、AI 機能の運用中に発生するため、その場限りで取り上げられます。

さまざまな NFR が旅のさまざまな時点で有効になるため、できるだけ早い段階で NFR を理解して定義するように努める必要があります。 たとえば、プライバシーはデータ選択の最初のステップから考慮する必要があります。 精度は、ユーザーがオンラインでシステムを使い始める運用段階で最も敏感になり、予期せぬ入力によってシステムが圧倒される可能性があります。 スケーラビリティは、ビジネスがユーザーやリクエストの数、あるいは提供される機能の範囲を拡大するときに重要となる戦略的な考慮事項です。

NFR に関しては、すべてを所有することはできません。 バランスをとる必要がある典型的なトレードオフのいくつかを以下に示します。

  • 精度を向上させる最初の方法の XNUMX つは、より大きなモデルを使用することですが、これはレイテンシに影響します。
  • 実稼働データを「そのまま」使用してさらに最適化することは、学習には最適ですが、プライバシーと匿名化のルールに違反する可能性があります。
  • よりスケーラブルなモデルはジェネラリストであり、企業またはユーザー固有のタスクの精度に影響を与えます。

さまざまな要件にどのように優先順位を付けるかは、利用可能な計算リソース、自動化の程度を含む UX コンセプト、AI によってサポートされる意思決定の影響によって異なります。

主要な取り組み

  1. 終わりを念頭に置いて始める: テクノロジーだけで仕事ができるとは考えないでください。 AI をユーザー向け製品に統合し、その利点、リスク、制限についてユーザーに教育するための明確なロードマップが必要です。
  2. 市場の調整: 市場機会と顧客のニーズを優先して AI 開発を導きます。 誇大広告に踊らされ、市場側の検証なしに AI の実装を急がないでください。
  3. ユーザー値: 効率、パーソナライゼーション、利便性、その他の価値の側面の観点から AI 製品の価値を定義、定量化し、伝達します。
  4. データ品質: データの品質と関連性に焦点を当てて、AI モデルを効果的にトレーニングします。 微調整には小さくて高品質のデータを使用し、最初からトレーニングには大規模なデータセットを使用するようにしてください。
  5. アルゴリズム/モデルの選択: ユースケースに応じて適切なレベルの複雑さと防御性 (プロンプト、微調整、ゼロからのトレーニング) を選択し、そのパフォーマンスを慎重に評価します。 時間が経つにつれて、製品に対する必要な専門知識と自信が得られると、より高度なモデル戦略に切り替えたくなる場合があります。
  6. ユーザー中心の設計: ユーザーのニーズと感情を念頭に置き、自動化とユーザー制御のバランスをとった AI 製品を設計します。 確率的 AI モデルの「予測不可能性」に留意し、ユーザーが確率的 AI モデルを使用してメリットを享受できるようにガイドします。
  7. コラボレーションデザイン: 信頼、透明性、ユーザー教育を重視することで、ユーザーが AI とコラボレーションできるようになります。
  8. 非機能要件: 開発全体を通じて精度、レイテンシ、スケーラビリティ、信頼性などの要素を考慮し、早い段階でこれらの間のトレードオフを評価するようにしてください。
  9. コラボレーション: AI 専門家、デザイナー、プロダクト マネージャー、その他のチーム メンバー間の緊密なコラボレーションを促進して、専門分野を超えたインテリジェンスの恩恵を受け、AI を適切に統合します。

参考文献

[1] テレサ・トーレス (2021)。 継続的な発見の習慣: 顧客価値とビジネス価値を生み出す製品を発見します。

[2] オービットメディア (2022)。 新しいブログ統計: 2022 年に有効なコンテンツ戦略は何ですか? 1016人のブロガーに聞いた.

[3] ドン・ノーマン (2013)。 日常のもののデザイン。

[4] Google、Gartner、Motista (2013)。 プロモーションから感動まで: B2B 顧客とブランドを結びつける.

注:画像はすべて作者によるものです。

この記事は、最初に公開された データサイエンスに向けて 著者の許可を得てTOPBOTSに再公開しました。

この記事をお楽しみください? AIリサーチの最新情報にサインアップしてください。

このような要約記事がさらにリリースされたらお知らせします。

タイムスタンプ:

より多くの トップボット