アートは死んでいない、それはただ機械が生成したものだ

プラトン再発行

フォロワー： 0

AI モデルがプログラマーに取って代わるずっと前にアーティストに取って代わる理由

おそらく、ジェネレーティブ AI が示唆する最も衝撃的なことは、創造性は自動化に直面した人間の創意工夫の最後の砦になるという一般的な見方とは対照的に、実際には次のように見えるということです。 はるかに簡単 比較的単純なプログラミング作業を自動化するよりも、かなり難しい創造的な作業を自動化するためです。これを理解するために、ジェネレーティブ AI のより一般的な XNUMX つのユースケース、コード生成と画像生成を比較します。しかし、生成モデルがより複雑なアプリケーションに拡張されたとしても、この主張はより一般的に有効であると私たちは信じています。

議論の短いバージョン (以下でより詳細に取り組みます) は、 GitHubコパイロット、現在の形式では、コーディングをいくらか効率的にすることができますが、プログラミングの知識を持つ有能なソフトウェア開発者の必要性を排除するものではありません. 大きな理由の XNUMX つは、プログラムの作成に関しては、正確さが非常に重要であるということです。 AI がプログラムを生成したとしても、それが正しいかどうかを人間が検証する必要があります。これは、最初からプログラムを作成するのとほぼ同じレベルの作業です。

一方、入力できる人は誰でも次のようなモデルを使用できます安定拡散高品質で他に類を見ない画像を、何桁も少ないコストで数分で作成できます。多くの場合、創造的な成果物には厳密な正確性の制約がなく、モデルの出力は驚くほど完全です。クリエイティブなビジュアルに依存している業界では、完全なフェーズシフトを見逃すことはできません。なぜなら、多くの用途では、現在 AI が生成できるビジュアルで十分であり、私たちはまだテクノロジーのごく初期のイニングにいるからです。

この分野が進んでいるペースでは、予測に自信を持てないことは十分に承知しています。ただし、現時点では、厳密にクリエイターによって作成された人間がデザインしたアートを使用するアプリケーションよりも、厳密にプログラマーによって作成されたクリエイティブなイメージでいっぱいのアプリケーションを目にする可能性がはるかに高いようです.

なぜ誇大宣伝され、なぜ今なのか？

コード生成と画像生成の詳細に入る前に、AI 全体と生成 AI が現時点でどれほど人気があるかを把握しておくと役に立ちます。

ジェネレーティブ AI は、これまでにない速さで開発者に受け入れられています。これを書いている時点で、Stable Diffusion は GitHub リポジトリのトレンドチャートを大幅に上回っています。. その成長は、インフラストラクチャや暗号の最近のどのテクノロジーよりもはるかに進んでいます (上の図を参照)。このテクノロジーを使用したスタートアップの立ち上げと資金調達の発表がほぼ毎日行われており、オンラインソーシャルネットワークには生成モデルによって作成されたコンテンツが殺到しています。

過去 2010 年間の AI への全体的な投資レベルも誇張するのは困難です。 20 年代半ば以降、出版物だけでも指数関数的に増加しています (下の図を参照)。現在、arXiv に投稿された全記事の約 XNUMX% が AI、ML、NLP に関するものです。重要なのは、理論上の結果が重要なしきい値を超えており、簡単に利用できるようになり、新しい技術、ソフトウェア、およびスタートアップのカンブリア紀の爆発を引き起こしたことです。

上の図の最近の急増は、主にジェネレーティブ AI によるものです。この XNUMX 年で、私たちは、画像を分類して単語の埋め込みを作成できる専門家のみの AI モデルから、効果的なコードを記述し、自然言語プロンプトを使用して非常に正確な画像を作成できる一般に使用可能なモデルへと移行しました。イノベーションのペースが加速したことは当然のことであり、かつて人間が支配していた他の分野に生成モデルが進出し始めたとしても驚くことではありません。

ジェネレーティブ AI とプログラミング

ジェネレーティブ AI の初期の用途の XNUMX つは、プログラマーの補助としてでした。それが機能する方法は、モデルがコードの大規模なコーパス (例: GitHub のすべてのパブリックリポジトリ) でトレーニングされ、プログラマーがコーディングする際に提案を行うことです。結果は抜群です。このアプローチが今後のプログラミングと同義になるのは当然のことです。

アートは死んだのではなく、機械が生成したPlatoBlockchainデータインテリジェンスにすぎません。垂直検索。あい。 — 生成されたコード: セミコロンを使用しない攻撃から保護します。

ただし、生産性の向上は、以下で説明する画像生成に比べてわずかです。前述のように、この理由の XNUMX つは、プログラミングでは正確さが重要であるということです (実際、エンジニアリングの問題はより広義ですが、この投稿ではプログラミングに焦点を当てています)。例えば、最近の研究が見つかりました高リスクに一致するシナリオの場合 CWE (一般的な弱点の列挙)、AI が生成したコードの 40% に脆弱性が含まれていた.

したがって、ユーザーは、生産性を大幅に向上させるのに十分なコードを生成することと、正確性をチェックできるようにコードを制限することとの間でバランスを取る必要があります。その結果、コパイロットは 助けました 開発者の生産性を向上させる — 最近の研究 (こちら & こちら) 約 2 倍以下の利益が得られますが、開発者言語とツールのこれまでの進歩で見られたものと同等のレベルです。たとえば、アセンブリから C への移行により、生産性が 2 ～ 5 倍向上したと見積もられています。

より経験豊富なプログラマーにとって、懸念はコードの正確さを超えて、全体的なコード品質に及ぶ可能性があります。として高速.aiのジェレミー・ハワード説明した OpenAI Codex モデルの最近のバージョンに関しては、「[I]t は冗長なコードを記述します。平均コード。私にとって、平均的なコードを自分が好きで正しいことがわかっているコードにすることは、ゼロから書くよりもはるかに時間がかかります — 少なくとも私がよく知っている言語では.

したがって、ジェネレーティブプログラミングが開発者の生産性を段階的に向上させていることは明らかですが、改善がこれまでに見られたものと劇的に異なることは明らかではありません。 ジェネレーティブ AI はより優れたプログラマーを作りますが、プログラマーが必要とするプログラミングは依然として必要です。

ジェネレーティブ AI とビジュアル

一方、生成モデルが画像生成などのクリエイティブな作品に与える影響は非常に大きいです。その結果、効率とコストが桁違いに改善され、業界全体のフェーズシフトの先駆けとなっているのを目にすることはまずありません。

この空間でジェネレーティブ AI が機能する方法は、プロンプトと呼ばれるユーザーからの単純なテキスト入力を受け取ることであり、モデルは視覚的な出力を生成します。現在、画像、動画、3D モデル、テクスチャなど、多くの出力形式を作成するためのモデルがあります。

特に興味深いのは、創造的な介入をほとんど行わずに、これらのモデルを拡張して新しいイメージやドメイン固有のイメージを生成する方法です。たとえば、Guido (著者の XNUMX 人) は、事前にトレーニングされた画像モデルを取得し、それを数十枚の自分の写真で再トレーニングしました。そこから、彼はプロンプトで。以下は、次のプロンプトから生成された写真です。」 キャプテン・アメリカとして"、" パリで"、" 絵の中で"。

画像生成がビジネスコンテキストでのコード生成から大きく離れているのは、ジェネレーティブ AI が経済計算を変える範囲です。上記の写真を作成するために、Guido は、インフラストラクチャリソースで約 50 ドルかかる少数の写真でモデルをトレーニングしました。. トレーニング後の画像生成コストは約 0.001 USD コンピューティングリソースで実行でき、クラウドまたは最新世代のラップトップで. さらに、画像の生成には数秒しかかかりません。

ジェネレーティブ AI がなければ、カスタムイメージを取得する唯一の方法は、アーティストを雇うか、自分で作成することです。 10 ドルで XNUMX 時間以内に完全にカスタム化された写真のようにリアルな画像を作成できるという仮定から始めたとしても、 ジェネレーティブ AI アプローチは、簡単に XNUMX 桁安く、XNUMX 桁速くなります。 より現実的には、カスタムアートワークやグラフィックデザインプロジェクトには数日から数週間かかる可能性が高く、数千ドルとは言わないまでも数百ドルの費用がかかります。

上記のプログラミング支援と同様に、ジェネレーティブ AI は次のようになります。 ツールとして採用 どちらもある程度のユーザー管理が必要です。しかし、イメージモデルがアーティストのアウトプットを完全に模倣する能力によって生み出される経済性の違いは、いくら強調してもしすぎることはありません。コード生成モデルを使用して、標準的なコンピューティングタスクを実行する非常に基本的な機能プログラムを作成する場合でも、多くのコードスニペットのレビュー、編集、およびテストの追加が必要になります。しかし、基本的な画像の場合は、プロンプトを入力して多数の候補から画像を選択するのに XNUMX 分もかかりません。

たとえば、私たち自身の漫画家 (および投資パートナー) のヨーコ・リー (@stuffyokodraws）。彼女の以前の 70 枚の画像を使用してモデルをトレーニングしたところ、モデルは不気味なレベルの模倣を含む画像を生成することができました。すべてのアーティストは次に何を作成するかを考え出さなければなりません。彼女は、訓練されたモデルが、少なくとも一定の期間内に何かを作成するよう迫られた場合に、彼女が考えていたよりも多くのオプションを提示できることさえ発見しました。同じオブジェクトを描画する方法は何百もありますが、生成モデルにより、どのパスを探索する価値があるかがすぐに明らかになりました。

したがって、そのようなタスクに関しては、コンピューターが必ずしもそうであると主張しているわけではありません。 優れた 1:1ベースで人間よりも。しかし、他の非常に多くのタスクと同様に、コンピューターが完全な作業出力を生成できる場合、それらは私たちを殺すだけです階段.

以下の図のうち、陽子が直接描いたものと生成されたものを当ててみてください。

経済性の大幅な改善、新しいスタイルやコンセプトを作成できる柔軟性、完全またはほぼ完全な成果物を生成する能力は、クリエイティブアセットが重要なすべての業界で著しい変化が見られる態勢にあることを示唆しています。ビジネスの主要な部分。そしてこれは映像に限らず、デザイン全般に言えることです。例えば：

ジェネレーティブ AI は、2D アート、テクスチャ、3D モデルを作成し、ゲームのレベルデザインを支援します。
マーケティングでは、ストックアート、商品写真、イラストに取って代わる態勢が整っているようです。
すでにウェブデザイン、インテリアデザイン、ランドスケープデザインでのアプリケーションが見られます。

そして、私たちはまだ始まったばかりです。ユースケースでコンテンツの創造的な生成が必要な場合、ジェネレーティブ AI がそれを妨害しない、または少なくともプロセスの一部にならない理由を理解するのは困難です。

さて、この投稿のポイントは何ですか? コード生成と画像生成にやや限定的に焦点を当てていますが、結果はより広く当てはまると思われます。特に、ビジュアル、テキスト、音楽のいずれであろうと、全面的な創造的な取り組みは、システム構築のずっと前に AI によって妨害される可能性があります。

上記で使用した正当性の議論に加えて、すべての先行技術を組み合わせたり再組み合わせたりすることで、創造的な成果の実用的な範囲に十分である場合もあります。たとえば、音楽業界や映画業界は、歴史的に人気のあるアルバムや映画の模造品を無数に生み出してきました。生成モデルが時間の経過とともにこれらの機能を自動化するのに役立つことは完全に考えられます。ただし、Stable Diffusion と DALL-E 2 によって作成された非常に多くの画像の注目すべき点は、 彼らは本当に良いです & 本当に面白い. 真に興味深い音楽スタイルの融合を生み出す AI モデルや、コンセプトとスタイルを結び付ける方法に興味をそそる長編映画を「書く」AI モデルを想像することは難しくありません。

それどころか、以前のシステムに、将来のすべてのシステムを開発するために必要なすべてのツールが含まれているとは想像しがたいです。あるいは、その複雑なシステムでさえ、さまざまなスタイルの芸術や音楽と同じくらい簡単に組み合わせることができます. 多くの場合、システムの価値、およびシステムを構築するのが非常に難しい理由は、詳細のロングテールにあります。すべてのトレードオフ、回避策、特定の設計空間の最適化、システムに含まれる制度的/潜在的な知識などです。だから私たちがしなければならないことを構築し続けます。

予測したいという衝動を抑えよう 正確に ジェネレーティブ AI がクリエイティブ業界に与える影響でも、 歴史が示唆するように、新しいツールは 拡張 アートの定義を縮小するのではなく、新しいタイプのアーティストがアクセスできるようにする. この場合、新しいアーティストはシステムビルダーです。そう、 テクノロジーの創業者にとって、ジェネレーティブ AI は厳密にポジティブなツールであると私たちは信じています ソフトウェアのリーチを拡大するために – ゲームはより美しく、マーケティングはより魅力的になり、書かれたコンテンツはより魅力的になり、映画はより刺激的になります。

いつの日か、インターネットの 2022 年後半のアーカイブが、ほとんどが人間によって生成された最後のコンテンツリポジトリの XNUMX つとして大切に保管される可能性があります。少なくとも、この記事のこのテキストは、すべて人間が作成したものです。

***

ここに示されている見解は、引用された個々の AH Capital Management, LLC (「a16z」) の見解であり、a16z またはその関連会社の見解ではありません。ここに含まれる特定の情報は、a16z が管理するファンドのポートフォリオ企業を含む第三者の情報源から入手したものです。 a16z は、信頼できると思われる情報源から取得したものですが、そのような情報を独自に検証しておらず、情報の現在または永続的な正確性、または特定の状況に対するその適切性について表明するものではありません。さらに、このコンテンツにはサードパーティの広告が含まれる場合があります。 a16z はそのような広告を確認しておらず、そこに含まれる広告コンテンツを推奨していません。

このコンテンツは情報提供のみを目的として提供されており、法律、ビジネス、投資、または税務に関するアドバイスとして信頼されるべきではありません。これらの問題については、ご自身のアドバイザーにご相談ください。証券またはデジタル資産への言及は、説明のみを目的としたものであり、投資の推奨または投資顧問サービスの提供を構成するものではありません。さらに、このコンテンツは、投資家または将来の投資家による使用を目的としたものではなく、a16zが管理するファンドへの投資を決定する際にいかなる状況においても信頼されない場合があります。（a16zファンドへの投資の申し出は、私募覚書、サブスクリプション契約、およびそのようなファンドの他の関連文書によってのみ行われ、その全体を読む必要があります。）言及、参照、または記載されているのは、a16zが管理する車両へのすべての投資を代表するものではなく、投資が有益である、または将来行われる他の投資が同様の特性または結果をもたらすという保証はありません。アンドリーセンホロウィッツが管理するファンドが行った投資のリスト（発行者がa16zに公開を許可していない投資、および公開されているデジタル資産への未発表の投資を除く）は、https：//a16z.com/investmentsで入手できます。 /。

記載されているチャートおよびグラフは、情報提供のみを目的としており、投資を決定する際に信頼することはできません。過去の実績は将来の結果を示すものではありません。内容は、示された日付の時点でのみ話されています。これらの資料に記載されている予測、推定、予測、目標、見通し、および/または意見は、予告なしに変更される場合があり、他の人が表明した意見と異なる場合があります。その他の重要な情報については、https：//a16z.com/disclosuresを参照してください。

タイムスタンプ： 2022 年 11 月 16 日2022 年 11 月 16 日