偽の写真は新しいものではありません。 1910 年代、イギリスの作家アーサー コナン ドイルは、庭で優雅な妖精が戯れている写真を撮った学齢期の XNUMX 人の姉妹にだまされたことで有名です。
今日、これらの写真が誰かをだますことができるとは信じがたいですが、1980 年代になるまで、Geoffrey Crawley という名の専門家が、フィルム写真の知識を直接適用し、明白なことを推測する神経を持っていませんでした。
後に姉妹の一人が認めたように、写真は偽物でした.
アーティファクトと常識の探求
デジタル写真は、偽物や探偵に豊富なテクニックをもたらしました.
今日の疑わしい画像の法医学的調査には、デジタル写真に固有の品質を探すことが含まれます。 写真に埋め込まれたメタデータ、Adobe Photoshop などのソフトウェアを使用して画像の歪みを修正し、 操作の明らかな兆候を探しています、元の機能をあいまいにするために複製されている領域など。
デジタル編集は微妙すぎて検出できない場合がありますが、明るいピクセルと暗いピクセルの分布方法を調整すると、目に飛び込んできます。 たとえば、2010 年に NASA は 土星の衛星ディオネとタイタンの写真. それは決して偽物ではありませんでしたが、漂遊アーティファクトを削除するためにクリーンアップされていました。 陰謀論者の注目.
不思議なことに、私はその画像を Photoshop に入れました。 以下の図は、これがどのように見えるかを大まかに再現しています。
ほとんどのデジタル写真は JPEG などの圧縮形式であり、カメラによってキャプチャされた情報の多くを削除することによってスリム化されています。 標準化されたアルゴリズムにより、削除された情報が目に見える影響を最小限に抑えますが、痕跡は残ります。
画像の任意の領域の圧縮は、画像と現在のカメラ設定で何が起こっているかによって異なります。 偽の画像が複数のソースを組み合わせている場合、多くの場合、これを次の方法で検出できます。 圧縮アーティファクトの慎重な分析.
一部のフォレンジック手法は、画像の形式とはほとんど関係ありませんが、本質的には 視覚探偵の仕事. 写真に写っている全員が同じように照らされていますか? 影と反射は意味がありますか? 耳と手は適切な場所で光と影を示していますか? 人の目に映るものとは? シーンを 3D でモデル化した場合、部屋のすべての線と角度が加算されますか?
アーサー・コナン・ドイルは妖精の写真にだまされたかもしれませんが、彼が作成したシャーロック・ホームズは、法医学写真分析の世界にぴったりだと思います。
人工知能の新時代
画像の現在の爆発 テキストから画像への作成 人工知能 ツールは、多くの点で、フィルムからデジタル写真への移行よりも急進的です。
入力するだけで、必要な画像を想起させることができるようになりました。 これらの画像は、既存のピクセルの塊を組み合わせて作成したフランケン写真ではありません。 それらは、指定された内容、品質、およびスタイルを備えたまったく新しい画像です。
最近まで、これらの画像を生成するために使用される複雑なニューラル ネットワークは、一般に公開されることが限られていました。 これは、23 年 2022 月 XNUMX 日に変更され、 オープンソースの安定拡散. 今では、コンピュータにゲーム レベルの Nvidia グラフィックス カードを搭載していれば、誰でも AI 画像コンテンツを作成できます。研究所やビジネス ゲートキーパーの活動は必要ありません。
これにより、多くの人が次のように尋ねるようになりました。オンラインで見たものをもう一度信じることができますか?」。 場合によります。
テキストから画像への AI は、多数の画像とキャプションのペアを分析するトレーニングからその賢さを引き出します。 各システムの長所と短所の一部は、トレーニングされた画像から導き出されます。 ここに例があります: これは、Stable Diffusion がジョージ・クルーニーがアイロンをかけているのを見る方法です。
これは現実的とは言えません。 Stable Diffusion が継続しなければならないのは、学習した情報だけです。ジョージ クルーニーを見たことがあり、その文字列を俳優の特徴に関連付けることができることは明らかですが、クルーニーの専門家ではありません。
ただし、一般的な中年男性の写真をもっと多く見て消化したはずなので、同じシナリオで一般的な中年男性を求めるとどうなるか見てみましょう。
これは明らかな改善ですが、まだ現実的ではありません。 いつものように、手と耳のトリッキーなジオメトリは、偽造の兆候を探すのに適した場所ですが、このメディアでは、不可能な照明の兆候ではなく、空間ジオメトリを見ています.
他にも手がかりがあるかもしれません。 部屋を注意深く再構築した場合、角は直角になりますか? 棚は理にかなっていますか? デジタル写真の調査に慣れている法医学の専門家は、おそらくそれについて電話をかけることができます。
私たちはもはや私たちの目を信じることができません
テキストから画像へのシステムの知識を拡張すれば、さらにうまくいく可能性があります。 説明した独自の写真を追加して、既存のトレーニングを補足することができます。 このプロセスは次のように知られています。 テキスト反転.
最近、Google がリリースした ドリームブース、特定の人、物、またはアートスタイルをテキストから画像への AI システムに注入するための、代替のより洗練された方法です。
このプロセスには頑丈なハードウェアが必要ですが、結果は驚異的です。 いくつかの素晴らしい作品が Reddit で共有され始めました。 写真を見て 下の投稿で DreamBooth に入れられた画像と、Stable Diffusion からのリアルなフェイク画像を表示します。
私たちはもはや自分の目を信じることはできませんが、少なくとも今のところ、法医学の専門家の目を信じることができるかもしれません. 将来のシステムが、それらを欺くように意図的に訓練される可能性は十分にあります。
私たちは、完全な写真やビデオさえもが一般的になる時代に急速に移行しています。 これがどれほど重要かは時がたてばわかるだろうが、それまでの間、Cottingley Fairy の写真の教訓を思い出す価値がある。
この記事はから再公開されます 会話 クリエイティブコモンズライセンスの下で 読む 原著.
画像のクレジット: ブレンダン・マーフィー / a提供されたuthor