Meta の新しい AI は、これまでに見たことのないオブジェクトも含めて、画像内のあらゆるオブジェクトを選択して切り取ることができます

プラトン再発行

フォロワー： 0

Meta の新しい AI は、PlatoBlockchain データインテリジェンス以前には見られなかったものであっても、画像内のあらゆるオブジェクトを選択して切り取ることができます。垂直検索。あい。

視覚的なシーンで個別のオブジェクトを選択することは、私たちには直感的に思えますが、機械はこのタスクに苦労しています。現在、Meta の新しい AI モデルは、オブジェクトが何であるかについて幅広い考えを開発し、これまでに見たことがないオブジェクトであってもオブジェクトを分離できるようにしました。

かなり平凡なコンピュータービジョンタスクのように思えるかもしれませんが、画像を解析して、あるオブジェクトがどこで終わり、別のオブジェクトが始まるかを判断できることは、かなり基本的なスキルです。これがなければ、より複雑なタスクのホストは解決できません。

「オブジェクトのセグメンテーション」は新しいものではありません。 AI研究者は何年もそれに取り組んできました。しかし、通常、これらのモデルの構築は時間のかかるプロセスであり、多くの人による画像の注釈とかなりのコンピューティングリソースが必要です。そして通常、結果として得られるモデルは、特定のユースケースに特化したものでした。

しかし現在、Meta の研究者はセグメントエニシングモデル (SAM) を発表しました。これは、以前に似たものが見られたかどうかに関係なく、あらゆるシーンのあらゆるオブジェクトを切り取ることができます。モデルは、テキストの説明からマウスのクリック、さらには視線追跡データまで、さまざまなプロンプトに応じてこれを行うこともできます。

「SAM は物体とは何かという一般的な概念を学習しており、あらゆる画像やあらゆるビデオのあらゆる物体のマスクを生成できます」と研究者は書いています。ブログ役職. 「私たちは可能性が広いと信じており、まだ想像もしていなかった多くの潜在的なユースケースに興奮しています。」

モデル開発の鍵となったのは、1.1 億個のセグメンテーションマスクからなる大規模な新しいデータセットでした。これは、特定のオブジェクトが含まれていることを示すために分離され、注釈が付けられた画像の領域を指します。これは、人間が手作業で画像に注釈を付け、自動化されたプロセスを組み合わせて作成されたもので、これまでに収集されたこのタイプのコレクションの中で群を抜いて最大のものです。

このような大規模なデータセットでトレーニングすることにより、Meta の研究者は、オブジェクトとは何かについての一般的な概念を開発したと述べています。この一般化する能力により、研究者は SAM を「基礎モデル」と呼ぶようになりました。物議を醸す用語次のような他の大規模な事前トレーニング済みモデルを説明するために使用されます OpenAI の GPT シリーズの機能は非常に一般的であり、多くのアプリケーションの基盤として使用できます。

画像のセグメンテーションは、さまざまなコンピュータービジョンタスクの重要な要素であることは間違いありません。シーンのさまざまなコンポーネントを分離できない場合、より複雑なことを行うのは困難です。研究者たちはブログで、ビデオや画像の編集に非常に役立つ可能性がある、または科学的画像の分析に役立つ可能性があると述べています。

おそらく、同社のメタバースへの野望により適切に、仮想現実ヘッドセットと組み合わせて使用し、ユーザーの視線に基づいて特定のオブジェクトを選択する方法のデモを提供します. また、大規模な言語モデルと組み合わせて、Web ページのビジュアルコンテンツとテキストコンテンツの両方を理解できるマルチモーダルシステムを作成できる可能性があるとも述べています。

幅広いプロンプトを処理できるため、システムは特に柔軟になります。でウェブページ同社は新しいモデルのデモを行い、画像を分析した後、特定のオブジェクトをマウスカーソルでクリックするか、セグメント化したいものを入力するか、画像全体を分割するだけで、特定のオブジェクトを分離するように求められることを示しています。オブジェクトを分離します。

そして最も重要なことは、同社はモデルとデータセットの両方を研究目的でオープンソース化しているため、他の人が自分の仕事に基づいて構築できるようになっています。これは、同社がLLaMA大言語モデルで採用したのと同じアプローチであり、急速に普及するに至りました。オンラインリークそして拍車をかける実験の波愛好家やハッカーによって。

SAM で同じことが起こるかどうかはまだわかりませんが、いずれにせよ、重要なコンピュータービジョンの問題のホストの進歩を加速できる AI 研究コミュニティへの贈り物です。

画像のクレジット：メタAI

SEO を活用したコンテンツと PR 配信。今日増幅されます。
Platoblockchain。 Web3メタバースインテリジェンス。知識の増幅。こちらからアクセスしてください。
情報源： https://singularityhub.com/2023/04/10/metas-new-ai-can-identify-and-remove-objects-in-images/

タイムスタンプ： 2023 年 4 月 10 日

タイムスタンプ： 2024 年 1 月 29 日

史上最も明るい宇宙爆発: 科学者たちはその持続性の謎を解明したかもしれない

ソースクラスター：

特異点ハブ

ソースノード： 1845408

タイムスタンプ： 2023 年 6 月 8 日

今週のWeb全体からの素晴らしい技術ストーリー（30月XNUMX日まで）PlatoBlockchainデータインテリジェンス。垂直検索。愛。

今週の素晴らしいWeb技術記事（30月XNUMX日まで）

ソースクラスター：

特異点ハブ

ソースノード： 1600178

タイムスタンプ： 2022 年 7 月 30 日

米国、大気中から大量のCO1.2を吸収する炭素回収プラントに2億ドル投資

ソースクラスター：

特異点ハブ

ソースノード： 1878327

タイムスタンプ： 2023 年 8 月 20 日

Meta の新しい AI は、画像内のあらゆるオブジェクトを選択して切り取ることができます。

プラトン再発行

より多くの特異点ハブ

遺伝子組み換えで光るペチュニアが間もなく購入できるようになります

心臓の老化を止めることはできますか? この画期的な遺伝子研究は始まりです

これまでで最大の遺伝子研究により、癌につながるDNAプロファイルが明らかに

新しいDNA「カムコーダー」は、細胞の発達を時間とともに「動画」で記録できる

オレゴン州の山火事の生存者のために 3D プリント住宅のコミュニティが建設中

キッチンテーブルでの重力実験: ほんの小さな測定が物理学の大きな進歩となる理由

史上最も明るい宇宙爆発: 科学者たちはその持続性の謎を解明したかもしれない

今週の素晴らしいWeb技術記事（30月XNUMX日まで）

米国、大気中から大量のCO1.2を吸収する炭素回収プラントに2億ドル投資

私たちに関しては

垂直検索とAi

プラットフォーム

フォロー

より多くの 特異点ハブ

私たちに関しては

垂直検索とAi

プラットフォーム

フォロー

より多くの特異点ハブ