Meta uus tehisintellekt suudab pildil välja valida ja lõigata mis tahes objekti – isegi selliseid, mida pole kunagi varem nähtud

Taasavaldanud Platon

järgijaid: 0

Meta uus tehisintellekt suudab pildil välja valida ja lõigata mis tahes objekti – isegi selliseid, mida pole kunagi nähtud enne PlatoBlockchaini andmeluure. Vertikaalne otsing. Ai.

Visuaalses stseenis eraldi objektide välja valimine tundub meile intuitiivne, kuid masinad näevad selle ülesandega vaeva. Nüüd on Meta uus tehisintellekti mudel loonud laia ettekujutuse sellest, mis objekt on, võimaldades sellel objekte eraldada isegi siis, kui ta pole neid kunagi varem näinud.

See võib tunduda üsna proosaline arvutinägemise ülesanne, kuid pildi sõelumine ja ühe objekti lõppemise ja teise alguse väljaselgitamine on üsna põhioskus, ilma milleta poleks palju keerulisemaid ülesandeid lahendatud.

"Objektide segmenteerimine" pole midagi uut; AI teadlased on selle kallal aastaid töötanud. Kuid tavaliselt on nende mudelite loomine olnud aeganõudev protsess, mis nõuab piltidele palju inimlikku annotatsiooni ja märkimisväärseid arvutusressursse. Ja tavaliselt olid saadud mudelid konkreetsetele kasutusjuhtudele väga spetsiifilised.

Nüüd aga on Meta teadlased avalikustanud mudeli Segment Anything Model (SAM), mis suudab mis tahes objekti mis tahes stseenist välja lõigata, olenemata sellest, kas see on midagi sarnast varem näinud. Mudel saab seda teha ka vastusena erinevatele viipadele, alates tekstikirjeldusest kuni hiireklõpsude või isegi silmade jälgimise andmeteni.

"SAM on õppinud üldise arusaama sellest, mis on objektid, ja see võib luua maske mis tahes pildil või videol olevale objektile," kirjutasid teadlased. blogi pärast. "Usume, et võimalused on laiad ja oleme põnevil paljudest potentsiaalsetest kasutusjuhtudest, mida me pole veel ette kujutanud."

Mudeli väljatöötamise võtmeks oli tohutu uus 1.1, XNUMX miljardist segmenteerimismaskist koosnev andmekogum, mis viitab kujutise piirkondadele, mis on eraldatud ja varustatud märkustega, mis näitavad, et need sisaldavad konkreetset objekti. See loodi piltide käsitsi sisestamise ja automatiseeritud protsesside kombinatsiooni abil ning see on siiani suurim seda tüüpi kollektsioon.

Meta teadlaste sõnul on sellise tohutu andmestiku kallal treenides välja töötanud üldise kontseptsiooni objektist, mis võimaldab segmenteerida asju, mida ta pole varem isegi näinud. See üldistusvõime ajendas teadlasi nimetama SAM-i "vundamendimudeliks", a vastuoluline termin kasutatakse teiste massiivsete eelkoolitatud mudelite kirjeldamiseks, näiteks OpenAI GPT seeriad, mille võimalused on väidetavalt nii üldised, et neid saab kasutada paljude rakenduste alusena.

Pildi segmenteerimine on kindlasti paljude arvutinägemisega seotud ülesannete põhikomponent. Kui te ei suuda stseeni erinevaid komponente eraldada, on sellega raske midagi keerulisemat teha. Oma ajaveebis väidavad teadlased, et see võib osutuda hindamatuks video- ja pilditöötluses või aidata kaasa teaduslike kujutiste analüüsimisele.

Võib-olla on ettevõtte metaversuaalsete ambitsioonide jaoks asjakohasem, et nad pakuvad demo selle kohta, kuidas seda saaks kasutada koos virtuaalreaalsuse peakomplektiga, et valida kasutaja pilgu põhjal konkreetseid objekte. Samuti väidavad nad, et seda võiks potentsiaalselt siduda suure keelemudeliga, et luua multimodaalne süsteem, mis suudab mõista nii veebilehe visuaalset kui ka tekstilist sisu.

Võimalus käsitleda laia valikut viipasid muudab süsteemi eriti paindlikuks. Sees veebileht Uut mudelit demonstreerides näitab ettevõte, et pärast pildi analüüsimist võidakse paluda konkreetsed objektid eraldada, klõpsates neil lihtsalt hiirekursoriga, sisestades selle, mida soovite segmentida, või jagades kogu pildi lihtsalt osadeks. eraldi objektid.

Ja mis kõige tähtsam, ettevõte hangib nii mudelit kui ka andmekogumit uurimiseesmärkidel avatud lähtekoodiga, et teised saaksid oma tööd edasi arendada. See on sama lähenemisviis, mida ettevõte kasutas oma LLaMA suurekeelse mudeli puhul, mis viis selle kiiresti lekkinud võrgus ja ergutades a eksperimenteerimise laine harrastajate ja häkkerite poolt.

Kas sama juhtub ka SAM-iga, tuleb veel näha, kuid mõlemal juhul on see kingitus tehisintellekti teadlaskonnale, mis võib kiirendada paljude oluliste arvutinägemisprobleemide lahendamist.

Image Credit: Meta AI

SEO-põhise sisu ja PR-levi. Võimenduge juba täna.
Platoblockchain. Web3 metaversiooni intelligentsus. Täiustatud teadmised. Juurdepääs siia.
Allikas: https://singularityhub.com/2023/04/10/metas-new-ai-can-identify-and-remove-objects-in-images/

Ajatempel: Aprill 10, 2023

Ajatempel: Jan 29, 2024

Kõigi aegade eredaim kosmiline plahvatus: teadlased võisid lahendada selle püsivuse mõistatuse

Allikaklaster:

Singulaarsuse keskus

Allikasõlm: 1845408

Ajatempel: Juuni 8, 2023

Selle nädala vinged tehnikalood kogu veebist (kuni 30. juulini) PlatoBlockchain Data Intelligence. Vertikaalne otsing. Ai.

Selle nädala ägedad tehnikalood veebist (kuni 30. juulini)

Allikaklaster:

Singulaarsuse keskus

Allikasõlm: 1600178

Ajatempel: Juuli 30, 2022

USA investeerib 1.2 miljardit dollarit süsinikdioksiidi kogumise tehastesse, et imeda õhust tonni CO2

Allikaklaster:

Singulaarsuse keskus

Allikasõlm: 1878327

Ajatempel: August 20, 2023

Meta uus tehisintellekt suudab pildil välja valida ja lõigata mis tahes objekti – isegi selliseid, mida pole kunagi varem nähtud

Taasavaldanud Platon

Veel alates Singulaarsuse keskus

Peagi saate osta geneetiliselt muundatud pimedas helendavaid petuuniaid

Kas me saame peatada südame vananemise? See märkimisväärne geneetiline uuring on algus

Seni suurim geneetiline uuring paljastab DNA-profiilid, mis põhjustavad vähki

Uued DNA "kaamerad" suudavad salvestada "filme" raku arengust läbi aja

Oregoni metsatulekahjus ellujäänute jaoks ehitatakse 3D-prinditud kodude kogukonda

Gravitatsioonikatsed köögilaual: miks võib väike, pisike mõõtmine olla füüsika jaoks suur samm edasi

Kõigi aegade eredaim kosmiline plahvatus: teadlased võisid lahendada selle püsivuse mõistatuse

Selle nädala ägedad tehnikalood veebist (kuni 30. juulini)

USA investeerib 1.2 miljardit dollarit süsinikdioksiidi kogumise tehastesse, et imeda õhust tonni CO2

Meist

Vertikaalne otsing ja Ai

Platvorm

Püsi ühenduses

konto