Meta gradi AI za preverjanje dejstev Wikipedia—vseh 6.5 milijona člankov PlatoBlockchain Data Intelligence. Navpično iskanje. Ai.

Meta gradi AI za preverjanje dejstev v Wikipediji – vseh 6.5 milijona člankov

slika

Večina ljudi, starejših od 30 let, se verjetno spomni raziskovanja z dobrimi starimi enciklopedijami. S police bi vzeli težko knjigo, preverili kazalo teme, ki vas zanima, nato pa obrnili na ustrezno stran in začeli brati. Ni bilo tako enostavno kot vtipkati nekaj besed v Googlovo iskalno vrstico, a na pozitivni strani ste vedeli, da informacije, ki ste jih našli na straneh Britannica ali Svetovna knjiga je bil točen in resničen.

Z internetnimi raziskavami danes ni tako. Ogromna množica virov je bila dovolj zmedena, a če dodamo še širjenje dezinformacij, je čudno, da kdo od nas verjame besedi, ki jo prebere na spletu.

Wikipedia je primer tega. Od začetka leta 2020 je bila angleška različica spletnega mesta v povprečju približno 255 milijonov ogledov strani na dan, zaradi česar je osmo najbolj obiskano spletno mesto na internetu. Prejšnji mesec se je povzpel na prvo mesto številka sedem, angleška različica pa je trenutno končana 6.5 milijonov izdelki.

Toda ne glede na to, kako obiskan je ta dostopni vir informacij, njegova natančnost pušča nekaj želenega; the Stran o lastni zanesljivosti spletnega mesta navaja: »Spletna enciklopedija se ne meni za zanesljivega vira in bralce odvrača od uporabe v akademskih ali raziskovalnih okoljih.«

Meta – nekdanji Facebook – želi to spremeniti. V blog post objavljeno prejšnji mesec, zaposleni v podjetju opisujejo, kako bi lahko AI pomagal narediti Wikipedijo natančnejšo.

Čeprav pri urejanju strani sodeluje več deset tisoč ljudi, dejstva, ki jih dodajajo, niso nujno pravilna; tudi če so citati prisotni, niso vedno točni niti celo ustrezni.

Meta razvija model strojnega učenja, ki skenira te navedbe in navzkrižno sklicuje njihovo vsebino na članke v Wikipediji, da bi preveril, ali so ne le teme usklajene, ampak so določene navedene številke točne.

Ne gre samo za izbiranje številk in zagotavljanje, da se ujemajo; Metin AI bo moral »razumeti« vsebino citiranih virov (čeprav je »razumeti« napačen izraz, kot pravi raziskovalka teorije kompleksnosti Melanie Mitchell bi ti povedal, ker je AI še vedno v "ozki" fazi, kar pomeni, da je orodje za zelo sofisticirano prepoznavanje vzorcev, medtem ko je "razumevanje" beseda, ki se uporablja za človeško spoznanje, ki je še vedno zelo drugačna stvar).

Metin model ne bo »razumel« vsebine s primerjavo besedilnih nizov in zagotavljanjem, da vsebujejo iste besede, ampak s primerjavo matematičnih predstavitev blokov besedila, do katerih pride z uporabo tehnik razumevanja naravnega jezika (NLU).

»Naredili smo indeks vseh teh spletnih strani, tako da smo jih razdelili na odlomke in zagotovili natančno predstavitev vsakega odlomka,« je Fabio Petroni, vodilni tehnični vodja Meta Fundamental AI Research, Rekel Digital Trends. »To ne predstavlja odlomka beseda za besedo, ampak pomen odlomka. To pomeni, da bosta dva dela besedila s podobnimi pomeni predstavljena v zelo tesnem položaju v nastalem n-dimenzionalnem prostoru, kjer so shranjeni vsi ti odlomki.«

Umetna inteligenca se usposablja na nizu štirih milijonov Wikipedijinih navedb in poleg tega, da izbere napačne navedbe na spletnem mestu, njeni ustvarjalci želijo, da bi sčasoma lahko predlagal natančne vire, ki bi prevzeli njihovo mesto, pri čemer črpajo iz ogromnega indeksa podatkov, ki so nenehno posodabljanje.

Ena velika težava, ki jo je treba rešiti, je delo v sistemu ocenjevanja za zanesljivost virov. Članek iz znanstvene revije bi na primer dobil višjo oceno kot objava na blogu. Količina vsebine na spletu je tako ogromna in raznolika, da lahko najdete »vire«, ki podpirajo skoraj vsako trditev, vendar ločite dezinformacije od dezinformacij (prve pomenijo napačne, druge pa namerno zavajanje) in strokovno pregledane od nestrokovno pregledanih, preverjenih dejstev od na hitro zbranih, ni majhna naloga – a zelo pomembna, ko gre za zaupanje.

Meta ima odprtokodni model in tisti, ki so radovedni, si lahko ogledajo a demo orodja za preverjanje. Metina objava na spletnem dnevniku je zapisala, da podjetje pri tem projektu ne sodeluje z Wikimedijo in da je še vedno v fazi raziskovanja in se trenutno ne uporablja za posodabljanje vsebine na Wikipediji.

Če si predstavljate ne tako oddaljeno prihodnost, v kateri je vse, kar preberete na Wikipediji, natančno in zanesljivo, ali ne bi bilo zaradi tega kakršno koli raziskovanje preveč enostavno? Nekaj ​​dragocenega je v tem, da sami preverjamo in primerjamo različne vire, kajne? Bil je velik preskok preiti od listanja težkih knjig do vnosa nekaj besed v iskalnik in pritiskanja »Enter«; ali res želimo, da se Wikipedia premakne iz raziskovalne izhodiščne točke v vir, ki dobi zadnjo besedo?

V vsakem primeru bo Metina raziskovalna skupina AI še naprej delala v smeri orodja za izboljšanje spletne enciklopedije. »Mislim, da nas je ob koncu dneva gnala radovednost,« Petroni je dejal. »Želeli smo videti, kakšna je meja te tehnologije. Popolnoma nismo bili prepričani, ali lahko [ta AI] naredi kaj pomembnega v tem kontekstu. Nihče še nikoli ni poskušal narediti česa podobnega.”

Kreditno slike: Gerd Altmann iz pixabay

Časovni žig:

Več od Središče singularnosti