Meta construiește o inteligență artificială pentru verificarea faptelor Wikipedia – toate cele 6.5 milioane de articole PlatoBlockchain Data Intelligence. Căutare verticală. Ai.

Meta construiește o inteligență artificială pentru a verifica Wikipedia – toate cele 6.5 milioane de articole

imagine

Majoritatea oamenilor de peste 30 de ani își amintesc probabil că au făcut cercetări cu enciclopedii bune de modă veche. Ați scoate un volum mare de pe raft, ați verifica indexul pentru subiectul dvs. de interes, apoi ați întoarce la pagina corespunzătoare și ați începe să citiți. Nu a fost la fel de ușor ca să tastați câteva cuvinte în bara de căutare Google, dar, în plus, știați că informațiile pe care le găsiți în paginile britanic sau Cartea mondială a fost corect si adevarat.

Nu este așa cu cercetarea pe internet de astăzi. Multitudinea copleșitoare de surse a fost suficient de confuză, dar adăugați proliferarea dezinformațiilor și este o minune că oricare dintre noi crede un cuvânt pe care îl citim online.

Wikipedia este un exemplu. La începutul anului 2020, versiunea în limba engleză a site-ului avea o medie de aproximativ 255 milioane de euro afișări de pagini pe zi, devenind al optulea cel mai vizitat site de pe internet. De luna trecută, s-a mutat la loc numărul șapte, iar versiunea în limba engleză are în prezent terminată 6.5 milioane de euro articole.

Dar, oricât de mare ar fi traficul acestei surse de informații, acuratețea ei lasă de dorit; cel pagină despre propria fiabilitate a site-ului afirmă: „Enciclopedia online nu se consideră a fi de încredere ca sursă și descurajează cititorii să o folosească în medii academice sau de cercetare.”

Meta — a fostului Facebook — vrea să schimbe acest lucru. Într-o blog publicat luna trecută, angajații companiei descriu modul în care AI ar putea ajuta la ca Wikipedia să fie mai precisă.

Deși zeci de mii de oameni participă la editarea site-ului, faptele pe care le adaugă nu sunt neapărat corecte; chiar și atunci când citările sunt prezente, ele nu sunt întotdeauna exacte și nici măcar relevante.

Meta dezvoltă un model de învățare automată care scanează aceste citate și face referințe încrucișate conținutul lor la articolele Wikipedia pentru a verifica că nu numai subiectele sunt aliniate, ci și cifrele specifice citate sunt corecte.

Aceasta nu este doar o chestiune de a alege numerele și de a vă asigura că se potrivesc; AI lui Meta va trebui să „înțeleagă” conținutul surselor citate (deși „înțelege” este o denumire greșită, după cum cercetătoarea în teoria complexității Melanie Mitchell ti-ar spune, deoarece AI este încă în faza „îngustă”, adică este un instrument pentru recunoașterea modelelor extrem de sofisticate, în timp ce „înțelegerea” este un cuvânt folosit pentru cunoașterea umană, care este încă un lucru foarte diferit).

Modelul lui Meta va „înțelege” conținutul nu comparând șiruri de text și asigurându-se că acestea conțin aceleași cuvinte, ci comparând reprezentările matematice ale blocurilor de text, la care ajunge folosind tehnici de înțelegere a limbajului natural (NLU).

„Ceea ce am făcut este să construim un index al tuturor acestor pagini web, împărțindu-le în pasaje și oferind o reprezentare precisă pentru fiecare pasaj”, Fabio Petroni, director principal de tehnologie Meta Fundamental AI Research, a spus Digital Trends. „Asta nu reprezintă cuvânt cu cuvânt pasajul, ci sensul pasajului. Aceasta înseamnă că două bucăți de text cu semnificații similare vor fi reprezentate într-o poziție foarte apropiată în spațiul n-dimensional rezultat în care sunt stocate toate aceste pasaje.”

Inteligența artificială este antrenată pe un set de patru milioane de citate Wikipedia și, pe lângă alegerea citărilor defecte de pe site, creatorii săi ar dori ca în cele din urmă să poată sugera surse precise care să le ia locul, trăgând dintr-un index masiv de date care este actualizare continuă.

O mare problemă rămasă de rezolvat este lucrul într-un sistem de clasificare pentru fiabilitatea surselor. O lucrare dintr-o revistă științifică, de exemplu, ar primi o notă mai mare decât o postare pe blog. Cantitatea de conținut online este atât de vastă și variată încât puteți găsi „surse” pentru a susține aproape orice afirmație, dar analizarea informațiilor greșite din dezinformare (prima înseamnă incorectă, în timp ce cea de-a doua înseamnă a înșela în mod deliberat), iar cea revizuită de colegi. de la cei care nu sunt evaluați de colegi, faptele verificate de la cei pălmuiți în grabă, nu este o sarcină mică – dar una foarte importantă când vine vorba de încredere.

Meta a deschis modelul său, iar cei curioși pot vedea a Demo a instrumentului de verificare. Postarea pe blog a lui Meta a remarcat că compania nu colaborează cu Wikimedia în acest proiect și că este încă în faza de cercetare și nu este utilizată în prezent pentru a actualiza conținutul de pe Wikipedia.

Dacă îți imaginezi un viitor nu prea îndepărtat în care tot ceea ce citești pe Wikipedia este corect și de încredere, nu ar face asta să faci orice fel de cercetare un pic prea ușor? Există ceva valoros în verificarea și compararea diferitelor surse noi înșine, nu-i așa? A fost un salt mare să treci de la paginarea cărților grele la introducerea de câteva cuvinte într-un motor de căutare și apăsarea „Enter”; vrem cu adevărat ca Wikipedia să treacă de la un punct de plecare a cercetării la o sursă de obținere a ultimului cuvânt?

În orice caz, echipa de cercetare AI a Meta va continua să lucreze la un instrument de îmbunătățire a enciclopediei online. „Cred că am fost mânați de curiozitate la sfârșitul zilei”, a spus Petroni a spus. „Am vrut să vedem care este limita acestei tehnologii. Nu eram absolut siguri dacă [acest AI] ar putea face ceva semnificativ în acest context. Nimeni nu a încercat vreodată să facă ceva asemănător.”

Credit imagine: Gerd Altmann din Pixabay

Timestamp-ul:

Mai mult de la Singularity Hub