Η Meta δημιουργεί μια τεχνητή νοημοσύνη για να ελέγξει τα γεγονότα της Wikipedia—και τα 6.5 εκατομμύρια άρθρα PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.

Η Meta δημιουργεί μια τεχνητή νοημοσύνη για να ελέγξει τα γεγονότα της Wikipedia—και τα 6.5 εκατομμύρια άρθρα

εικόνα

Οι περισσότεροι άνθρωποι άνω των 30 πιθανώς θυμούνται ότι έκαναν έρευνα με παλιές καλές εγκυκλοπαίδειες. Θα τραβούσατε έναν βαρύ τόμο από το ράφι, θα ελέγξατε το ευρετήριο για το θέμα που σας ενδιαφέρει και, στη συνέχεια, θα γυρνούσατε στην κατάλληλη σελίδα και θα ξεκινούσατε να διαβάζετε. Δεν ήταν τόσο εύκολο όσο να πληκτρολογήσετε μερικές λέξεις στη γραμμή αναζήτησης Google, αλλά από τη θετική πλευρά, ξέρατε ότι οι πληροφορίες που βρήκατε στις σελίδες του Britannica ή η Παγκόσμιο βιβλίο ήταν ακριβής και αληθινός.

Δεν συμβαίνει το ίδιο με την έρευνα στο Διαδίκτυο σήμερα. Το συντριπτικό πλήθος των πηγών ήταν αρκετά μπερδεμένο, αλλά προσθέστε τον πολλαπλασιασμό της παραπληροφόρησης και είναι απορίας άξιο που οποιοσδήποτε από εμάς πιστεύει μια λέξη που διαβάζει στο διαδίκτυο.

Η Wikipedia είναι ένα χαρακτηριστικό παράδειγμα. Από τις αρχές του 2020, η αγγλική έκδοση του ιστότοπου ήταν περίπου κατά μέσο όρο 255 εκατομμύρια προβολές σελίδων ανά ημέρα, καθιστώντας τον τον όγδοο ιστότοπο με τις περισσότερες επισκέψεις στο διαδίκτυο. Από τον περασμένο μήνα, είχε ανέβει στο σημείο νούμερο επτά, και η αγγλική έκδοση έχει τελειώσει 6.5 εκατομμύρια άρθρα.

Όμως, όσο υψηλή επισκεψιμότητα κι αν είναι αυτή η πηγή πληροφοριών, η ακρίβειά της αφήνει κάτι το επιθυμητό. ο σελίδα σχετικά με την αξιοπιστία του ιστότοπου αναφέρει, «Η ηλεκτρονική εγκυκλοπαίδεια δεν θεωρεί τον εαυτό της αξιόπιστη ως πηγή και αποθαρρύνει τους αναγνώστες να τη χρησιμοποιήσουν σε ακαδημαϊκά ή ερευνητικά περιβάλλοντα».

Ο Μέτα —του πρώην Facebook— θέλει να το αλλάξει αυτό. Σε ένα ανάρτηση που δημοσιεύτηκε τον περασμένο μήνα, οι υπάλληλοι της εταιρείας περιγράφουν πώς η τεχνητή νοημοσύνη θα μπορούσε να βοηθήσει να γίνει η Wikipedia πιο ακριβή.

Αν και δεκάδες χιλιάδες άτομα συμμετέχουν στην επεξεργασία του ιστότοπου, τα στοιχεία που προσθέτουν δεν είναι απαραίτητα σωστά. Ακόμη και όταν υπάρχουν αναφορές, δεν είναι πάντα ακριβείς ούτε καν σχετικές.

Η Meta αναπτύσσει ένα μοντέλο μηχανικής εκμάθησης που σαρώνει αυτές τις παραπομπές και παραπέμπει το περιεχόμενό τους σε άρθρα της Wikipedia για να επαληθεύσει ότι όχι μόνο τα θέματα είναι ευθυγραμμισμένα, αλλά και συγκεκριμένα στοιχεία που αναφέρονται είναι ακριβή.

Αυτό δεν είναι απλώς θέμα επιλογής αριθμών και διασφάλισης ότι ταιριάζουν. Το AI του Meta θα χρειαστεί να «κατανοήσει» το περιεχόμενο των πηγών που αναφέρονται (αν και το «καταλαβαίνω» είναι εσφαλμένη ονομασία, όπως η ερευνήτρια της θεωρίας πολυπλοκότητας Melanie Mitchell θα σου έλεγε, επειδή η τεχνητή νοημοσύνη βρίσκεται ακόμα στη «στενή» φάση, που σημαίνει ότι είναι ένα εργαλείο για εξαιρετικά εξελιγμένη αναγνώριση προτύπων, ενώ η λέξη «κατανόηση» είναι μια λέξη που χρησιμοποιείται για την ανθρώπινη γνώση, η οποία εξακολουθεί να είναι πολύ διαφορετική).

Το μοντέλο του Meta θα «κατανοήσει» το περιεχόμενο όχι συγκρίνοντας συμβολοσειρές κειμένου και βεβαιώνοντας ότι περιέχουν τις ίδιες λέξεις, αλλά συγκρίνοντας μαθηματικές αναπαραστάσεις μπλοκ κειμένου, στις οποίες καταλήγει χρησιμοποιώντας τεχνικές κατανόησης φυσικής γλώσσας (NLU).

«Αυτό που κάναμε είναι να δημιουργήσουμε ένα ευρετήριο όλων αυτών των ιστοσελίδων, τεμαχίζοντάς τες σε αποσπάσματα και παρέχοντας μια ακριβή αναπαράσταση για κάθε απόσπασμα», ο Fabio Petroni, επικεφαλής τεχνολογίας της Meta της Fundamental AI Research. είπε Digital Trends. «Αυτό δεν αντιπροσωπεύει λέξη προς λέξη το απόσπασμα, αλλά το νόημα του αποσπάσματος. Αυτό σημαίνει ότι δύο κομμάτια κειμένου με παρόμοια σημασία θα αναπαρασταθούν σε πολύ κοντινή θέση στον n-διάστατο χώρο που προκύπτει, όπου αποθηκεύονται όλα αυτά τα αποσπάσματα."

Η τεχνητή νοημοσύνη εκπαιδεύεται σε ένα σύνολο τεσσάρων εκατομμυρίων αναφορών της Wikipedia, και εκτός από τις λανθασμένες αναφορές στον ιστότοπο, οι δημιουργοί του θα ήθελαν τελικά να είναι σε θέση να προτείνουν ακριβείς πηγές για να πάρουν τη θέση τους, αντλώντας από ένα τεράστιο ευρετήριο δεδομένων που συνεχής ενημέρωση.

Ένα μεγάλο ζήτημα που μένει να επιλυθεί είναι η εργασία σε ένα σύστημα βαθμολόγησης για την αξιοπιστία των πηγών. Μια εργασία από ένα επιστημονικό περιοδικό, για παράδειγμα, θα λάβει υψηλότερο βαθμό από μια ανάρτηση ιστολογίου. Ο όγκος του διαδικτυακού περιεχομένου είναι τόσο τεράστιος και ποικίλος που μπορείτε να βρείτε «πηγές» για να υποστηρίξετε σχεδόν κάθε ισχυρισμό, αλλά αναλύοντας την παραπληροφόρηση από την παραπληροφόρηση (η πρώτη σημαίνει λανθασμένη, ενώ η δεύτερη σημαίνει σκόπιμη εξαπάτηση) και η αξιολόγηση από ομοτίμους από τους μη αξιολογημένους από ομοτίμους, τα γεγονότα που ελέγχθηκαν από τους βιαστικά-χαστούκι-μαζί, δεν είναι μικρό έργο — αλλά πολύ σημαντικό όταν πρόκειται για εμπιστοσύνη.

Η Meta έχει ανοιχτού κώδικα το μοντέλο της και όσοι είναι περίεργοι μπορούν να δουν α διαδήλωση του εργαλείου επαλήθευσης. Η ανάρτηση ιστολογίου του Meta σημείωσε ότι η εταιρεία δεν συνεργάζεται με το Wikimedia σε αυτό το έργο και ότι βρίσκεται ακόμα στο στάδιο της έρευνας και δεν χρησιμοποιείται επί του παρόντος για την ενημέρωση περιεχομένου στη Wikipedia.

Εάν φαντάζεστε ένα όχι και πολύ μακρινό μέλλον όπου όλα όσα διαβάζετε στη Wikipedia είναι ακριβή και αξιόπιστα, δεν θα καθιστούσε κάπως πολύ εύκολη την πραγματοποίηση οποιουδήποτε είδους έρευνας; Υπάρχει κάτι πολύτιμο στο να ελέγχουμε και να συγκρίνουμε οι ίδιοι διάφορες πηγές, έτσι δεν είναι; Ήταν ένα μεγάλο άλμα για να πάμε από τη σελιδοποίηση σε βαριά βιβλία στην πληκτρολόγηση λίγων λέξεων σε μια μηχανή αναζήτησης και το πάτημα "Enter". Θέλουμε πραγματικά η Wikipedia να μεταβεί από ένα ερευνητικό σημείο άλματος σε μια πηγή που λέει την τελευταία λέξη;

Σε κάθε περίπτωση, η ερευνητική ομάδα τεχνητής νοημοσύνης της Meta θα συνεχίσει να εργάζεται για ένα εργαλείο για τη βελτίωση της διαδικτυακής εγκυκλοπαίδειας. «Νομίζω ότι μας οδηγούσε η περιέργεια στο τέλος της ημέρας», είπε ο Πετρόνι είπε. «Θέλαμε να δούμε ποιο ήταν το όριο αυτής της τεχνολογίας. Δεν ήμασταν απολύτως σίγουροι αν [αυτό το AI] θα μπορούσε να κάνει κάτι σημαντικό σε αυτό το πλαίσιο. Κανείς δεν είχε προσπαθήσει ποτέ να κάνει κάτι παρόμοιο».

Image Credit: Gerd Altmann από Pixabay

Σφραγίδα ώρας:

Περισσότερα από Κέντρο μοναδικότητας