Το νέο AI Chatbot «Jais» των ΗΑΕ απευθύνεται σε Αραβικά ομιλητές

Το νέο AI Chatbot «Jais» των ΗΑΕ απευθύνεται σε Αραβικά ομιλητές

Μια ομάδα ακαδημαϊκών, ερευνητών και μηχανικών στα Ηνωμένα Αραβικά Εμιράτα (ΗΑΕ) αποκάλυψε ένα νέο γενεαλογικό chatbot τεχνητής νοημοσύνης που ονομάζεται «Jais» για να απευθύνεται ειδικά σε άτομα που μιλούν την αραβική γλώσσα σε όλο τον κόσμο, σύμφωνα με το CNN.

Η ομάδα υποστηρίζει ότι τα αραβικά, το έκτο περισσότερο ομιλούμενοι γλώσσα στον κόσμο με περίπου 272 εκατομμύρια ομιλητές, έχει «υποεκπροσωπείται στο mainstream AI». Ελπίζουν να τερματίσουν την κυριαρχία των αγγλικών στην εκπαίδευση συστημάτων τεχνητής νοημοσύνης γνωστά ως μεγάλα γλωσσικά μοντέλα (LLMs).

Το chatbot Jais AI εστιάζει στη Μέση Ανατολή

Το γλωσσικό ζήτημα στην τεχνητή νοημοσύνη είναι μια παγκόσμια ανησυχία. Η Ιαπωνία εγκατέλειψε πρόσφατα τα αγγλικά καθώς η χώρα δημιουργεί τη δική της έκδοση του ChatGPT. Ερευνητές είπε ενώ το chatbot του OpenAI υπερέχει στα Αγγλικά, συχνά υπολείπεται στα Ιαπωνικά «λόγω διαφορών στο σύστημα αλφαβήτου, περιορισμένων δεδομένων και άλλων παραγόντων».

Το Jais πήρε το όνομά του από ένα βουνό στα ΗΑΕ, το CNN αναφέρουν λέει, και μπορεί να εκτελέσει εργασίες κατόπιν εντολής, όπως να γράψει ποιήματα, όπως ακριβώς ChatGPT ή της Google Βάρδος, αλλά σε περιορισμένη κλίμακα. Η τεχνητή νοημοσύνη εκπαιδεύεται σε 13 δισεκατομμύρια παραμέτρους δεδομένων, κάτι πολύ υψηλό σε σύγκριση με τις σχεδόν 3.5 δισεκατομμύρια παραμέτρους του ChatGPT 175, ένα μέτρο του μεγέθους ενός μεγάλου γλωσσικού μοντέλου, αλλά όχι της ακρίβειάς του.

Υπάρχουν σχέδια να επεκταθεί το σύνολο δεδομένων του Jais σε 30 δισεκατομμύρια παραμέτρους και να του δοθεί η δυνατότητα να διαβάζει εικόνες και γραφήματα αντί για κείμενο, σύμφωνα με τον Timothy Baldwin, καθηγητή επεξεργασίας φυσικής γλώσσας στο Πανεπιστήμιο Τεχνητής Νοημοσύνης Mohamed bin Zayed του Άμπου Ντάμπι (MBZUAI).

Το πανεπιστήμιο συνεργάστηκε με την Cerebras Systems and Inception της Silicon Valley, μια θυγατρική της εταιρείας τεχνητής νοημοσύνης G42 με έδρα τα Ηνωμένα Αραβικά Εμιράτα, για τη δημιουργία της Jais. Ο Baldwin είπε ότι ενώ οι ανταγωνιστές LLM όπως το LLaMA του Meta και το GPT του OpenAI μπορούν να κατανοήσουν τα αραβικά, εκπαιδεύονται κυρίως σε διαδικτυακά αγγλικά δεδομένα.

Για τον Jais, η εκπαίδευση περιελάμβανε έναν συνδυασμό συνόλων δεδομένων Αγγλικών και Αραβικών, αλλά με σκόπιμη εστίαση σε περιεχόμενο από τη Μέση Ανατολή, όπου τα αραβικά ομιλούνται και γράφονται ευρέως.

Ο Baldwin είπε ότι μια τέτοια εστίαση επιτρέπει στο chatbot της τεχνητής νοημοσύνης να υπερβεί «αυτό που οποιοσδήποτε άλλος μπόρεσε να πετύχει για τα αραβικά».

Σύμφωνα με το MBZUAI, η μοναδική εκπαίδευση του Jais βοηθά το chatbot «να κατανοήσει τις πολιτισμικές αποχρώσεις και τις διαλέκτους», καθιστώντας το πιο χρήσιμο για ένα ευρύ φάσμα διαφορετικών βιομηχανιών. Οι προγραμματιστές έκαναν το μοντέλο διαθέσιμο στο κοινό σε ανοιχτό κώδικα, που σημαίνει ότι ο καθένας μπορεί να το προσαρμόσει.

Το νέο AI Chatbot «Jais» των ΗΑΕ εξυπηρετεί τους αραβικούς ομιλητές PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.

Το νέο AI Chatbot «Jais» των ΗΑΕ εξυπηρετεί τους αραβικούς ομιλητές PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.

Εναλλαγή μεταξύ διαλέκτων

Ο Baldwin είπε στο CNN ότι η ποικίλη εκπαίδευση δεδομένων του Jais θα του επιτρέψει να αλλάζει μεταξύ διαλέκτων της σύγχρονης τυπικής αραβικής γλώσσας, η οποία χρησιμοποιείται για επίσημα έγγραφα και επίσημη γραφή, και τοπικές διαλέκτους που χρησιμοποιούνται συνήθως σε ιστολόγια ή μέσα κοινωνικής δικτύωσης.

«Σίγουρα υπάρχει περιθώριο βελτίωσης εκεί, αλλά η εστίαση ήταν περισσότερο στην ευρωστία όσον αφορά το να μπορούμε να καταλάβουμε εάν έχουμε πιο άτυπες πληροφορίες για το μοντέλο», είπε.

Όπως και άλλα chatbots τεχνητής νοημοσύνης που δημιουργούνται, το Jais είναι κατασκευασμένο για να αντιστέκεται στις προτροπές που δημιουργούν «τοξικό ή επιβλαβές» απαντά, είπε ο Baldwin, και δεν θα απαντήσει σε ερωτήματα που «οδηγούν σε αυτοτραυματισμό ή υποδηλώνουν εθισμό». Θέματα όπως η ομοφυλοφιλία είναι εκτός ορίων, σύμφωνα με τις μουσουλμανικές πεποιθήσεις.

Διαβάστε επίσης: Η εξάρτηση του ChatGPT από την «αγγλική γλώσσα» ανάγκασε την Ιαπωνία να δημιουργήσει το δικό της Chatbot AI

Σύμφωνα με τον Mohammed Soliman, διευθυντή στρατηγικών τεχνολογιών και προγράμματος ασφάλειας στον κυβερνοχώρο στο Middle East Institute στην Ουάσιγκτον, DC, γλώσσες που βασίζονται στο λατινικό αλφάβητο όπως τα αγγλικά κυριαρχούν το διαδίκτυο, που σημαίνει ότι τα σύνολα δεδομένων είναι τα μεγαλύτερα σε αυτές τις γλώσσες.

«Η πρόσβαση σε εργαλεία τεχνητής νοημοσύνης αποκλειστικά σε όσους μπορούν να μιλούν συγκεκριμένες γλώσσες θα μπορούσε να αποτρέψει τις μειονεκτούσες κοινωνίες από το να καρπωθούν τα οφέλη της τεχνητής νοημοσύνης», είπε.

«[Αυτά τα LLM] δεν γνωρίζουν άλλους πολιτισμούς, επηρεάζοντας αρνητικά την εμπειρία χρήστη για άτομα διαφορετικού υπόβαθρου», πρόσθεσε ο Soliman, όπως αναφέρει το CNN.

Τα ΗΑΕ έχουν κάνει σημαντικά βήματα στην ανάπτυξη συστημάτων τεχνητής νοημοσύνης. Το Εμιράτο ήταν η πρώτη χώρα στον κόσμο που διόρισε α υπουργός ΑΙ Το 2017. Φέρεται επίσης να υπερηφανεύεται για το μεγαλύτερο μοντέλο παραγωγής τεχνητής νοημοσύνης της περιοχής, το Falcon, το οποίο κυκλοφόρησε από το Συμβούλιο Έρευνας Προηγμένης Τεχνολογίας του Άμπου Ντάμπι και το Ινστιτούτο Καινοτομίας Τεχνολογίας (TII) τον Μάρτιο.

Σφραγίδα ώρας:

Περισσότερα από MetaNews