Μια ομάδα ακαδημαϊκών, ερευνητών και μηχανικών στα Ηνωμένα Αραβικά Εμιράτα (ΗΑΕ) αποκάλυψε ένα νέο γενεαλογικό chatbot τεχνητής νοημοσύνης που ονομάζεται «Jais» για να απευθύνεται ειδικά σε άτομα που μιλούν την αραβική γλώσσα σε όλο τον κόσμο, σύμφωνα με το CNN.
Η ομάδα υποστηρίζει ότι τα αραβικά, το έκτο περισσότερο ομιλούμενοι γλώσσα στον κόσμο με περίπου 272 εκατομμύρια ομιλητές, έχει «υποεκπροσωπείται στο mainstream AI». Ελπίζουν να τερματίσουν την κυριαρχία των αγγλικών στην εκπαίδευση συστημάτων τεχνητής νοημοσύνης γνωστά ως μεγάλα γλωσσικά μοντέλα (LLMs).
Το chatbot Jais AI εστιάζει στη Μέση Ανατολή
Το γλωσσικό ζήτημα στην τεχνητή νοημοσύνη είναι μια παγκόσμια ανησυχία. Η Ιαπωνία εγκατέλειψε πρόσφατα τα αγγλικά καθώς η χώρα δημιουργεί τη δική της έκδοση του ChatGPT. Ερευνητές είπε ενώ το chatbot του OpenAI υπερέχει στα Αγγλικά, συχνά υπολείπεται στα Ιαπωνικά «λόγω διαφορών στο σύστημα αλφαβήτου, περιορισμένων δεδομένων και άλλων παραγόντων».
Το Jais πήρε το όνομά του από ένα βουνό στα ΗΑΕ, το CNN αναφέρουν λέει, και μπορεί να εκτελέσει εργασίες κατόπιν εντολής, όπως να γράψει ποιήματα, όπως ακριβώς ChatGPT ή της Google Βάρδος, αλλά σε περιορισμένη κλίμακα. Η τεχνητή νοημοσύνη εκπαιδεύεται σε 13 δισεκατομμύρια παραμέτρους δεδομένων, κάτι πολύ υψηλό σε σύγκριση με τις σχεδόν 3.5 δισεκατομμύρια παραμέτρους του ChatGPT 175, ένα μέτρο του μεγέθους ενός μεγάλου γλωσσικού μοντέλου, αλλά όχι της ακρίβειάς του.
Υπάρχουν σχέδια να επεκταθεί το σύνολο δεδομένων του Jais σε 30 δισεκατομμύρια παραμέτρους και να του δοθεί η δυνατότητα να διαβάζει εικόνες και γραφήματα αντί για κείμενο, σύμφωνα με τον Timothy Baldwin, καθηγητή επεξεργασίας φυσικής γλώσσας στο Πανεπιστήμιο Τεχνητής Νοημοσύνης Mohamed bin Zayed του Άμπου Ντάμπι (MBZUAI).
Το πανεπιστήμιο συνεργάστηκε με την Cerebras Systems and Inception της Silicon Valley, μια θυγατρική της εταιρείας τεχνητής νοημοσύνης G42 με έδρα τα Ηνωμένα Αραβικά Εμιράτα, για τη δημιουργία της Jais. Ο Baldwin είπε ότι ενώ οι ανταγωνιστές LLM όπως το LLaMA του Meta και το GPT του OpenAI μπορούν να κατανοήσουν τα αραβικά, εκπαιδεύονται κυρίως σε διαδικτυακά αγγλικά δεδομένα.
Για τον Jais, η εκπαίδευση περιελάμβανε έναν συνδυασμό συνόλων δεδομένων Αγγλικών και Αραβικών, αλλά με σκόπιμη εστίαση σε περιεχόμενο από τη Μέση Ανατολή, όπου τα αραβικά ομιλούνται και γράφονται ευρέως.
Ο Baldwin είπε ότι μια τέτοια εστίαση επιτρέπει στο chatbot της τεχνητής νοημοσύνης να υπερβεί «αυτό που οποιοσδήποτε άλλος μπόρεσε να πετύχει για τα αραβικά».
Σύμφωνα με το MBZUAI, η μοναδική εκπαίδευση του Jais βοηθά το chatbot «να κατανοήσει τις πολιτισμικές αποχρώσεις και τις διαλέκτους», καθιστώντας το πιο χρήσιμο για ένα ευρύ φάσμα διαφορετικών βιομηχανιών. Οι προγραμματιστές έκαναν το μοντέλο διαθέσιμο στο κοινό σε ανοιχτό κώδικα, που σημαίνει ότι ο καθένας μπορεί να το προσαρμόσει.
Εναλλαγή μεταξύ διαλέκτων
Ο Baldwin είπε στο CNN ότι η ποικίλη εκπαίδευση δεδομένων του Jais θα του επιτρέψει να αλλάζει μεταξύ διαλέκτων της σύγχρονης τυπικής αραβικής γλώσσας, η οποία χρησιμοποιείται για επίσημα έγγραφα και επίσημη γραφή, και τοπικές διαλέκτους που χρησιμοποιούνται συνήθως σε ιστολόγια ή μέσα κοινωνικής δικτύωσης.
«Σίγουρα υπάρχει περιθώριο βελτίωσης εκεί, αλλά η εστίαση ήταν περισσότερο στην ευρωστία όσον αφορά το να μπορούμε να καταλάβουμε εάν έχουμε πιο άτυπες πληροφορίες για το μοντέλο», είπε.
Όπως και άλλα chatbots τεχνητής νοημοσύνης που δημιουργούνται, το Jais είναι κατασκευασμένο για να αντιστέκεται στις προτροπές που δημιουργούν «τοξικό ή επιβλαβές» απαντά, είπε ο Baldwin, και δεν θα απαντήσει σε ερωτήματα που «οδηγούν σε αυτοτραυματισμό ή υποδηλώνουν εθισμό». Θέματα όπως η ομοφυλοφιλία είναι εκτός ορίων, σύμφωνα με τις μουσουλμανικές πεποιθήσεις.
Διαβάστε επίσης: Η εξάρτηση του ChatGPT από την «αγγλική γλώσσα» ανάγκασε την Ιαπωνία να δημιουργήσει το δικό της Chatbot AI
Σύμφωνα με τον Mohammed Soliman, διευθυντή στρατηγικών τεχνολογιών και προγράμματος ασφάλειας στον κυβερνοχώρο στο Middle East Institute στην Ουάσιγκτον, DC, γλώσσες που βασίζονται στο λατινικό αλφάβητο όπως τα αγγλικά κυριαρχούν το διαδίκτυο, που σημαίνει ότι τα σύνολα δεδομένων είναι τα μεγαλύτερα σε αυτές τις γλώσσες.
«Η πρόσβαση σε εργαλεία τεχνητής νοημοσύνης αποκλειστικά σε όσους μπορούν να μιλούν συγκεκριμένες γλώσσες θα μπορούσε να αποτρέψει τις μειονεκτούσες κοινωνίες από το να καρπωθούν τα οφέλη της τεχνητής νοημοσύνης», είπε.
«[Αυτά τα LLM] δεν γνωρίζουν άλλους πολιτισμούς, επηρεάζοντας αρνητικά την εμπειρία χρήστη για άτομα διαφορετικού υπόβαθρου», πρόσθεσε ο Soliman, όπως αναφέρει το CNN.
Τα ΗΑΕ έχουν κάνει σημαντικά βήματα στην ανάπτυξη συστημάτων τεχνητής νοημοσύνης. Το Εμιράτο ήταν η πρώτη χώρα στον κόσμο που διόρισε α υπουργός ΑΙ Το 2017. Φέρεται επίσης να υπερηφανεύεται για το μεγαλύτερο μοντέλο παραγωγής τεχνητής νοημοσύνης της περιοχής, το Falcon, το οποίο κυκλοφόρησε από το Συμβούλιο Έρευνας Προηγμένης Τεχνολογίας του Άμπου Ντάμπι και το Ινστιτούτο Καινοτομίας Τεχνολογίας (TII) τον Μάρτιο.
- SEO Powered Content & PR Distribution. Ενισχύστε σήμερα.
- PlatoData.Network Vertical Generative Ai. Ενδυναμώστε τον εαυτό σας. Πρόσβαση εδώ.
- PlatoAiStream. Web3 Intelligence. Ενισχύθηκε η γνώση. Πρόσβαση εδώ.
- PlatoESG. Ανθρακας, Cleantech, Ενέργεια, Περιβάλλον, Ηλιακός, Διαχείριση των αποβλήτων. Πρόσβαση εδώ.
- PlatoHealth. Ευφυΐα βιοτεχνολογίας και κλινικών δοκιμών. Πρόσβαση εδώ.
- πηγή: https://metanews.com/uaes-new-ai-chatbot-jais-caters-to-arabic-speakers-challenging-english-bias/
- :έχει
- :είναι
- :δεν
- :που
- 13
- 2017
- 30
- 7
- a
- Ικανός
- ακαδημαϊκούς
- πρόσβαση
- Σύμφωνα με
- ακρίβεια
- Κατορθώνω
- προστιθέμενη
- προηγμένες
- Προηγμένη Τεχνολογία
- αρνητικά
- συγκινητικός
- Μετά το
- AI
- AI chatbot
- Συστήματα AI
- επιτρέπει
- Αλφάβητο
- Επίσης
- και
- απαντήσεις
- κάποιος
- Άραβας
- Αραβικά Εμιράτα
- αραβικός
- ΕΙΝΑΙ
- Υποστηρίζει
- γύρω
- τεχνητός
- τεχνητή νοημοσύνη
- AS
- At
- διαθέσιμος
- επίγνωση
- υπόβαθρα
- ήταν
- είναι
- πεποιθήσεις
- οφέλη
- μεταξύ
- Πέρα
- Δισεκατομμύριο
- BIN
- ιστολόγια
- μπορεί να υπερηφανεύεται
- και οι δύο
- όρια
- Χτίζει
- χτισμένο
- αλλά
- by
- που ονομάζεται
- CAN
- προμηθεύω
- εξυπηρετεί
- σίγουρα
- chatbot
- chatbots
- ChatGPT
- cia
- CNN
- συνδυασμός
- σύγκριση
- Ανησυχία
- περιεχόμενο
- θα μπορούσε να
- Συμβούλιο
- χώρα
- δημιουργία
- πολιτιστικός
- προσαρμόσετε
- στον κυβερνοχώρο
- κυβερνασφάλεια
- ημερομηνία
- σύνολα δεδομένων
- dc
- εξάρτηση
- προγραμματιστές
- ανάπτυξη
- διαφορές
- διαφορετικές
- Διευθυντής
- διάφορα
- do
- έγγραφα
- Επικράτηση
- Ανατολή
- αλλιώς
- Εμιράτο
- εμιράτα
- ενεργοποιήσετε
- τέλος
- Μηχανικοί
- Αγγλικά
- Αποκλειστικό
- Ανάπτυξη
- εμπειρία
- παράγοντες
- Falls
- μακριά
- Far Cry
- Εταιρεία
- Όνομα
- Συγκέντρωση
- εστιάζει
- Για
- επίσημος
- από
- γενετική
- Παραγωγική τεχνητή νοημοσύνη
- Go
- Της Google
- γραφικές παραστάσεις
- Έχω
- he
- βοηθά
- Ψηλά
- ελπίζοντας
- HTML
- HTTPS
- if
- εικόνες
- βελτίωση
- in
- έναρξη
- βιομηχανίες
- άτυπος
- Καινοτομία
- είσοδοι
- αντί
- Ινστιτούτο
- Νοημοσύνη
- Internet
- συμμετέχουν
- ζήτημα
- IT
- ΤΟΥ
- Ιαπωνία
- Ιαπωνικά
- jpg
- μόλις
- γνωστός
- Έλλειψη
- Γλώσσα
- Γλώσσες
- large
- μεγαλύτερη
- Latin
- Μου αρέσει
- Περιωρισμένος
- γραμμή
- Είδος μικρής καμήλας
- τοπικός
- που
- Mainstream
- Κατασκευή
- Μάρτιος
- max-width
- νόημα
- μέτρο
- Εικόνες / Βίντεο
- Μέσο
- Μέση Ανατολή
- εκατομμύριο
- μοντέλο
- μοντέλα
- ΜΟΝΤΕΡΝΑ
- Mohamed
- Μωάμεθ
- περισσότερο
- Βουνό
- Ονομάστηκε
- Φυσικό
- Επεξεργασία φυσικής γλώσσας
- Φύση
- Κοντά
- Νέα
- αποχρώσεις
- of
- επίσημος ανώτερος υπάλληλος
- συχνά
- on
- διαδικτυακά (online)
- ανοίξτε
- ανοικτού κώδικα
- or
- ΑΛΛΑ
- έξω
- δική
- παράμετροι
- People
- Εκτελέστε
- φώναξε
- Πλάτων
- Πληροφορία δεδομένων Plato
- Πλάτωνα δεδομένα
- κυρίως
- πρόληψη
- μεταποίηση
- Δάσκαλος
- Πρόγραμμα
- δημόσιο
- ερωτήματα
- σειρά
- Διάβασε
- θερισμός
- πρόσφατα
- κυκλοφόρησε
- αναφέρθηκαν
- έρευνα
- ερευνητές
- Απάντηση
- Αντίπαλος
- ευρωστία
- Δωμάτιο
- s
- Είπε
- λέει
- Κλίμακα
- ασφάλεια
- Κοντά
- σημαντικός
- Πυρίτιο
- έκτος
- Μέγεθος
- Μ.Κ.Δ
- social media
- Πηγή
- μιλούν
- Ηχεία
- συγκεκριμένες
- ειδικά
- ομιλείται
- πρότυπο
- Στρατηγική
- άλματα
- θυγατρική
- τέτοιος
- διακόπτης
- σύστημα
- συστήματα
- εργασίες
- Τεχνολογίες
- Τεχνολογία
- Τεχνολογική καινοτομία
- όροι
- κείμενο
- ότι
- Η
- ο κόσμος
- Εκεί.
- Αυτοί
- αυτοί
- εκείνοι
- προς την
- είπε
- εργαλεία
- Θέματα
- εκπαιδευμένο
- Εκπαίδευση
- ΗΑΕ
- καταλαβαίνω
- μοναδικός
- Ενωμένος
- Ηνωμένο Αραβικό
- Ηνωμένα Αραβικά Εμιράτα
- πανεπιστήμιο
- αποκαλυπτήρια
- μεταχειρισμένος
- Χρήστες
- Η εμπειρία χρήστη
- συνήθως
- εκδοχή
- ήταν
- Ουάσιγκτον
- we
- Ποιό
- ενώ
- Ο ΟΠΟΊΟΣ
- ευρύς
- Ευρύ φάσμα
- ευρέως
- θα
- με
- εργάστηκαν
- κόσμος
- παγκόσμιος
- γραφή
- γραπτή
- Zayed
- zephyrnet