Ο κορεατικός γίγαντας ιστού Naver έκανε το ντεμπούτο του την περασμένη εβδομάδα μια οικογένεια μεγάλων γλωσσικών μοντέλων με το όνομα HyperCLOVA X, η οποία ισχυρίστηκε ότι έχει καλύτερη απόδοση στη διαγλωσσική συλλογιστική σε ασιατικές γλώσσες από άλλα μοντέλα - και ως εκ τούτου μπορεί να βοηθήσει την περιοχή να αναπτύξει κυρίαρχα μεγάλα γλωσσικά μοντέλα.
Naver ανακοίνωσε το ντεμπούτο του HyperCLOVA X στα κορεάτικα και έδειξε μια αγγλική γλώσσα Τεχνική αναφορά στο περιοδικό ανοιχτής πρόσβασης arXiv που ισχυρίζεται ότι «Πιστεύουμε ότι το HyperCLOVA X – με τις ανταγωνιστικές του ικανότητες στα αγγλικά και άλλες γλώσσες πέρα από τα κορεατικά – μπορεί να παρέχει χρήσιμη καθοδήγηση σε περιοχές ή χώρες για την ανάπτυξη των δικών τους κυρίαρχων LLMs».
Τα LLM ήταν προεκπαιδευμένα σε δεδομένα «αποτελούμενα από κορεάτικα, πολύγλωσσα και κωδικοποιημένα τμήματα».
Το πολύγλωσσο υποσύνολο ήταν κυρίως αγγλικά, αλλά περιλάμβανε επίσης μια ποικιλία από άλλες γλώσσες – όπως τα ιαπωνικά, τα γερμανικά και τα γαλλικά.
Υλικό κορεατικής γλώσσας αποτελούσε περίπου το ένα τρίτο των δεδομένων πριν από την προπόνηση, ένδειξη ότι η Naver επέλεξε να βελτιώσει την απόδοση των μοντέλων της στη μητρική της γλώσσα. Η προεκπαιδευτική διαδικασία έλαβε επίσης υπόψη την ιδιαίτερη γραμματική της κορεατικής γλώσσας.
Το αποτέλεσμα αυτής της προσπάθειας, ισχυρίζεται ο Naver, είναι μοντέλα «με εγγενή επάρκεια τόσο στα κορεατικά όσο και στα αγγλικά».
Ακόμα καλύτερα, τα μοντέλα εμφανίζουν "πολυγλωσσία" - την ικανότητα να εργάζονται σε γλώσσες άλλες από αυτές που έχουν εκπαιδευτεί να χειρίζονται.
«Η ανάλυσή μας δείχνει ότι το HyperCLOVA X όχι μόνο είναι σε θέση να επεκτείνει την ικανότητα συλλογισμού του πέρα από τις κυρίως στοχευμένες γλώσσες του, αλλά και να επιτύχει το πιο προηγμένο επίπεδο μηχανικής μετάφρασης μεταξύ κορεατικών και μη στοχευμένων γλωσσών, όπως τα ιαπωνικά και τα κινέζικα», αναφέρει η τεχνική έκθεση. «Η εντυπωσιακή πολυγλωσσική ικανότητα του HyperCLOVA X περιλαμβάνει επίσης διαγλωσσική μεταφορά μεταξύ Κορεατικών και Αγγλικών, όπου ο συντονισμός εντολών σε μια γλώσσα μπορεί να οδηγήσει στην εμφάνιση δυνατοτήτων παρακολούθησης οδηγιών στην άλλη», πρόσθεσε.
Τα αποτελέσματα των πολύγλωσσων δοκιμών οδήγησαν τον προγραμματιστή στο συμπέρασμα ότι το HyperCLOVA X «μπορεί να μεταφερθεί σε ασιατικές γλώσσες που υποεκπροσωπούνται στα δεδομένα προεκπαίδευσης».
Η κυρίαρχη τεχνητή νοημοσύνη αναδεικνύεται ως απαραίτητη εθνική ικανότητα – ως μέσο διασφάλισης της ασφάλειας δεδομένων και μείωσης της εξάρτησης από υπεράκτιους παρόχους. Η Nvidia υπερασπίστηκε την ιδέα, η οποία συμπτωματικά έχει τη δυνατότητα να δημιουργήσει μια ακόμη μεγαλύτερη αγορά για τα προϊόντα της.
Όμως, όπως επισημαίνει η τεχνική έκθεση του Naver, οι αγγλικοί και βορειοαμερικανικοί πολιτισμοί «υπερεκπροσωπούνται εξαιρετικά στα σώματα προ-κατάρτισης» για τα υπάρχοντα κύρια LLM.
«Συνεπώς, αυτά τα LLM παρουσιάζουν περιορισμούς στην ικανότητά τους να επεξεργάζονται και να κατανοούν μη αγγλικές γλώσσες όπως τα κορεάτικα, τα οποία ενσωματώνουν διακριτές πολιτισμικές αποχρώσεις, γεωπολιτικές καταστάσεις και άλλες τοπικές ιδιαιτερότητες, καθώς και μοναδικά γλωσσικά χαρακτηριστικά», εξηγεί.
Η περιφερειακή βαρέων βαρών Κίνα επιδίωξε να αναπτύξει LLM προς το εθνικό της συμφέρον –ή τουλάχιστον το συμφέρον του ΚΚΚ– για ποικίλη επιτυχία. Παρόλα αυτά, chatbots όπως το ERNIE του Baidu είχαν συλλέγονται πάνω από 100 εκατομμύρια χρήστες μέχρι το τέλος του 2023.
Ο Nak-ho-Seon, επικεφαλής της τεχνολογίας Naver Cloud Hyperscale AI, δήλωσε ότι σχεδιάζει «να δημιουργήσει εξειδικευμένη τεχνητή νοημοσύνη υπερ-κλίμακας για διάφορες περιοχές και χώρες στο μέλλον».
Εν τω μεταξύ, η τεχνική έκθεση περιλαμβάνει μια δέσμευση για «διερεύνηση της πολυτροπικότητας, με στόχο τη διεύρυνση των δυνατοτήτων του HyperCLOVA X για την απρόσκοπτη επεξεργασία και ενσωμάτωση διαφορετικών τύπων δεδομένων, όπως κείμενο, εικόνες και ήχο», ενώ επιδιώκεται να βελτιστοποιηθούν οι ικανότητες συμπερασμάτων του μοντέλου.
Ο Naver ισχυρίστηκε ότι «ερευνά ενεργά την ενοποίηση εξωτερικών εργαλείων και API για να αυξήσει τις λειτουργίες του μοντέλου» – μια προσπάθεια που πιστεύει ότι θα «επιτρέψει στο HyperCLOVA X να έχει πρόσβαση σε εξειδικευμένα σύνολα δεδομένων και υπηρεσίες». ®
- SEO Powered Content & PR Distribution. Ενισχύστε σήμερα.
- PlatoData.Network Vertical Generative Ai. Ενδυναμώστε τον εαυτό σας. Πρόσβαση εδώ.
- PlatoAiStream. Web3 Intelligence. Ενισχύθηκε η γνώση. Πρόσβαση εδώ.
- PlatoESG. Ανθρακας, Cleantech, Ενέργεια, Περιβάλλον, Ηλιακός, Διαχείριση των αποβλήτων. Πρόσβαση εδώ.
- PlatoHealth. Ευφυΐα βιοτεχνολογίας και κλινικών δοκιμών. Πρόσβαση εδώ.
- πηγή: https://go.theregister.com/feed/www.theregister.com/2024/04/08/naver_cloud_hyperclova_llm_sovereign_ai/
- :έχει
- :είναι
- :δεν
- :που
- $UP
- 100
- 2023
- 7
- a
- ικανότητες
- ικανότητα
- Ικανός
- πρόσβαση
- Λογαριασμός
- Κατορθώνω
- δραστήρια
- προστιθέμενη
- AI
- Στοχεύω
- Επίσης
- Αμερικανικη
- an
- ανάλυση
- και
- APIs
- ΕΙΝΑΙ
- γύρω
- AS
- ασιάτης
- At
- γνωρίσματα
- ήχου
- αυξάνω
- Baidu
- BE
- Πιστεύω
- πιστεύει
- Καλύτερα
- μεταξύ
- Πέρα
- και οι δύο
- ευρύνω
- αλλά
- by
- CAN
- δυνατότητες
- ικανότητα
- Χωρητικότητα
- CCP
- πρωταγωνίστησε
- chatbots
- Κίνα
- κινέζικο
- επέλεξε
- ισχυρίστηκε
- Backup
- CO
- κωδικός
- ανταγωνιστική
- Αποτελείται
- έννοια
- καταλήγω
- συνεπώς
- χώρες
- δημιουργία
- πολιτιστικός
- πολιτισμών
- ημερομηνία
- την ασφάλεια των δεδομένων
- σύνολα δεδομένων
- ντεμπούτο
- έκανε το ντεμπούτο του
- Ντεμπούτα
- δηλώνονται
- Εξάρτηση
- ανάπτυξη
- Εργολάβος
- ανάπτυξη
- Display
- διακριτικός
- διάφορα
- προσπάθεια
- ενσωματώνει
- εμφάνιση
- σμυριδόπετρα
- ενεργοποιήσετε
- τέλος
- προσπάθεια
- Αγγλικά
- εξασφαλίζοντας
- Even
- έκθεμα
- υφιστάμενα
- Εξηγεί
- διερευνήσει
- επεκτείνουν
- εξωτερικός
- εξαιρετικά
- οικογένεια
- Για
- Γαλλικά
- λειτουργίες
- μελλοντικός
- γεωπολιτικό
- Γερμανικά
- γίγαντας
- γραμματική
- καθοδήγηση
- είχε
- λαβή
- κεφάλι
- Βαρέων βαρών
- βοήθεια
- χρήσιμο
- Αρχική
- HTML
- HTTPS
- εικόνες
- εντυπωσιακός
- βελτίωση
- in
- περιλαμβάνονται
- περιλαμβάνει
- ένδειξη
- συμφυής
- ενσωματώσει
- ολοκλήρωση
- τόκος
- σε
- IT
- ΤΟΥ
- Ιαπωνικά
- ημερολόγιο
- jpg
- Κορεάτικα
- Γλώσσα
- Γλώσσες
- large
- μεγαλύτερος
- Επίθετο
- οδηγήσει
- ελάχιστα
- Led
- Επίπεδο
- Μου αρέσει
- περιορισμούς
- LLM
- μηχανή
- που
- Mainstream
- αγορά
- υλικό
- Ενδέχεται..
- μέσα
- εκατομμύριο
- μοντέλο
- μοντέλα
- Ονομάστηκε
- εθνικός
- Naver
- απαραίτητος
- Βόρειος
- αποχρώσεις
- Nvidia
- of
- on
- ONE
- αποκλειστικά
- ανοίξτε
- Βελτιστοποίηση
- or
- ΑΛΛΑ
- δικός μας
- έξω
- επί
- δική
- Ειδικότερα
- Εκτελέστε
- επίδοση
- φώναξε
- Πλάτων
- Πληροφορία δεδομένων Plato
- Πλάτωνα δεδομένα
- Ενέχυρο
- σημεία
- δυναμικού
- κυρίως
- πρωτίστως
- διαδικασια μας
- παρέχουν
- Παρόχους υπηρεσιών
- μείωση
- περιοχή
- περιφερειακός
- περιοχές
- αναφέρουν
- αποτέλεσμα
- Αποτελέσματα
- Reuters
- s
- άψογα
- ασφάλεια
- αναζήτηση
- τμήματα
- Υπηρεσίες
- Δείχνει
- καταστάσεων
- επιδιώξει
- κυρίαρχος
- ειδικευμένος
- state-of-the-art
- Μελών
- τέτοιος
- στοχευμένες
- Τεχνικός
- Τεχνολογία
- δοκιμή
- κείμενο
- από
- ότι
- Η
- Το μέλλον
- τους
- επομένως
- Αυτοί
- Τρίτος
- εκείνοι
- προς την
- πήρε
- εργαλεία
- εκπαιδευμένο
- μεταφορά
- μεταφέρονται
- Μετάφραση
- τύποι
- υποεκπροσωπούνται
- καταλαβαίνω
- μοναδικός
- Χρήστες
- ποικιλία
- διάφορα
- ήταν
- we
- ιστός
- εβδομάδα
- ΛΟΙΠΌΝ
- ήταν
- Ποιό
- ενώ
- θα
- με
- Εργασία
- X
- ακόμη
- zephyrnet