Korea veebihiiglane Naver debüteeris eelmisel nädalal suurte keelemudelite perekonna nimega HyperCLOVA X, mis väidetavalt toimib Aasia keeltes keeltevahelises arutluskäigus paremini kui teised mudelid – ja võib seetõttu aidata piirkonnal välja töötada suveräänseid suuri keelemudeleid.
Naver teatas HyperCLOVA X debüüt korea keeles ja viitas inglise keelele tehniline aruanne avatud juurdepääsuga ajakirjas arXiv, mis kinnitab: „Usume, et HyperCLOVA X – oma konkurentsivõimelise võimekusega inglise keeles ja muudes keeltes peale korea keele – võib pakkuda piirkondadele või riikidele kasulikke juhiseid oma suveräänsete LLM-ide arendamiseks.”
LLM-id olid eelkoolitatud andmete põhjal, mis koosnesid koreakeelsetest, mitmekeelsetest ja koodisegmentidest.
Mitmekeelne alamhulk oli valdavalt inglise keel, kuid hõlmas ka mitmeid teisi keeli – näiteks jaapani, saksa ja prantsuse keelt.
Korea keele materjal moodustas umbes kolmandiku koolituseelsetest andmetest, mis näitab, et Naver otsustas parandada oma mudelite jõudlust oma kodukeeles. Eelkoolitusprotsessis võeti arvesse ka korea keele grammatikat.
Naveri kinnitusel on selle jõupingutuse tulemuseks mudelid, "millele on omane nii korea kui ka inglise keele oskus".
Veelgi parem, mudelid näitavad "mitmekeelsust" - võimet töötada muudes keeltes kui need, mida nad on õpetatud kasutama.
"Meie analüüs näitab, et HyperCLOVA X ei suuda mitte ainult laiendada oma arutlusvõimet oma peamiselt sihitud keeltest kaugemale, vaid saavutab ka tipptasemel masintõlketaseme korea ja sihtimata keelte, näiteks jaapani ja hiina keele vahel," tehnilises aruandes öeldakse. "HyperCLOVA X muljetavaldav mitmekeelsus hõlmab ka keeltevahelist edastust korea ja inglise keele vahel, kus juhiste häälestamine ühes keeles võib viia juhiste järgimise võimaluste esilekerkimiseni teises," lisas ta.
Mitmekeelsed testitulemused viisid arendaja järeldusele, et HyperCLOVA X "saab üle kanda Aasia keeltesse, mis on koolituseelsetes andmetes alaesindatud".
Suveräänne tehisintellekt on kujunemas vajalikuks riiklikuks võimeks – andmeturbe tagamise ja offshore-teenusepakkujatest sõltuvuse vähendamise vahendina. Nvidia on selle kontseptsiooni eest seisnud, millel on juhuslikult potentsiaal luua oma toodetele veelgi suurem turg.
Kuid nagu Naveri tehniline aruanne osutab, on inglise ja Põhja-Ameerika kultuurid olemasolevate peavoolu LLM-ide jaoks "eelkoolituskorpustes äärmiselt üleesindatud".
"Järelikult on nendel LLM-idel piiratud võime töödelda ja mõista mitte-inglise keeli, näiteks korea keelt, mis kehastab eristavaid kultuurilisi nüansse, geopoliitilisi olukordi ja muid piirkondlikke eripärasid, aga ka ainulaadseid keelelisi atribuute," selgitatakse.
Piirkondlik raskekaalu Hiina on püüdnud arendada LLM-e oma riiklikes huvides – või vähemalt KKP huvides –, et vahelduv edu. Sellegipoolest olid sellised vestlusrobotid nagu Baidu ERNIE kogutud 100. aasta lõpuks üle 2023 miljoni kasutaja.
Nak-ho-Seon, Naver Cloudi hüperskaala tehisintellekti tehnoloogia juht, teatas, et kavatseb tulevikus "luua eri piirkondade ja riikide jaoks spetsialiseerunud superskaala tehisintellekti".
Vahepeal sisaldab tehniline aruanne lubadust "uurida multimodaalsust, eesmärgiga laiendada HyperCLOVA X-i võimalusi, et sujuvalt töödelda ja integreerida erinevat tüüpi andmeid, nagu tekst, pildid ja heli", püüdes samal ajal optimeerida mudeli järelduste tegemise võimeid.
Naver väitis, et ta "uurib aktiivselt väliste tööriistade ja API-de integreerimist mudeli funktsioonide täiustamiseks" - see ettevõtmine "võimaldab HyperCLOVA X-il juurdepääsu spetsiaalsetele andmekogumitele ja teenustele". ®
- SEO-põhise sisu ja PR-levi. Võimenduge juba täna.
- PlatoData.Network Vertikaalne generatiivne Ai. Jõustage ennast. Juurdepääs siia.
- PlatoAiStream. Web3 luure. Täiustatud teadmised. Juurdepääs siia.
- PlatoESG. Süsinik, CleanTech, Energia, Keskkond päikeseenergia, Jäätmekäitluse. Juurdepääs siia.
- PlatoTervis. Biotehnoloogia ja kliiniliste uuringute luureandmed. Juurdepääs siia.
- Allikas: https://go.theregister.com/feed/www.theregister.com/2024/04/08/naver_cloud_hyperclova_llm_sovereign_ai/
- :on
- :on
- :mitte
- : kus
- $ UP
- 100
- 2023
- 7
- a
- võimeid
- võime
- Võimalik
- juurdepääs
- konto
- Saavutada
- aktiivselt
- lisatud
- AI
- Eesmärk
- Ka
- ameerika
- an
- analüüs
- ja
- API-liidesed
- OLEME
- ümber
- AS
- aasia
- At
- atribuudid
- heli-
- suurendama
- Baidu
- BE
- Uskuma
- usub,
- Parem
- vahel
- Peale
- mõlemad
- laiendada
- kuid
- by
- CAN
- võimeid
- võime
- Võimsus
- CCP
- tuntud
- jututoad
- Hiina
- hiina
- Valisin
- väitis
- Cloud
- CO
- kood
- konkurentsivõimeline
- Koosneb
- mõiste
- lõpetama
- Järelikult
- riikides
- looma
- kultuuriline
- kultuuride
- andmed
- andmekaitse
- andmekogumid
- debüüt
- debüteeris
- Debuts
- kuulutatud
- Sõltuvus
- arendama
- arendaja
- arenev
- Ekraan
- eristusvõime
- mitu
- jõupingutusi
- kehastab
- tekkimine
- smirgel
- võimaldama
- lõpp
- püüdma
- Inglise
- tagades
- Isegi
- näitama
- olemasolevate
- Selgitab
- uurima
- laiendama
- väline
- äärmiselt
- pere
- eest
- prantsuse
- funktsionaalsused
- tulevik
- geopoliitiline
- saksa
- hiiglane
- grammatika
- juhised
- olnud
- käepide
- juhataja
- raskekaalu
- aitama
- kasulik
- Avaleht
- HTML
- HTTPS
- pildid
- muljetavaldav
- parandama
- in
- lisatud
- hõlmab
- näidustus
- omane
- integreerima
- integratsioon
- huvi
- sisse
- IT
- ITS
- jaapani
- ajakiri
- jpg
- korea
- keel
- Keeled
- suur
- suurem
- viimane
- viima
- kõige vähem
- Led
- Tase
- nagu
- piirangud
- LLM
- masin
- tehtud
- mainstream
- Turg
- materjal
- mai..
- vahendid
- miljon
- mudel
- mudelid
- Nimega
- riiklik
- Naver
- vajalik
- põhja-
- varjutamine
- Nvidia
- of
- on
- ONE
- ainult
- avatud
- optimeerima
- or
- Muu
- meie
- välja
- üle
- enda
- eriline
- täitma
- jõudlus
- plaanid
- Platon
- Platoni andmete intelligentsus
- PlatoData
- Pant
- võrra
- potentsiaal
- valdavalt
- eelkõige
- protsess
- anda
- pakkujad
- vähendamine
- piirkond
- piirkondlik
- piirkondades
- aru
- kaasa
- Tulemused
- Reuters
- s
- sujuvalt
- turvalisus
- otsib
- segmendid
- Teenused
- Näitused
- olukordades
- otsisin
- suveräänne
- spetsialiseeritud
- modernne
- Ühendriigid
- selline
- suunatud
- Tehniline
- Tehnoloogia
- test
- tekst
- kui
- et
- .
- Tulevik
- oma
- seetõttu
- Need
- Kolmas
- need
- et
- võttis
- töövahendid
- koolitatud
- üle
- üle antud
- Tõlge
- liigid
- alaesindatud
- mõistma
- ainulaadne
- Kasutajad
- sort
- eri
- oli
- we
- web
- nädal
- Hästi
- olid
- mis
- kuigi
- will
- koos
- Töö
- X
- veel
- sephyrnet