Koreański gigant internetowy Naver w zeszłym tygodniu zadebiutował rodziną dużych modeli językowych o nazwie HyperCLOVA X, które, jak twierdzi, radzą sobie lepiej z rozumowaniem międzyjęzycznym w językach azjatyckich niż inne modele – i dlatego mogą pomóc regionowi w opracowaniu suwerennych modeli dużych języków.
Naver ogłosił debiut HyperCLOVA X w języku koreańskim i wskazano na język angielski raport techniczny w czasopiśmie o otwartym dostępie arXiv, w którym stwierdza się: „Wierzymy, że HyperCLOVA X – dzięki swoim konkurencyjnym możliwościom w języku angielskim i innych językach poza koreańskim – może zapewnić regionom lub krajom pomocne wskazówki dotyczące rozwijania własnych, suwerennych LLM”.
Osoby LLM zostały wstępnie przeszkolone na podstawie danych „składających się z segmentów koreańskich, wielojęzycznych i kodowych”.
Podzbiór wielojęzyczny składał się głównie z języka angielskiego, ale obejmował także wiele innych języków, takich jak japoński, niemiecki i francuski.
Materiał w języku koreańskim stanowił około jednej trzeciej danych przed szkoleniem, co wskazuje, że firma Naver zdecydowała się poprawić wyniki swoich modeli w swoim ojczystym języku. W procesie przygotowawczym uwzględniono także specyficzną gramatykę języka koreańskiego.
Jak twierdzi Naver, efektem tych wysiłków są modele „z wrodzoną biegłością zarówno w języku koreańskim, jak i angielskim”.
Co więcej, modele wykazują „wielojęzyczność” – zdolność do pracy w językach innych niż te, których nauczyła się używać.
„Nasza analiza pokazuje, że HyperCLOVA X jest w stanie nie tylko rozszerzyć swoje możliwości rozumowania poza główne języki docelowe, ale także osiągnąć najnowocześniejszy poziom tłumaczenia maszynowego między językiem koreańskim a językami niedocelowymi, takimi jak japoński i chiński” – dodał. stwierdza raport techniczny. „Imponująca wielojęzyczność HyperCLOVA X obejmuje także międzyjęzyczny transfer między językiem koreańskim i angielskim, gdzie dostosowanie instrukcji w jednym języku może prowadzić do pojawienia się możliwości wykonywania instrukcji w drugim” – dodał.
Wyniki testów wielojęzycznych doprowadziły twórcę do wniosku, że HyperCLOVA X „można przenieść na języki azjatyckie, które są niedostatecznie reprezentowane w danych przedtreningowych”.
Suwerenna sztuczna inteligencja wyłania się jako niezbędny potencjał krajowy – jako środek zapewniający bezpieczeństwo danych i zmniejszający zależność od dostawców offshore. Nvidia broniła tej koncepcji, która przypadkowo ma potencjał do stworzenia jeszcze większego rynku dla jej produktów.
Jednak, jak wskazuje raport techniczny Navera, kultury angielskie i północnoamerykańskie „są niezwykle nadreprezentowane w korpusach przedszkoleniowych” istniejących głównego nurtu LLM.
„W rezultacie te szkoły LLM wykazują ograniczone możliwości przetwarzania i rozumienia języków innych niż angielski, takich jak koreański, który ucieleśnia charakterystyczne niuanse kulturowe, sytuacje geopolityczne i inne specyfiki regionalne, a także unikalne cechy językowe” – wyjaśnia.
Regionalne Chiny wagi ciężkiej starały się rozwijać LLM w swoim interesie narodowym – lub przynajmniej w interesie KPCh różny sukces. Niemniej jednak chatboty takie jak ERNIE Baidu tak zrobiły zebrany ponad 100 milionów użytkowników do końca 2023 roku.
Nak-ho-Seon, szef technologii Naver Cloud Hyperscale AI, oświadczył, że planuje „stworzyć w przyszłości wyspecjalizowaną sztuczną inteligencję na superskalę dla różnych regionów i krajów”.
Tymczasem raport techniczny zawiera zobowiązanie do „badania multimodalności w celu poszerzenia możliwości HyperCLOVA X w celu płynnego przetwarzania i integrowania różnorodnych typów danych, takich jak tekst, obrazy i dźwięk”, przy jednoczesnym dążeniu do optymalizacji możliwości wnioskowania modelu.
Naver twierdził, że „aktywnie bada integrację zewnętrznych narzędzi i interfejsów API w celu zwiększenia funkcjonalności modelu” – wierzy, że przedsięwzięcie to „umożliwi HyperCLOVA X dostęp do specjalistycznych zbiorów danych i usług”. ®
- Dystrybucja treści i PR oparta na SEO. Uzyskaj wzmocnienie już dziś.
- PlatoData.Network Pionowe generatywne AI. Wzmocnij się. Dostęp tutaj.
- PlatoAiStream. Inteligencja Web3. Wiedza wzmocniona. Dostęp tutaj.
- PlatonESG. Węgiel Czysta technologia, Energia, Środowisko, Słoneczny, Gospodarowanie odpadami. Dostęp tutaj.
- Platon Zdrowie. Inteligencja w zakresie biotechnologii i badań klinicznych. Dostęp tutaj.
- Źródło: https://go.theregister.com/feed/www.theregister.com/2024/04/08/naver_cloud_hyperclova_llm_sovereign_ai/
- :ma
- :Jest
- :nie
- :Gdzie
- $W GÓRĘ
- 100
- 2023
- 7
- a
- zdolności
- zdolność
- Zdolny
- dostęp
- Konto
- Osiągać
- aktywnie
- w dodatku
- AI
- Cel
- również
- amerykański
- an
- analiza
- i
- Pszczoła
- SĄ
- na około
- AS
- azjatyckiego
- At
- atrybuty
- audio
- zwiększać
- Baidu
- BE
- uwierzyć
- uważa,
- Ulepsz Swój
- pomiędzy
- Poza
- obie
- poszerzać
- ale
- by
- CAN
- możliwości
- zdolność
- Pojemność
- CCP
- bronił
- nasze chatboty
- Chiny
- chiński
- wybrał
- twierdził,
- Chmura
- CO
- kod
- konkurencyjny
- Składa się
- pojęcie
- stwierdza,
- w konsekwencji
- kraje
- Stwórz
- kulturalny
- Hodowle
- dane
- bezpieczeństwo danych
- zbiory danych
- debiut
- zadebiutował
- Debiuty
- Deklarowana
- Zależność
- rozwijać
- Deweloper
- rozwijanie
- Wyświetlacz
- charakterystyczny
- inny
- wysiłek
- ucieleśnia
- powstanie
- wschodzących
- umożliwiać
- zakończenia
- starać się
- Angielski
- zapewnienie
- Parzyste
- pokazać
- Przede wszystkim system został opracowany
- Objaśnia
- odkryj
- rozciągać się
- zewnętrzny
- niezwykle
- członków Twojej rodziny
- W razie zamówieenia projektu
- francuski
- funkcjonalności
- przyszłość
- geopolityczna
- niemiecki
- gigant
- gramatyka
- poradnictwo
- miał
- uchwyt
- głowa
- Heavyweight
- pomoc
- pomocny
- Strona główna
- HTML
- HTTPS
- zdjęcia
- imponujący
- podnieść
- in
- włączony
- obejmuje
- wskazanie
- nieodłączny
- integrować
- integracja
- odsetki
- najnowszych
- IT
- JEGO
- Japonki
- dziennik
- jpg
- koreański
- język
- Języki
- duży
- większe
- Nazwisko
- prowadzić
- najmniej
- Doprowadziło
- poziom
- lubić
- Ograniczenia
- LLM
- maszyna
- zrobiony
- Mainstream
- rynek
- materiał
- Może..
- znaczy
- milion
- model
- modele
- O imieniu
- narodowy
- Naver
- niezbędny
- Północ
- zacienienie
- Nvidia
- of
- on
- ONE
- tylko
- koncepcja
- Optymalizacja
- or
- Inne
- ludzkiej,
- na zewnątrz
- koniec
- własny
- szczególny
- wykonać
- jest gwarancją najlepszej jakości, które mogą dostarczyć Ci Twoje monitory,
- plany
- plato
- Analiza danych Platona
- PlatoDane
- Zastaw
- zwrotnica
- potencjał
- przeważnie
- głównie
- wygląda tak
- zapewniać
- dostawców
- redukcja
- region
- regionalny
- regiony
- raport
- dalsze
- Efekt
- Reuters
- s
- płynnie
- bezpieczeństwo
- poszukuje
- Segmenty
- Usługi
- Targi
- sytuacje
- poszukiwany
- suwerenny
- wyspecjalizowanym
- state-of-the-art
- Zjednoczone
- taki
- ukierunkowane
- Techniczny
- Technologia
- test
- XNUMX
- niż
- że
- Połączenia
- Przyszłość
- ich
- w związku z tym
- Te
- Trzeci
- tych
- do
- wziął
- narzędzia
- przeszkolony
- przenieść
- przeniesione
- Tłumaczenie
- typy
- niedostatecznie reprezentowany
- zrozumieć
- wyjątkowy
- Użytkownicy
- różnorodność
- różnorodny
- była
- we
- sieć
- tydzień
- DOBRZE
- były
- który
- Podczas
- będzie
- w
- Praca
- X
- jeszcze
- zefirnet