غول وب کره ای Naver هفته گذشته خانواده ای از مدل های زبانی بزرگ به نام HyperCLOVA X را معرفی کرد که ادعا کرد در استدلال میان زبانی در زبان های آسیایی نسبت به سایر مدل ها بهتر عمل می کنند - و بنابراین ممکن است به منطقه برای توسعه مدل های زبان بزرگ مستقل کمک کند.
ناور اعلام کرد اولین HyperCLOVA X به زبان کره ای و به انگلیسی زبان اشاره کرد گزارش فنی در مجله دسترسی آزاد arXiv که ادعا می کند "ما معتقدیم که HyperCLOVA X - با قابلیت های رقابتی خود در انگلیسی و سایر زبان های فراتر از کره ای - می تواند راهنمایی مفیدی برای مناطق یا کشورها در توسعه LLM های مستقل خود ارائه دهد."
LLM ها روی داده های «شامل بخش های کره ای، چند زبانه و کد» از قبل آموزش دیده بودند.
زیرمجموعه چند زبانه عمدتاً انگلیسی بود، اما همچنین شامل انواع زبانهای دیگر مانند ژاپنی، آلمانی و فرانسوی بود.
مطالب زبان کره ای حدود یک سوم داده های قبل از آموزش را تشکیل می داد، که نشان می دهد ناور تصمیم گرفته است عملکرد مدل های خود را در زبان اصلی خود بهبود بخشد. فرآیند پیشآموزشی نیز گرامر خاص زبان کرهای را در نظر گرفت.
ناور بیان میکند که نتیجه این تلاش، مدلهایی «با مهارت ذاتی در کرهای و انگلیسی» است.
بهتر از آن، مدلها «چندزبانی» را نشان میدهند - توانایی کار به زبانهایی غیر از زبانهایی که آموزش دیدهاند.
"تحلیل ما نشان می دهد که HyperCLOVA X نه تنها قادر است توانایی استدلال خود را فراتر از زبان های هدف اصلی خود گسترش دهد، بلکه همچنین می تواند به سطح پیشرفته ای در ترجمه ماشینی بین زبان های کره ای و غیر هدفمند مانند ژاپنی و چینی دست یابد." گزارش فنی بیان می کند. "توانایی چشمگیر چند زبانه HyperCLOVA X همچنین شامل انتقال بین زبانی بین کره ای و انگلیسی است، جایی که تنظیم آموزش در یک زبان می تواند منجر به ظهور قابلیت های دنبال کردن دستورالعمل در زبان دیگر شود."
نتایج آزمون چند زبانه توسعهدهنده را به این نتیجه رساند که HyperCLOVA X میتواند به زبانهای آسیایی که در دادههای قبل از آموزش کمتر ارائه شدهاند، منتقل شود.
هوش مصنوعی مستقل به عنوان یک ظرفیت ملی ضروری در حال ظهور است - به عنوان وسیله ای برای تضمین امنیت داده ها و کاهش وابستگی به ارائه دهندگان خارج از کشور. انویدیا از این مفهوم دفاع کرده است که اتفاقاً پتانسیل ایجاد بازار بزرگتری برای کالاهای خود دارد.
اما همانطور که گزارش فنی ناور اشاره میکند، فرهنگهای انگلیسی و آمریکای شمالی «بسیار بیش از حد در مجموعههای پیشآموزشی» برای LLMهای اصلی موجود وجود دارد.
در نتیجه، این LLM ها محدودیت هایی را در ظرفیت پردازش و درک زبان های غیرانگلیسی مانند کره ای، که مظهر تفاوت های فرهنگی متمایز، موقعیت های ژئوپلیتیکی، و سایر ویژگی های منطقه ای، و همچنین ویژگی های زبانی منحصر به فرد است، نشان می دهند.
چین سنگین وزن منطقه ای به دنبال توسعه LLM در راستای منافع ملی خود – یا حداقل به نفع حکچ – بوده است. موفقیت متفاوت. با این وجود، رباتهای چت مانند ERNIE بایدو داشتند جمع آوری شد بیش از 100 میلیون کاربر تا پایان سال 2023.
Nak-ho-Seon، رئیس فناوری هوش مصنوعی Naver Cloud Hyperscale، اعلام کرد که قصد دارد "در آینده هوش مصنوعی فوقالعادهای را برای مناطق و کشورهای مختلف ایجاد کند."
در همین حال، گزارش فنی شامل تعهدی برای "کاوش چندوجهی، با هدف گسترش قابلیتهای HyperCLOVA X برای پردازش و یکپارچهسازی انواع مختلف دادهها، مانند متن، تصاویر، و صوت" است، در حالی که به دنبال بهینهسازی تواناییهای استنتاج مدل است.
ناور ادعا کرد که "به طور فعال در حال تحقیق در مورد ادغام ابزارهای خارجی و APIها برای تقویت عملکردهای مدل است" - تلاشی که معتقد است "HyperCLOVA X را قادر می سازد تا به مجموعه داده ها و خدمات تخصصی دسترسی پیدا کند." ®
- محتوای مبتنی بر SEO و توزیع روابط عمومی. امروز تقویت شوید.
- PlatoData.Network Vertical Generative Ai. به خودت قدرت بده دسترسی به اینجا.
- PlatoAiStream. هوش وب 3 دانش تقویت شده دسترسی به اینجا.
- PlatoESG. کربن ، CleanTech، انرژی، محیط، خورشیدی، مدیریت پسماند دسترسی به اینجا.
- PlatoHealth. هوش بیوتکنولوژی و آزمایشات بالینی. دسترسی به اینجا.
- منبع: https://go.theregister.com/feed/www.theregister.com/2024/04/08/naver_cloud_hyperclova_llm_sovereign_ai/
- : دارد
- :است
- :نه
- :جایی که
- $UP
- 100
- 2023
- 7
- a
- توانایی
- توانایی
- قادر
- دسترسی
- حساب
- رسیدن
- فعالانه
- اضافه
- AI
- هدف
- همچنین
- امریکایی
- an
- تحلیل
- و
- رابط های برنامه کاربردی
- هستند
- دور و بر
- AS
- آسیایی
- At
- خواص
- سمعی
- تقویت کردن
- بایدو
- BE
- باور
- معتقد است که
- بهتر
- میان
- خارج از
- هر دو
- گسترده تر
- اما
- by
- CAN
- قابلیت های
- قابلیت
- ظرفیت
- حزب کمونیست چین
- دفاع و پشتیبانی
- chatbots
- چین
- چینی
- را انتخاب
- ادعا کرد که
- ابر
- CO
- رمز
- رقابتی
- شامل
- مفهوم
- نتیجه گیری
- در نتیجه
- کشور
- ایجاد
- فرهنگی
- فرهنگ
- داده ها
- امنیت داده ها
- مجموعه داده ها
- اغاز کار
- عرضه شد
- آغاز بکار
- اظهار شده
- وابستگی
- توسعه
- توسعه دهنده
- در حال توسعه
- نمایش دادن
- متمایز
- مختلف
- تلاش
- مظهر
- خروج
- سنگ سنباده
- قادر ساختن
- پایان
- تلاش کن
- انگلیسی
- حصول اطمینان از
- حتی
- نمایش دادن
- موجود
- توضیح می دهد
- اکتشاف
- گسترش
- خارجی
- خیلی
- خانواده
- برای
- فرانسوی
- ویژگی های
- آینده
- جغرافیای سیاسی
- آلمانی
- غول
- دستور زبان
- راهنمایی
- بود
- دسته
- سر
- سنگین وزن
- کمک
- مفید
- صفحه اصلی
- HTML
- HTTPS
- تصاویر
- موثر
- بهبود
- in
- مشمول
- شامل
- نشانه
- ذاتی
- ادغام
- ادغام
- علاقه
- به
- IT
- ITS
- ژاپنی
- روزنامه
- JPG
- کره ای
- زبان
- زبان ها
- بزرگ
- بزرگتر
- نام
- رهبری
- کمترین
- رهبری
- سطح
- پسندیدن
- محدودیت
- LLM
- دستگاه
- ساخته
- مسیر اصلی
- بازار
- ماده
- ممکن است..
- به معنی
- میلیون
- مدل
- مدل
- تحت عنوان
- ملی
- ناور
- لازم
- شمال
- تفاوت های ظریف
- کارت گرافیک Nvidia
- of
- on
- ONE
- فقط
- باز کن
- بهینه سازی
- or
- دیگر
- ما
- خارج
- روی
- خود
- ویژه
- انجام
- کارایی
- برنامه
- افلاطون
- هوش داده افلاطون
- PlatoData
- گرو
- نقطه
- پتانسیل
- غالباً
- در درجه اول
- روند
- ارائه
- ارائه دهندگان
- کاهش
- منطقه
- منطقهای
- مناطق
- گزارش
- نتیجه
- نتایج
- رویترز
- s
- یکپارچه
- تیم امنیت لاتاری
- به دنبال
- بخش ها
- خدمات
- نشان می دهد
- شرایط
- به دنبال
- پادشاه
- تخصصی
- وضعیت هنر
- ایالات
- چنین
- هدف قرار
- فنی
- پیشرفته
- آزمون
- متن
- نسبت به
- که
- La
- آینده
- شان
- از این رو
- اینها
- سوم
- کسانی که
- به
- در زمان
- ابزار
- آموزش دیده
- انتقال
- منتقل
- ترجمه
- انواع
- کمتر نماینده
- فهمیدن
- منحصر به فرد
- کاربران
- تنوع
- مختلف
- بود
- we
- وب
- هفته
- خوب
- بود
- که
- در حین
- اراده
- با
- مهاجرت کاری
- X
- هنوز
- زفیرنت