Meta به هوش مصنوعی می‌پردازد: آیا می‌تواند با Google، ChatGPT و MidJourney رقابت کند؟

بازنشر افلاطون

دنبال: 0

متا به شدت تلاش های هوش مصنوعی خود را در تلاش برای رسیدن به رقبایی مانند گوگل، مایکروسافت و OpenAI افزایش می دهد. این غول شبکه های اجتماعی مدل جدیدی از متن به تصویر را معرفی کرده است که نام دارد CM3leon که ادعا می کند عملکردی پیشرفته برای تولید تصاویر از پیام های متنی دارد. اما هنوز برای آزمایش یا استفاده تجاری در دسترس نیست.

CM3leon یک پیشرفت برای قابلیت‌های هوش مصنوعی متا است. این مدل نه‌تنها می‌تواند تصاویری با کیفیت بالا از توضیحات متن تولید کند، بلکه می‌تواند شرح‌های منسجمی برای تصاویر موجود بنویسد. این زمینه را برای مدل‌های پیشرفته‌تر درک تصویر در آینده فراهم می‌کند.

متا از تیم قدرتمند علم داده و زیرساخت‌های محاسباتی خود برای پیشبرد مدل‌های پیشرفته مانند CM3leon استفاده می‌کند. در حالی که هوش مصنوعی مبتنی بر انتشار مانند MidJourney سرفصل خبرها را به خود اختصاص داده است، متا روی معماری ترانسفورماتورهای اتورگرسیو (همان فناوری استفاده شده توسط ChatGPT) شرط بندی کرده است. شرکت ادعای CM3leon 5 برابر کمتر از سایر روش های قابل مقایسه به محاسبات آموزشی نیاز دارد.

در مقایسه‌های رو در رو، به نظر می‌رسد که CM3leon با اشیاء و محدودیت‌های پیچیده در پیام‌های متنی بهتر از مدل‌هایی مانند DALL-E 2 OpenAI و حتی Midjourney برخورد می‌کند. تصاویر به اشتراک گذاشته شده توسط متا نشان می دهد که مولد متن به تصویر جدید آن می تواند به طور دقیق آناتومی انسان را نشان دهد (دیگر دست اسپاگتی ندارد) و حتی می تواند متن دقیق را ارائه دهد (بدون کلمات تصادفی در تصاویر هوش مصنوعی).

چند نمونه از نسل های ارائه شده توسط CM3leon. تصویر: متا — چند نمونه از تصاویر ارائه شده توسط CM3leon. تصویر: متا

CM3leon همچنین تصاویر پیشرفته‌ای را ارائه می‌کند که به کاربران امکان می‌دهد نمایش دقیق‌تری از ایده‌های خود ایجاد کنند: متن به تصویر، تصویر به تصویر، ویرایش تصویر با هدایت ساختار، شی به تصویر، تقسیم‌بندی به تصویر و ارتقاء رزولوشن فوق‌العاده برخی از ویژگی‌هایی هستند که در دسترس نیستند. در هر ژنراتوری غیر از انتشار پایدار با استفاده از کنترل شبکه.

شایعه LLM جدید

به گفته منابعی که به نقل از وب‌سایت‌ها منتشر شده، متا همچنین در حال برنامه‌ریزی برای انتشار نسخه تجاری مدل زبان طبیعی LLaMA خود برای توسعه‌دهندگان خارجی است. فایننشال تایمز. اگر درست باشد، این امر به استارت‌آپ‌ها و شرکت‌ها اجازه می‌دهد تا برنامه‌های کاربردی سفارشی مبتنی بر هوش مصنوعی متا بسازند و غول رسانه‌های اجتماعی را در رقابت مستقیم با ChatGPT (OpenAI-Microsoft)، Bard (Google) و Claude v2 (Anthropic-Google) قرار دهند.

به نظر می‌رسد تمرکز متا در تمام برنامه‌هایش به شدت به سمت هوش مصنوعی معطوف شده است، حتی اگر مدعی شده است که به شدت روی پروژه‌های متاورس خود نیز متمرکز است. در اوایل سال جاری، این شرکت یک واحد هوش مصنوعی مولد اختصاصی را به رهبری مدیر ارشد تولید راه اندازی کرد کریس کاکس. متا نیز در حال کار است ابزارهای هوش مصنوعی که تبلیغات بهتری را برای کاربران هدف ایجاد می کند.

با منبع باز مدل های کلیدی مانند LLaMA LLM به بیرون درز کرد (بزرگترین، پیشرفته ترین، LLM منبع باز موجود در جهان)، Meta قصد دارد نوآوری توسعه دهندگان در سراسر جهان را برای بهبود فناوری تسریع کند. این در تضاد با رویکرد بسته رقبای مانند OpenAI است. با این حال، کسب درآمد از مدل های متا همچنان یک احتمال است.

هجوم فعالیت‌های هوش مصنوعی زمانی رخ می‌دهد که متا با کاهش ارزش سهام و مناقشات پیرامون حریم خصوصی و اطلاعات نادرست ناشی از فعالیت در فیس‌بوک، که بزرگترین پلتفرم این شرکت است، دست و پنجه نرم می‌کند. مدیر عامل متا مارک زاکربرگ معتقد است که این سرمایه گذاری سنگین در هوش مصنوعی مولد است با چشم انداز شرکت برای متاورس مطابقت دارد و می تواند جریان های درآمد جدیدی را باز کند.

متا نیز اخیرا Threads را راه اندازی کرد، یک کلون توییتر که شاهد رشد سریع کاربران است، پیشی گرفتن از آنچه توسط OpenAI به دست آمده است پس از راه اندازی ChatGPT. همچنین ثابت کرده است که در استفاده از عناصر کلیدی فناوری های قبلی، بهبود آنها و ایجاد محصولات موفقی که تقریباً رقبای خود را در زمینی که ایجاد کرده اند، می کشد، ماهر است.

با مدل‌های جدیدی مانند CM3leon که عملکرد امیدوارکننده‌ای از خود نشان می‌دهند، به نظر می‌رسد متا مصمم است به شدت به دنبال هوش مصنوعی برای تغییر شکل آینده‌اش باشد، پس از اینکه سرمایه‌گذاران را تحت تأثیر تلاش‌های متاورز خود قرار نداده است. رقابت برای رهبری هوش مصنوعی مولد به تازگی یک دونده جدید پیدا کرده است.