متا به شدت تلاش های هوش مصنوعی خود را در تلاش برای رسیدن به رقبایی مانند گوگل، مایکروسافت و OpenAI افزایش می دهد. این غول شبکه های اجتماعی مدل جدیدی از متن به تصویر را معرفی کرده است که نام دارد CM3leon که ادعا می کند عملکردی پیشرفته برای تولید تصاویر از پیام های متنی دارد. اما هنوز برای آزمایش یا استفاده تجاری در دسترس نیست.
CM3leon یک پیشرفت برای قابلیتهای هوش مصنوعی متا است. این مدل نهتنها میتواند تصاویری با کیفیت بالا از توضیحات متن تولید کند، بلکه میتواند شرحهای منسجمی برای تصاویر موجود بنویسد. این زمینه را برای مدلهای پیشرفتهتر درک تصویر در آینده فراهم میکند.
متا از تیم قدرتمند علم داده و زیرساختهای محاسباتی خود برای پیشبرد مدلهای پیشرفته مانند CM3leon استفاده میکند. در حالی که هوش مصنوعی مبتنی بر انتشار مانند MidJourney سرفصل خبرها را به خود اختصاص داده است، متا روی معماری ترانسفورماتورهای اتورگرسیو (همان فناوری استفاده شده توسط ChatGPT) شرط بندی کرده است. شرکت ادعای CM3leon 5 برابر کمتر از سایر روش های قابل مقایسه به محاسبات آموزشی نیاز دارد.
در مقایسههای رو در رو، به نظر میرسد که CM3leon با اشیاء و محدودیتهای پیچیده در پیامهای متنی بهتر از مدلهایی مانند DALL-E 2 OpenAI و حتی Midjourney برخورد میکند. تصاویر به اشتراک گذاشته شده توسط متا نشان می دهد که مولد متن به تصویر جدید آن می تواند به طور دقیق آناتومی انسان را نشان دهد (دیگر دست اسپاگتی ندارد) و حتی می تواند متن دقیق را ارائه دهد (بدون کلمات تصادفی در تصاویر هوش مصنوعی).
CM3leon همچنین تصاویر پیشرفتهای را ارائه میکند که به کاربران امکان میدهد نمایش دقیقتری از ایدههای خود ایجاد کنند: متن به تصویر، تصویر به تصویر، ویرایش تصویر با هدایت ساختار، شی به تصویر، تقسیمبندی به تصویر و ارتقاء رزولوشن فوقالعاده برخی از ویژگیهایی هستند که در دسترس نیستند. در هر ژنراتوری غیر از انتشار پایدار با استفاده از کنترل شبکه.
شایعه LLM جدید
به گفته منابعی که به نقل از وبسایتها منتشر شده، متا همچنین در حال برنامهریزی برای انتشار نسخه تجاری مدل زبان طبیعی LLaMA خود برای توسعهدهندگان خارجی است. فایننشال تایمز. اگر درست باشد، این امر به استارتآپها و شرکتها اجازه میدهد تا برنامههای کاربردی سفارشی مبتنی بر هوش مصنوعی متا بسازند و غول رسانههای اجتماعی را در رقابت مستقیم با ChatGPT (OpenAI-Microsoft)، Bard (Google) و Claude v2 (Anthropic-Google) قرار دهند.
به نظر میرسد تمرکز متا در تمام برنامههایش به شدت به سمت هوش مصنوعی معطوف شده است، حتی اگر مدعی شده است که به شدت روی پروژههای متاورس خود نیز متمرکز است. در اوایل سال جاری، این شرکت یک واحد هوش مصنوعی مولد اختصاصی را به رهبری مدیر ارشد تولید راه اندازی کرد کریس کاکس. متا نیز در حال کار است ابزارهای هوش مصنوعی که تبلیغات بهتری را برای کاربران هدف ایجاد می کند.
با منبع باز مدل های کلیدی مانند LLaMA LLM به بیرون درز کرد (بزرگترین، پیشرفته ترین، LLM منبع باز موجود در جهان)، Meta قصد دارد نوآوری توسعه دهندگان در سراسر جهان را برای بهبود فناوری تسریع کند. این در تضاد با رویکرد بسته رقبای مانند OpenAI است. با این حال، کسب درآمد از مدل های متا همچنان یک احتمال است.
هجوم فعالیتهای هوش مصنوعی زمانی رخ میدهد که متا با کاهش ارزش سهام و مناقشات پیرامون حریم خصوصی و اطلاعات نادرست ناشی از فعالیت در فیسبوک، که بزرگترین پلتفرم این شرکت است، دست و پنجه نرم میکند. مدیر عامل متا مارک زاکربرگ معتقد است که این سرمایه گذاری سنگین در هوش مصنوعی مولد است با چشم انداز شرکت برای متاورس مطابقت دارد و می تواند جریان های درآمد جدیدی را باز کند.
متا نیز اخیرا Threads را راه اندازی کرد، یک کلون توییتر که شاهد رشد سریع کاربران است، پیشی گرفتن از آنچه توسط OpenAI به دست آمده است پس از راه اندازی ChatGPT. همچنین ثابت کرده است که در استفاده از عناصر کلیدی فناوری های قبلی، بهبود آنها و ایجاد محصولات موفقی که تقریباً رقبای خود را در زمینی که ایجاد کرده اند، می کشد، ماهر است.
با مدلهای جدیدی مانند CM3leon که عملکرد امیدوارکنندهای از خود نشان میدهند، به نظر میرسد متا مصمم است به شدت به دنبال هوش مصنوعی برای تغییر شکل آیندهاش باشد، پس از اینکه سرمایهگذاران را تحت تأثیر تلاشهای متاورز خود قرار نداده است. رقابت برای رهبری هوش مصنوعی مولد به تازگی یک دونده جدید پیدا کرده است.
از اخبار ارزهای دیجیتال مطلع باشید، بهروزرسانیهای روزانه را در صندوق ورودی خود دریافت کنید.