Tech Rivals змагаються за запуск мультимодальних носіїв зі штучним інтелектом – звіт

Tech Rivals змагаються за запуск мультимодальних носіїв зі штучним інтелектом – звіт

Такі великі технологічні компанії, як Microsoft, Google, OpenAI та інші, намагаються інтегрувати мультимодальний штучний інтелект для створення розумних окулярів та інших переносних пристроїв із фронтальними камерами.

Мультимодальний штучний інтелект — це потужна форма технології, яка поєднує багато джерел даних, щоб вийти за рамки простих згенерованих текстових відповідей. Він може розуміти текст, зображення, аудіо, відео, мову та навіть жести рук.

As повідомляє The Information, великі технологічні компанії роблять ставку на те, що мультимодальні системи можуть добре підійти розумні окуляри із вбудованими камерами на передній панелі, а також іншими технологіями, які можна носити.

Читайте також: Окуляри Ray-Ban від Meta тепер мають можливості AI для звуку та зображення

Нова битва за панування ШІ

У 2024 році це бачення стане ключовим напрямком розвитку та суперництва з ШІ для Big Tech. Багато компаній говорили про це бачення або працювали над ним протягом кількох років, йдеться у звіті.

Тепер вони впевнені, що можуть продавати розумні окуляри на основі ШІ. Наприклад, OpenAI обговорював «вбудовування» свого програмного забезпечення для розпізнавання об’єктів, GPT-4 з Vision, у носії Snapchat Spectacles.

Угода зі Snap, материнською компанією Snapchat, може призвести до появи нових функцій для розумних окулярів, пише The Information. Фірма намагалася перетворити пристрій на продукт для масового ринку.

Tech Rivals змагаються за запуск мультимодальних носіїв зі штучним інтелектом – звіт

Tech Rivals змагаються за запуск мультимодальних носіїв зі штучним інтелектом – звіт

У лютому компанія Snap натякнула на те, як вона планує інтегрувати генеративний штучний інтелект у свої окуляри Spectacles для запису фото та відео. Генеральний директор Еван Шпігель сказав, що штучний інтелект можна використовувати для «покращення роздільної здатності та чіткості Snap після того, як користувач зробить його». відповідно галузевим ЗМІ.

Його можна навіть використовувати для «більш екстремальних трансформацій», як-от редагування зображень або створення знімків на основі введення тексту, додав він.

OpenAI і Microsoft вже працюють із запуском AI гуманний, яка нещодавно випустила пристрій під назвою Привіт Пін який використовує лазерну проекційну систему для відображення тексту та зображень на руці користувача.

Гаджет призначений для носіння на одязі, і його можна торкнутися, щоб спілкуватися з віртуальним помічником, який працює на основі технології OpenAI GPT-4 і потужності хмарних обчислень від Microsoft.

Окуляри Ray-Ban від Meta викликають ажіотаж у соціальних мережах

Окуляри Ray-Ban від Meta викликають ажіотаж у соціальних мережах

Meta лідирує в індустрії

Поштовх технологічної індустрії стався після того, як Meta минулого тижня показала останню версію своїх розумних окулярів Ray-Ban, які використовують штучний інтелект, щоб «бачити, чути та ідентифікувати речі за допомогою вбудованої камери та мікрофона».

Після активації Ray-Ban може реагувати на голосову команду на кшталт: «Цей чай не містить кофеїну?» зробивши знімок, проаналізувавши його, а потім надавши відповідь, – сказав генеральний директор Meta Марк Цукерберг.

Але тест по CNET показує, що Ray-Bans галюцинують — окуляри бачать речі, яких насправді не було, і дають опис предметів. Це загальний проблема з генеративним ШІ.

Що стосується Google, то в 2013 році компанія почала продавати прототип своїх перших розумних окулярів, відомих просто як Glass, за 1,500 доларів. Окуляри не прижилися, і їх розкритикували як загрозу приватному житті.

Зрештою, Google зупинений виробництво скла. Зараз компанія додає мультимодальний штучний інтелект до конкурента ChatGPT Близнюки а також очікується, що впровадить цю технологію у свої носимі пристрої.

Інтеграція мультимодального штучного інтелекту в такі пристрої, як розумні окуляри доповненої реальності, як правило, спрямована на покращення їхньої функціональності та надання користувачам більш захоплюючого досвіду.

Його також можна використовувати для багатьох практичних застосувань, зокрема для перекладу мов, віддаленої підтримки для інженерів і обміну даними в реальному часі для солдатів у бою.

За даними, у 2022 році світовий ринок носимих пристроїв оцінювався приблизно в 61 мільярд доларів Оцінки. Очікується, що сектор зростатиме на 15% щороку до 2030 року — швидше, ніж ринок смартфонів.

Часова мітка:

Більше від МетаНовини