Tech Rivals соревнуются за выпуск мультимодальных носимых устройств с искусственным интеллектом - отчет

Tech Rivals соревнуются за выпуск мультимодальных носимых устройств с искусственным интеллектом – отчет

Крупнейшие технологические компании, такие как Microsoft, Google, OpenAI и другие, стремятся интегрировать мультимодальный искусственный интеллект для создания умных очков и других носимых устройств с фронтальными камерами.

Мультимодальный ИИ — это мощная форма технологии, которая объединяет множество источников данных, выходя за рамки простых генерируемых текстовых ответов. Он может понимать текст, изображения, аудио, видео, речь и даже жесты рук.

As переправу По данным The Information, крупные технологические компании делают ставку на то, что мультимодальные системы могут хорошо подойти для умные очки со встроенными камерами спереди, а также другими портативными технологиями.

Читайте также: Очки Ray-Ban от Meta теперь имеют возможности искусственного интеллекта для звука и зрения

Новая битва за доминирование ИИ

В 2024 году это видение станет ключевым направлением развития и соперничества в области искусственного интеллекта для крупных технологических компаний. Многие компании говорили об этом видении или работали над ним в течение нескольких лет, говорится в отчете.

Теперь они уверены, что смогут продавать умные очки на базе искусственного интеллекта. Например, OpenAI обсуждала «встраивание» своего программного обеспечения для распознавания объектов GPT-4 с Vision в носимые устройства Snapchat Spectacles.

Сделка с Snap, материнской компанией Snapchat, может привести к появлению новых функций для умных очков, пишет The Information. Фирма изо всех сил пыталась превратить устройство в продукт массового рынка.

Tech Rivals соревнуются за выпуск мультимодальных носимых устройств с искусственным интеллектом - отчет

Tech Rivals соревнуются за выпуск мультимодальных носимых устройств с искусственным интеллектом - отчет

В феврале Snap намекнула, что планирует интегрировать генеративный искусственный интеллект в свои очки для фото- и видеозаписи Spectacles. Генеральный директор Эван Шпигель заявил, что искусственный интеллект можно использовать для «улучшения разрешения и четкости снимка после того, как пользователь его сделает». согласно в отраслевые СМИ.

Его можно даже использовать для «более экстремальных преобразований», таких как редактирование изображений или создание снимков на основе ввода текста, добавил он.

OpenAI и Microsoft уже работают над AI-стартапом гуманный, которая недавно выпустила устройство под названием Ай Пин который использует систему лазерной проекции для отображения текста и изображений на руке пользователя.

Гаджет предназначен для ношения на одежде, и его можно использовать, чтобы поговорить с виртуальным помощником, работающим на базе технологии OpenAI GPT-4 и мощностей облачных вычислений от Microsoft.

Очки Ray-Ban от Meta с искусственным интеллектом вызвали ажиотаж в социальных сетях

Очки Ray-Ban от Meta с искусственным интеллектом вызвали ажиотаж в социальных сетях

Мета лидирует в отрасли

Прорыв в технологической отрасли произошел после того, как компания Meta на прошлой неделе представила последнюю версию своих умных очков Ray-Ban, которые используют искусственный интеллект, чтобы «видеть, слышать и идентифицировать вещи с помощью встроенной камеры и микрофона».

При активации Ray-Ban может реагировать на голосовую команду, например: «Этот чай без кофеина?» сделав снимок, проанализировав его, а затем предоставив ответ, сказал генеральный директор Meta Марк Цукерберг.

Но тест, проведенный CNET показывает, что у очков Ray-Ban галлюцинации — очки видели вещи, которых на самом деле не было, и продолжали описывать эти предметы. Это общий проблема с генеративным ИИ.

Что касается Google, то в 2013 году компания начала продавать прототип своих первых умных очков, известных просто как Glass, за 1,500 долларов. Очки не прижились и подверглись критике как угроза частной жизни.

В конце концов, Гугл остановившийся производство стекла. Теперь компания добавляет мультимодальный искусственный интеллект к конкуренту ChatGPT. Gemini и, как ожидается, также внедрит эту технологию в свои носимые устройства.

Интеграция мультимодального искусственного интеллекта в носимые устройства, такие как умные очки дополненной реальности, обычно направлена ​​на повышение их функциональности и предоставление пользователям более захватывающего опыта.

Его также можно использовать для множества практических приложений, включая перевод языков, удаленную поддержку инженеров и обмен данными в реальном времени для солдат в бою.

По данным компании, в 2022 году мировой рынок носимых устройств оценивался примерно в 61 миллиард долларов. Оценки. Ожидается, что этот сектор будет расти на 15% каждый год до 2030 года — быстрее, чем рынок смартфонов.

Отметка времени:

Больше от МетаНьюс