Tech Rivals fait la course pour lancer des appareils portables multimodaux à IA – Rapport

Tech Rivals fait la course pour lancer des appareils portables multimodaux à IA – Rapport

De grandes entreprises technologiques comme Microsoft, Google, OpenAI et d’autres s’efforcent d’intégrer l’IA multimodale pour créer des lunettes intelligentes et d’autres appareils portables dotés de caméras frontales.

L’IA multimodale est une forme puissante de technologie qui combine de nombreuses sources de données pour aller au-delà des simples réponses textuelles générées. Il peut comprendre du texte, des images, de l’audio, de la vidéo, de la parole et même des gestes de la main.

As rapporté Selon The Information, les grandes entreprises technologiques parient que les systèmes multimodaux peuvent être un bon choix pour lunettes intelligentes avec des caméras intégrées à l'avant ainsi que d'autres technologies portables.

A lire également: Les lunettes Ray-Ban de Meta disposent désormais de capacités d'IA pour le son et la vue

Nouvelle bataille pour la domination de l’IA

Cette vision s’annonce comme un domaine clé de développement et de rivalité en matière d’IA pour les grandes technologies en 2024. De nombreuses entreprises ont parlé de cette vision ou y ont travaillé pendant plusieurs années, indique le rapport.

Désormais, ils sont convaincus de pouvoir vendre des lunettes intelligentes alimentées par l’IA. Par exemple, OpenAI a discuté de « l'intégration » de son logiciel de reconnaissance d'objets, GPT-4 avec Vision, dans les appareils portables Spectacles de Snapchat.

L'accord avec Snap, la société mère de Snapchat, pourrait entraîner de nouvelles fonctionnalités pour les lunettes intelligentes, écrit The Information. L’entreprise a eu du mal à transformer l’appareil en un produit grand public.

Tech Rivals fait la course pour lancer des appareils portables multimodaux à IA – Rapport

Tech Rivals fait la course pour lancer des appareils portables multimodaux à IA – Rapport

En février, Snap a fait allusion à la manière dont il envisage d'intégrer l'IA générative dans ses lunettes d'enregistrement photo et vidéo, Spectacles. Le PDG Evan Spiegel a déclaré que l'IA pourrait être utilisée pour "améliorer la résolution et la clarté d'un Snap après que l'utilisateur l'a capturé". selon aux médias de l'industrie.

Il pourrait même être utilisé pour des « transformations plus extrêmes », comme l’édition d’images ou la création de Snaps basés sur la saisie de texte, a-t-il ajouté.

OpenAI et Microsoft travaillent déjà avec une startup d'IA Humain, qui a récemment lancé un appareil appelé le Aï Pin qui utilise un système de projection laser pour afficher du texte et des images sur la main d'un utilisateur.

Le gadget est conçu pour être porté sur des vêtements et peut être utilisé pour parler à un assistant virtuel alimenté par la technologie GPT-4 d'OpenAI et la puissance de cloud computing de Microsoft.

Les lunettes Ray-Ban alimentées par l'IA de Meta font sensation sur les réseaux sociaux

Les lunettes Ray-Ban alimentées par l'IA de Meta font sensation sur les réseaux sociaux

Meta mène la poussée de l'industrie

L’essor de l’industrie technologique intervient alors que Meta a dévoilé la semaine dernière la dernière version de ses lunettes intelligentes Ray-Ban, qui utilisent l’IA pour « voir, entendre et identifier des objets via une caméra et un microphone intégrés ».

Lorsqu'elles sont activées, les Ray-Ban peuvent répondre à une commande vocale telle que « Ce thé est-il sans caféine ? » en prenant une photo, en l'analysant, puis en fournissant une réponse, a déclaré Mark Zuckerberg, PDG de Meta.

Mais un test par CNET montre que les Ray-Ban hallucinent : les lunettes ont vu des choses qui n'étaient pas vraiment présentes et ont ensuite donné une description des objets. C'est un commun problème avec l’IA générative.

Quant à Google, en 2013, la société a commencé à vendre un prototype de ses premières lunettes intelligentes, simplement connues sous le nom de Glass, pour 1,500 XNUMX $. Les lunettes n'ont pas fait leur chemin et ont été critiquées comme une menace pour la vie privée.

Finalement, Google arrêté produisant du verre. La société ajoute désormais l'intelligence artificielle multimodale à son rival ChatGPT GEMINI et devrait également intégrer la technologie dans ses appareils portables.

L'intégration de l'IA multimodale dans les wearables comme les lunettes intelligentes de réalité augmentée vise généralement à améliorer leurs fonctionnalités et à offrir aux utilisateurs une expérience plus immersive.

Il peut également être utilisé pour de nombreuses applications pratiques, notamment la traduction de langues, l’assistance à distance pour les ingénieurs et le partage de données en temps réel pour les soldats au combat.

En 2022, le marché mondial des wearables était évalué à environ 61 milliards de dollars, selon estimations. Le secteur devrait croître de 15 % chaque année jusqu’en 2030, soit plus vite que la marché des smartphones.

Horodatage:

Plus de MétaActualités