Tech-Rivalen rennen um die Einführung multimodaler KI-Wearables – Bericht

Tech-Rivalen rennen um die Einführung multimodaler KI-Wearables – Bericht

Große Technologieunternehmen wie Microsoft, Google, OpenAI und andere bemühen sich darum, multimodale KI zu integrieren, um intelligente Brillen und andere tragbare Geräte mit nach vorne gerichteten Kameras zu bauen.

Multimodale KI ist eine leistungsstarke Form der Technologie, die viele Datenquellen kombiniert, um über einfache generierte Textantworten hinauszugehen. Es kann Text, Bilder, Audio, Video, Sprache und sogar Handgesten verstehen.

As berichtet Laut The Information setzen große Technologieunternehmen darauf, dass multimodale Systeme gut geeignet sein können intelligente Brille mit eingebauten Kameras auf der Vorderseite sowie anderer tragbarer Technologie.

Lies auch: Die Ray-Ban-Brillen von Meta verfügen jetzt über KI-Funktionen für Ton und Bild

Neuer Kampf um die KI-Dominanz

Die Vision entwickelt sich zu einem Schlüsselbereich der Entwicklung und KI-Rivalität für Big Tech im Jahr 2024. Viele der Unternehmen hätten über diese Vision gesprochen oder mehrere Jahre daran gearbeitet, heißt es in dem Bericht.

Jetzt sind sie zuversichtlich, dass sie intelligente Brillen mit KI verkaufen können. Zum Beispiel, OpenAI diskutierte über die „Einbettung“ seiner Objekterkennungssoftware GPT-4 mit Vision in die Spectacles-Wearables von Snapchat.

Der Deal mit Snap, der Muttergesellschaft von Snapchat, könnte zu neuen Funktionen für die Datenbrillen führen, schrieb The Information. Das Unternehmen hatte Mühe, das Gerät zu einem Massenmarktprodukt zu machen.

Tech-Rivalen rennen um die Einführung multimodaler KI-Wearables – Bericht

Tech-Rivalen rennen um die Einführung multimodaler KI-Wearables – Bericht

Im Februar deutete Snap an, wie das Unternehmen generative KI in seine Foto- und Videoaufzeichnungsbrille Spectacles integrieren will. CEO Evan Spiegel sagte, KI könne genutzt werden, um „die Auflösung und Klarheit eines Snaps zu verbessern, nachdem der Benutzer ihn aufgenommen hat“. gemäß zu Branchenmedien.

Es könne sogar für „extremere Transformationen“ verwendet werden, etwa das Bearbeiten von Bildern oder das Erstellen von Snaps basierend auf Texteingaben, fügte er hinzu.

OpenAI und Microsoft arbeiten bereits mit KI-Startups zusammen Menschlich, die kürzlich ein Gerät namens auf den Markt gebracht hat Ai-Pin das ein Laserprojektionssystem verwendet, um Text und Bilder auf der Hand eines Benutzers anzuzeigen.

Das Gerät ist zum Tragen an der Kleidung konzipiert und kann angetippt werden, um mit einem virtuellen Assistenten zu sprechen, der auf der GPT-4-Technologie von OpenAI und Cloud-Computing-Leistung basiert Microsoft.

Metas KI-gestützte Ray-Ban-Brille sorgt in den sozialen Medien für Aufsehen

Metas KI-gestützte Ray-Ban-Brille sorgt in den sozialen Medien für Aufsehen

Meta führt den Branchenschub an

Der Vorstoß der Technologiebranche kommt, als Meta letzte Woche die neueste Version seiner Ray-Ban-Smart-Brille vorstellte, die KI nutzt, um „Dinge über eine eingebaute Kamera und ein Mikrofon zu sehen, zu hören und zu identifizieren“.

Bei Aktivierung kann die Ray-Ban auf einen Sprachbefehl wie „Ist dieser Tee koffeinfrei?“ reagieren. indem man ein Foto macht, es analysiert und dann eine Antwort gibt, sagte Mark Zuckerberg, CEO von Meta.

Aber ein Test von CNET zeigt, dass die Ray-Bans halluzinieren – die Brille sah Dinge, die nicht wirklich vorhanden waren, und gab dann eine Beschreibung der Gegenstände ab. es ist ein verbreitet Problem mit generativer KI.

Was Google betrifft, so begann das Unternehmen 2013 mit dem Verkauf eines Prototyps seiner ersten Datenbrille, einfach Glass genannt, für 1,500 US-Dollar. Die Brille fand keinen Anklang und wurde als Gefährdung der Privatsphäre kritisiert.

Schließlich Google gestoppt Herstellung von Glas. Das Unternehmen erweitert nun den ChatGPT-Rivalen um multimodale künstliche Intelligenz Gemini Es wird erwartet, dass das Unternehmen die Technologie auch in seine Wearables integriert.

Die Integration multimodaler KI in Wearables wie Augmented-Reality-Datenbrillen zielt typischerweise darauf ab, deren Funktionalität zu verbessern und Benutzern ein immersiveres Erlebnis zu bieten.

Es kann auch für viele praktische Anwendungen verwendet werden, einschließlich der Übersetzung von Sprachen, der Fernunterstützung für Ingenieure und der Echtzeit-Datenfreigabe für Soldaten im Kampf.

Im Jahr 2022 wurde der weltweite Wearables-Markt demnach auf etwa 61 Milliarden US-Dollar geschätzt Schätzungen. Es wird erwartet, dass der Sektor bis 15 jedes Jahr um 2030 % wächst – schneller als die Smartphone-Markt.

Zeitstempel:

Mehr von MetaNews