Tech Rivals Race för att lansera multimodala AI Wearables - Rapport

Tech Rivals Race för att lansera multimodala AI Wearables – Rapport

Stora teknikföretag som Microsoft, Google, OpenAI och andra tävlar om att integrera multimodal AI för att bygga smarta glasögon och andra bärbara enheter med kameror som ser framifrån.

Multimodal AI är en kraftfull form av tekniken som kombinerar många datakällor för att gå längre än enkla genererade textsvar. Den kan förstå text, bilder, ljud, video, tal och till och med handgester.

As rapporterade av The Information satsar stora teknikföretag på att multimodala system kan passa bra smarta glasögon med inbyggda kameror framför samt annan bärbar teknologi.

Läs också: Metas Ray-Ban-glasögon har nu AI-kapacitet för ljud och syn

Ny kamp om AI-dominans

Visionen håller på att formas för att bli ett nyckelområde för utveckling och AI-rivalitet för Big Tech 2024. Många av företagen har pratat om den här visionen eller arbetat med den i flera år, heter det i rapporten.

Nu är de övertygade om att de kan sälja smarta glasögon som drivs av AI. Till exempel, OpenAI diskuterade att "bädda in" sin mjukvara för objektigenkänning, GPT-4 med Vision, i Snapchats bärbara glasögon.

Affären med Snap, moderbolaget till Snapchat, kan resultera i nya funktioner för de smarta glasögonen, skrev The Information. Företaget har kämpat för att förvandla enheten till en massmarknadsprodukt.

Tech Rivals Race för att lansera multimodala AI Wearables - Rapport

Tech Rivals Race för att lansera multimodala AI Wearables - Rapport

I februari tipsade Snap om hur man planerar att integrera generativ AI i sina foto- och videoinspelningsglasögon, Spectacles. VD Evan Spiegel sa att AI skulle kunna användas för att "förbättra upplösningen och klarheten i en Snap efter att användaren fångar den." enligt till branschmedia.

Det kan till och med användas för "mer extrema transformationer", som att redigera bilder eller skapa snaps baserat på textinmatning, tillade han.

OpenAI och Microsoft arbetar redan med AI-start Human, som nyligen lanserade en enhet som heter Hej Pin som använder ett laserprojektionssystem för att visa text och bilder på en användares hand.

Gadgeten är designad för att bäras på kläder och kan avlyssnas för att prata med en virtuell assistent som drivs av OpenAI:s GPT-4-teknik och molnberäkningskraft från Microsoft.

Metas AI-drivna Ray-Ban-glasögon orsakar uppståndelse på sociala medier

Metas AI-drivna Ray-Ban-glasögon orsakar uppståndelse på sociala medier

Meta leder branschens push

Den tekniska industrins push kommer när Meta förra veckan avslöjade den senaste versionen av sina Ray-Ban smarta glasögon, som använder AI för att "se, höra och identifiera saker via en inbyggd kamera och mikrofon."

När den är aktiverad kan Ray-Ban svara på ett röstkommando som "Är det här teet koffeinfritt?" genom att ta en bild, analysera den och sedan ge ett svar, sa Metas vd Mark Zuckerberg.

Men ett test av CNET visar att Ray-Bans hallucinerar – glasögonen såg saker som inte riktigt var närvarande och fortsatte med att ge en beskrivning av föremålen. Det är en gemensam problem med generativ AI.

När det gäller Google började företaget 2013 sälja en prototyp av sina tidigaste smarta glasögon, helt enkelt känd som Glass, för $1,500 XNUMX. Glasögonen fattade inte, och kritiserades som ett hot mot privatlivet.

Så småningom Google slutade producerar glas. Företaget lägger nu till multimodal artificiell intelligens till ChatGPT-konkurrenten tvillingarna och förväntas också införliva tekniken i sina wearables.

Integreringen av multimodal AI i bärbara enheter som smarta glasögon med augmented reality syftar vanligtvis till att förbättra deras funktionalitet och erbjuda användarna en mer uppslukande upplevelse.

Den kan också användas för många praktiska tillämpningar, inklusive översättning av språk, fjärrsupport för ingenjörer och datadelning i realtid för soldater i strid.

År 2022 värderades den globala wearables-marknaden till cirka 61 miljarder dollar, enligt uppskattningar. Sektorn förväntas växa med 15 % varje år fram till 2030 – snabbare än smartphonemarknaden.

Tidsstämpel:

Mer från MetaNews