科技竞争对手竞相推出多模式人工智能可穿戴设备 - 报告

技术竞争对手竞相推出多模式人工智能可穿戴设备——报告

微软、谷歌、OpenAI 等主要科技公司正在竞相整合多模式人工智能,以构建智能眼镜和其他带有前置摄像头的可穿戴设备。

多模式人工智能是一种强大的技术形式,它结合了许多数据源,超越了简单生成的文本回复。它可以理解文本、图像、音频、视频、语音,甚至手势。

As 报道 据 The Information 报道,大型科技公司押注多式联运系统非常适合 智能眼镜 前置内置摄像头以及其他可穿戴技术。

也可以参考: Meta 的雷朋眼镜现已具备声音和视觉 AI 功能

争夺人工智能主导地位的新战斗

这一愿景将成为 2024 年大型科技公司发展和人工智能竞争的关键领域。报告称,许多公司已经谈论过这一愿景或为此付出了数年的努力。

现在,他们有信心能够销售由人工智能驱动的智能眼镜。例如, OpenAI 讨论了将其对象识别软件 GPT-4 with Vision“嵌入”到 Snapchat 的 Spectacles 可穿戴设备中。

The Information 报道称,与 Snapchat 母公司 Snap 的交易可能会给智能眼镜带来新功能。该公司一直在努力将该设备转变为大众市场产品。

科技竞争对手竞相推出多模式人工智能可穿戴设备 - 报告

科技竞争对手竞相推出多模式人工智能可穿戴设备 - 报告

今年 XNUMX 月,Snap 暗示计划如何将生成式人工智能集成到其照片和视频录制眼镜 Spectacles 中。首席执行官埃文·斯皮格尔 (Evan Spiegel) 表示,人工智能可用于“在用户捕捉快照后提高快照的分辨率和清晰度”。 根据 给行业媒体。

他补充说,它甚至可以用于“更极端的转换”,例如编辑图像或根据文本输入创建快照。

OpenAI 和微软已经与人工智能初创公司合作 人道, 最近推出了一款名为 艾品 它使用激光投影系统在用户的手上显示文本和图像。

该小工具设计为佩戴在衣服上,可以通过点击与由 OpenAI 的 GPT-4 技术和云计算能力提供支持的虚拟助手进行对话。 微软.

Meta 的人工智能雷朋眼镜在社交媒体上引起轰动

Meta 的人工智能雷朋眼镜在社交媒体上引起轰动

Meta 引领行业推动

随着 Meta 上周发布了最新版本的雷朋智能眼镜,该眼镜利用人工智能“通过内置摄像头和麦克风看到、听到和识别事物”,推动了科技行业的发展。

激活后,雷朋可以响应语音命令,例如“这茶不含咖啡因吗?” Meta 首席执行官马克·扎克伯格 (Mark Zuckerberg) 表示,通过拍摄照片、分析照片,然后提供响应。

但通过测试 CNET 表明雷朋眼镜产生了幻觉——眼镜看到了并不真正存在的东西,并接着对这些物品进行了描述。它是一个 常见 生成式人工智能的问题。

至于谷歌,2013 年,该公司开始销售其最早的智能眼镜原型,简称为 Glass,售价为 1,500 美元。这款眼镜并没有流行起来,并被批评为对隐私的威胁。

最终,谷歌 停止 生产玻璃。该公司现在正在为 ChatGPT 竞争对手添加多模式人工智能 双子座 预计还将将该技术融入其可穿戴设备中。

将多模态人工智能集成到增强现实智能眼镜等可穿戴设备中通常旨在增强其功能并为用户提供更身临其境的体验。

它还可以用于许多实际应用,包括翻译语言、工程师的远程支持以及战斗中士兵的实时数据共享。

据预测,2022 年全球可穿戴设备市场价值约为 61 亿美元 估计。预计到 15 年,该行业每年将以 2030% 的速度增长——比 智能手机市场。

时间戳记:

更多来自 元新闻