微软、谷歌、OpenAI 等主要科技公司正在竞相整合多模式人工智能,以构建智能眼镜和其他带有前置摄像头的可穿戴设备。
多模式人工智能是一种强大的技术形式,它结合了许多数据源,超越了简单生成的文本回复。它可以理解文本、图像、音频、视频、语音,甚至手势。
As 报道 据 The Information 报道,大型科技公司押注多式联运系统非常适合 智能眼镜 前置内置摄像头以及其他可穿戴技术。
也可以参考: Meta 的雷朋眼镜现已具备声音和视觉 AI 功能
争夺人工智能主导地位的新战斗
这一愿景将成为 2024 年大型科技公司发展和人工智能竞争的关键领域。报告称,许多公司已经谈论过这一愿景或为此付出了数年的努力。
现在,他们有信心能够销售由人工智能驱动的智能眼镜。例如, OpenAI 讨论了将其对象识别软件 GPT-4 with Vision“嵌入”到 Snapchat 的 Spectacles 可穿戴设备中。
The Information 报道称,与 Snapchat 母公司 Snap 的交易可能会给智能眼镜带来新功能。该公司一直在努力将该设备转变为大众市场产品。
今年 XNUMX 月,Snap 暗示计划如何将生成式人工智能集成到其照片和视频录制眼镜 Spectacles 中。首席执行官埃文·斯皮格尔 (Evan Spiegel) 表示,人工智能可用于“在用户捕捉快照后提高快照的分辨率和清晰度”。 根据 给行业媒体。
他补充说,它甚至可以用于“更极端的转换”,例如编辑图像或根据文本输入创建快照。
在您的计算机上运行 chatGPT 时 #AR眼镜,您将在日常活动中获得指导
而不是 #AI 基于通用模型,它需要理解我!
所以我已经编程了我的 @眼镜 问我为什么要做事。这样我就可以收集意见来培训我自己的个人法学硕士 pic.twitter.com/5wPdgr6jXp
— 桑德·维恩霍夫 (@sndrv) 2023 年 4 月 17 日
OpenAI 和微软已经与人工智能初创公司合作 人道, 最近推出了一款名为 艾品 它使用激光投影系统在用户的手上显示文本和图像。
该小工具设计为佩戴在衣服上,可以通过点击与由 OpenAI 的 GPT-4 技术和云计算能力提供支持的虚拟助手进行对话。 微软.
Meta 引领行业推动
随着 Meta 上周发布了最新版本的雷朋智能眼镜,该眼镜利用人工智能“通过内置摄像头和麦克风看到、听到和识别事物”,推动了科技行业的发展。
激活后,雷朋可以响应语音命令,例如“这茶不含咖啡因吗?” Meta 首席执行官马克·扎克伯格 (Mark Zuckerberg) 表示,通过拍摄照片、分析照片,然后提供响应。
但通过测试 CNET 表明雷朋眼镜产生了幻觉——眼镜看到了并不真正存在的东西,并接着对这些物品进行了描述。它是一个 常见 生成式人工智能的问题。
至于谷歌,2013 年,该公司开始销售其最早的智能眼镜原型,简称为 Glass,售价为 1,500 美元。这款眼镜并没有流行起来,并被批评为对隐私的威胁。
最终,谷歌 停止 生产玻璃。该公司现在正在为 ChatGPT 竞争对手添加多模式人工智能 双子座 预计还将将该技术融入其可穿戴设备中。
将多模态人工智能集成到增强现实智能眼镜等可穿戴设备中通常旨在增强其功能并为用户提供更身临其境的体验。
它还可以用于许多实际应用,包括翻译语言、工程师的远程支持以及战斗中士兵的实时数据共享。
据预测,2022 年全球可穿戴设备市场价值约为 61 亿美元 估计。预计到 15 年,该行业每年将以 2030% 的速度增长——比 智能手机市场。
- :具有
- :是
- :不是
- $UP
- 12
- 15%
- 17
- 2013
- 2022
- 2024
- 500
- a
- 关于
- 根据
- 添加
- 添加
- 后
- AI
- AI供电
- 目标
- 已经
- 还
- 分析
- 和
- 应用领域
- 保健
- 国家 / 地区
- 人造的
- 人工智能
- AS
- 问
- 助理
- At
- 音频
- 增强
- 增强现实技术
- 基于
- 战斗
- BE
- 成为
- 投注
- 超越
- 大
- 大科技
- 亿
- 建立
- 内建的
- by
- 被称为
- 相机
- 相机
- CAN
- 能力
- 捕获
- 摔角
- 原因
- CEO
- ChatGPT
- 明晰
- 服装
- 云端技术
- 云计算
- CNET
- 收集
- 打击
- 结合
- 购买的订单均
- 公司
- 公司
- 计算
- 计算能力
- 信心
- 可以
- 创造
- data
- 数据共享
- 天
- 处理
- 描述
- 设计
- 研发支持
- 设备
- 设备
- DID
- 讨论
- 屏 显:
- 做
- ,我们将参加
- 最早
- 工程师
- 提高
- 埃文
- 甚至
- 所有的
- 例子
- 预期
- 体验
- 极端
- 特征
- 二月
- 公司
- 适合
- 针对
- 申请
- 止
- 前
- 功能
- 其他咨询
- 产生
- 生成的
- 生成式人工智能
- 得到
- 给
- 玻璃
- 全球
- Go
- 非常好
- 谷歌
- 增长
- 指导
- 手
- 有
- he
- 听
- 高
- 创新中心
- HTTPS
- i
- 鉴定
- 图片
- 身临其境
- in
- 包含
- 合并
- 行业中的应用:
- 信息
- 输入
- 代替
- 整合
- 积分
- 房源搜索
- 成
- IT
- 项目
- 它的
- 键
- 已知
- 语言
- 激光器是如何工作的
- 名:
- 最新
- 发射
- 推出
- 信息
- 喜欢
- ll
- LLM
- 占地
- 许多
- 标记
- 马克·扎克伯格
- 市场
- 最大宽度
- me
- 媒体
- 元
- 麦克风
- 微软
- 模型
- 更多
- my
- 需要
- 全新
- 新功能
- 现在
- 对象
- of
- 提供
- on
- OpenAI
- or
- 其他名称
- 其它
- 己
- 母公司
- 个人
- 图片
- 计划
- 柏拉图
- 柏拉图数据智能
- 柏拉图数据
- 功率
- 供电
- 强大
- 实用
- 当下
- 隐私
- 市场问题
- 生产
- 产品
- 程序
- 投影
- 原型
- 优
- 推
- 种族
- 赛车
- 雷朋
- 阅读
- 实时的
- 实时数据
- 现实
- 真
- 最近
- 承认
- 了解
- 远程
- 报告
- 分辨率
- 回应
- 响应
- 导致
- 揭密
- 对手
- 对抗
- 对手
- 运行
- 说
- 锯
- 扇形
- 出售
- 卖房
- 几个
- 成型
- 共享
- 作品
- 简易
- 只是
- 智能
- 智能眼镜
- 捕捉
- snapchat
- So
- 社会
- 社会化媒体
- 软件
- 听起来
- 来源
- 眼镜
- 言语
- 开始
- 启动
- 搅拌
- SUPPORT
- 系统
- 产品
- 服用
- 谈论
- 螺纹
- 茶
- 科技
- 高科技公司
- 科技产业
- 专业技术
- test
- 文本
- 比
- 这
- 信息
- 其
- 然后
- 他们
- 事
- Free Introduction
- 威胁
- 至
- 培训
- 转换
- true
- 转
- 一般
- 理解
- 直到
- 使用
- 用过的
- 用户
- 用户
- 使用
- 价值
- Ve
- 版本
- 通过
- 视频
- 在线会议
- 虚拟助理
- 愿景
- 音色
- 是
- 耐磨
- 可穿戴技术
- 身打扮
- 周
- 井
- 去
- 为
- 这
- 为什么
- 维基百科上的数据
- 工作
- 加工
- 写
- 年
- 年
- 完全
- 您一站式解决方案
- 和风网
- 扎克伯格