AI 已经太久没有一个 「哇哦」 时刻了。
自 ChatGPT 首次惊艳世人以来已经过了快两年时间,人们似乎已经开始习惯了 AI 作为一个什么都 「略懂」 的万金油选手出现在身边。可这样的时间久了,难免会让人觉得稀松平常。今年 5 月,AI 头部品牌发布了旗下最新版本的大模型,然而收获的不是 「哇哦」,而是 「即便能像博士一样推理,也比不出 9.11 和 9.9 谁大谁小」 这样的吐槽。
的确,目前的 AI,能力在提高,但是效果有限;场景没突破,功能不再惊艳。这也是 AI 大模型应用遇到的普遍困境。这尴尬的氛围正在外溢:比如,手机上的 AI 功能,作为人们接触 AI 门槛最低、最频繁、依赖性最高的使用场景,也因为 AI 行业整体的延宕而缺乏 「爆点」。
客观的说,手机 AI 好不好用?当然好用。不然也不会有众多手机 AI 产品出色的活跃度和用户体量。但是如果深究到底有多好用?相信资深 AI 用户们只要深思熟虑一番,或多或少都会有些 「摸到了 AI 的边界」 的感觉。
但这种感觉对于一个被寄予 「颠覆未来」 厚望的品类来说却是大忌。行业也亟待扭转这种温吞的状态。问题是,如何扭转?
10 月 10 日,vivo 开发者大会 (VDC)召开,vivo 发布了全新 AI 战略:蓝心智能。同步发布的新产品还包括全面升级的自研蓝心大模型矩阵、OriginOS 5、蓝河操作系统 2 等。与此同时,vivo 还披露了其在安全、人文、生态合作等方面的一系列最新成果。从这里,我们看到 vivo 对于 AI 的现状和未来确有独到的理解和尝试。同时,在审视 vivo 诸多能力落地的过程中,也碰撞出一些对于 AI 发展的新鲜观察。
vivo 副总裁、OS 产品副总裁、vivo AI 全球研究院院长周围现场演讲
重新思考 AI 的位置
在今年初的 MWC 上有一种普遍的观点,那就是 AI 或许应该暂时被放在 「副驾驶」 的位置上。实际上,这种论调体现了当时人们对于 AI 既新奇又疏离的感受。智能硬件行业也是如此,即便 2024 年被称作 「AI 手机元年」,但在当时相对保守的氛围下,手机端的 AI 服务也大多以 AI 小助手、AI 问答 APP,甚至只是 AI 修图等形式呈现。
然而,这种仅仅把 AI 定义为 「助手」 的思维显然禁锢了 AI 在手机端发挥作用的潜力。如今,以 vivo 为代表的手机厂商开始重新审视 AI 的定位,尝试让 AI 发挥更大的主动性。
在 vivo 发布的 「蓝心智能」 全新 AI 战略下,vivo 决定充分释放 AI 的能动性,将大模型技术与手机操作系统深度融合,利用 AI 赋能 OS。
具体来说,vivo 的实践将在重构人与设备的交互体验,重构人与数字世界的服务体验,重构人与物理世界的沟通体验这 3 个方向协同推进。
在人与设备的交互体验方面,vivo 向 AI 释放了手机端所有层面的交互能力。从简单的打字、语音,向包括圈、点、滑、拨,甚至声音的情感等不同的方面延伸。比如,在使用 「小 V 圈搜」 进行搜索时,用户可以长按导航条激活小 V,还可以直接将图片、文件、文字拖拽给小 V。甚至可以不输入命令,直接随手用指尖圈选内容发给小 V。这就避免了很多 「问不到点子上」 的尴尬时刻。毕竟把自己想问的问题翻译给 AI 也很费神。在 vivo 的设计下,无论怎样交互,小 V 都会将想要了解的内容反馈给用户。
小 V 圈搜
在人与数字世界的服务体验方面,vivo 让 AI 与人的关系更近了。首先是将 「垂直 AI」 的理念下放到手机端,除了助手小 V 以外,还通过 「蓝心智能体广场」 塑造了小 V 作业助手、小 V 运动教练等专家 AI。这就从一定程度上解决了 AI「泛泛而谈」 的问题。此外,vivo 让 AI 介入了人使用手机的痕迹,分析用户用手机的习惯,把用户喜欢的文章和视频等用更有逻辑的方式呈现出来。
在人与物理世界的沟通体验方面,vivo 努力让 AI 更加显示出积极主动的一面。此前,vivo 的蓝心大模型已经升级了语言大模型和端侧大模型的能力,并带来 vivo 自研的语音大模型、图像大模型以及多模态大模型,拥有了听和看的能力。在此基础上,vivo 让 AI 能够读屏,能够通过摄像头 「看懂」 外部世界。比如,在 vivo 的 「看见」APP 蓝心升级版中,视障人士就可以把手机镜头对准周围环境和物品,让手机成为他们的眼睛。此时,APP 会自动播报它 「看见」 的内容和文字信息,让他们能够独自安全地走到更远的地方。因为有大模型的加持,用户还可以与 AI 进行多轮语音对话,得到更多细节信息。
实际上,vivo 提出了相当现实的愿景,却起到了根本逻辑上的改变。不用太多科幻的许诺,通过将前沿的 AI 大模型研究充分释放到手机端,vivo 就能将 AI 从机械的你问我答的 「副驾驶」 身份中解放出来,适当地帮人类把握方向盘,甚至充当教练的角色。当人们体验了 AI 解禁后的洪荒之力,就像发现了老朋友的另一面,很难不 「哇哦」 一下。
正如 vivo 副总裁、OS 产品副总裁周围所说,「手机不是一个神秘的东西,它就是我们生活、工作所依靠的东西。vivo 就是想把它的基础体验做好,把基于产品的那些功能增强」。的确,手机本身已经成为人身体的延伸,手机中的 AI 没有道理不为人类承担得更多。
理念背后,AI 能力落地的硬实力
可以看到,vivo 的重构战略是将现有手机端 AI 能力整体向前推进了一大步。如何能够支撑这样的体系性进化?在 VDC 上,vivo 公布了蓝心大模型矩阵和 OriginOS 5,向世人集中秀了一波肌肉。
一方面,此次蓝心大模型矩阵的集中展示是最令人激动的环节:
vivo 几乎在大模型的所有前沿应用领域都有所突破,一口气拿出了升级版语言大模型,以及发布 3B 端侧大模型、蓝心语音大模型、蓝心多模态大模型等全线产品,可谓火力全开。
其中,升级后的蓝心语言大模型在上下文能力、推理能力、准确度以及时延上,均有明显提升。新发布的 vivo 自研蓝心语音大模型可以准确理解自然语义,实现超低时延对话,还可以感知人的情绪、模拟人的音色,像朋友一般与用户聊天,甚至担当同声传译的角色。这次新发布的还有蓝心图像大模型和蓝心多模态大模型。蓝心图像大模型强化了中国特色与东方美学的融合生成能力,是国内最懂中文语境的图像模型之一。而蓝心多模态大模型则提升了识别能力,能够更深层次理解用户的屏幕内容,还拥有更自然的视频流实时对话能力。
而此次的重头戏其实还应该放在新发布的全新端侧大模型蓝心 3B 身上。这款端侧大模型有 30 亿参数,但是能力却可以越级比肩拥有 70 亿甚至 90 亿参数的同类产品。对比蓝心自己的 7B 大模型,端侧大模型 3B 的覆盖场景更多。相比蓝心 7B 极致性能提升 300%,平衡模式下功耗优化达 46%,极致出词速度可以达到 80 字/s,系统功耗仅 450mA ,内存仅占用 1.4GB,打破了 「模型小、能力强、功耗低」 的不可能三角定律,实现了以小搏大的效果。
据 vivo 介绍,蓝心大模型 3B 已经获得了泰尔实验室端侧大模型综合能力的 5 星认证以及 AIIA 安全防范能力 5 星认证。更令人激动的是,3B 还只是一个开始。明年,vivo 还将发布端侧视觉大模型和多模态大模型。
考虑到目前 vivo 蓝心大模型已经在上海人工智能实验室大模型测评榜单、微软的 MathVista 测试榜单,以及 ChartQA 测试榜单上都取得了 3B 参数级排名第一的成绩。在以文本理解为代表的 OCRBench 榜单上,蓝心多模态大模型 13B 取得了所有模型参数的最高分,超过了 GPT4o、qwen 等一众超大规模多模态大模型,我们有理由期待未来 vivo 将手机的智能化程度推向一个新的层次。
另一方面,承载蓝心大模型矩阵诸多能力的,恰是全新升级的 OriginOS 5:
在塞下了前面如此之多的 AI 大模型能力之后,vivo 确实需要一个能够完全释放 AI 能力的操作系统了。因此,OriginOS 5 既是 AI 的容器,也是 AI 的出入口。沉浸式嵌入 OriginOS 5 中的 「蓝心小 V」 拥有了十八般武艺。比如,交互更灵便的小 V 搜索,推荐内容更精确的小 V 建议,能够梳理用户喜好按照逻辑呈现的小 V 记忆。而此前提到的 「专家」AI 选手们,则通过小 V 智能体的形式在小 V 智能体广场里呈现。
同时,OriginOS 5 也在流畅度、续航、通信方面针对 AI 能力的释放作出了相应的优化。实际上,AI 的硬实力更需要操作系统的软实力来体现。操作系统优化的成熟与否,直接影响用户对 AI 的认可度。vivo 推出 OriginOS 5 本身就是对 AI 与人类交互能力的一次长足探索。也正是对 vivo 立足 「AI 重构系统体验」 的一次检验。
至此,vivo 已经将 AI 推到了手机端服务 C 位的位置上。经过战略转变和能力落地,AI 的效能得以全部释放,开始作为智力和精力的延伸,为人类赋能。
冷思考:多些务实,少些科幻
纵观 vivo 的全新 AI 战略,这其中的平实、务实令人感慨。
诚然,我们已经听过了太多关于 AI 的远大愿景和宏大叙事了。实际上,当我们将人们对 AI 的注意力引向科幻场景 (比如终极人工智能、AI 替代人类等等)时,其实是在消解大众探索 AI 帮助人类提高的努力。
在当前 AI 与人类都还在 「教学相长」 的阶段,我们更需要有人亦步亦趋地做好 AI 的普及。而这,何尝不是一种科技平权。
又或许,vivo 内部 「本分」 的理念,让其更坚持用户导向,也让产品的功能能够回归本源。
对此,vivo 副总裁、OS 产品副总裁周围介绍到 「我们的本分文化叫平常心文化」,他认为 「vivo 发展 AI 的思路和 vivo 的企业文化是完全一致的」。
周围认为,vivo 是 「回到本质去思考,本质的东西就是 『因』 层面的东西,我们把这些东西做好,自然 『果』 是水到渠成的」。言及至此,不得不提及一个小细节:此前我们评测手机 AI 应用的过程中发现,在二十余款 AI 应用中,能够在折叠屏手机展开横放的情况下自动变为横向显示的 AI 应用屈指可数。而蓝心小 V 不仅自动适配横向展开,而且还根据用户双手操作的特点进行了布局调整,可谓用心至深。
或许,凡此种种从用户需求出发的小细节叠加在一起,恰能体现 vivo「本分」 的初心。大概也是 vivo 能够从用户体验出发让 AI 重构系统体验的原动力。
无论如何,AI 诞生的根本原因就是帮助人类,推动进步。而 AI 的下一个阶段也必然是渗透社会的方方面面,带来更大的变革。显然,此次 VDC 让我们看到,对于手机领域,vivo 已经作出了根本性的决断,率先下出了先手棋。
下载专栏报道 APP,第一时间获取深度独到的商业科技资讯,连接更多创新人群与线下活动
#AI 手机终于迎来了哇哦时刻