vivo不装了！销量王者冷艳发布PhoneGPT 短信笔记全都创新做！不愧是国产手机界的模型暗藏大佬！电话

2024-11-15

编辑 | 伊风

出品 | 技术栈（微信号：blog51cto）

AI手机还能怎样卷？

当天vivo在开发者大会上发布的答案，相对能让人眼前一亮！

经过融合用户记忆、端侧模型、和被动口头才干，vivo搞出了PhoneGPT，宣称要做AI助理界的智能驾驶！

就是说PhoneGPT，不再满足于便捷的义务口头，而是可以自己决策，启动义务的拆解，并经过屏幕识别等技术，最终做出举措、成功义务。

这么说或许还是有点形象，还是来看vivo的蓝心小V订餐视频更直观！

在用户给小V收回用餐需求之后，小V智能地调起相关APP，搜查到了餐厅的电话，还自己拨出电话和店员成功了预订！整个口头环节，包含和真人的对话都十分丝滑。

除了手机智能，蓝厂家的硬科技也丝毫不输，自研的蓝心大模型性能在线。在端侧方面，提出“30亿参数量级是端侧黄金尺寸”的结论，发布了新的蓝心3B，在排行榜击败了Gemma-2和Phi-3-mini等小模型中的佼佼者。

让人不得不慨叹一句，原来vivo还是模型界的暗藏大佬。

一个温常识，vivo在国产手机销量王座上曾经稳坐三年之久，而经常使用vivo AI的用户也在全球打破了5亿。

想了解AI手机的未来，vivo和蓝心智能的AI策略，相对值得一看。

一、PhoneGPT：AI不只要“口头”更要“懂你”

vivo蓝心智能的外围看点，就是他们把大模型与操作系统成功了深度融合。

vivo副总裁周围说，这样的成成成果，是大模型可以了解用户团体的情形和偏好，进而让系统被动提供共性化的服务。

详细来说，AI重构后的手机系统，带来了三集体验的反派，区分是交互体验、服务体验和链接体验。

1.交互体验

不少人埋怨过苹果Siri的僵化和机械，在AI 2.0之前，咱们的手机助手只能做一些便捷的口头上班。

而有了大模型，AI助手可以真正在文字、语音、图像甚至行为层面，全方面多角度的做用意了解，成功所谓的“口头且懂你”。

在交互体验方面，周围举的例子就是语音交互！作为咱们日常最多经常使用的、也是最直观的交互方式，vivo能做出什么花招呢？

小V的方言对话，让用户不再须要切换“川普”、“粤普”，而小V也会用方言来回答，AI和用户的距离，这么一下就拉近了。

2.服务体验

在服务的优化上，我觉得vivo真是做到了那句被说烂了的话，“一切的配置都值得用AI重做一遍”。

vivo针对电话、短信等基础配置都做了创新，例如，电话的内容可以转文字也可以启动翻译，笔记配置可以间接用AI润饰，拍照间接扫描识别等等。

小编觉得，这些设计好在并不是伪需求，而是真实的用AI帮用户处置了一些疑问。

既然是开发者大会，vivo慷慨发表将放开平台化才干，使得第三方运行也能接入这些AI黑科技。

3.链接体验

周围所说的链接体验，重要讲AI时代中，用户与服务的相关变动。

AI确实给服务注入了生机，如今人和服务可以双向奔赴了！在面向开发者的方面，vivo做了致力，让APP提供的服务更好地做散发，找到须要Ta的用户。

尤其是针对轻量化、原子化的服务，vivo构建了系统级的感知和用意识别，成功系统被动散发服务。

在面向用户的方面，vivo提出了一个幽默的概念是“人与设施的独特记忆”。

听起来AI更像是一个不时陪伴咱们的好友了，随着手机经常使用，AI会不时裁减对咱们的常识图谱，相当于手机系统会“越用越好用”。

这个能成功啥详细配置呢？

用这个现场的例子，咱们一下就悟了。

例如用户唤起小V说，“帮我找找，去年和小贝在全球影城的照片，发给他并祝他生日快乐”。这个例子就很考验AI,须要智能助手记住用户的社会相关以及对方的样子，还能在相册找到合乎人物、期间、地点条件的照片，并能跨运行找到备注为“小贝”的人发送信息，最后还可以再提供专属服务如介绍生日餐厅。

不过这些物品都交给AI又觉得心里毛毛的，觉得就像有人把我的相册都翻了一遍。

不过，vivo也很注重安保疑问。甚至抗下了渺小的技术应战，不只把通话总结、文档概要、本地常识图谱这种你不想被他人看到的隐衷搬进了端侧，还贴心肠把查看配置也成功端侧成功了。这下可以稍微舒一口吻，安心用AI了。

而后，既然有了多个智能体，最好就是让他们配合起来，成功1+1大于2的成果。假设再配上用意了解，让这个担任调度的中心也由AI来成功局部上班，在懂人的基础上，可以启动自主决策。

这一综合，就成功了咱们文章扫尾，能提供智能驾驶体验的phoneGPT！

视频中的餐厅订餐，就基于蓝心大模型的多模态配置，在用户用意识能被动成功义务，经过屏幕识别，AI自己去操作控件，口头每步的操作。

依据周围的泄漏，phoneGPT的每一步口头准确度到达了94%，每一步口头只要要极短的2s期间。为了安保，这个配置也会向端侧开展，并且口头成果上还会再退化。

好家伙，AI真·公家助理的时代来了！

二、全新蓝心大模型矩阵发布，蓝心3B超Phi-3-mini

从GPT-4o发布，模型的多模态才干就成为了一个重点。

在新的模型矩阵中，蓝心的语音、图像和多模态大模型是第一次性启动亮相的选手。

既然是手机厂商，端侧模型必需是开发的重中之重。

在此前开发的1B、7B 、13B端侧模型的基础上，vivo不时地去做测试，在综合思索了模型成果、性能、内存、功耗后，试图寻觅最优打算，提出了30亿参数量级是端侧黄金尺寸的结论。

在钻研指点下，vivo的30亿蓝心端侧大模型——蓝心3B正式推出。相比于去年所推出的7B大模型，蓝心3B做到了300%的性能优化，还降落了46%的功耗和63%的内存占用。蓝心3B的性能强的可怕，做到了每秒80字的极致出词速度，并且成功450mA的极致低能耗，且只占用1.4GB的内存。

周围说，蓝心3B打破了端侧模型“才干强-消耗低-模型小”的无法能三角，并且在多份榜单上做到行业上游水平。

vivo谋求做“最懂中国人的大模型”，详细到多模态大模型方面，他们做了生图配置的水墨格调以及汉字相关创作的性能优化。

看这张榜单，能看出vivo在模型才干上是有过硬积攒的。就语音那张榜单来看，语音不时是豆包过硬的外围技术，能在语音交互上超越豆包，说明天常的对话义务基本不在话下了。

三、写在最后：最好的AI技术，要在运行里跑起来

vivo秀完AI硬实力的“肌肉”后，开局了对自研系统OriginOS 5 的引见。

就像他们自己所说的那样：不止要有好的技术，还要能落地到产品的层面上。

于是，咱们就看到了vivo在对界面和用户操作深度思索之上的作品——原子岛。

在用意识别的基础上，用户只要要将文本等外容复制或拖动到原子岛上，就会智能介绍你想要关上的APP，真正做到束缚双手，让科技快人一步。

在最后看到原子岛三个字的时刻，或许很容易以为这是对苹果灵动岛的模拟之作。但是坦率的说，前者带给我的预料之外的惊喜，能看到vivo对AI如何扭转交互外形的思索之深。

vivo的开发者大会，让人从新意识了这位国产手机的销量王者，关于AI的策略设想，咱们不只要术，还有道。

vivo PhoneGPT 国产手机

<<DevOps 咱们一同聊聊克制瓶颈的四个步骤

移动处置打算与制作业的未来>>

vivo不装了！销量王者冷艳发布PhoneGPT 短信 笔记全都创新做！不愧是国产手机界的模型暗藏大佬！ 电话