vivo不装了!销量王者冷艳发布PhoneGPT 短信 笔记全都创新做!不愧是国产手机界的模型暗藏大佬! 电话

编辑 | 伊风

出品 | 技术栈(微信号:blog51cto)

AI手机还能怎样卷?

当天vivo在开发者大会上发布的答案,相对能让人眼前一亮!

经过融合用户记忆、端侧模型、和被动口头才干,vivo搞出了PhoneGPT,宣称要做AI助理界的智能驾驶!

就是说PhoneGPT,不再满足于便捷的义务口头,而是可以自己决策,启动义务的拆解,并经过屏幕识别等技术,最终做出举措、成功义务。

这么说或许还是有点形象,还是来看vivo的蓝心小V订餐视频更直观!

在用户给小V收回用餐需求之后,小V智能地调起相关APP,搜查到了餐厅的电话,还自己拨出电话和店员成功了预订!整个口头环节,包含和真人的对话都十分丝滑。

除了手机智能,蓝厂家的硬科技也丝毫不输,自研的蓝心大模型性能在线。在端侧方面,提出“30亿参数量级是端侧黄金尺寸”的结论,发布了新的蓝心3B,在排行榜击败了Gemma-2和Phi-3-mini等小模型中的佼佼者。

让人不得不慨叹一句,原来vivo还是模型界的暗藏大佬。

一个温常识,vivo在国产手机销量王座上曾经稳坐三年之久,而经常使用vivo AI的用户也在全球打破了5亿。

想了解AI手机的未来,vivo和蓝心智能的AI策略,相对值得一看。

一、PhoneGPT:AI不只要“口头”更要“懂你”

vivo蓝心智能的外围看点,就是他们把大模型与操作系统成功了深度融合。

vivo副总裁周围说,这样的成成成果,是大模型可以了解用户团体的情形和偏好,进而让系统被动提供共性化的服务。

详细来说,AI重构后的手机系统,带来了三集体验的反派,区分是交互体验、服务体验和链接体验。

1.交互体验

不少人埋怨过苹果Siri的僵化和机械,在AI 2.0之前,咱们的手机助手只能做一些便捷的口头上班。

而有了大模型,AI助手可以真正在文字、语音、图像甚至行为层面,全方面多角度的做用意了解,成功所谓的“口头且懂你”。

在交互体验方面,周围举的例子就是语音交互!作为咱们日常最多经常使用的、也是最直观的交互方式,vivo能做出什么花招呢?

小V的方言对话,让用户不再须要切换“川普”、“粤普”,而小V也会用方言来回答,AI和用户的距离,这么一下就拉近了。

2.服务体验

在服务的优化上,我觉得vivo真是做到了那句被说烂了的话,“一切的配置都值得用AI重做一遍”。

vivo针对电话、短信等基础配置都做了创新,例如,电话的内容可以转文字也可以启动翻译,笔记配置可以间接用AI润饰,拍照间接扫描识别等等。

小编觉得,这些设计好在并不是伪需求,而是真实的用AI帮用户处置了一些疑问。

既然是开发者大会,vivo慷慨发表将放开平台化才干,使得第三方运行也能接入这些AI黑科技。

3.链接体验

周围所说的链接体验,重要讲AI时代中,用户与服务的相关变动。

AI确实给服务注入了生机,如今人和服务可以双向奔赴了!在面向开发者的方面,vivo做了致力,让APP提供的服务更好地做散发,找到须要Ta的用户。

尤其是针对轻量化、原子化的服务,vivo构建了系统级的感知和用意识别,成功系统被动散发服务。

在面向用户的方面,vivo提出了一个幽默的概念是“人与设施的独特记忆”。

听起来AI更像是一个不时陪伴咱们的好友了,随着手机经常使用,AI会不时裁减对咱们的常识图谱,相当于手机系统会“越用越好用”。

这个能成功啥详细配置呢?

用这个现场的例子,咱们一下就悟了。

例如用户唤起小V说,“帮我找找,去年和小贝在全球影城的照片,发给他并祝他生日快乐”。这个例子就很考验AI,须要智能助手记住用户的社会相关以及对方的样子,还能在相册找到合乎人物、期间、地点条件的照片,并能跨运行找到备注为“小贝”的人发送信息,最后还可以再提供专属服务如介绍生日餐厅。

不过这些物品都交给AI又觉得心里毛毛的,觉得就像有人把我的相册都翻了一遍。

不过,vivo也很注重安保疑问。甚至抗下了渺小的技术应战,不只把通话总结、文档概要、本地常识图谱这种你不想被他人看到的隐衷搬进了端侧,还贴心肠把查看配置也成功端侧成功了。这下可以稍微舒一口吻,安心用AI了。

而后,既然有了多个智能体,最好就是让他们配合起来,成功1+1大于2的成果。假设再配上用意了解,让这个担任调度的中心也由AI来成功局部上班,在懂人的基础上,可以启动自主决策。

这一综合,就成功了咱们文章扫尾,能提供智能驾驶体验的phoneGPT!

视频中的餐厅订餐,就基于蓝心大模型的多模态配置,在用户用意识能被动成功义务,经过屏幕识别,AI自己去操作控件,口头每步的操作。

依据周围的泄漏,phoneGPT的每一步口头准确度到达了94%,每一步口头只要要极短的2s期间。为了安保,这个配置也会向端侧开展,并且口头成果上还会再退化。

好家伙,AI真·公家助理的时代来了!

二、全新蓝心大模型矩阵发布,蓝心3B超Phi-3-mini

从GPT-4o发布,模型的多模态才干就成为了一个重点。

在新的模型矩阵中,蓝心的语音、图像和多模态大模型是第一次性启动亮相的选手。

既然是手机厂商,端侧模型必需是开发的重中之重。

在此前开发的1B、7B 、13B端侧模型的基础上,vivo不时地去做测试,在综合思索了模型成果、性能、内存、功耗后,试图寻觅最优打算,提出了30亿参数量级是端侧黄金尺寸的结论。

在钻研指点下,vivo的30亿蓝心端侧大模型——蓝心3B正式推出。相比于去年所推出的7B大模型,蓝心3B做到了300%的性能优化,还降落了46%的功耗和63%的内存占用。蓝心3B的性能强的可怕,做到了每秒80字的极致出词速度,并且成功450mA的极致低能耗,且只占用1.4GB的内存。

周围说,蓝心3B打破了端侧模型“才干强-消耗低-模型小”的无法能三角,并且在多份榜单上做到行业上游水平。

vivo谋求做“最懂中国人的大模型”,详细到多模态大模型方面,他们做了生图配置的水墨格调以及汉字相关创作的性能优化。

看这张榜单,能看出vivo在模型才干上是有过硬积攒的。就语音那张榜单来看,语音不时是豆包过硬的外围技术,能在语音交互上超越豆包,说明天常的对话义务基本不在话下了。

三、写在最后:最好的AI技术,要在运行里跑起来

vivo秀完AI硬实力的“肌肉”后,开局了对自研系统OriginOS 5 的引见。

就像他们自己所说的那样:不止要有好的技术,还要能落地到产品的层面上。

于是,咱们就看到了vivo在对界面和用户操作深度思索之上的作品——原子岛。

在用意识别的基础上,用户只要要将文本等外容复制或拖动到原子岛上,就会智能介绍你想要关上的APP,真正做到束缚双手,让科技快人一步。

在最后看到原子岛三个字的时刻,或许很容易以为这是对苹果灵动岛的模拟之作。但是坦率的说,前者带给我的预料之外的惊喜,能看到vivo对AI如何扭转交互外形的思索之深。

vivo的开发者大会,让人从新意识了这位国产手机的销量王者,关于AI的策略设想,咱们不只要术,还有道。

您可能还会对下面的文章感兴趣: