AI眼镜自在画布！奥运冠军站台多智能体！百度亮出4款产品新外形李彦宏的野心多模态iRAG 秒哒超级运行百度不造

2024-11-14

编辑 | 言征

出品 | 技术栈（微信号：blog51cto）

进入下半年，国际大模型厂商们都在忙什么？

11月12日上午9点35分，百度环球大会如约而至。李彦宏身着白衬衫，信步走入在上海世博核心的主会场，用一个小时的期间为人们展现了大模型进入2024年之后，百度最新取得的一些产品技术停顿。

李彦宏全程一个小时的演讲，回忆了过去24个月环球生成式人工智能改革带来了的大迸发，激动地喊出了放眼业内仿佛还不太敢喊出的一句slogon：“AI运行时代真的来了！”，并同时发布了两个重磅新品：文心iRAG和秒哒。

这里划重点，这两款技术产品，一款是多模态畛域的检索增强，另一款则是多智能体的产品开发运行，这代表了百度作为国际大模型领旗者，押宝运行的两慷慨向，值得各位一探。

1.李彦宏的第一个押宝：过去24个月，大模型最大的变动

大模型时代曾经前行了24个月，模型层面出现了哪些变动？百度开创人李彦宏给出了自己的答案：基本消弭了幻觉。

而在消弭幻觉方面，检索增强作为一种技术手腕成为了行业共识。“然而，在多模态方面，检索增强还做得不够。”

李彦宏现场给出了一个“文生天坛图像”的开源模型的失误例子，真实的天坛是三层的，而开源模型则会煞有其事地生成四层，令人难辨虚实。

基于此，百度死磕多模态方面的幻觉疑问，李彦宏自豪的发布了今天第一个“炸弹”：检索增强的文生图技术iRAG。

大抵的原理也不难了解：就是其将百度搜查的亿级图片资源跟弱小的基础模型才干相结合，可以生成各种超真实的图片，“全体成果远远超越文生图原生系统,去掉了机器味”。

百度首席技术官王海峰在接上去的演讲中更详细一步的提醒了iRAG面前的黑科技：百度多模态可控生图大模型。该模型经过多模态留意力机制、图文交织编码等技术结合分散模型，优化了全体留意力计算的高准确性，让检索增强的文生图环节可以智能剖析、了解、布局和泛化。

李彦宏示意，iRAG技术极大地提高了A生成图片的可用性,具有无幻觉、超真实、无老本、立等可取等商业价值。

2.第二个押宝：一个只靠想法就能赚钱的运行：秒哒以及面前的技术成功

无需代码就能开发运行，曾经不再是什么新颖的大模型话题。但真正做进去的App没有，即使强如OpenAI，也在去年尝试了GPTs之后，让只需对话就能生成AI运行的热度归于寂静。

不过，这次百度做到了。早在上个月，李彦宏就曾在外部的季度策略复盘会议上示意：智能体虽然还是不是行业共识，但它是百度未来的一个赌注。

李彦宏将如今的智能体做一个分类，总共分为了四种：公司类、角色类、工具类、行业类。不同类型的智能体方面，百度近年来都曾经跟业内的生态同伴启动了深化的协作，李彦宏甚至给出了比亚迪、百胜餐饮、小好友自己创作悟空动画片等真实幽默的例子。

重头戏来了，李彦宏会上甩出了另一款大模型“炸弹”运行——无代码工具“秒哒”！

秒哒具有无代码编程、多智能体协作和多工具调用三大特性,李彦宏对其寄托了厚望，称之为“迄今为止人类历史上最复杂的多智能体协作工具”。作为一个不须要写代码就能够成功恣意想法的工具,秒哒让每团体都具有程序员的才干,会谈话就能做出运行。

李彦宏还在会场展现了一个五个智能体协作开发的案例，1号智能体小组长担任筹划呼唤2号智能体筹划和3号智能体被称为小编，4号智能体是程序员，5号是质检员等等。

前不久OpenAI说未来极有或许会出现一团体的公司，而李彦宏发布的这款“多哒”仿佛也印证了未来的公司或许真的不用再吃力心力去招聘诸如产品经理、开发等人员，一个想法或许就足以让你搞定一款运行。

李彦宏总结说,“只需有想法,你就可以心想事成,咱们将迎来一个史无前例的只靠想法就能赚钱的时代。

李彦宏将做智能体类比为PC时代做网站、或是移动时代做自媒体账号，“不同之处是智能体更像人、更智能，更像你的开售、客服和助理。智能体或许会变成AI原生时代，内容信息和服务的新载体。

话说回来，小编想到了一个疑问：这款运行仿佛跟去年AutoGPT的场景很像，终究上流在哪里？

接上去王海峰的演解说开了这个困惑：如今多智能体的技术语境未然出现了变动。去年的多智能体还处于“快思索”的大模型语境，而不同的是，往年下半年，百度也有了自己的“慢思索”模型。

“人类思索有两个系统，系统1反响快，但容易出错，系统2虽慢，但理性准确。”王海峰会场上发布了百度的思索模型面前的成功技术，让模型像人一样启动义务拆解和自主布局的才干，学会运用工具及决策。

详细而言，要训练一个思索模型，须要这几样关键的物品：训练所需的思索环节数据，提醒智能构建、智能探求思索和执行门路。王海峰引见了如今思索模型的最大难题还是数据的无余，百度驳回了分解环节数据的模式。

经过用户模拟器生成指令、工具模拟器模拟配置、畛域常识构建推理，创立了思索模型数据分解的闭环，再结合强化学习等手腕从而成功思索环节的有监视精调。

遗憾的是，秒哒如今还是一个期货，估量明年上半年发布。

3.一个小惊喜网盘与文心的碰撞：自在画布

不过，现货也是有的，李彦宏在工具类智能体引见时，展现了百度全新的运行智能体，即百度文库和百度网盘联结开发的“自在画布”，让用户可以在一块相似“画布”的界面上自在拖拽文档、音视频等富媒体素材，迅速生成多模态内容。自在画布是一个由文心多模态大模型加持的万能白板，可以协助用户成功从找资料，到编辑、生成和分享的所有义务。

李彦宏示意，“这不是期货，而是立刻可用的现货，是真正服务于发明的新质消费力!

4.百度的野心

进入全新的AI反派浪潮，不时努力于科技驱动的“AI先生”李彦宏关于重塑百度有了新的思索和野心。李彦宏曾经做国一个估量，要一年内把大模型API的调用量优化10倍。如今看，仅仅半年，百度的季度就超越了预期！

仅过去半年，百度文心大模型的日均调用量曾经超越15亿,相较一年前初次披露的5000万次,增长约30倍。李彦宏示意“增速超出预期”,说明AI是真需求。他感叹,这条峻峭的增长曲线,代表着过去两年中国大模型运行的迸发。

毫无不懂，百度在国际领有相对的先发长处，但在打造超级运行上，向来没有特意保守，关于Kimi、豆包在C端的高歌猛进，李彦宏此前示意不会跟进。

此次百度环球大会2024，作为技术人出身的李彦宏，再次说明了这一观念，并表白了对未来智能运行迸发的有限等候。“百度所要做的，不是打造一个‘超级运行’，而是要打造数百万个‘超级有用’！”

奥运冠军也来了，巴黎奥运会上百度黑科技的力气也可圈可点

李彦宏在现场发布了基于百度文心大模型的100大产业运行，涵盖了制作、动力、交通、政务、金融、汽车、教育、互联网等泛滥行业。李彦宏示意，“发布这100大产业运行，其实也代表咱们的认知和态度。

这个环球不应该被软件吞噬，而是，用AI运行来发明环球！让咱们一同见证：Application creating the world！

话中有话，百度给自己在大模型时代的定位十分笃定：要成为这个时代的基础设备，而非超级用户收割机。

5.One More Thing：百度首款AI眼镜预发布

这场发布会，除了李彦宏的演讲，小编还等候此前透显露来的百度AI眼镜。近两年这款AI发明的新物种十分热，无妨来看看百度AI眼镜怎么从新定义人与环球的交互模式！

果真在主会场的最后，小度科技CEO李莹带来了全新AI配件产品小度AI眼镜，号称“行走的百科全书”。

据引见，作为环球首款搭载中文大模型的原生AI眼镜，成功了佩戴温馨性与配置片面性的融合。李莹示意，AI眼镜作为人类的第一视角设备，其捕捉视觉、声响、位置等信息的才干，将给人们带来史无前例的感官加长，也必定会成为更高效、方便的人机交互入口，带给人们全新的视角和更粗疏的感触，从新定义人与环球的互动模式。

重量轻达45g，30分钟快充，56h待机，全双工对话，八面聪听，搭载DuerOS操作系统，摄像头明晰度方面，视频了解方面以及软硬一体的整合设计才干也在业内处于上游的水平。

详细的参数大家可以翻看官方的预报，这里不再赘述了。小度科技CEO李莹示意，小度AI眼镜将于明年上半年正式上市，至于多少钱，也没有地下，此前曾传言2300左右，不过一切未定，敬请等候吧。

想了解更多AIGC的内容，请访问：

AI.x社区

百度李彦宏 AI

<<一幅艺术画作让大模型降生重动物资料！MIT基于图形的人工智能模型凶猛了！贝多芬的第九交响曲居然跟资料结构有相似性活久见

开发人员能否应该经常使用人工智能代码审查工具>>

AI眼镜 自在画布！奥运冠军站台 多智能体 ！百度亮出4款产品新外形 李彦宏的野心 多模态iRAG 秒哒 超级运行 百度不造