平均1秒生成1篇高分高考作文 飞桨文心大模型是怎样做到的
全国高考正在启动中,百度AI技术也迎来一场“高考”。6月7日,百度数字人度晓晓在高考语文考试完结后,化身为“数字人考生”,应战高考作文写作,引发全网热议。AI写作触及人造言语解决、数据开掘、常识图谱等多项人工智能技术,百度经常使用飞桨文心大模型允许度晓晓又好又快地成功了高考作文的写作。据报道,度晓晓介入作答了全国新高考Ⅰ卷题为《本手、妙手、俗手》议论文,40秒就依据标题创作了40多篇文章,平均1秒生成1篇,随机抽取其中一篇,其分数已赶超约75%高考考生。
平均1秒1篇,效果超75%考生 文心大模型写作又快又好
将AI运行于文字创作,在技术圈里早已不算新颖事。随着大数据、深度学习等技术的开展,AI在文本生成才干上有了大幅度优化。从财经、体育类资讯快讯,再到诗歌、小说等文学创作,AI写作笼罩的畛域越来越广,创作方式和内容也变得愈加丰盛多彩。
但相比于评论、摘要、快报等外容方式,用AI生成高考作文的难度显然更高。高考作文的写作在“审题”、“逻辑”和“创意”等三个方面对AI提出了更大的应战。在审题层面,高考作文题材、方式泛滥,再加上纷简约杂的内容主题,每一种变幻无穷的组合都是对AI的了解才干的极限考验。逻辑层面,高考作文要求800字以上,如何保证长文各个片段之间的逻辑性和连接性对AI是另一大应战。最后,在创意层面,可读性是高考作文最关键的评分规范之一,AI写作不只有切题连接,还要擅长旁征博引、巧用修辞,甚至新陈代谢,防止文章空泛有趣。
面对这些应战,度晓晓在飞桨文心大模型的协助指点下,又快又好地成功了写作。曾负责北京高考语文阅卷组组长的申怡为度晓晓的作文打出了48分的效果(满分60分)。她示意,依据往年状况,取得48分及以上作文效果的考生,仅占不到25%,也就是说,度晓晓的作文分数已赶超约75%高考考生。曾加入过《最弱小脑》的学霸网红潘周聃也对度晓晓的作文水平表白了“参观”。
这面前得益于文心大模型最新发布的融合义务关系常识的千亿大模型ERNIE 3.0 Zeus,该模型在学习海量数据和常识的基础上,进一步学习百余种不同方式的义务常识,增强了模型的效果,在各类NLP义务上体现出了更强的零样本和小样本学习才干。深刻地讲,文心大模型就像个孤陋寡闻的“尖子生”、“学霸”,它的了解才干和创作才干比传统模型更强。不只具有“倚马可待”的极速消费才干,还具有“下笔如有神”的品质保证。
在文心大模型的允许下,度晓晓成功的高考作文比以往有了显著的品质优化。首先,生成的作文能够紧扣主题、立意明白,度晓晓很好地理解了给定的作文标题,围绕主题启动文字的组织,佐证文章观念,输入关于主题踊跃正向的见地;而后在800字的长文本中,度晓晓能够保证生成的内容结构完整、言语流利,并在扫尾引入和开头扣题,上下文连接流利。同时,由于文心大模型具有更强的常识储藏,度晓晓生成的作文更擅长旁征博引,并失当经常使用排比、比喻等修辞手法,大大优化了文章的可读性。
不过,让申怡感到异常的是,度晓晓在作文里犯了个小失误——经常使用了网络热词YYDS。而之所以会产生这样的“丢分点”,是由于度晓晓学习了一些抢手网络数据。从生成文章的前后文看,度晓晓是体会了YYDS的“精髓”,自身用法贴切,但不太合乎高考作文写作规范,也正面反映了AI写作还可以继续学习、提高。
文心大模型助力智能创作,推进AIGC时代来到
过去一年,百度AI技术落地减速,其中尤以近来新兴的AIGC有目共睹。AIGC是继UGC、PGC之后一种新型的内容消费方式,指运用人工智能技术智能消费内容,数字人、TTV(Text to Video)等都是其标杆性运行。百度钻研院预测,2022年AIGC技术将借助大模型的跨模态综合技术才干,可以激起创意,优化内容多样性,降落制形老本,成功大规模运行。
本次度晓晓写高考作文,就是基于飞桨文心大模型成功的AIGC创作。文心大模型具有“常识增强”的外围特点,能从大规模常识和海量数据中启动融合学习,学习效率更高、效果更好,具有通用性好、泛化性强的特点。
除了智能写作,在文心大模型的允许下,AI曾经具有了很强的了解和生成才干,能够成功创意作品的智能生成,包含AI作画、AI写歌、AI剪辑等。目前,智能作画、智能对话、智能创作、故事生成等大模型的创意运行曾经上线文心大模型创意与探求社区——旸谷社区,搜查「文心大模型」即可进入官方启动体验。未来,基于大模型的AIGC将会放开赋能到更多的内容消费畛域。
预训练大模型的兴起,使得人工智能的通用性进一步增强。大模型具有效果好、泛化性强、研发流程规范化水平初等特点,正在成为人工智能技术及运行的新基座。百度自2019年开局深耕预训练模型研发,先后发布常识增强文心系列模型。在刚刚完结的WAVE SUMMIT 2022深度学习开发者峰会上,文心大模型迎来一系列更新:发布10个新的大模型,包含融合学习义务常识的常识增强千亿大模型、多义务一致学习的视觉大模型、跨模态大模型、动物计算大模型、行业大模型等;提出撑持大模型产业落地的3个关键门路:树立更适配场景需求的大模型体系,提供全流程允许运行落地的工具、平台和方法,树立激起翻新的放开生态等。
除了在智能创作上的运行,文心大模型也曾经运行于工业、动力、教育、金融、通讯、媒体等行业,例如工业畛域的零部件品质检测、动力畛域的输电线路巡检、金融行业的合同消息抽取等等,真正协助企业降本增效并激起翻新。同时,文心大模型也片面运行于智能搜查、消息流、智能音箱等互联网产品,优化用户失掉消息、常识和服务的效率和效果。
目前飞桨已构建了业内规划最全、最适宜产业运行的模型库体系,大模型作为人工智能 “基础设备”的一局部,进一步拓宽了人工智能技术落地的场景笼罩广度,愈加深了产业运行的深度。文心大模型将继续降落运行门槛,推进产业智能化更新,让人工智能技术惠及每一团体。