最近一段期间对于大模型技术的学习及运行的心得体会
“怎样把大模型的各种技术与运行场景相联合是一个值得思索的疑问”
当天这篇文章应该算是对这几个月以来学习和运行大模型技术的总结,也可以说是这段期间的心得体会。
当天关键从技术与运行两个方面来讲,当然也会夹杂着一些自己的了解与想法。
对于大模型技术的学习与运行及心得体会
对任何一项技术来说,关键有两个方面,其一是技术面,其二是运行面;技术实质只是一个工具,也就是咱们常说的,技术是为业务服务的。
一项新技术的发生,要么在新技术上构建新的运行,要么就用新技术去处置旧疑问。
而大模型技术是最近两年爆火的一项技术,由于它使得人工智能技术获取了渺小的提高,使得人工智能不只仅只是一个理念,而是真正成为一个有或许成功的指标。
技术面
在前面说技术的实质是工具,因此从技术的角度来说,技术的作用就是怎样把这个工具做得更好。
咱们经常说大模型技术,其实大模型是人工智能技术的一个分支——机器学习技术深化后发生的深度学习技术所开发的一款产品或许说工具。
因此,对于大模型的“技术”钻研的都是怎样把模型这个工具做的更好,比如说不同架构的神经网络,训练方式,微调方式;再详细的比如,Transformer架构,前向流传,反向流传,损失计算等等;再有如迁徙学习,强化学习,反抗网络等无外如是。
怎样把大模型做得更好,更快,更好用,重不关键?
关键,但受限于大模型的自身的技术复杂度和老本疑问,对绝大局部人和企业来说,大模型渺小的资金和技术老本都是无法接受的,也就是说大模型这个技术不是普通人和普通企业能够玩得转的。
从我的团体的角度来说,大模型技术要不要学?
要学,由于它是未来开展的方向,但学到什么水平就是一个值得思索的疑问了。
假设说你就痴迷于技术无法自拔,或许说你对技术有着剧烈的猎奇心和驱能源,那么你可以选用深化钻研大模型的技术,比如深度学习网络,反向流传算法等等。
而对大局部人来说,只要要了解大模型的基本原理,以及了解大模型的训练与微调,能够依据详细的业务场景微调出一个能够处置实践疑问的模型就可以了。
工具是一个始终开展和退化的环节,因此必定要有人去钻研把一个大模型做的更好的技术,只要这样才不会让大模型技术停滞不前。
从这段期间的学习来看,在之前宣布的文章中基本上曾经涵盖了大模型绝大局部技术理念。
总之一句话,对于大模型的技术目的只要一个,那就是把模型做得更好。
运行面
从运行的层面来说,目前大模型的关键运行有以下几个方向:
AIGC可以说是大模型技术的关键运行方向之一,也是发生比拟早的运行场景,由于如今的大模型就叫做生成式人工智能,而AIGC就是内容生成的畛域。
从技术的角度来说,AIGC就是应用大模型的生成才干,来生成各种文字,图片,视频,音频,PPT等各种内容方式,而技术要求处置的疑问就是让大模型在不同的畛域体现更好。
而Agent的运行范围就愈加普遍,比如一些上班流,也包含智能驾驶技术,工业生成等方向。
Agent就是应用各种环境感知才干,而后应用大模型做出正当和准确的判别,而后做出正确的决策并口头,口头的环节是经过调用外部工具的方式来成功。
而Agent的外围技术就是大模型的推理和布局才干,详细来说就是应用揭示词和思想链,以及外部工具,让大模型能够做到独立思索和判别,学会拆解疑问和指标,并经常使用工具处置疑问的环节。
而常识库技术是对大模型技术毛病的补充,有了常识库就可以处置大模型常识无余的疑问,并且可以大大降落大模型的毛病——幻觉疑问。
而常识库关键触及的技术是常识库的搭建,检索,存储;也就是让大模型更好的了解外部常识,关键技术载体就是RAG——检索生成增强。
从技术的角度来说,大模型关键触及的技术就以上几个方面;而从运行角度来说,大模型的运行更多的是靠构想力,而不是技术。
大模型的技术就那么多,而怎样应用这些技术构建愈加好用与正当化的运行是一个值得思索的疑问。
原文链接: