还有一些罕用的网站 团体对于人工自动技术学习的心得与方法

“学习大模型技术是有方法的,千万不要只知道埋头上班”

学习人工自动技术也有一段期间了,只管说也算不上什么成绩,但对人工自动技术也算有了一个初步的意识,以及一些团体的学习环节与心得。

而当天就来便捷引见一下团体学习人工自动技术的一些书籍,网站和心得;由于人工自动技术有不同的成功形式,所以当天所说的人工自动特指大模型技术。

大模型技术学习

先来思索一个疑问,应该怎样学习大模型技术?

首先从团体的阅从来说,学习大模型技术或许说学习任何一门新的技艺,首先就是要了解它的基本概念,比如什么是大模型,它无能什么,而后该怎样用,最好自己入手尝试一下。

而后第二步也是比拟关键的一步,也是很多人钻牛角尖的一步;第二步就是在了解基本概念的基础之上,尽快找一个时机去经常使用这项技术,而不是钻进新技术的通常中。

由于理想中很多人学习新技术的时刻,都青睐钻研它的通常,而不器重实操,包含作者自己之前也是这种状况。

很多时刻就是,觉得懂了好多通常,他人问起来也能和人家吹的缄口不语,如同自己很懂。但理想上,这时对技术的了解只是逗留在外表,对很多技术细节和成功理念都没有一个深化的了解。

也就是说,这时咱们所谓的很懂其实很空泛,除了吹嘘逼之外啥都干不了。

因此,最好的形式就不要沉溺于通常,尽快介入通常;这时,或许会由于对通常不了解,你会踩很多坑,很多物品都不知道为什么,这时你会觉得很艰巨。

但只需你能保持下去,缓缓你就会在通常中发现很多疑问,包含一些之前先想不明确却释然开朗的疑问和一些之前觉得天经地义,但如今却以为不正当的疑问。

而这时,你就会对整个大模型技术有了愈加深入的了解,这时再回头看一些通常你就会看到不一样的物品。

这也就是政治课上常说的,通常与通常相联合,用通常去验证通常,用通常去指点通常。

再有,学习一项新技术,团体以为应该从以下三个角度登程:

上方这个顺序并不是乱排的,而是有要素的,首先第一点就是运行;任何技术刚开局必要求从运行开局,要素就是你要求对它有一个具象化的了解,而不是只看一些形象的通常。

从运行开局,你就能知道它是个什么,能做到什么以及能用来处置什么疑问;而后,你就会思索它为什么会这么做,处置了什么疑问,以及怎样处置的,为什么会选用这种打算,有没有其它处置打算等等。

而这些疑问就存在于其通常之中,这个通常不只仅只是技术通常,还包含其设计理念,处置打算等。

而有了基础通常之后,还要求详细落实,比如说经过爱因斯坦的相对论,那怎样证实相对论,这就要求详细的技术成功。

还拿大模型来说,大模型的基础通常是深度学习,但怎样成功深度学习?经过神经网络,那神经网络模型应该是什么样的?又该怎样成功?

所以就有了正向流传,反向流传,损失计算等等详细技术的产生;这也是为什么,正反向流传和损失计算的形式都不止一种。

所以,从运行开局对技术有个基础的印象,其次经过通常去深化对技术的了解,最后经过详细的技术来成功通常。

上方就是团体经常看的书籍,以及网站:

大模型运行开发极简入门,这是作者刚开局学习大模型技术购置的书籍,从目录结构上看,它从大模型的基础通常,chatGPT的基本操作以及其接口开发,还包含模型的微和谐Langchain这种大模型运行开发框架的经常使用。

对刚入门想学习人工自动技术的人来说,这是一个不错的选用,但有一个硬性条件就是,要有一点编程的基础,什么言语不关键,关键的是要有编程的思想。

从零开局大模型开发与微调,是基于pytorch开发的清华大学开源的chatGLM模型为基础,完整引见了成功一个大模型所要求的技术,如编/解码器,Transformer架构,数据处置,强化学习等等。当然这本书也要求必定的技术基础,否则大略率看疑问。

机器学习——周志华版,是一本对于机器学习的书籍;机器学习是深度学习的前身,在大模型爆火之前,机器学习才是关键的钻研方向。而这边机器学习书中引见了多种机器学习的算法,如允许向量机,决策树,神经网络,监视学习,强化学习等,外面详细引见了各种算法的成功原理。

多模态大模型算法,运行与微调——刘兆峰,这本书是一本愈加倾向于通常方面的书籍,外面详细引见了Transformer模型架构,GPT系列,以及深度生成模型等;而且还有一局部文本生成,图像生成和代码生成的案例,详细引见了不同类型大模型的成功原理。

多模态大模型技术原理与实战,可以说是一本从运行角度来引见大模型技术的书籍,其特点就是除了引见了大模型的开展之外;着重引见了中小企业大模型的构建之路,比如微信的微调,包含LoRA,AdaLoRA等;以及模型提升打算,剪枝,蒸馏等。还包含大模型的完整部署打算,以及基于大模型技术购机下层运行,如自动客服,基于思想链的AI助理等。

大规模言语模型从通常到通常,这本书关键并重于大模型运维方面的内容,包含大模型的基础原理,以及大模型的训练和微调环节,包含前期的数据处置,大模型散布式并行计算以及监视微调的方法等。

这里只是引见了基本作者团体觉得还不错的书籍,当然这些书籍或许并不适宜每一团体;而且每本书的并重方向也不一样,假设有对这些书籍感兴味的读者可以选用性的购置。

以下是罕用的一些网站:

huggingface:一个相似于github的托管网站,只不过github托管的是代码,huggingface托管的是大模型和数据集。

github官方:代码托管平台,很多大模型都是把模型托管在huggingface上,代码托管在github上。

openAI官方:chatGPT网站,提供了与chatGPT的交互以及openAI的服务接口(目前openAI屏蔽了中国大陆的接口服务,假构想经常使用可以经常使用一些第三方的镜像服务)

字节旗下coze(扣子)官方:提供了经过性能的形式即可体验AI代理的平台

aigc网站:一个提供各种AIGC才干的网站,比如文本生成,视频生成等

pytorch官方:由meta开发的一款基于torch架构的python成功的大模型开发框架

由于大模型技术属于一个新兴技术,最前沿,最威望的内容都在网络中,而书籍中的内容在某些方面曾经有些过期了。当然,这里并不是说书不好,而是现今时代,消息改革太快,书籍降级的速度不可跟上。

还有一点就是,书籍只管在某些方面过期了,但其系统性和专业性还是普通技术网站所不可比拟的。

原文链接:​ ​​ ​​

您可能还会对下面的文章感兴趣: