机器学习大话人工智能数据迷信

2024-11-14

写作此文须要6小时，蕴含4个带图实例，目的是从微观上剖析和了解这三个术语，适宜不同阶段人工智能(缩写AI)、数据迷信、机器学习(缩写人数机)喜好者。完整浏览或许须要20分钟。

前言：学科交叉乃大势所趋，新兴学科应市场需求孕育而生。人数机，便发生在这样的时代背景下。什么，你所在的学校至今还没开设相关专业?不用惊恐，老牌资本主义国度德国雷同如此。但是，学好微积分、线代、提升、统计、编程，你和人数机或许只是俩三堂专业课的距离。本文旨在从微观的视角剖析人数机，详细到某个学科或疑问，请参见文中给出的链接。

机器学习、深度学习、增强学习，这些“学习”都是什么鬼?3 中的回答或许会让你大跌眼镜。

本文提纲：

1，人数机的概念 2，AI的运行畛域 3，AI的解法-机器学习 4，机器学习底层的模型-运筹、统计 5，AI的算法 6，强AI vs 弱AI 7，AI学术界、工业界的世界排名

书归正传，咱们一同逐点击破人数机这个大泡泡，力图以最深刻易懂的言语恢复他们矮小上外表下弱小的真面目(数学模型+算法)。

本文局部内容节选自我在上方疑问的回答：

机器学习、提升通常、统计剖析、数据开掘、神经网络、人工智能、形式识别之间的相关是什么? – 知乎

首先我把最近火起来的，关于人数机最抢手的几个术语都列进去，由于不知道它们的话，你或许曾经OUT了。

人工智能、数据迷信、大数据、机器学习、神经网络、深度学习、计算机视觉、自然言语处置、增强学习、(无)监视学习、数据开掘、文本开掘、形式识别、虚构事实、增强事实、GPU计算、并行计算、物联网、工业4.0、智能供应链、智能xx、商业智能、xx智能、图像处置、智能驾驶、统计推断、(凸)提升、K-means算法、Ford-Fulkerson算法等等。(欢迎评论区补充“火”的术语)

下文我尝试把这些术语依照概念、运行、模型、方法、算法来启动分类。

1，概念–人工智能(Artificial Intelligence)、数据迷信(Data Science)、大数据(Big>国际(世界)TOP互联网公司、学术界(人工智能)超高薪的揽才方案有哪些? – 知乎

再举个比循环语句稍稍复杂点的例子：预测(Forecasting、Prediction)。

给你一堆点(x_i,y_i),人眼一看，依据数据以往的趋向，下一个点x_n的y坐标–y_n应该出如今箭头所指的中央。但是假设有1000堆相似数据等你预测呢?你须要1000团体来描这个点么?NO，你只须要教会计算机如何依据x_n预测出y_n的值。–很便捷，学过统计的应该都知道线性回归(Linear Regression)，用最小二乘法依据以往的数据(x_i,y_i)算出线性系数b_0和b_1，那么预测函数y=b_0+b_1*x，电脑就可以依据这个公式来预测前面一切的y值。当然有进阶版的分段线性回归(piecewise linear fitting)，欢迎听下回合成。

2，运行

形式识别(Pattern Recognition)、计算机视觉(Computer Vision)、自然言语处置(Natural Language Processing)、数据开掘(Data Mining)、物联网(Intenet of Things)、商业智能(Business Inteligence)、智能驾驶(Auto Driving)、云计算(Cloud Computing)、虚构增强事实(Virtual Augmented Reality)等

这些都属于人工智能和大数据的运行场景。

形式识别：把一堆横七竖八的数据或像素(图像)里深藏的“形式”或规定用计算机智能识别进去。

计算机视觉、图像处置：“教”计算机像人一样识别图像或视频中的形式。

自然言语处置：雷同的，计算机看待人说的话只是一段段音频信号(signal)，或许更底层些，只是一个x坐标为期间t的二维数据。如何把电信号翻译成文字(text)，须要人来“教”它。

数据开掘：从一大堆数据里开掘出你想要的有用的消息。怎样样，是不是和形式识别有点必由之路之妙?不过其关键数据对象是数据库(Database)，相似的还有文本开掘(text mining)。

物联网：把一切物品(例如家电)都联网，并实时坚持数据的连通，而后计算机处置这些数据。例如依据客人的生存习性智能开关暖气。

商业智能：人工智能运行在商业大数据畛域。例如银行欺诈性买卖的监测。

智能驾驶：望文生义，内置在汽车甚至设置在云端的计算机智能给你开车。应用的是计算机处置汽车上的摄像头实时发生的图片消息，以及雷达发生的信号。

云计算：把计算义务传送到“云端”，得出结果后再传送回来。云端或许是一个大的计算机集群(Cluster)，难点在于如何协同CPU和GPU。

虚构、增强事实(VR、AR)：VR眼镜应该都体验过吧?未来的趋向，3D电影演唱会等，足不出户体验现场感。Pokemon Go是AR最好的例子，使虚构和事实混合在一同。俩者的外围技术都在计算机视觉里，包括校准、3D重建、识别、追踪等等。

经过以上九个术语的翻译，置信妈妈再也不用担忧我被“概念”的炒作蒙蔽双眼了。

再举个例子：形式识别(Pattern Recognition)里的图像宰割(Image Segmentation)。

给你一张图片，你自然知道描出图里一切物体的轮廓，把该图宰割成了几块，该图的“形式”就被识别进去了。但是给你100，1000张图呢?你还有耐烦一张张用手描轮廓?这时刻你须要教计算机如何画这个轮廓，并且不只仅限于几张图，这个模型或算法必定适用于绝大少数的图片。这就是形式识别和图像宰割。

3，方法–机器学习(Machine Learning)

前面讨论了概念和运行，那么用什么方法来成功2中的运行呢?机器学习便是最有力的方法之一。把机器学习独自放在方法里，是为了表现其关键性。只管它是一门建设在统计和提升上的新兴学科，但是在人工智能、数据迷信等畛域，它相对是外围课程中的外围。

机器学习，望文生义，教机器如何“学习”，或让机器自己“学习”。因此从字面上看就自然的属于人工智能范围。“学习”这个看似浅近的术语，在1线性回归的例子里，仅仅指求解(学习)b0, b1这俩个系数。任何其余炒得炽热的“xx学习”，也只是求解一些参数-说得都很难听，仅此而已。

关于统计和运筹学这俩门基础学科来说，机器学习又是运行(见上方四类疑问)，由于它少量地用到了统计的模型如马尔可夫随机场(Markov Random Field–MRF)，和其余学科的模型，如偏微分方程(变分法等)，最后通常转化成一个能量函数最小化的提升疑问。

机器学习的外围在于建模和算法，学习失掉的参数只是一个结果(见5)。

机器学习里最关键的四类疑问(按学习的结果分类)：

预测(Prediction) –可以用如回归(Regression)等模型。

聚类(Clustering) –如K-means方法。

分类(Classification) –如允许向量机法(Support Vector Machine)。

降维(Dimensional reduction) –如主成份剖析法(Principal component analysis (PCA)–纯矩阵运算)。

前三个从字面意思就好了解，那么为什么要降维呢?由于通常状况下，一个自变量x就是一个维度，机器学习中动不动就几百万维，运算复杂度十分高。但是几百万维度里，或许其中几百维就蕴含了95%的消息。因此为了运算效率，舍弃5%的消息，咱们须要从几百万维中找出这蕴含95%消息的维度。这就是降维疑问。

机器学习按学习方法的分类：

监视学习 (Supervised Learning，如深度学习)，

无监视学习 (Un-supervised Learning，如聚类)，

半监视学习 (Semi-supervised Learning)，

增强学习 (Reinforced Learning)。

这里不从艰涩的定义上深化开展，举俩个例子或许成果更好。

邮件分类的例子：

邮件治理器中的渣滓邮件和非渣滓邮件的分类，就是一个典型的机器学习的分类疑问。这是一个有监视的学习疑问(Supervised Learning)，什么叫有监视呢?计算机是在你的监视(标志)下启动学习的。便捷地说，新来一封邮件，你把他标志为渣滓邮件，计算机就学习该邮件里有什么内容才使得你标志为“渣滓”;相反，你标志为反常邮件，计算机也学习其中的内容和渣滓邮件有何不同你才把它标志为“反常”。可以把这俩个分类便捷的看成”0″和“1”的分类，即二分疑问(Binary Classification)。并且，随着你标志越来越多，计算机学习到的法令也越来越多，新发生一封邮件标志的正确率也会越来越高。

当然分类可不止用在判别渣滓邮件，其余运行例如银行欺诈买卖的判别(商业智能范围)，计算机视觉里给计算机一张图片，分类为狗还是猫(驰名的ImagNet，可是把图片分红了2万多类)。等等。

前面讲了监视学习，无监视学习即在没有人工标志的状况下，计算机启动预测、分类等上班。

再来一个例子–聚类(Clustering)–无监视的学习

事前没有对图中的点启动标志类别，左图在计算机看来，仅仅是12个点(x，y坐标)，但是人眼可以判别它大抵可以分为三类(这时，123，321，132代表的都是相反的聚类，顺序没有相关)。如何教计算机把数据归类呢?这就是聚类疑问。其中最经典的算法叫K-means。

半监视介于俩者之间，增强学习牵扯到更深的运筹、随机环节、博弈论基础，这里临时不开展。

机器学习作为新创的学科或方法，被宽泛地运行于人工智能和数据迷信等疑问的求解。依照行业的说法，神经网络、深度学习、增强学习等模型都属于机器学习的范围。

本节最后出一个思索题，1中的线性回归属于监视还是无监视学习呢?

4，模型–运筹学(Operations Research(O.R.))、

凸提升(Convex Optimization)、统计剖析(Statistical Analysis)、神经网络(Neural Network)、深度学习(Deep Learning)

把它们归到一类，由于他们都是一种处置实践疑问的模型。例如处置图像宰割疑问，你可以用统计的模型(如马尔可夫随机场)，也可以用神经网络模型，当然也可以用深度学习，即卷积神经网络模型(Convolutional Neural Networks)。

统计和运筹作为有深沉渊源的学科，这俩个名词自身就能成为一个专业，其下又有有数的分支和方向。他们自身钻研的对象就是大数据，因此和人工智能、数据迷信有着自然的渊源。最远由于人数机的兴起，统计、凸提升模型也再度热了起来(特意是概率图模型)。置信他们和人工智能会起到相反相成、相互促成的成果。

神经网络(监视学习门下，须要有标签的数据)和深度学习，相比前俩个庞大学科，充其量只能算一个基于图论(Graph Theory)的模型。神经网络也是由来已久，刚开局的全衔接神经网络(Fully Connected Neural Network)以及多层神经网络，都是传统神经网络，由于参数多计算(学习这些参数)的复杂度很高，因此适用性不强没有失掉足够的注重。直到近些年卷积神经网络的横空入世，深度神经网络(Deep Neural Network)已基本秒杀其余一切传统方法，缺陷是须要有标签的庞大的数据集以及训练期间过长(计算机资源)。

当然人工智能，特意是深度学习有过热的趋向，造成炒概念这样不良风尚的发生，甚至有偷换概念之嫌。上方链接乃计算机视觉领军人物之一加州大学洛杉矶分校UCLA统计学和计算机迷信传授Song-Chun Zhu的访谈录，给深度学习泼一点冷水。初探计算机视觉的三个源头、兼谈人工智能|正本清源

由于O.R.出身，把运筹放在最后一点–楼主必定正本清源O.R.的在人工智能中表演的关键角色。

在机器学习里我已提到，这里再强调一遍，简直一切的人工智能疑问最后会归纳为求解一个提升疑问(Optimization Problem)。而钻研如何求解提升疑问的学科，正是运筹学。

运筹学的作用，不只限于求解其余模型(如统计)最后发生的提升疑问，也可以作为模型自身(提升模型)来处置人工智能疑问。

提升模型蕴含指标函数和解放条件。提升疑问就是求解满足解放条件的状况下使得指标函数最优的解。敬请读者们关注我的运筹专栏，听我下回细心合成。这里只提一点，大家所熟知的允许向量机，其实齐全可以看作运筹中的二次布局(Quadratic Programming)疑问。

[指挥若定]大数据和人工智能时代下的运筹学 – 知乎专栏

最后唠叨一句楼主的科研方向，就是用运筹学中的混合整数布局(Mixed Integer Nonlinear Programming)模型建模，处置人工智能中的运行，如图像宰割。

由于版面有限，不再详细开展。关于运筹学你所要知道的简直一切，都在上方：

运筹学–一门建模、提升、决策的迷信 – 知乎专栏

5，算法–K-means，Ford-Fulkerson

做过人工智能实践/科研名目的人知道，处置一个实践疑问就像小时刻解运行题，从假定未知数开局(已是模型的范围)，普通步骤便是数学建模-设计算法-编程成功，并以此重复斟酌。因此为了文章的完整性，加上算法这一节。

K-means在3的聚类疑问中已提到，这里重点讲讲最大流以及算法和模型之间的相关。

Ford-Fulkerson算法属于运筹学或图论-网络流疑问(Network Flow Problem)中一个十分经典的疑问-最大流疑问(Max Flow Problem)的算法，它在图像处置特意是图像宰割中，有着极为关键的运行。

如图：把一张3*3像素的图像看作3*3个点的图(图论术语里的图)，并且把高低左右相邻的点用边衔接起来，组成edge(图论里的边)。这么一来，图像宰割疑问就完美地转换成了一个基于图论(或许network flow)的提升疑问。如下图，九个像素的图被最大流算法用绿线宰割成了俩个局部(segment)，绿线即为最小宰割(min cut)，这里s点和t点是为了构建网络流模型额外参与的俩个点(terminal node)。

上方讨论模型和算法的相关，引自我在上方的回答：

想学数据剖析(人工智能)须要学哪些课程? – 知乎

这里强调下数学建模的关键性，为何要数学建模呢?确实很多naive的算法齐全不须要建设在数学模型之上，比如clustering外面经典的EM算法，是一个iterative method，基本一眼就能看出算法的思绪而后编程成功。那么基于数学模型上的算法有何妙处呢?答案是一个好的数学模型，往往是被钻研了几十甚至几百年的学科，比如图论，很多性质都曾经被钻研得很透彻可以间接经常使用。回到上方的例子，我建设的这个网络流的模型，是一个被钻研了很久的模型，因此我可以间接经常使用其很多已知的好定理或算法来服务我的疑问，比如这里基于里max flow的Ford-Fulkerson算法，假设能在其基础上做改良，等于站在凡人的肩膀。因此这就是数学建模的关键之处。

往往同一个疑问，从不同的角度去看可以有千百种数学建模方法，而不同的数学模型差异往往渺小。而数学建模又是处置一个实践疑问的第一步，在这基础上才思索算法和数据结构设计。因此，数学模型和面前的数学基础在我看来是重中之重，也是我介绍学习的课程的外围。当然了，计算机系出生的好友，数学这个层面学习得不是很深，可以倾向于算法的设计和成功，它们也是关键的。

6，强者工智能(Strong AI或 Artificial General Intelligence) vs 弱人工智能(Applied AI，narrow AI，weak AI)

上方唠叨了那么多，说来说去都是建设在以二进制为机理的图灵计算机上的“弱人工智能”，即计算机须要人去“教”它怎样做。而人工智能、神经网络的最终目的，是模拟人脑的机理和组成(脑神经元、神经网络)，让计算机能像人一样具备思想、自主看法，自行学习和决策，称为“强者工智能”。

这里不得不提到母校德国海德堡大学物理系和英国曼彻斯特大学牵头的欧盟“人脑方案”，其最终目的就是打破计算机的二进制机理，模拟人脑神经元(Neuron)放电(spark)的随机性，打造出一台能像人脑一样“思索”的计算机。从此计算机不再二进制(0或1)，而是可以取[0,1]间的随机值。另外工业界如IBM也在打造此类计算机。

此机一旦面世，以往一切惯例将被打破，“强者工智能”的新纪元或许会随之来到。

7，人工智能学术界、工业界世界排名

依照本文作者的尿性，最后不出异常会给个排名。当天也不例外，排名不分先后。

学术界：人工智能等新兴学科通常设置在计算机系，此处可参考CS排名

美国仰仗传授数量自始自终地排在前头：CMU、斯坦福、MIT、UC伯克利、哈佛、普林斯顿

英国伦敦也是AI重地：牛津、剑桥、帝国理工再加爱丁堡

加拿大堪称深度学习孵化地，DL三杰都和国有渊源：多大、蒙特利尔、UCB

欧洲因教职稀少排名自然弱，瑞士俩校拔得头筹，ETH、EPFL，海德堡HCI五传授之阵容理当占得一席，哦，原来三个附属物理系。

亚洲新加坡、香港你来我往，日本东大山河日下，中国清华异军突起，姚班功无法没。

工业界：仰仗着财大气粗吸引人才，以及计算才干和数据量的长处，工业界在AI畛域或许曾经赶超学术界

美国自然是世界AI中心(硅谷、西雅图、波士顿、纽约)：Google刚请来了斯坦福李飞飞(sabbatical)以及多大的Geoffrey Hinton，Facebook有NYU的Yann LeCun, 微软、IBM钻研院早已名声在外，Amazon云计算一家独大，还有Uber、Airbnb、LinkedIn等新贵互联网公司的助力。

英国伦敦：DeepMind被Google收买，Google、微软等在伦敦都设有钻研院。

欧洲：IBM、Google在苏黎世和慕尼黑都有钻研院，扩招中;amazon在卢森堡有钻研院;德国传统公司，如拜耳、博世、西门子等纷繁发力AI建设钻研院，宝马飞驰奥迪等车场也投注智能驾驶。最后说说海德堡，SAP总部所在地，还有NEC、ABB等欧洲钻研院。

加拿大：加拿大政府在多伦多刚成立人工智能钻研院-Vector Institute ，G Hinton任首席迷信顾问，Google在蒙特利尔预备成立新钻研院，可见Yoshua Bengio指导的深度学习钻研院名声在外。

中国：北有科技之都北京，得天独厚的长处，微软亚洲钻研院造就起了中国一少量AI大佬;百度、京东以及地平线机器人、滴滴等一少量互联网新贵开局锋芒毕露。南有深圳，华为、腾讯、大疆、顺丰等也毫不认输。

到此，置信读者们可以更有自信地吹“人工智能、数据迷信、机器学习”的牛逼了。

数据迷信机器学习人工智能

<<视觉大模型训练和推理减速

机器视觉>>

机器学习 大话 人工智能 数据迷信

您可能还会对下面的文章感兴趣：

随便看看

机器学习大话人工智能数据迷信