机器学习和深度学习的奥秘面纱揭开AI

2024-11-14

深度学习、机器学习、人工智能——这些盛行词皆代表了剖析学的未来。在这篇文章中，咱们将经过一些实在环球的案例来解释什么是机器学习和深度学习。在的文章中，咱们将探求垂直用例。这样做的目的不是要把你变成一个数据迷信家，而是让你更好地理解你可以用机器学习做什么。开发人员能越来越容易地经常使用机器学习，数据迷信家时常与畛域专家、架构师、开发人员和数据工程师一同上班，因此，详细了解机器学习的或者性对每团体来说都很关键。你的业务发生的每一条消息都有参与价值的后劲。这篇和的文章旨在激起你对自己数据的回忆，以发现新的时机。

什么是人工智能?

纵观人工智能的历史，其定义被不时重写。人工智能是一个概括性术语(这个概念始于50年代);机器学习是AI的子集，而深度学习又是机器学习的子集。

1985年，当我还是美国国度安保局的实习生时，人工智能也是一个十分抢手的话题。在美国国度安保局，我甚至上了一节麻省理工对于人工智能专家系统的视频课程。专家系统在规定引擎中捕捉专家的常识。规定引擎在金融和医疗保健等行业中有宽泛的运行，最近更是用于事情处置，但是当数据出现变动时，规定的降级和保养会变得意外艰巨。机器学习的好处在于从数据中学习，并且可以提供数据驱动的概率预测。

在过去10年里，剖析学出现了怎么的变动?

依据《哈佛商业评论》的托马斯•达文波特，剖析技术过去十年里出现了天翻地覆的变动，跨商用主机性能更弱小、老本更低的散布式计算，流媒体剖析、改良的机器学习技术，都使企业能够存储和剖析更多的、不同类型的数据。

相似Apache Spark这样的技术经常使用迭代算法，经过在内存中跨迭代缓存数据并经常使用更轻量级的线程，进一步减速了散布式数据的并行处置。

图形处置单元(GPUs)放慢了多核主机的并行处置速度。GPU领有一个由数千个更小、更高效的外围组成的大规模并行架构，这些外围专门设计用于同时处置多义务，而CPU由几个为顺序串行处置而优化的外围组成。就潜在的性能而言，从Cray-1退化到如今领有少量GPU的集群，其性能优化大概是曾经环球上最快计算机的100万倍，而老本却只要其极小一局部。

什么是机器学习?

机器学习经常使用算法在数据中发现形式，而后经常使用一个能识别这些形式的模型对新的数据启动预测。

普通来说，机器学习可以分为三种类型：监视型、非监视型、介于两者之间。监视学习算法经常使用标志数据，而非监视学习算法在未标志数据中发现形式。半监视学习经常使用标志数据和未标志数据的混合。强化学习训练算法在反应的基础上最大化鼓励。

监视学习

监视算法经常使用标志数据，这些数据的输入和指标的结果或标签都会提供应算法。

监视学习也被称为预测建模或预测剖析，由于你建设了一个能够做出预测的模型。预测建模的一些例子是分类和回归。分类依据已知项的已标志示例(例如，已知能否为欺诈的买卖)来识别一个项属于哪个类别(例如，某买卖能否为欺诈)。逻辑回归预测了一个概率——例如，欺诈的概率。线性回归预测一个数值——例如，欺诈的数量。

一些分类的例子包括：

逻辑回归(或其余算法)的一些例子包括：

So线性回归的一些例子包括：

这里还有其余的监视和非监视学习算法，咱们不会逐一引见，但咱们会详细引见每类中的一个。

分类示例：借记卡坑骗

分类决定一组具备已知标签和预先确定个性的数据，并学习如何依据这些消息标志新数据。个性是你问的“能否”疑问。标签就是这些疑问的答案。

让咱们看一个借记卡坑骗的示例。

咱们想要预测什么?

你可以用来启动预测的“ 能否 ”疑问或属性是什么?

要构建分类器模型，你须要提取对分类最有奉献的有用个性。

决策树

决策树创立一个基于输入特色预测类或标签的模型。它的上班原理在于评价每个节点上蕴含一个特色的疑问，而后依据答案决定到下一个节点的分支。预测借记卡欺诈的或者决策树如下所示。个性疑问是节点，答案“是”或“否”是树中到子节点的分支。(留意，真正的树会有更多的节点。)

疑问一：24小时内的破费能否大于平均?

疑问2：当天能否有多笔买卖来自高危险的商家?

决策树很受欢迎，由于它们易于可视化和解释。将算法与集成方法相联合，可以提高模型的精度。一个集成例子是一个随机森林算法，它联合了决策树的多个随机子集。

无监视学习

无监视学习，有时也被称为形容剖析，没有预先提供的标志数据。这些算法发现输入数据中的相似性或法令。无监视学习的一个例子是基于购置数据对相似的客户启动分组。

聚类

在聚类中，一个算法经过剖析输入实例之间的相似性将它们分类。一些聚类用例包括:

K均值算法将数据分组到K个集群中，每个数据都属于离其集群中心均值最近的集群。

聚类的一个例子是，一个公司宿愿细分其客户，以便更好地定制产品和服务。客户可以依据比如人口统计和购置历史记载等特色被分组。为了获取更有价值的结果，无监视学习的聚类经常与有监视学习相联合。例如，在这个bankingcustomer360用例中，首先依据问卷答案对客户启动细分。接着对客户个体启动剖析，并标上用户画像。而后，这些标签经过客户ID与账户类型和购置内容等个性启动链接。最后，咱们在被标签的客户身上运行了监视机器学习，准许将考查用户画像与他们的银行行为咨询起来，以提供深化的见地。

深度学习

深度学习用来称说多层神经网络，它是由输入和输入之间的节点“隐含层”组成的网络。神经网络有许多变种，你可以在这个神经网络备忘单上了解更多。改良的算法、GPUs和大规模并行处置(MPP)使得具备数千层的神经网络成为或者。每个节点接受输入数据和一个权重，而后向下一层的节点输入一个置信值，直到抵达输入层，计算出该置信值的误差。经过在一个叫做梯度降低的环节中启动反向流传，误差会再次经过网络发送回来，并调整权值来改良模型。这个环节重复了数千次，依据发生的误差调整模型的权值，直到误差不无法再缩小为止。

在此环节中，各层学习模型的最优特色，其好处是特色不须要预先确定。但是，这也象征着一个缺陷，即模型的决策是无法解释的。由于解释决策或者很关键，钻研人员正在开发新的方法来了解深度学习这个黑盒子。

机器学习人工智能深度学习 Ai

<<经常使用Streamlit和Matplotlib创立交互式折线图

失业的程序员平衡十三>>

机器学习和深度学习的奥秘面纱 揭开AI

您可能还会对下面的文章感兴趣：

随便看看

机器学习和深度学习的奥秘面纱揭开AI