机器学习和深度学习的区别
机器学习和深度学习之间的主要区别
机器学习和深度学习之间的主要区别是:
- 机器学习在小型/中型数据集上提供出色的性能,而深度学习在大型数据集上提供出色的性能
- ML 在低端机器上工作,而 DL 需要强大的机器,最好有 GPU。
- 机器学习的执行时间从几分钟到几小时,而深度学习则需要数周时间。
- 与深度学习相比,机器学习需要更少的数据来训练算法。深度学习需要大量且多样化的数据集来识别底层结构。
什么是AI?
人工智能 是计算机科学的一个分支,其中机器被编程并被赋予认知能力,可以像人类和动物一样思考和模仿行为。人工智能的基准是人类在推理、语言、学习、视觉和解决问题方面的智能,这在未来还很遥远。
人工智能有三个不同的级别
1)狭义人工智能: 当机器能够比人类更好地执行特定任务时,人工智能被称为狭义的人工智能。人工智能的最新研究现在在这里
2)通用人工智能:当人工智能能够以与人类相同的准确度执行任何智力任务时,它就达到了一般状态
3)主动人工智能:当人工智能能够在很多任务上击败人类时,它就处于活跃状态
早期的人工智能系统使用模式匹配和 专家系统.
什么是机器学习(ML)?
毫升(机器学习) 是一种人工智能,其中计算机经过训练可以自动完成人类无法完成或无法完成的任务。它是基于对计算机算法的研究来分析、理解和识别数据模式的最佳工具。机器学习可以在最少的人为干预下做出决策。
比较 人工智能 与机器学习相比,机器学习使用数据来提供能够理解输入和输出之间关系的算法。当机器学习完成后,它可以预测新数据点的值或类别。
什么是深度学习 (DL)?
深度学习是一种模拟大脑神经元网络的计算机软件。它是机器学习的一个子集,之所以被称为深度学习,是因为它利用了深度神经网络。机器使用不同的层从数据中学习。模型的深度由模型中的层数表示。深度学习是人工智能的最新进展。在深度学习中,学习阶段是通过神经网络完成的。神经网络是一种层层堆叠的架构
机器学习与深度学习的区别
以下是深度学习与机器学习之间的主要区别
产品型号 | 机器学习 | 深度学习 |
---|---|---|
数据依赖性 | 在小型/中型数据集上表现出色 | 在大数据集上表现出色 |
硬件依赖 | 在低端机器上工作。 | 需要功能强大的机器,最好配备 GPU:DL 执行大量矩阵乘法 |
特征工程 | 需要了解代表数据的特征 | 无需了解代表数据的最佳特征 |
执行时间处理时间 | 从几分钟到几小时 | 最多数周。神经网络需要计算大量权重 |
可解释性 | 有些算法很容易解释(逻辑、决策树),有些算法几乎不可能解释(SVM、XGBoost) | 困难至不可能 |
何时使用 ML 或 DL?
产品型号 | 机器学习 | 深度学习 |
---|---|---|
训练数据集 | S小号 | L大号 |
选择功能 | 是 | 没有 |
算法数量 | 更多来自Google的 | 少数 |
训练时间 | 短 | 长 |
与深度学习相比,使用机器学习,你需要更少的数据来训练算法。深度学习需要大量且多样化的数据来识别底层结构。此外,机器学习提供了训练速度更快的模型。大多数先进的深度学习架构可能需要几天到一周的时间来训练。深度学习相对于机器学习的优势在于它具有高度的准确性。你不需要了解哪些特征是数据的最佳表示;神经网络学会了如何选择关键特征。在机器学习中,你需要自己选择要包含在模型中的特征。
机器学习过程
假设你要构建一个识别物体的程序。为了训练模型,你将使用 分类分类器使用对象的特征来尝试识别它所属的类别。
在示例中,将训练分类器来检测图像是否是:
- 自行车
- 船
- 汽车代理
- 机
上面的四个对象是分类器必须识别的类别。要构建分类器,您需要输入一些数据并为其分配标签。算法将获取这些数据,找到一种模式,然后将其归类到相应的类别中。
此任务称为 监督学习. 在监督学习中,您输入给算法的训练数据包含标签。
训练算法需要遵循几个标准步骤:
- 收集数据
- 训练分类器
- 作出预测
第一步是必要的,选择正确的数据将决定算法的成功或失败。你选择用来训练模型的数据称为 功能。 在对象示例中,特征是图像的像素。
每幅图像都是数据中的一行,而每个像素都是一列。如果您的图像是 28×28 大小,则数据集包含 784 列(28×28)。在下面的图片中,每张图片都已转换为特征向量。标签告诉计算机图像中的对象是什么。
目标是使用这些训练数据对物体类型进行分类。第一步是创建特征列。然后,第二步是选择一种算法来训练模型。训练完成后,模型将预测哪张图片对应哪个物体。
之后,使用该模型预测新图像就变得很容易了。对于输入到模型中的每个新图像,机器都会预测其所属的类别。例如,一张没有标签的全新图像正在通过模型。对于人类来说,将图像可视化为汽车是微不足道的。机器也会利用其先前的知识来预测图像是汽车。
深度学习过程
在深度学习中,学习阶段是通过神经网络完成的。神经网络是一种层层堆叠的架构。
考虑上面相同的图像示例。训练集将被输入到神经网络
每个输入都会进入一个神经元,并与权重相乘。乘法的结果流向下一层并成为输入。这个过程对网络的每一层都重复进行。最后一层称为输出层;它为回归任务提供实际值,为分类任务提供每个类的概率。神经网络使用数学算法来更新所有神经元的权重。当权重值给出接近现实的输出时,神经网络就训练充分了。例如,训练有素的神经网络可以比传统神经网络更准确地识别图片上的物体。
使用深度学习自动提取特征
一个数据集可以包含十几个到几百个特征。系统会从这些特征的相关性中学习。然而,并不是所有的特征对算法都有意义。机器学习的一个关键部分是找到一组相关的特征,让系统学到一些东西。
在机器学习中执行此部分的一种方法是使用特征提取。特征提取结合现有特征来创建更相关的特征集。可以使用 PCA、T-SNE 或任何其他降维算法来完成。
例如,在图像处理中,从业者需要手动提取图像中的特征,如眼睛、鼻子、嘴唇等。这些提取的特征被输入到分类模型中。
深度学习解决了这个问题,特别是对于卷积神经网络。神经网络的第一层将从图片中学习小细节;接下来的几层将结合先前的知识来生成更复杂的信息。在卷积神经网络中,特征提取是使用过滤器完成的。网络将过滤器应用于图片以查看是否存在匹配,即特征的形状是否与图像的一部分相同。如果匹配,网络将使用此过滤器。因此,特征提取过程是自动完成的。
结语
人工智能 赋予机器认知能力。比较人工智能与机器学习,早期的人工智能系统使用模式匹配和专家系统。
机器学习背后的理念是机器无需人工干预即可学习。机器需要找到一种方法来学习如何根据数据解决任务。
深度学习是人工智能领域的突破。当有足够的数据进行训练时,深度学习会取得令人印象深刻的结果,尤其是在图像识别和文本翻译方面。主要原因是特征提取是在网络的不同层中自动完成的。