深度学习初学者教程:神经网络基础
什么是深度学习?
深度学习 是一种模拟大脑神经元网络的计算机软件。它是基于人工神经网络和表征学习的机器学习的一个子集。它之所以被称为深度学习,是因为它利用了深度神经网络。这种学习可以是监督式、半监督式或无监督式的。
深度学习算法是由连通层构成的。
- 第一层称为输入层
- 最后一层称为输出层
- 中间的所有层都称为隐藏层。深度一词表示网络连接两层以上的神经元。

每个隐藏层由神经元组成。神经元相互连接。神经元将处理并传播其上层的输入信号。下一层神经元所接收信号的强度取决于权重、偏差和激活函数。
网络消耗大量的输入数据,并通过多层对其进行操作;网络可以在每一层学习数据越来越复杂的特征。
深度学习过程
深度神经网络在许多任务中提供最先进的准确率,从物体检测到语音识别。它们可以自动学习,无需程序员明确编码的预定义知识。

为了理解深度学习的概念,我们可以想象一个家庭,里面有一个婴儿和父母。这个蹒跚学步的孩子用小手指着物体,总是说“猫”这个词。由于他的父母关心他的教育,他们一直告诉他“是的,那是一只猫”或“不,那不是猫”。婴儿坚持指着物体,但对“猫”的回答越来越准确。这个小孩内心深处不知道为什么他能说出它是猫还是不是。他刚刚学会了如何通过观察宠物的整体来对复杂的特征进行分层,并继续关注诸如尾巴或鼻子等细节,然后再下定决心。
神经网络的工作原理也类似。每一层都代表更深层次的知识,即知识的层次结构。四层的神经网络比两层的神经网络能学习更复杂的特征。
学习分为两个阶段:
第一阶段:第一阶段包括应用输入的非线性变换并创建统计模型作为输出。
第二阶段:第二阶段旨在用一种称为导数的数学方法改进模型。
神经网络会重复这两个阶段数百至数千次,直到达到可接受的准确度。这两个阶段的重复称为一次迭代。
举一个深度学习的例子,看下面的动作,模型正在尝试学习如何跳舞。经过 10 分钟的训练,模型不知道如何跳舞,看起来就像是乱涂乱画。
经过48小时的学习,计算机就掌握了舞蹈艺术。
神经网络的分类
浅层神经网络:浅层神经网络在输入和输出之间只有一个隐藏层。
深度神经网络:深度神经网络不止一层。例如,用于图像识别的 Google LeNet 模型有 22 层。
如今,深度学习被广泛应用于无人驾驶汽车、手机、谷歌搜索引擎、欺诈检测、电视等等。
深度学习网络的类型
现在,在这个深度神经网络教程中,我们将了解深度学习网络的类型:

前馈神经网络
最简单的人工神经网络。在这种架构中,信息只朝一个方向流动,即向前。这意味着信息流从输入层开始,到达“隐藏”层,最后到达输出层。网络
没有循环。信息在输出层停止。
递归神经网络 (RNN)
RNN 是一种多层神经网络,可以在上下文节点中存储信息,从而可以学习数据序列并输出数字或其他序列。简而言之,它是一种人工神经网络,其神经元之间的连接包括循环。RNN 非常适合处理输入序列。

例如,如果任务是预测句子“你想要…………吗?”中的下一个单词。
- RNN 神经元将接收指向句子开头的信号。
- 网络接收单词“Do”作为输入,并产生一个数字向量。该向量反馈给神经元,为网络提供记忆。此阶段帮助网络记住它接收到了“Do”,并且它在第一个位置接收到了它。
- 网络将以类似的方式处理下一个单词。它选取单词“你”和“想要”。神经元的状态在接收到每个单词时都会更新。
- 最后阶段发生在收到单词“a”之后。神经网络将为每个可用于完成句子的英语单词提供一个概率。训练有素的 RNN 可能会为“café”、“drink”、“burger”等分配较高的概率。
RNN 的常见用途
- 帮助证券交易者生成分析报告
- 检测财务报表合同中的异常
- 检测欺诈性信用卡交易
- 为图片提供标题
- 强大的聊天机器人
- 当从业者处理时间序列数据或序列(例如,音频记录或文本)时,RNN 的标准用途就会出现。
卷积神经网络(CNN)
CNN 是一种多层神经网络,具有独特的架构,旨在提取每层数据中越来越复杂的特征来确定输出。CNN 非常适合感知任务。
当存在非结构化数据集(例如图像)并且从业者需要从中提取信息时,主要使用 CNN。
例如,如果任务是预测图像标题:
- CNN 接收一张猫的图片,用计算机术语来说,这张图是像素的集合。一般来说,灰度图有一层,彩色图有三层。
- 在特征学习(即隐藏层)期间,网络将识别独特的特征,例如猫的尾巴、耳朵等。
- 当网络彻底学会如何识别一张图片后,它就能为它所知道的每张图片提供一个概率,概率最高的标签将成为网络的预测。
强化学习
强化学习 强化学习是机器学习的一个分支,通过接收虚拟“奖励”或“惩罚”来训练系统,本质上是通过反复试验来学习。谷歌的 DeepMind 已经利用强化学习在围棋比赛中击败了人类冠军。强化学习还用于视频游戏,通过提供更智能的机器人来改善游戏体验。
其中最著名的算法是:
- Q学习
- 深度Q网络
- 状态-行动-奖励-状态-行动 (SARSA)
- 深度确定性策略梯度(DDPG)
深度学习应用示例
现在,在本深度学习初学者教程中,让我们了解深度学习应用:
金融领域的人工智能
金融科技行业已经开始使用人工智能来节省时间、降低成本和增加价值。深度学习正在通过使用更强大的信用评分来改变贷款行业。信贷决策者可以使用人工智能来制定强大的信贷贷款申请,以实现更快、更准确的风险评估,使用机器智能来考虑申请人的性格和能力。
Underwrite 是一家金融科技公司,为信贷机构提供 AI 解决方案。underwrite.ai 使用 AI 来检测哪些申请人更有可能偿还贷款。他们的方法远远优于传统方法。
人力资源中的人工智能
Under Armour 是一家运动服装公司,借助人工智能革新了招聘方式,使求职者体验现代化。事实上,Under Armour 将其零售店的招聘时间缩短了 35%。早在 2012 年,Under Armour 就面临着日益增长的人才需求。他们平均每月收到 30000 份简历。阅读所有这些申请并开始筛选和面试过程花费的时间太长了。招聘和入职的漫长过程影响了 Under Armour 为其零售店配备充足的人员、增加产能并准备运营的能力。
当时,Under Armour 拥有所有“必备”人力资源技术,例如采购、申请、跟踪和入职的交易解决方案,但这些工具还不够有用。Under Armour 选择 HireVue是一家人力资源解决方案的 AI 提供商,提供按需和现场面试服务。结果令人惊叹;他们成功将招聘时间缩短了 35%。作为回报,他们聘用了更高质量的员工。
营销中的AI
人工智能是应对客户服务管理和个性化挑战的宝贵工具。由于应用了人工智能技术,呼叫中心管理和呼叫路由中的语音识别功能得到了改进,从而为客户提供了更加无缝的体验。
例如,音频的深度学习分析使系统能够评估客户的情绪基调。如果客户对 AI聊天机器人,系统可以将对话重新路由给真实的人工操作员来处理该问题。
除了上述三个深度学习的例子外,人工智能还广泛应用于其他领域/行业。
深度学习为何重要?
深度学习是一种强大的工具,可以使预测成为可操作的结果。深度学习在模式发现(无监督学习)和基于知识的预测方面表现出色。 大数据 是深度学习的燃料。当两者结合时,组织可以在生产力、销售、管理和创新方面获得前所未有的成果。
深度学习可以超越传统方法。例如,深度学习算法在图像分类中的准确率比机器学习算法高出 41%,在面部识别中的准确率比机器学习算法高出 27%,在语音识别中的准确率比机器学习算法高出 25%。
深度学习的局限性
现在,在这个神经网络教程中,我们将了解深度学习的局限性:
数据标签
目前大多数人工智能模型都是通过“监督学习”进行训练的。这意味着人类必须标记和分类底层数据,这可能是一项庞大且容易出错的工作。例如,开发自动驾驶汽车技术的公司正在雇佣数百人来手动注释来自原型车的数小时视频,以帮助训练这些系统。
获取大量训练数据集
事实证明,像 CNN 这样的简单深度学习技术在某些情况下可以模仿医学和其他领域专家的知识。 机器学习然而,需要的训练数据集不仅有标记,而且还要足够广泛和通用。
深度学习方法需要数千次观察,模型才能在分类任务中表现得相对出色,在某些情况下,需要数百万次观察,才能达到人类的水平。毫不奇怪,深度学习在大型科技公司中很出名;他们正在使用大数据来积累 PB 级的数据。这让他们能够创建一个令人印象深刻且高度准确的深度学习模型。
解释一个问题
大型复杂模型很难用人类的语言来解释。例如,为什么会做出特定的决定。这是某些人工智能工具在可解释性很有用或确实需要的应用领域中接受度很低的原因之一。
此外,随着人工智能应用的扩大,监管要求也可能推动对更多可解释的人工智能模型的需求。
结语
深度学习概述:深度学习是 人工智能。深度学习架构由输入层、隐藏层和输出层组成。“深度”一词意味着有两个以上的完全连接层。
神经网络种类繁多,每种架构都旨在执行特定任务。例如,CNN 在图片处理方面表现非常出色,RNN 在时间序列和文本分析方面则表现不俗。
深度学习现在活跃于不同的领域,从金融到营销、供应链和营销。大公司是第一批使用深度学习的公司,因为他们已经拥有大量数据。深度学习需要拥有广泛的训练数据集。


