入门 | 初学者必读：解读14个深度学习关键词_技术资料_物联网_中国计算网——工业互联网一站式服务平台—

　　在轴突末端与相邻树突形成的突出间隙中，扩散着一种叫做神经传递素的化学物质，他实现了神经传递。神经中最关键的部分，是神经通过树突接收到刺激，处理后，通过轴突末梢传输出去。在末梢处会经过突触间隙，然后到达许多接受神经的树突。该过程将重复进行。

　　4.感知机

　　感知机是一个简单的线形二进制分类器。它接收输入和与其相连的权重(表示输入变量的相对重要性)，将它们结合来产生输出。输出接下来被用于分类。感知机已经存在很长一段时间了，最早的使用可追溯到1950年代，其中一个也是应用到早期的人工神经网络中。

　　5.多层感知机

　　一个多层感知机(MLP)是由几个含有全邻接层的感知机组成，形成一个简单的前馈神经网络(见下)。这个多层感知器在非线性激活函数上有许多好处，这些都是单层感知器不具备的。

　　6.前馈神经网络

　　在非周期性连接的神经网络结构中，前馈神经网络是最简单的形式。最初的人工神经网络中，前馈网络中的信息从输入节点单方向前进，而后通过所有隐藏层，到达输出节点，不存在任何周期。前馈网络不同于之后的连接构成有向循环的周期性网络架构(见下文)。

　　7.循环神经网络

　　和上文所提到的前馈神经网络不同，循环神经网络的连接构成有向循环。这种双向流动允许内部时间状态表示，继而允许序列处理。并且值得注意的是，它提供了用于识别语音和手写的必要能力。

　　8.激活函数

　　在神经网络中，激活函数通过组合网络的加权输入来产生判定边界输出结果。激活函数的范围从标识(线性)到Sigmoid函数(逻辑或软步长)，双曲线(正切)和超越。为了采用反向传播(见下文)，神经网络必须使用可微的激活函数。

　　9.反向传播

　　我所见过的对反向传播的定义中，最基本、简洁的定义是数据科学家Mikio L. Braun在Quora上给出的答案。我在此列出原文，以防破坏这份答案简洁的完美。

　　反向传播只是在个别错误上进行梯度下降。通过比较对神经网络预期输出的预测，而后计算相对于神经网络的权重的误差梯度。然后得出了权值空间中减小误差的方向。

　　我将它列在这里。

　　10.成本函数

　　在训练神经网络时，必须评估网络输出的正确性。众所周知，预期上正确的训练输出数据和实际的训练输出是可比拟的。成本函数便能测量实际和训练输出之间的差异。实际和预期输出之间的零成本将意味着训练神经网络成为可能。但这显然是理想化的。

　　所以，通过什么机制来调整成本函数，以实现将其最小化的目标呢?

　　11.梯度下降

　　梯度下降法是求函数局部极小值的一个优化算法。虽然它不能保证全定义域内的最小值，但梯度下降对于难以通过分析 (例如通过将导数取0获得最优解)求得精确解的问题十分有用。

　　正如上文所述，在神经网络的情况中，随机梯度下降用于对网络参数做出知情调整，以达到使成本函数最小化的目标，从而使网络的实际输出迭代性地愈加接近在培训期间的预期输出。这种迭代最小化采用微积分，即微分。在训练步骤之后，网络权重根据成本函数的梯度和网络的当前权重接收更新，使得下一个训练步骤的结果可以更加接近正确值(通过更小的成本函数测量)。反向传播(关于错误的反向传播)便用于将这些更新以小份的形式送到网络。

　　12.梯度消失问题

　　由于反向传播使用链式规则来计算梯度(通过微分)，朝向n层神经网络的“前”(输入)层将使其修改的梯度以一个较小的值乘以n次方，然后再更新之前的固定值。这意味着梯度将指数性减小。 n越大，网络将需要越来越多的时间来有效地训练。

　　13.卷积神经网络

　　卷积神经网络(CNN)通常与计算机视觉和图像识别相关联，并采用卷积的数学概念来模仿生物视觉皮层的神经连接网格。

　　首先，正如 Denny Britz 所描述一样，卷积可以被认为是在图像的矩阵表示之上的滑动窗口(见下文)。

2/3 首页上一页 1 2 3 下一页尾页