梳理数百个问题后，我总结出10个数据科学面试必掌握概念……(数据,网络,web开发)

梳理数百个问题后，我总结出10个数据科学面试必掌握概念……

导读：本文共3328.5字符，通常情况下阅读需要11分钟。同时您也可以点击右侧朗读，来听本文内容。按键盘←（左） →（右）方向键可以翻页。

摘要：接下来，请跟着小编一起来学习吧！1.激活函数(Activation Functions)对神经元或节点有基本了解之后，你就会发现激活函数像电灯开关一样，能够决定是否激活神经元。激活函数有几种类型，但是最流行的激活函数是整流线性单元函数，也称为ReLU函数。ReLU函数优于S型函数和双曲正切函数函数，因为它执行梯度下降的速度更快。请注意，在图像中，当x(或z)很大时，斜率非常小，这会显著减缓梯度下降... ...

音频解说

卷积神经网络(CNN)是一种神经网络，它提取输入信息(通常是图像)，按照重要程度将图像的不同特征进行分类，然后输出预测。CNN优于前馈神经网络的原因在于，它可以更好地捕获整个图像的空间(像素)依赖性，这意味着它可以更好地理解图像的组成。

CNN使用一种称为“卷积”的数学运算。维基百科这样定义卷积：对两个函数的数学运算产生了第三个函数，该函数表示一个函数的形状如何被另一个函数修改。因此，CNN在其至少一层中使用卷积代替通用矩阵乘法。

5.循环神经网络(Recurrent Neural Networks)

梳理数百个问题后，我总结出10个数据科学面试必掌握概念……

循环神经网络(RNN)是另一种神经网络，能够摄取各种大小的输入信息，因此可与序列数据配合使用，效果极佳。RNN既考虑当前输入也考虑先前给定的输入，这意味着相同的输入在技术上可以基于先前的给定输入产生不同的输出。

从技术上讲，RNN是一种神经网络，其中节点之间的连接沿时间序列形成有向图，从而使它们可以使用其内部存储器来处理可变长度的输入序列。

6.长短期记忆网络(Long Short-Term Memory Networks)

长短期记忆网络(LSTM)是一种递归神经网络，可弥补常规RNN的一大劣势：短期记忆。

具体来说，如果序列太长，即滞后时间大于5-10个步长，则RNN倾向于忽略先前步骤中提供的信息。例如，如果我们将一个段落输入RNN，则它可能会忽略该段落开头提供的信息。为了解决这个问题，LSTM诞生了。

7.权重初始化(Weight Initialization)

权重初始化的要点是保证神经网络不会收敛到无效解。如果权重全部初始化为相同的值(例如零)，则每个单元将获得完全相同的信号，并且每一层的输出都是一样的。

因此，你要随机初始化权重，使其接近零，但不等于零。用于训练模型的随机优化算法就要达到这样效果。

8.批量梯度下降和随机梯度下降(Batch vs. Stochastic Gradient Descent)

批量梯度下降和随机梯度下降是用于计算梯度的两种不同方法。

批量梯度下降仅使用整个数据集计算梯度。特别是对于较大的数据集，它要慢得多，但对于凸或平滑误差流形来说效果更好。

在随机梯度下降的情况下，一次使用单个训练样本来计算梯度。因此，它的计算速度更快且成本更低。然而，在这种情况下达到全局最优值时，它趋向于反弹。这会产生好的解决方案，但不是最优解决方案。

9.超参数(Hyper-parameters)

超参数既是调节网络结构的变量，也是控制网络训练方式的变量。常见的超参数包括：

模型架构参数，例如层数，隐藏单元数等…
学习率(alpha)
网络权重初始化
时期数(定义为整个训练数据集中的一个周期)
批量
其他

10.学习率(Learning Rate)

学习率是神经网络中使用的超参数，每次更新模型权重时，神经网络都会控制该模型响应估计的误差调整模型的数量。

如果学习率太低，则模型训练将进行得非常缓慢，因为每次迭代中对权重进行的更新最少。因此，在达到最低点之前需要进行多次更新。如果将学习率设置得太高，则由于权重的急剧更新，会对损失函数造成不良的发散行为，并且可能无法收敛。

若想继续学习更多相关知识，请继续关注亿速云网站，小编会继续努力为大家带来更多实用的文章！

本文：梳理数百个问题后，我总结出10个数据科学面试必掌握概念……的详细内容，希望对您有所帮助，信息来源于网络。

梳理数百个问题后，我总结出10个数据科学面试必掌握概念……(数据,网络,web开发)

目录

13 人围观 / 0 条评论 ↓快速评论↓

搜索

最新文章

猜你喜欢

特价优惠

标签

流量统计