ML02 数据归一化

数据归一化,对机器学习模型是非常重要的。做了很多漂亮的特征的工作之后,可能就会自然而然的加速模型的训练速度,提升结果准确率。

归一化

是什么

  1. 归一化将数据变小
  2. 把有量纲表达式变为无量纲表达式

为什么

  1. 加速梯度下降求解最优解的速度
  2. 提高结果精确度

怎么做

常用的归一化方法分类:

  1. 直线型方法。极值法和标准差法
  2. 折线型方法。三折线法
  3. 曲线型方法。半正态分布

参考文章:

  1. https://blog.csdn.net/pipisorry/article/details/52247379
  2. http://www.cnblogs.com/LBSer/p/4440590.html