notebook.community
Edit and run
为了更加方便得处理数值型特征,往往需要
[0, 1]
这样做的目的是为了使得数据更加贴合模型假设和减少设计矩阵(每行表示一个样例,每列一维特征)的条件数(进一步避免zigzag pa).
在已知特征最大最小值的情况下通过缩放除去量纲放到[-1, 1]区间
[-1, 1]
其中$maxAbs(X)$指的是取值的绝对值的最大值
在已知特征最大最小值的情况下通过缩放除去量纲并缩放到[0, 1]区间.
Z-score又叫做stardard score, normal score.借鉴了正态分布转化为标准正态分布的思想,使得特征的统计量变为均值为0,标准差为1.
其中$\mu$为均值,$\sigma$为标准差
sklearn中的sklearn.preprocessing提供了多个归一化函数用于对特征进行归一化,主要有:
sklearn.preprocessing
In [ ]: