深度学习篇---归一化
一、什么是 Z-score 归一化Z-score 归一化是一种常见的数据预处理方法目的是将不同量纲、不同取值范围的数据变换为均值为 0、标准差为 1的分布。公式x原始数据μ数据的均值σ数据的标准差转换后的数据称为Z 分数表示原始数据距离均值有多少个标准差。二、Z-score 归一化的特点1. 不改变数据分布形态只改变数据的位置均值和尺度标准差不改变原始分布的相对形状如偏度、峰度等不变。2. 对异常值敏感均值和标准差受极端值影响较大若数据中存在离群点Z-score 归一化效果可能变差。3. 输出范围无固定区间与 Min-Max 归一化不同Z-score 归一化后的数据范围不固定在 [0,1] 或 [-1,1]一般约 99.7% 的数据落在 [-3,3] 之间假设近似正态分布。4. 保留相对关系原始数据的大小顺序、距离的相对关系在欧氏距离意义下按比例缩放会被保留。三、应用场景场景说明机器学习算法对基于距离的算法KNN、SVM、K-Means、PCA非常必要防止特征量纲影响模型正则化与梯度下降使损失函数等高线更圆加快收敛速度特征可比性消除不同单位、不同尺度的影响便于综合比较异常检测Z-score 绝对值过大可视为异常如z 3四、优缺点总结✅ 优点不受数据取值范围限制适用于近似正态分布的数据保留原始数据的分布形态许多统计模型和机器学习模型假设数据服从标准正态分布Z-score 可满足该要求❌ 缺点要求知道或能计算均值和标准差对实时流数据不友好对异常值敏感输出范围不确定不适用于必须限定输出区间的场景如图像像素值 0–255五、与 Min-Max 归一化的简单对比特性Z-score 归一化Min-Max 归一化输出范围均值 0标准差 1无固定上下界固定区间如 [0,1]对异常值敏感性敏感非常敏感极端值压缩正常值适用分布正态或近似正态任意分布但需注意边界值是否保留零值变换后通常不为零可能保留 0若原数据有 0六、Mermaid 总结框图以下框图总结了 Z-score 归一化的核心概念、公式、优缺点及应用场景。七、其他常见的归一化一、Min-Max 归一化公式输出范围通常[0, 1]也可以映射到任意区间 [a, b]特点将数据线性压缩到固定区间对异常值极其敏感一个极大值会压缩其余正常数据保留原始数据的相对大小关系适用场景需要严格限制输出范围的情况如图片像素处理、神经网络输入层二、MaxAbs 归一化公式输出范围[-1, 1]特点不移动/中心化数据仅缩放保留数据的正负号对异常值敏感受最大绝对值影响适用场景稀疏数据避免破坏零值、已中心化的数据三、RobustScaler鲁棒归一化公式IQR 四分位距即 Q3 - Q1输出范围无固定区间特点对异常值不敏感使用中位数和分位数受极端值影响远小于 Z-score 和 Min-Max适用场景数据包含大量离群点四、单位向量归一化L2 归一化公式输出范围每个样本的 L2 范数为 1向量长度为 1特点将每个样本行缩放为单位向量而不是逐特征缩放保留方向信息消除长度影响适用场景文本分类TF-IDF 后、聚类余弦相似度、需要比较向量方向的场景五、均值归一化Mean Normalization公式输出范围通常[-1, 1]特点结合了中心化减均值和缩放除极差比 Min-Max 多了中心化比 Z-score 分母不同适用场景需要数据有正有负且范围可控六、对数/幂变换非线性归一化对数变换x′log(1x)处理长尾分布Box-Cox 变换x′xλ−1λ1使数据更接近正态分布特点非线性改变分布形态压缩大值适用场景偏态分布、异方差性数据七、对比总结表方法公式核心输出范围对异常值敏感是否中心化典型应用Z-score(x - μ)/σ无固定≈99.7%在[-3,3]敏感✅距离类模型、PCAMin-Max(x - min)/(max - min)[0,1]或自定义非常敏感❌图像、神经网络MaxAbsx / max(|x|)[-1,1]敏感❌稀疏数据RobustScaler(x - median)/IQR无固定不敏感✅含异常值的数据L2 归一化x / |x|₂单位向量范数为1视情况❌文本、余弦相似度均值归一化(x - μ)/(max - min)[-1,1] 附近非常敏感✅需中心化且范围可控对数变换log(1 x)(0, ∞) → (0, ∞)不敏感压缩大值❌长尾分布八、Mermaid 总结框图九、选择建议数据情况推荐方法近似正态分布无大异常值Z-score需要严格输出范围如 [0,1]Min-Max有较多异常值RobustScaler稀疏数据含很多0MaxAbs需要比较向量方向文本/推荐L2 归一化长尾分布对数变换 → 再 Z-score神经网络输入无严格要求Min-Max 或 Z-score通常 Z-score 收敛更快