深度学习篇---归一化

张

张建站

2026/7/30 22:28:26

10分钟阅读

一、什么是 Z-score 归一化Z-score 归一化是一种常见的数据预处理方法目的是将不同量纲、不同取值范围的数据变换为均值为 0、标准差为 1的分布。公式x原始数据μ数据的均值σ数据的标准差转换后的数据称为Z 分数表示原始数据距离均值有多少个标准差。二、Z-score 归一化的特点1. 不改变数据分布形态只改变数据的位置均值和尺度标准差不改变原始分布的相对形状如偏度、峰度等不变。2. 对异常值敏感均值和标准差受极端值影响较大若数据中存在离群点Z-score 归一化效果可能变差。3. 输出范围无固定区间与 Min-Max 归一化不同Z-score 归一化后的数据范围不固定在 [0,1] 或 [-1,1]一般约 99.7% 的数据落在 [-3,3] 之间假设近似正态分布。4. 保留相对关系原始数据的大小顺序、距离的相对关系在欧氏距离意义下按比例缩放会被保留。三、应用场景场景说明机器学习算法对基于距离的算法KNN、SVM、K-Means、PCA非常必要防止特征量纲影响模型正则化与梯度下降使损失函数等高线更圆加快收敛速度特征可比性消除不同单位、不同尺度的影响便于综合比较异常检测Z-score 绝对值过大可视为异常如z 3四、优缺点总结✅ 优点不受数据取值范围限制适用于近似正态分布的数据保留原始数据的分布形态许多统计模型和机器学习模型假设数据服从标准正态分布Z-score 可满足该要求❌ 缺点要求知道或能计算均值和标准差对实时流数据不友好对异常值敏感输出范围不确定不适用于必须限定输出区间的场景如图像像素值 0–255五、与 Min-Max 归一化的简单对比特性Z-score 归一化Min-Max 归一化输出范围均值 0标准差 1无固定上下界固定区间如 [0,1]对异常值敏感性敏感非常敏感极端值压缩正常值适用分布正态或近似正态任意分布但需注意边界值是否保留零值变换后通常不为零可能保留 0若原数据有 0六、Mermaid 总结框图以下框图总结了 Z-score 归一化的核心概念、公式、优缺点及应用场景。七、其他常见的归一化一、Min-Max 归一化公式输出范围通常[0, 1]也可以映射到任意区间 [a, b]特点将数据线性压缩到固定区间对异常值极其敏感一个极大值会压缩其余正常数据保留原始数据的相对大小关系适用场景需要严格限制输出范围的情况如图片像素处理、神经网络输入层二、MaxAbs 归一化公式输出范围[-1, 1]特点不移动/中心化数据仅缩放保留数据的正负号对异常值敏感受最大绝对值影响适用场景稀疏数据避免破坏零值、已中心化的数据三、RobustScaler鲁棒归一化公式IQR 四分位距即 Q3 - Q1输出范围无固定区间特点对异常值不敏感使用中位数和分位数受极端值影响远小于 Z-score 和 Min-Max适用场景数据包含大量离群点四、单位向量归一化L2 归一化公式输出范围每个样本的 L2 范数为 1向量长度为 1特点将每个样本行缩放为单位向量而不是逐特征缩放保留方向信息消除长度影响适用场景文本分类TF-IDF 后、聚类余弦相似度、需要比较向量方向的场景五、均值归一化Mean Normalization公式输出范围通常[-1, 1]特点结合了中心化减均值和缩放除极差比 Min-Max 多了中心化比 Z-score 分母不同适用场景需要数据有正有负且范围可控六、对数/幂变换非线性归一化对数变换x′log⁡(1x)处理长尾分布Box-Cox 变换x′xλ−1λ1使数据更接近正态分布特点非线性改变分布形态压缩大值适用场景偏态分布、异方差性数据七、对比总结表方法公式核心输出范围对异常值敏感是否中心化典型应用Z-score(x - μ)/σ无固定≈99.7%在[-3,3]敏感✅距离类模型、PCAMin-Max(x - min)/(max - min)[0,1]或自定义非常敏感❌图像、神经网络MaxAbsx / max(|x|)[-1,1]敏感❌稀疏数据RobustScaler(x - median)/IQR无固定不敏感✅含异常值的数据L2 归一化x / |x|₂单位向量范数为1视情况❌文本、余弦相似度均值归一化(x - μ)/(max - min)[-1,1] 附近非常敏感✅需中心化且范围可控对数变换log(1 x)(0, ∞) → (0, ∞)不敏感压缩大值❌长尾分布八、Mermaid 总结框图九、选择建议数据情况推荐方法近似正态分布无大异常值Z-score需要严格输出范围如 [0,1]Min-Max有较多异常值RobustScaler稀疏数据含很多0MaxAbs需要比较向量方向文本/推荐L2 归一化长尾分布对数变换 → 再 Z-score神经网络输入无严格要求Min-Max 或 Z-score通常 Z-score 收敛更快

Multisim仿真演示：相位补偿电容从1uF到10uF对系统响应速度的影响

Multisim仿真解析：相位补偿电容如何重塑系统动态响应 1. 相位补偿的本质与工程意义当我们谈论反馈系统中的相位补偿时，实际上是在讨论如何驯服一个潜在的"电子野兽"。就像驯兽师需要理解动物的本能反应一样，工程师必须掌握电路对快…...

2026/7/30 22:27:15 阅读更多 →

Unity DOTS渲染瓶颈突破：3天将10万实体FPS从28提升至142的5步量化调优法

第一章：Unity DOTS渲染瓶颈突破：3天将10万实体FPS从28提升至142的5步量化调优法在真实项目中，我们面对一个由10万个动态移动的DOTS实体组成的开放场景——每个实体携带Transform, RenderMesh, Material, 和自定义Velocity组件。初始帧率稳定在…...

2026/5/8 21:11:29 阅读更多 →

当大模型学会‘思考’算法：拆解EoH如何用‘思想+代码’协同进化，超越Google的FunSearch

当大模型学会‘思考’算法：拆解EoH如何用‘思想代码’协同进化超越传统方法在算法设计领域，一个令人振奋的转折点正在到来——大型语言模型不再仅仅是代码生成的工具，而是开始参与算法本身的创造过程。这种变革的核心在于，我们不…...

2026/5/8 21:11:30 阅读更多 →

D2DX：三步实现《暗黑破坏神2》高清宽屏体验的终极指南

D2DX：三步实现《暗黑破坏神2》高清宽屏体验的终极指南【免费下载链接】d2dx D2DX is a complete solution to make Diablo II run well on modern PCs, with high fps and better resolutions. 项目地址: https://gitcode.com/gh_mirrors/d2/d2dx 你是否还在…...

2026/7/29 17:35:40 阅读更多 →

解决全部报错！OpenClaw Windows适配优化+网关修复教程

🦞教程适配：OpenClaw v2.7.9 | 适配 Windows10/11、macOS 双系统核心亮点：提供全程可视化图形操作界面，自动补齐全套运行依赖，数据独立存储于本地设备，兼容多款主流大模型，并采用轻量化的 45.7…...

2026/7/29 22:41:47 阅读更多 →

【计算机Python毕业设计案例】基于 Python 的智慧校园学生课堂考勤监督管理平台学生请假审批与考勤台账管理系统设计(程序+文档+讲解+定制)

博主介绍：✌️码农一枚 ，专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者，博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围：&am…...

2026/7/29 22:41:49 阅读更多 →

终极免费指南：如何彻底解锁Wand专业版功能，实现手机远程控制游戏修改

终极免费指南：如何彻底解锁Wand专业版功能，实现手机远程控制游戏修改【免费下载链接】Wand-Enhancer Advanced UX and interoperability extension for Wand (WeMod) app 项目地址: https://gitcode.com/GitHub_Trending/we/Wand-Enhancer 还在为…...

2026/7/29 22:41:50 阅读更多 →