2026.04.05-04.06随记·

张

张建站

2026/4/7 3:23:42

10分钟阅读

1、DL1、为什么ReLU函数在x0的点不可导也能作为激活函数做梯度下降答ReLU 在 x0 确实不可导但深度学习里根本不要求激活函数处处可导只要求 “几乎处处可导”“能算梯度” 就够了。x0 点是这样处理的遇到 x0直接把梯度强行设为 0 或 1对整体优化几乎没有影响框架PyTorch / TensorFlow内部就是这么干的# 伪代码 if x 0: grad 1 elif x 0: grad 0 else: grad 0 # 随便给一个就行2、一些术语小批量随记梯度下降mini-batch stochastic gradient descent SGD全连接神经网络Fully Connected Neural Network,FCNN又称为前馈神经网络Feedforward Neural Network或多层感知机Multilayer PerceptronMLP全连接神经网络的层数不看输入层也就是得 - 13、常见的激活函数需要掌握只做了解4、训练误差与泛化误差模型在训练数据集上计算得到的误差称为训练误差training error模型应用在同样从原始样本的分布中抽取的无限多数据样本时模型误差的期望称为泛化误差5、模型复杂性当有简单的模型和大量的数据时期望泛化误差与训练误差都很大而且两者相接近当有复杂的模型和更少的样本时预计训练误差会下降但泛化误差会增大对于神经网络来说我们认为需要更多训练迭代的模型比较复杂而需要早停early stopping的模型即较少训练迭代周期就不那么复杂影响模型泛化的因素• 可调整参数的数量。当可调整参数的数量有时称为自由度很大时模型往往更容易过拟合• 参数采用的值。当权重的取值范围较大时模型可能更容易过拟合(权重取值大意味着模型在空间中是一个极度崎岖、陡峭的函数。它对输入的微小变化噪音极为敏感稍微偏离训练集一点点输出就会谬以千里。)• 训练样本的数量。6、欠拟合过拟合模型复杂度高训练数据集多正常拟合模型复杂度高训练数据集小过拟合模型复杂度低训练数据集多欠拟合模型复杂度低训练数据集小正常拟合7、权重衰减L2正则化抑制过拟合的手段8、Dropout抑制过拟合的手段Dropout 也是一种抑制过拟合的手段它的做法是在学习的过程中随机删除神经元的方法在神经网络上做法就是设置这些神经元的激活值为0。训练时随机选出隐藏层的神经元然后将其删除被删除的神经元不再进行信号的传递。目的为了防止网络过度依赖某些神经元采用ReLU激活会造成某些神经元死掉训成一根筋何时开何时关训练时开测试 / 推理 / 部署时关。具体流程训练期间做激活值修正称为 inverted dropout在每次训练迭代中dropout 会随机禁用网络中的部分神经元例如 50%。这实际上会创建一个新的、更小的神经网络其中包含更少的神经元。但是该层的激活值需要除以 1-dropout 率以便该隐藏层的输出响应的期望不变测试期间不用修改如果训练期间不对激活值修正那么就在推理测试期间修正乘以1-dropout 率9、网络参数对称如果我们将隐藏层的所有参数初始化为 w c会发生什么初始权重相同前向输出绝对一样反向传播算出的梯度绝对一样更新后的新权重依然一样。所有神经元学一样的东西失去表达能力。参数初始化方法随机初始化、Xavier 初始化、Kaiming 初始化2、PyTorch1、d2l.use_svg_display() # 使用svg来显示图片这样清晰度高一些。只要调用一次整个文件、整个会话里的所有图都会变成 SVG 高清格式

RNN-LSTM-BiLSTM学习

NLP-AHU-146一、NNLM在学习RNN(循环神经网络)前，我们需要先掌握NNLM(神经网络语言模型)，掌握NNLM后可以很便捷地以增量方式理解RNN。这是一个NNLM，它包括输入层，embedding(嵌入)，隐藏层与输出层，目的是学习…...

2026/4/7 3:23:41 阅读更多 →

项目介绍 Python实现基于蚁群算法（ACO）的三维无人机航迹规划（含模型描述及部分示例代码）专栏近期有大量优惠还请多多点一下关注加油谢谢你的鼓励是我前行的动力谢谢支持加油谢谢

Python实现基于蚁群算法（ACO）的三维无人机航迹规划的详细项目实例更多详细内容可直接联系博主本人或者访问对应标题的完整博客或者文档下载页面（含完整的程序，GUI设计和代码详解） 还请多多点一下关注加油谢谢 …...

2026/4/7 3:22:53 阅读更多 →

如何创建一人机器人公司？2026年版建议

谁不想拥有自己的公司呢，不再看脸色，只跟客户一手交钱一手交货，大概是每个科研人的必经之路。机器人硬件工程师Mustafa提出Solo Robotic Company建议，在此基础上，我补充了一点建议，希望对各位有所启发。来源：Mustafa@oprydai 核心主题 1/不要试图建一家通用的机器人…...

2026/4/7 3:21:49 阅读更多 →

基于MATLAB的轮轨接触几何计算GUI程序设计与实现

1-148 matlab的带有gui的轮轨接触几何计算程序基于matlab的带有gui的轮轨接触几何计算程序,根据不同的踏面和轨头，计算不同横移量下面的接触点位置。程序已调通，可直接运行有没有人蹲过现成的、换文件就能换轮轨、不用啃半天赫兹接触前的几何方程、结果还…...

2026/4/5 0:00:53 阅读更多 →

【CPP 深度学习】PyTorch On CPP 系列课程第一章 01 ：入门与环境搭建【Ai Infra 3.0】[PyTorch CPP LibTorch 硕士研一课程]

章节 1: PyTorch ON Cpp入门与环境搭建本章将为PyTorch的使用做好准备。我们首先会配置必要的软件和环境。接着，主要内容将转向PyTorch的核心数据结构：张量。您将学习如何： 使用常用包管理器安装PyTorch。配置适合PyTorch项目的开发环境…...

2026/4/5 0:05:12 阅读更多 →

4DGL-uLCD-SE：轻量级嵌入式GUI驱动框架

1. 项目概述4DGL-uLCD-SE 是一个面向嵌入式系统设计的轻量级、可移植的图形用户界面（GUI）驱动框架，专为 4D Systems 公司推出的 uLCD 系列智能显示模块（如 uLCD-320GL, uLCD-70DT, uLCD-43PT 等）而构建。该库并非直接操…...

2026/4/5 0:34:09 阅读更多 →

电源逆变结构设计与选型指南

1. 电源逆变结构概述作为一名硬件工程师，我在过去十年里设计过各种电源转换电路。电源逆变结构是电力电子领域的核心内容，它决定了电能转换的效率、可靠性和成本。简单来说，电源逆变就是将直流电(DC)转换为交流电(AC)的过程，这在太…...

2026/4/5 0:34:18 阅读更多 →

更多精彩文章