Koopman算子与信息论的交叉-ICLR2026Oral给嵌入式AI控制带来了什么
Koopman 算子与信息论的交叉ICLR 2026 Oral 论文给嵌入式 AI 控制带来了什么方向AI / 嵌入式 / 机器人控制 / 物理仿真 / 论文解读做嵌入式机器人控制的工程师很可能没怎么听说过 Koopman 算子。但这套理论实际上在解决一个你每天都在碰的问题非线性动力系统的预测和控制。2026年4月23日ICLR 2026 的一篇 Oral 论文——《Information Shapes Koopman Representation》——把 Koopman 表征学习和信息论融合在了一起在软体机器人、流体仿真、全球天气预报等场景下取得了显著的性能提升。这篇文章我打算从工程角度解释清楚Koopman 算子是什么、它在控制领域为什么重要、这篇论文解决了什么问题、以及对嵌入式 AI 控制的启示。控制非线性系统的核心困难先回到最基础的地方。一个简单的线性系统状态方程是这样的x(t1) A · x(t) 其中 A 是固定的矩阵x 是状态向量这套系统很好控制给定当前状态乘以矩阵 A就知道下一时刻的状态。稳定性分析、最优控制、卡尔曼滤波这些经典方法全部建立在线性系统上。但真实世界的系统几乎都是非线性的x(t1) f(x(t)) f 是任意非线性函数一个摆锤sin(θ) 项使得方程非线性一段绳索的运动每个节点的状态互相耦合软体机器人柔性结构的变形完全非线性大气流体卡门涡街中的漩涡演化传统做法是在平衡点附近线性化雅可比矩阵但这只在邻域内有效一旦系统偏离平衡点线性化的近似就失效了。Koopman 算子非线性变线性的数学魔法1931年Bernard Koopman 提出了一个优雅的思路非线性系统在原始状态空间里是非线性的但如果把它提升到足够高维的函数空间就可以用线性算子来描述。用形式化语言说对于非线性系统 x(t1) f(x(t)) Koopman 算子 K 作用于观测函数 g(x) g(x(t1)) K · g(x(t)) 其中 g: 状态空间 → 函数空间高维嵌入 K 是线性算子在函数空间里的矩阵直觉上说原来状态空间里弯弯曲曲的轨迹换一个坐标系函数空间就变成了直线。原始状态空间 函数潜空间 线性演化 弯曲轨迹 → 直线轨迹 x₀→x₁→x₂→… φ₀→φ₁→φ₂→… 其中 φᵢ g(xᵢ) 是状态的高维嵌入如果找到了这个嵌入函数 g控制问题就变成了线性控制问题经典的 LQR、MPC 都可以直接用。为什么要用神经网络学习 g数学上Koopman 算子是无穷维的——完整描述非线性系统需要无穷多个基函数。实际工程里只能用有限维近似。过去十年研究者们开始用神经网络来学习这个嵌入函数 g把它叫做Koopman 表征学习或者深度 Koopman 方法。但这里有个关键问题有限维近似下应该保留哪些信息这篇论文解决了什么核心发现信息论视角下的权衡论文的出发点是一个被忽视的 Trade-off保留太多信息 → 难以维持线性结构嵌入空间里还是有非线性残差 压缩太多 → 丢失关键模态长期预测误差累积过去的 Koopman 学习方法通常用互信息MI来衡量保留了多少信息。但论文发现单纯最大化互信息会导致模态坍塌——模型倾向于把所有表达能力集中到少数几个主导模态细粒度的动力学特征被丢弃了。对软体机器人来说这意味着主要的刚体运动被学到了但柔性形变的细节被遗忘了。控制器就会在需要精确操控形变的时候失效。解决方案动态信息瓶颈 冯·诺依曼熵论文提出了一个统一的信息论框架训练目标包含三个部分Loss -互信息(MI) ← 时间连贯性保住预测相关的模态 冯·诺依曼熵(VNE) ← 预测充分性防止模态坍塌保持多样性 线性前向一致性 ← 结构一致性确保嵌入空间真的是线性的 重建损失 ← 信息完整性能从潜空间还原原始状态冯·诺依曼熵VNE这个项是关键。它来自量子信息论衡量的是矩阵密度算子的信息多样性——简单说如果特征值分布很均匀VNE 高如果能量集中到少数几个特征值VNE 低。在 Koopman 学习里最大化 VNE 等价于鼓励模型均匀地使用各个维度的表达能力防止模型偷懒把信息塞进少数几个维度。实验结果软体机器人控制软体机器人是 Koopman 方法最有挑战性的场景之一——硅胶材料的形变是强非线性的传统控制理论基本没有好的解法。论文在软体机器人仿真任务里预测精度显著优于多种 Koopman 基线方法。这是个质性的改进以前方法在复杂形变场景下经常出现预测漂移新方法的轨迹更稳定。卡门涡街流体仿真这是流体力学里的经典问题圆柱绕流周期性脱落漩涡。──────────────────────── ──────→ ○ →→→ 漩涡 漩涡 漩涡 ──→ ────────────────────────Koopman 方法学到这个系统的特征值应该分布在单位圆附近对应稳定的周期性演化。但过去的方法经常出现谱退化特征值飘离单位圆意味着长期预测轨迹要么发散特征值 1要么衰减为零特征值 1。论文的方法学到的特征值更密集地分布在单位圆上长期 rollout 的轨迹和真实动力学接近。ERA5 全球天气预测这是最高维的场景ERA5 是 ECMWF 的全球大气再分析数据集包含温度、湿度、风速、地势等多个物理场分辨率是全球 0.25 度网格。在这个任务上“Information Shaped Koopman” 实现了高保真的长期天气预测这对于传统方法来说是极难做到的。对嵌入式 AI 控制的启示Koopman 方法在学术界不是新东西但这篇论文的工程含义是很直接的1. 轻量化的非线性控制器用 Koopman 方法你可以做到用神经网络学习状态嵌入 g离线训练不需要实时推理嵌入后的线性控制器LQR/MPC极其轻量微秒级运行整个控制器可以部署在 STM32H7 或 Cortex-M4 这类 MCU 上训练阶段离线PC 或服务器 收集数据 → 训练 Koopman 网络 → 提取线性化矩阵 A 部署阶段嵌入式MCU 传感器数据 → 嵌入函数 g简单前向传播→ 线性状态 → LQR 控制律矩阵乘法→ 控制量输出对比端到端神经网络控制器Koopman 方法在嵌入式部署上有明显优势推理计算量更小线性控制律就是矩阵乘法稳定性有数学保证线性系统的稳定性分析是成熟理论可解释性更好特征值对应系统的模态2. 物理模拟加速在机器人仿真和数字孪生场景里高保真物理模拟有限元、流体仿真计算极慢无法实时运行。Koopman 代理模型的思路是用神经网络学到物理系统的 Koopman 表征用线性传播替代昂贵的物理求解器速度快几个数量级同时保持对物理规律的尊重因为线性结构是从真实物理数据里学出来的而不是凭空近似。局限与现实当然Koopman 方法也不是万能的嵌入维度的选择有限维近似的精度依赖于正确选择嵌入维度。维度太低近似误差大维度太高嵌入网络复杂MCU 跑不动。分布外泛化如果系统工作在训练数据覆盖之外的状态Koopman 近似可能失效。训练数据需求学习好的嵌入需要足够多、足够多样的轨迹数据。实际工程里Koopman 方法最适合动力学已知但非线性严重、需要实时控制、对稳定性有要求的场景——软体机械臂、流体驱动执行器、四旋翼无人机的姿态控制。学术界和嵌入式控制实践之间往往有很深的鸿沟但 Koopman 方法是为数不多的可以真正落地到 MCU 上的理论工具之一。这篇 ICLR Oral 的贡献让这个方向的理论基础更扎实了一步。参考资料机器之心 “ICLR 2026 OralInformation Shapes Koopman Representation”2026-04-23UCL/ICL/上海财经大学等联合研究