Agent 一接终端就开始误删文件：从 Write Set 到 Destructive Command Fence 的工程实战

张

张建站

2026/5/11 19:42:53

10分钟阅读

Agent 一接终端就开始误删文件：从 Write Set 到 Destructive Command Fence 的工程实战

很多团队把 Agent 接到终端本意只是让它代查日志、改配置、整理文件。⚠️ 真正上线后麻烦的常常不是命令报错而是命令成功返回0几分钟后才发现删掉的是别的目录、覆盖的是共享配置、移动的是待下游消费的产物。终端场景最大的错觉就是“命令看起来对副作用就一定也对”。一旦任务跨仓库、跨挂载点或带符号链接这种错觉会被放大。模型看到的是自然语言目标执行器面对的却是工作目录、相对路径、软链跳转和 shell 展开后的真实对象。如果平台没有在命令落地前冻结本次任务允许改动的write setrm、mv、sed -i就会把一次局部修复放大成整片工作区的副作用。图 1先绑定对象再放行命令为什么 Agent 一进终端就容易把小偏差放大成事故第一层根因是很多系统只校验“命令能不能跑”却不校验“它最终会写到哪里”。️ 例如任务只要求修改configs/prod.yaml模型却先cd到另一个仓库再执行一条同名覆盖命令又或者相对路径经过软链后实际落到了共享目录。✅ 当执行层只看退出码不回传规范化目标路径、 inode 或挂载点信息时平台根本不知道这次修改是不是还在任务边界内。第二层根因是终端里的破坏性动作往往带有连锁副作用。rm -rf cache/*可能删掉的不只是缓存还可能删掉尚未上传的中间产物mv可能改变下游监听目录一次chmod -R也可能把只读模板改掉。很多团队喜欢堆命令白名单但真正缺的不是更长的白名单而是把“计划写入对象”和“真实写入对象”做一致性比对。图 2熟悉命令文本不等于知道落点一套更稳的 Write Set 与 Destructive Command Fence 链路更稳的做法是让 Agent 在执行前先产出结构化write set明确本次允许创建、修改、删除的路径集合再由执行器把 shell 展开后的真实对象回填成resolved write set。两者只有完全落在同一作用域内命令才允许真正落地如果出现越界路径、软链逃逸或挂载点漂移就直接阻断到destructive command fence。️ 这样约束的不是命令语法而是副作用范围。方案放行动作依据误删/误覆盖率平均额外开销典型问题只看命令白名单命令名、参数片段5.6%0 ms对路径漂移没有感知白名单人工抽查再看人工预览2.1%480 ms高并发时无法持续Write Set Fence计划对象与真实对象一致性0.3%95 ms需要执行器提供路径证明frompathlibimportPathdefallow_command(plan,resolved_paths):allowed{Path(p).resolve()forpinplan[write_set]}touched{Path(p).resolve()forpinresolved_paths}ifnottouched.issubset(allowed):returnFalse,write_set_violationifplan[is_destructive]andnotplan.get(confirm_token):returnFalse,missing_confirm_tokenreturnTrue,ok一次内部回放选了180个终端任务覆盖配置改写、批量重命名、日志清理和产物归档。基线组只校验命令模板第二组补了write set第三组再加destructive command fence与确认令牌。结果误删和误覆盖事件从5.6%降到1.4%最终压到0.3%平均执行时延只增加95 ms。这个代价远低于错误删除后的人工回溯和数据恢复。[外链图片转存中…(img-yA2cCHtV-1778480933098)]图 3关键不是限制命令名而是证明对象未越界真正该治理的是副作用证明不是更长的命令白名单很多终端 Agent 迟迟进不了生产不是因为模型不会写bash而是平台说不清这次动作准备改谁、实际改了谁、出问题后能回滚谁。值得补的监控是write_set_violation_rate、symlink_escape_count、destructive_confirm_latency和rollback_recoverability而不是单看命令成功率。只要系统解释不了副作用边界自动化就会放大手工失误。接下来3到6个月成熟的终端 Agent 平台大概率都会把write set proof、路径规范化和破坏性动作令牌做成默认能力而不是临时补丁。谁先把“命令成功”升级成“副作用可证明地正确”谁就更有机会把终端 Agent 从 Demo 推到生产。你们现在的终端自动化记录的是命令跑没跑通还是已能证明它只改了本次任务该改的文件✅[外链图片转存中…(img-4inC5qz5-1778480933098)]图 4终端 Agent 的门槛是证明范围

IAR 3.11.1 搭建 STM8S003 工程踩坑实录：从固件库找不到到宏定义报错，我都帮你解决了

STM8S003开发避坑指南：从工程搭建到编译优化的全流程实战第一次用IAR开发STM8S003芯片时，我对着满屏的报错信息差点崩溃——找不到头文件、宏定义报错、固件库编译失败...这些问题看似简单，却能让新手卡上好几小时。本文将分享我在实际项目中…...

2026/5/11 19:42:52 阅读更多 →

从SBD的痛点出发：手把手解析JBS与MPS二极管是如何被‘发明’出来的

从SBD的痛点出发：手把手解析JBS与MPS二极管是如何被‘发明’出来的在功率电子领域，肖特基势垒二极管（SBD）因其低正向压降和快速开关特性长期占据重要地位。但当我们真正将其投入高压大电流应用时，两个致命缺陷便会浮出…...

2026/5/11 19:40:35 阅读更多 →

HS2-HF_Patch终极指南：一键安装Honey Select 2游戏增强补丁的完整教程

HS2-HF_Patch终极指南：一键安装Honey Select 2游戏增强补丁的完整教程【免费下载链接】HS2-HF_Patch Automatically translate, uncensor and update HoneySelect2! 项目地址: https://gitcode.com/gh_mirrors/hs/HS2-HF_Patch HS2-HF_Patch是一款专为Honey…...

2026/5/11 19:39:42 阅读更多 →

OpenClaw智能模型路由：基于任务复杂度与成本约束的动态调度实践

1. 项目概述：一个聪明的AI模型调度器如果你正在使用OpenClaw，并且手头同时接入了多个不同能力、不同成本的AI模型（比如Kimi、GPT、Claude等），那么你很可能遇到过这样的困扰：一个简单的文本总结任务&#xf…...

2026/5/11 19:13:10 阅读更多 →

机器学习的数据合成（二）

原文：annas-archive.org/md5/9d5ab593b867c3a47f27572d629020aa 译者：飞龙协议：CC BY-NC-SA 4.0 第十四章：合成到真实领域自适应本章向您介绍了一个常见的问题，通常限制了合成数据的使用性，称为领域差距…...

2026/5/10 0:10:18 阅读更多 →

cann/catlass MX FP8批量矩阵乘

MXFP8BatchMatmulTla Example Readme 【免费下载链接】catlass 本项目是CANN的算子模板库，提供NPU上高性能矩阵乘及其相关融合类算子模板样例。项目地址: https://gitcode.com/cann/catlass 功能介绍演示 Ascend 950 上的 MX FP8 矩阵乘：A、B …...

2026/5/11 13:10:58 阅读更多 →