AI Weekly 3.30-4.5
本周 AI 快讯 | 1 分钟速览01DeepSeek 连续三天服务异常社区猜测 V4 疑似灰度上线3 月 29 日晚至 31 日反复中断最长一次近 13 小时3.55 亿用户受影响微博热搜 95 万宕机前后模型能力出现明显变化知识库截止日期更新至 2026 年多名开发者确认 Zero-shot 编码水平质变。02阿里三天三连发Qwen3.6-Plus 编程逼近 Opus视频图像双线并进Qwen3.6-PlusSWE-bench 78.8 分参数量不到GLM-5和Kimi K2.5的一半Wan2.7-Image破解 AI 标准脸支持 12 种语言超长文本渲染Wan2.7-Video全模态输入覆盖生成到续写全链路同周字节Seedance 2.0同步企业公测。03小米 MiMo 日调用量突破万亿 TokenToken Plan 上线四档订阅雷军官宣里程碑Token Plan ¥39-659 元/月无 5 小时限额支持集中消耗Max 档 ¥659/月仅含 1600M Credits折合单价高于多数国产模型 API高端定价引发讨论。04Apple Intelligence 国行意外上线又紧急撤回苹果远程删除本地模型3 月 31 日凌晨 iOS 26.4 Beta 用户发现 9.5GB 端侧模型可下载激活苹果数小时内下线功能并远程删除已下载文件称因「软件问题」上线时间待监管审批。05Claude Code 51 万行源码泄露Anthropic 清理泄露误伤 8100 个 GitHub 仓库npm 打包失误暴露 59.8MB source map三层记忆架构、自主后台代理「KAIROS」、宠物系统「Buddy」等核心设计被扒GitHub 镜像 8.4 万星 8.2 万 fork清理泄露代码时误伤约 8100 个仓库大量为与泄露无关的正常 fork。06Anthropic 宣布订阅不再覆盖 OpenClaw 等第三方工具仅给一天迁移4 月 4 日 12pm PT 起生效用户需购买额外用量包或使用 API keyClaude Code 负责人 Boris Cherny 称第三方工具对系统造成「过大压力」OpenClaw 创始人此前已加入 OpenAI。07谷歌 Gemma 4 发布首次 Apache 2.0 完全开源4 款模型覆盖 2B 到 31B旗舰 31B Arena AI 排名第 31452 EloAIME 数学从 20.8% 飙至 89.2%无 MAU 限制、无使用限制、完全商用自由累计下载超 4 亿次。08OpenAI 1220 亿美元融资创纪录估值 8520 亿同周收购 TBPN 播客亚马逊 500 亿美元、英伟达和软银各 300 亿领投月收入已达 20 亿美元周活 9 亿用户同周以低几亿美元收购科技播客 TBPN首次涉足媒体为 IPO 铺叙事。09龙虾生态周报腾讯企业版 记忆服务智谱视觉编程OpenClaw 中国镜像腾讯云「ClawPro」企业版公测「Agent Memory」四层记忆架构使准确率提升 59%智谱GLM-5V-Turbo多模态视觉编程基座发布OpenClaw 上线中国镜像站并原生捆绑 QQ Bot。01DeepSeek 连续三天服务异常社区猜测「V4」疑似灰度上线3 月 29 日晚 21:35 至 30 日上午 10:33DeepSeek 经历了自 2025 年初爆红以来最长的一次服务中断持续近 13 个小时。此后 3 月 30 日和 31 日又分别出现数小时不等的异常三天内服务反复瘫痪。3.55 亿用户受到影响微博相关话题热度一度冲至 95 万以上网页端和 App 持续提示「服务器繁忙」深度思考、长文本推理等核心功能大面积限流甚至完全不可用。截至发稿官方未发布正式故障公告或补偿方案。蹊跷的是宕机前后 DeepSeek 的模型能力出现了明显变化。多名开发者在 Zero-shot 编码测试中发现输出结构更清晰、逻辑严谨程度质变知识库截止日期也已更新至 2026 年。社区因此猜测这次中断并非单纯事故而是DeepSeek V4灰度切换的前奏部分能力或蒸馏版本可能已经替换了现有V3接口只是标签尚未更换。预测市场上「V4 是否在 4 月 15 日前发布」的看涨比例已达 65%。有传闻称V4 Lite规模达 200B 参数支持 1M token 上下文和全模态通过 mHC 架构最高可扩展至万亿参数级别但均未经官方证实。02阿里三天三连发「Qwen3.6-Plus」编程逼近 Opus视频图像双线并进三天三个赛道三款模型。4 月 2 日阿里发布Qwen3.6-Plus千问 3.6 系列的首个模型聚焦 Agent 编程能力。SWE-bench Verified 拿到 78.8 分Terminal-Bench 2.0 拿到 61.6 分在多项编程基准上匹敌Claude Opus 4.5超越GLM-5和Kimi K2.5而参数量不到后两者的一半。百万 token 上下文百炼 API 输入价格 2 元/百万 token支持 OpenAI 和 Anthropic 协议可直接在 OpenClaw、Claude Code 中切换使用。同日字节Seedance 2.0视频生成模型也面向企业开放公测主打肖像安全和版权合规视频生成赛道本周两家同步发力。4 月 1 日上线的Wan2.7-Image是阿里的图像生成与编辑统一模型核心卖点是破解 AI「标准脸」支持从骨相到五官的像素级捏脸全新「调色盘」功能可一键提取参考图色调比例并精准迁移超长文本渲染覆盖 12 种语言最高输出一页 A4 论文的排版内容。4 月 3 日跟进的Wan2.7-Video覆盖文本、图像、视频、音频全模态输入打通生成、编辑、复刻、续写、驱动全链路。三款模型均已上线百炼 API 和通义千问 AppQwen3.6系列后续还将发布更强的 Max 版本和小尺寸开源模型。03小米 MiMo 日调用量破万亿 Token「Token Plan」上线四档订阅4 月 3 日雷军在微博宣布4 月 2 日 MiMo 大模型调用量突破 1 万亿 Token。从 3 月 19 日三款模型全球发布到破万亿刚好两周。MiMo-V2-Pro在 Text Arena 评测中闯入全球前五仅次于 Anthropic、OpenAI 和谷歌三家。同日小米推出 MiMo Token Plan统一 Credit 点数体系单次订阅覆盖MiMo-V2-Pro、MiMo-V2-Omni、MiMo-V2-TTS三款模型。Token Plan 分四档Lite ¥39/月6000 万 Credits、Standard ¥99/月2 亿、Pro ¥329/月7 亿、Max ¥659/月16 亿首购 88 折。MiMo-V2-Omni按 1 倍消耗MiMo-V2-Pro按 2 倍超过 256K 上下文按 4 倍MiMo-V2-TTS限时免费。没有 5 小时滚动窗口限制所有额度支持集中消耗用户自己掌控节奏。但定价不算便宜Max 档 ¥659/月约合 90 美元16 亿 Credits 折算下来的 token 单价高于 DeepSeek、Kimi 等国产模型 API。04「Apple Intelligence」国行意外上线苹果远程删除已下载的本地 AI 模型一个不该出现的选项在 3 月 31 日凌晨悄悄出现在了部分国行 iPhone 的设置页面。更新了 iOS 26.4 Beta 的用户发现「Siri」变成了「Apple 智能与 Siri」点进去后系统提示可以下载一个 9.5GB 的端侧 AI 模型部分功能确实可以激活使用。知名苹果爆料人马克·古尔曼很快证实这是意外上线苹果尚未获得中国监管部门的审批。数小时内苹果紧急下线了该功能。真正引发争议的是苹果的处理方式。据多位用户反馈苹果不仅撤回了推送更新还远程删除了已经下载到本地的 AI 模型文件。你下载到手机里的东西苹果随时可以删掉。苹果官方回应称系「软件问题」导致其他地区的模型被短暂开放下载已迅速修复。中国大陆目前是 Apple Intelligence 唯一未上线的主要市场上线时间「依监管部门审批情况而定」。据此前爆料国行版将采用百度文心一言做底层语言处理、阿里通义千问负责合规审查的混合架构技术对接已完成系统接口已打通9.5GB 的模型包都已经挂在服务器上唯一在等的就是监管部门的审批文件。05「Claude Code」51 万行源码泄露Anthropic 清理泄露误伤 8100 个 GitHub 仓库59.8MB51.2 万行 TypeScript一个被意外打入 npm 包的 source map 文件。3 月 31 日凌晨Claude Code v2.1.88 的 npm 发布中包含了完整的源码映射安全研究员 Chaofan Shou 在 UTC 08:23 公开披露帖子浏览量突破 2800 万。数小时内 GitHub 上出现了重建的完整镜像仓库累计获得 8.4 万星和 8.2 万 fork。Anthropic 发言人确认这是「人为打包失误非安全漏洞」并表示没有涉及或泄露任何敏感用户数据或凭证。被扒出的核心设计包括解决「上下文熵」问题的三层记忆架构MEMORY.md作为轻量指针索引常驻上下文主题文件按需加载原始对话记录仅通过 grep 检索而不回读名为「KAIROS」的自主后台代理可在用户离开时持续运行执行索引构建、记忆合并和代码库一致性检查还有一个完整的宠物养成系统「Buddy」包含扭蛋机制和稀有度分级几乎确定是 4 月 1 日的彩蛋功能。据 TechCrunch 报道Anthropic 随后向 GitHub 提交 DMCA 下架通知但范围严重失控约 8100 个仓库被波及其中大量是 Anthropic 自己公开仓库的正常 fork与泄露代码无关。Anthropic 承认是操作失误已撤回绝大部分通知仅保留对 1 个仓库及其 96 个 fork 的下架。安全公司 Straiker 警告攻击者现在可以精确研究 Claude Code 的上下文管道针对性构造越狱载荷盲试时代结束了。06Anthropic 宣布订阅不再覆盖「OpenClaw」等第三方工具仅给一天迁移Claude Code 负责人 Boris Cherny 周五晚间在社交媒体发帖宣布从明天起砍掉第三方工具的订阅覆盖。4 月 4 日中午 12 点太平洋时间起Claude 订阅将不再覆盖 OpenClaw 等第三方工具的用量。想继续用要么购买额外的用量包限时折扣要么切换到 API key 付费。从公告到生效留给用户的迁移窗口只有一天。Anthropic 发言人对 Business Insider 表示第三方工具对系统造成了「过大的压力」通过订阅接入的 OpenClaw 实质上是在用聊天级别的价格跑多租户自动化任务属于「订阅套利」。时间点耐人寻味。OpenClaw 创始人 Peter Steinberger 不久前刚加入 OpenAI据他透露他和 OpenClaw 基金会董事 Dave Morin 曾尝试说服 Anthropic 推迟成功延后了一周。Steinberger 正在引导 OpenClaw 用户转向 OpenAI 的GPT-5.x Codex系列作为默认引擎。这条消息叠加此前的额度危机Max 用户 19 分钟烧完 5 小时额度、3 月促销结束、token 计数 bug 三重叠加Anthropic 的开发者口碑正在快速消耗。免费午餐结束了多数用户表示理解收费逻辑但一天迁移期的做法让社区反感远大于价格本身。07谷歌「Gemma 4」发布首次 Apache 2.0 完全开源AIME 数学 20.8% 到 89.2%Codeforces 编程 ELO 从 110 到 2150。4 月 2 日谷歌在 Cloud Next 大会上发布Gemma 4这是 Gemma 家族首次采用 Apache 2.0 协议无 MAU 限制、无使用限制、商用魔改二次分发全部自由。四款模型覆盖从树莓派到数据中心的完整算力场景E2B2.3B 参数和 E4B4.5B面向端侧26B MoE128 专家激活 8 个实际推理参数仅 3.8B和 31B Dense 面向服务器。旗舰 31B 在 Arena AI 排名第 3Elo 1452仅次于两个体量远超自己的闭源模型。自初代发布以来Gemma 累计下载超 4 亿次社区衍生版本超 10 万个。Gemma 4的架构引入了交替注意力机制局部滑动窗口与全局全上下文交替切换和双 RoPE 位置编码使 256K 上下文在长距离时不掉质量。所有模型原生支持图像和视频输入、函数调用和结构化 JSON 输出小模型还额外支持音频输入覆盖 140 多种语言。从跑分看Gemma 4在部分基准上略逊Qwen 3.5、GLM-5和Kimi K2.5但综合模型质量、本地部署便利性、多模态能力和许可证透明度Gemma 4在质量、本地部署和许可证三者的平衡上很难找到对手。Hugging Face、Kaggle、Ollama、llama.cpp、MLX 等框架已全部首日支持。08OpenAI 1220 亿美元融资创纪录估值 8520 亿同周收购「TBPN」播客亚马逊 500 亿美元英伟达 300 亿软银 300 亿。三家巨头联手撑起了人类历史上最大的单笔融资。3 月 31 日 OpenAI 宣布完成 1220 亿美元融资投后估值 8520 亿美元超过英特尔、AMD、IBM 市值之和。微软继续参与黑石、富达、红杉、淡马锡、ARK Invest 等跟投。首次引入散户投资者通过银行渠道募集超 30 亿美元。亚马逊 500 亿中有 350 亿以 OpenAI IPO 或实现 AGI 为对赌条件。OpenAI 披露月收入已达 20 亿美元ChatGPT 周活用户 9 亿企业业务占比超 40%预计年底前与消费者业务持平。同周 4 月 2 日OpenAI 以「低几亿美元」的价格收购了科技播客 TBPNTechnology Business Programming Network首次涉足媒体。TBPN 由前科技创始人 John Coogan 和 Jordi Hays 主持每天在 YouTube 直播三小时被称为「科技界的 SportsCenter」扎克伯格、纳德拉、Altman 是常驻嘉宾。2025 年广告收入 500 万美元2026 年预计超 3000 万。TBPN 将并入 OpenAI 战略部门向 Chris Lehane 汇报Altman 承诺保持编辑独立。但批评者指出一家估值 8520 亿的 AI 公司在 IPO 前收购一个频繁讨论自己和竞争对手的媒体平台1926 年 RCA 创建 NBC 卖收音机的故事正在 AI 时代重演。09龙虾生态周报腾讯「ClawPro」 记忆服务智谱视觉编程OpenClaw 中国镜像一周之内龙虾生态同时补齐了四块拼图。4 月 2 日腾讯云发布企业版 OpenClaw「ClawPro」并开启公测。4 月 3 日紧跟发布「龙虾」记忆服务 TencentDB Agent Memory自研四层渐进式记忆架构从 L0 原始对话全量保存到 L1 自动提取事实偏好、L2 按项目聚类场景分块、L3 形成稳定用户画像逐层提炼。以插件形态无缝集成至 Lighthouse 和 ClawPro免费一键开启。评测数据显示接入后 OpenClaw 总回答准确率达 76.10%较原生记忆提升近 59%。视觉层方面4 月 2 日智谱发布GLM-5V-Turbo一款从预训练阶段就深度融合视觉与文本的多模态 Coding 基座。它能看懂设计稿、截图和网页界面并据此生成可运行代码深度适配 Claude Code 和龙虾场景。本土化方面OpenClaw 4 月 1 日上线了官方中国镜像站告诉龙虾「registry 使用中国镜像站」即可切换3 月 31 日发布的 v2026.3.31 版本原生捆绑 QQ Bot 作为内置渠道插件。企业级、记忆层、视觉层、本土化四个方向同周推进龙虾正在从极客玩具变成企业级基础设施。