一、核心观点概览1. AI 发展时间线预测核心预测1-2 年内2026-2027 年AI 系统将具备数据中心里的天才国家country of geniuses in a data center的能力90% 置信度通用人工智能AGI将在 10 年内2035 年前实现5% 不确定性可能因地缘政治、公司动荡等外部因素延迟 10 年具体能力里程碑领域时间预测置信度编码可验证任务1-2 年极高软件开发自动化几乎已接近高非可验证任务科学发现、创意写作存在不确定性中等通俗理解就像玩游戏升级AI 已经从小学生水平升级到大学生水平再过一两年就要变成博士水平了。原文引用“到 26 年底、27 年初我们将拥有 AI 系统……能够操作当今人类进行数字工作时使用的各种界面智力水平媲美甚至超越诺贝尔奖得主并具备与物理世界交互的能力。”“我认为在编码方面……我认为一两年内就能实现。要说 10 年后还不能实现端到端的编码自动化那是绝对不可能的。”2. “大计算量假设”Big Blob of Compute Hypothesis达里奥自 2017 年提出的核心理论认为只有7 个关键因素影响 AI 进展原始计算量raw compute— 电脑的脑力有多大数据数量quantity of data— 给 AI 看多少东西来学习数据质量和分布quality and distribution— 学的东西要五花八门不能只学一种训练时长how long you train for— 让 AI 学多久可扩展的目标函数objective function that can scale to the moon— 给 AI 设定的学习目标好不好归一化/数值稳定性normalization/conditioning— 让计算过程不出错第七个因素未明确详述— 一些技术细节核心论点“所有那些巧妙的技巧、方法以及’我们需要新方法才能做某事’这类想法——其实都不太重要。”通俗理解就像养孩子不是靠什么速成秘诀而是给他足够的营养计算量让他多读书多见世面数据给他足够的时间成长训练时长给他好老师好目标目标函数理论延续性“这就是当时的假设也是我至今仍然坚持的假设。我没见到太多与这个假设不符的现象。”3. 缩放定律Scaling Law的延续预训练缩放继续有效仍在提供增益从 GPT-1 到 GPT-2 的过渡显示了泛化能力的突破强化学习RL缩放与预训练呈现相同的对数线性增长从数学竞赛AIME到代码任务再到更广泛的任务原文引用“我们在强化学习中看到了与预训练相同的缩放规律……模型的表现与训练时长呈对数线性关系。”GPT 演进历程模型训练数据关键发现GPT-1 之前标准语言建模基准泛化能力差GPT-1同人小说等文学文本约 10 亿词窄分布泛化有限GPT-2全网爬取Common Crawl、Reddit 链接开始获得泛化能力通俗理解就像学习一样一开始只学课本GPT-1后来去整个互联网学习GPT-2才真正变得聪明。4. AI 学习与人类学习的类比达里奥提出一个四层学习谱系进化几百万年 ← → 人的一辈子学习 ← → 临时抱佛脚 ← → 本能反应 ↓ ↓ ↓ 预训练 上下文学习 即时反应关键洞察“预训练不像人类学习的过程。它介于人类学习过程和人类进化过程之间。”详细解释大语言模型LLM的预训练介于人类进化和人类长期学习之间模型比人类大脑更空白blank slate人类大脑从进化中获得大量先验知识而模型从随机权重开始百万级上下文长度使模型能在上下文内进行类似工作中学习的能力通俗理解人类像是一台预装了很多软件的电脑出厂设置AI 像是一台只有操作系统的电脑但学习能力超强样本效率差异预训练使用万亿级 token人类一生接触的词汇量远少于此但一旦训练完成模型在长上下文如 100 万 token内的学习能力非常强5. 经济扩散理论核心观点AI 技术的发展速度 ≠ 经济扩散速度通俗理解技术变厉害 ≠ 马上改变所有人的生活时间框架阶段时间特征技术发展1-2 年天才国家出现经济扩散开始1-5 年不确定收入开始涌入全面经济影响更长时间取决于监管、生物发现周期等为什么扩散需要时间“新冠疫苗够厉害了吧从研发到人人都打上还是花了 1 年半。脊髓灰质炎疫苗 50 年前就发明了但现在还有一些地方没消灭这个病。”关键约束因素监管流程如临床试验、FDA 审批改变管理change management企业采用新技术的惯性基础设施限制历史类比“我们最终让每个人都接种了疫苗。但花了一年时间。花了一年半时间……脊髓灰质炎疫苗已经有了 50 年但我们仍在努力消灭非洲最偏远地区的这种病。”通俗理解就像给你一台超级厉害的游戏机但你还要学会怎么用买游戏卡带说服爸妈允许你玩等朋友也买了才能联机这些都需要时间扩散速度判断“它将比世界上任何技术都快但它仍然有自己的极限。”“不是立即也不慢——比以前的技术快但它有自己的极限。”6. Anthropic 的商业战略数据中心采购策略核心困境“如果我在 2027 年底购买一万亿美元的计算量而实际收入只有 8000 亿那么世界上没有任何力量、没有任何对冲手段能阻止我破产。”通俗理解就像你要开奶茶店你听说明年奶茶会超级火但你不确定是明年火还是后年火如果你借钱买了 100 台机器但客人没来那么多你就破产了所以你先买 50 台稳妥一点策略选择负责任扩展responsible scaling不过度押注选择支持数千亿而非万亿美元的计算量接受部分需求无法满足的风险避免破产风险两难选择对比选择后果买太少电脑AI 不够用赚不到钱研发受限买太多电脑如果 AI 赚钱没那么快公司会破产达里奥的选择宁可少买一点也不要冒破产的风险收入增长轨迹2023 年0 → 10 亿美元年化收入 2024 年10 亿 → 数十亿 2025 年预计继续 10 倍增长行业计算量预测年份计算量GW对应成本202510-15 GW约 1500 亿美元202630-40 GW约 3000-4000 亿美元2028约 100 GW约 1 万亿美元2029约 300 GW约 3 万亿美元盈利能力模型理想状态50% 计算用于训练50% 用于推理推理毛利率 50%盈利能力取决于需求预测准确性“当你低估了将得到的需求时就会盈利当你高估了将得到的需求时就会亏损。”7. 软件工程的自动化光谱达里奥区分了多个层次强调这些是完全不同的基准通俗理解很多人听说AI 能写 90% 的代码就以为程序员要失业了。达里奥说完全不是这样自动化层次层次描述状态1️⃣AI 写 90% 的代码行✅ 已完成Anthropic 内部及下游用户2️⃣AI 写 100% 的代码行 接近生产力与 90% 有质的区别3️⃣AI 完成 90% 的完整任务包括编译、测试、部署、写文档 接近4️⃣AI 能做任何程序员现在做的事100% 现有 SWE 任务⏳ 未来5️⃣公司不需要那么多程序员了90% SWE 需求减少⏳ 更远关键洞察“人们以为我在说我们将不需要 90% 的软件工程师。这两者完全是天壤之别。”“即使今天 100% 的软件工程师任务都由模型完成也不意味着软件工程师会失业。他们可以做新的更高层次的工作。”通俗理解就像洗碗机洗碗机能洗 90% 的碗 ≠ 厨房不需要人了人还要做饭、摆盘子、清理桌面程序员也一样AI 写代码但人还要决定做什么功能检查 AI 写得对不对跟团队沟通历史类比编译器写了几乎所有代码行但软件工程师需求未消失参考农业自动化历程在《技术的青春期》一文中论述8. 计算机使用Computer Use能力通俗理解Anthropic 做了一个能让 AI 像人一样用电脑的功能。进展数据首次发布时约一年半前约 15% 任务完成率很笨目前65-70% 任务完成率还可以但不够可靠需要跨越信任点trust point才能大规模部署应用场景示例视频编辑AI 需要能够全面控制电脑屏幕访问历史对话记录查看社交媒体Twitter上的观众反馈与工作人员沟通学习用户品味和剪辑历史自主执行剪辑工作举个例子假设你让 AI 帮你剪视频它要会看你的历史视频要会看观众在社交媒体上说了什么要会理解你喜欢什么风格然后才能剪出你满意的视频当前障碍“即使你看到了计算机使用能力我仍然不会把真正的工作交给它们……那种失败率即使它们能完成十分之七的工作我仍然会找真人来做。”通俗理解就像请了个实习生能干 70% 的活但你不敢把重要工作全交给它。9. 行业竞争动态自我改进循环AI 写 AI通俗理解这是一个很厉害的概念——用 AI 来制造更好的 AI进展更好的 AI → 帮助构建更好的下一代 AI目前观察到 15-20% 的开发速度提升6 个月前仅 5%正在加速“六个月前可能只有 5%。所以它开始滚雪球了……我认为它正变得越来越快。”通俗理解就像你学习一开始自己做题后来有个 AI 家教帮你AI 家教越来越厉害你学得越来越快你学得越快又能造出更厉害的 AI 家教这就是滚雪球效应Anthropic 内部使用 AI 的情况工程师已经不自己写底层代码CUDA了全交给 AIGPU 内核、芯片设计都由 Claude 完成观察到显著的生产力提升竞争格局所有主要 AI 公司都在使用 AI 进行内部开发优势是雪球式积累的从 10% → 20% → 25% → 40%…但无法完全阻止竞争对手使用自己的模型10. 对工作中学On-the-Job Learning的看法当前状态研发RD是特例有外部记忆库代码库、文档其他职业需要 6 个月积累的隐性知识更难替代视频编辑案例“他们花 6 个月建立这种理解……我们应该何时期待 AI 系统能够即时获得这种能力”通俗理解这是一个还没完全解决的问题一个视频剪辑师工作 6 个月会了解老板的喜好、公司的风格这些知识不是写在文档里的是潜移默化学会的AI 现在还不擅长这个技术路径长上下文学习百万级 token 上下文可容纳 6 个月的工作记忆持续学习continual learning模型在工作过程中持续更新通俗理解就像新同学转学到你们班一开始什么都不懂几个月后知道哪个老师严厉、哪个同学好相处AI 也需要这个融入的过程进展预测“我认为在下个月或两个月内我们很有可能会解决这个问题。”工程挑战需要存储完整的 KV 缓存GPU 内存限制训练时上下文长度与服务时不一致导致的性能下降11. 关于适应性/摩擦Friction的讨论通俗理解你可能会想“AI 这么好为什么公司不马上都用起来”核心观点“摩擦是非常真实的它并不专门源于 AI 模型的局限性。”企业采用新技术的流程法务部审查“这个东西合法吗”安全部审查“这个东西安全吗”保险和合规审查领导层审批“这东西值得花这么多钱吗”向团队解释和推广“这个东西怎么用”通俗理解就像你想养只宠物你要查资料了解怎么养要说服爸妈同意要准备笼子、食物要花时间和它熟悉这些都需要时间不是一天能搞定的。Anthropic 的产品采用速度Claude Code 等产品的采用速度比一般企业软件快但仍需要时间不是无限快“即使数据中心里存在通用人工智能或’天才国家’它的传播速度会很快——可能每年 3 倍、5 倍或 10 倍的增长——但永远不会是无限快的。”二、关键数据汇总事情数字什么意思Anthropic 收入增长每年 10 倍去年赚 1 块今年赚 10 块明年赚 100 块行业计算量增长约 3 倍/年当前趋势计算机使用任务完成率初始约 15%约 2024 年中计算机使用任务完成率当前65-70%2025 年初AI 辅助开发速度提升15-20%原来 5 小时干完现在 4 小时干完AI 辅助开发速度提升6 个月前约 5%2024 年中通用人工智能置信度10 年内90%几乎肯定会发生编码通用人工智能1-2 年极高置信度-2030 年前万亿美元收入“难以想象不会发生”-每吉瓦计算量成本100-150 亿美元/年-三、理论框架总结1. 技术进展 vs 经济扩散┌─────────────────────────────────────────────────────────────────┐ │ 技术进步快 经济扩散较慢但仍是史上最快 │ │ ↓ ↓ │ │ 1-2 年天才国家出现 1-5 年收入开始涌入 │ │ 5-10 年全面经济影响 │ └─────────────────────────────────────────────────────────────────┘2. 计算量采购的金发姑娘原则买太少 刚刚好 买太多 ↓ ↓ ↓ 错过机会 支持数千亿规模 破产风险 收入不足 接受部分需求 如果需求延迟 研发受限 无法满足 无法挽回3. 可验证性任务谱系高可验证性 ←————————————————————————→ 低可验证性 ↓ ↓ 编码、数学 科学发现、创意写作 进度快、置信度高 进度不确定4. 软件工程自动化层次层次 1: 90% 代码由 AI 编写 ✅ 已实现 层次 2: 100% 代码由 AI 编写 接近 层次 3: 90% 端到端任务 接近 层次 4: 100% 现有 SWE 任务 ⏳ 未来 层次 5: 90% SWE 需求减少 ⏳ 更远四、达里奥最坚信的几件事大家都低估了 AI 的进展“最令人惊讶的是……公众缺乏对我们离指数增长终点有多近的认识。大家还在吵那些老掉牙的政治问题没意识到 AI 马上就要改变一切了。”不要盲目扩张“不是无限快的扩散……我们仔细思考过这个问题并做出了平衡。宁可少赚点也不要冒险破产。”计算量才是王道“所有那些巧妙的技巧……都不太重要。只有少数几件事是真正重要的。那些花里胡哨的技巧不重要重要的是有多少电脑、多少数据。”AI 赚钱是肯定的“我很难想象在 2030 年之前不会出现数万亿美元的收入。2030 年前 AI 行业肯定能赚上万亿美元这几乎是一定的。”行业竞争本质“我们都处于一种滚雪球式的动态中……10%、20%、25%、40%……”五、潜在风险与不确定性1. 有些事 AI 还搞不定科学发现、创意写作等领域的自动化路径不如编码清晰但已有从可验证到不可验证的泛化证据通俗理解写代码、做数学题 → 很快就能完全自动化搞科学发现、写小说 → 还不太好说2. 意外事件5% 概率“也许……所有的芯片制造厂都被导弹炸毁了……你可以构想一个有 5% 概率的世界在那里事情被延迟了 10 年。”通俗理解比如打仗把芯片厂炸了比如大公司内部出大问题3. 需求预测风险计算量采购的时机错误可能导致公司破产即使技术预测正确商业预测错误也会致命通俗理解以为明年能赚很多钱结果没赚那么多买了太多电脑还不起钱4. 工作中学瓶颈某些职业需要长期隐性知识积累长上下文技术可能解决这个问题但存在工程挑战通俗理解有些工作需要混资历比如销售要知道哪些客户好说话这些知识很难教给 AI5. 扩散速度限制企业采用新技术需要时间监管流程如临床试验无法无限加速六、重要原文摘录关于通用人工智能时间线“基于基本假设……我们有 90% 的把握实现我所谓的’数据中心里的天才国家’。”关于编码自动化“我认为在编码方面……我认为一两年内就能实现。要说 10 年后还不能实现那是绝对不可能的。”关于经济扩散“治愈所有疾病需要多长时间……你必须进行生物学发现。你必须制造新药。你必须通过监管流程。”关于 Anthropic 战略“我们买了很多……与市场上最大的玩家购买的量相当。但如果你问我为什么没有签署从 2027 年中期开始的一万亿美元的算力合约……因为那样会破产。”关于公众认知“对我来说这简直太疯狂了……人们还在谈论那些同样陈旧的、敏感的政治议题……而此时我们已接近指数增长的终点。”七、结论与启示对 AI 行业的启示计算量竞赛仍将持续缩放定律继续有效计算量是核心竞争要素需求预测是关键风险过度投资可能导致破产时机把握至关重要自我改进循环正在加速AI 辅助开发的比例从 5% 增至 20%形成正反馈对企业的启示提前布局 AI 采用扩散速度虽有限制但比历史任何技术都快关注可验证任务编码、数据分析等领域将最先被自动化隐性知识仍是壁垒需要长期积累的工作短期内难以完全自动化对个人的启示1. 技能转型窗口期1-2 年内编码能力将大幅贬值学编程还有用但要学怎么指挥 AI 写代码而不是自己一行行写2. 什么能力不会被 AI 取代做决定的能力跟人沟通的能力发现新问题的能力创意、战略规划等非可验证任务短期安全创意和审美3. AI 协作能力是关键能够有效利用 AI 的人将保持竞争优势什么时候要开始学用 AI现在越早学会用 AI未来越有优势八、一句话总结AI 很快就会变得超级聪明1-2 年会写代码、会用电脑、会做很多现在只有人能做的事。但它真正改变世界还需要更长时间5-10 年因为公司适应、法律允许、大家学会用都需要时间。对个人来说越早学会用 AI未来越有优势。