【AI使用热潮兴起】按头让员工猛猛用AI的硅谷巨头开始“玩不起”了。此前AI用得越多似乎就代表员工越先进公司越有未来。但当员工真的开始狂用AI企业很快发现自己有没有逼出来更高生产力还未可知账单先膨胀了。一边开始为Token账单头疼一边又怕自己在AI竞赛里落后硅谷正在面对一个自己亲手制造的难题。一切要从去年说起虽然“鼓励员工拥抱AI”的现象早已有之但2025年突然变成了不由分说的浪潮。最明显的就是硅谷大厂带头按头员工多用AI。微软开发者工具业务的高管潘正磊Julia Liuson表示“使用AI已经不再是可选项而是每个职位、每个层级的核心能力。”彼时她在内部邮件中要求管理者在评估员工表现时考虑其使用内部AI工具的情况其中包括GitHub Copilot。亚马逊则一边表示未来部分岗位可能因AI而减少一边告诉员工应对方式是“拥抱AI”。去年夏天CEO安迪·贾西Andy Jassy向全体员工发送了一封关于生成式AI的邮件在邮件中表示随着公司大规模部署生成式AI和智能体部分现有岗位需要的人会减少在未来几年里AI带来的效率提升预计会减少亚马逊的企业员工总数。贾西还直接要求员工主动拥抱AI“了解AI参加研讨会和培训尽可能使用和试验AI参与团队头脑风暴思考如何更快、更大范围地为客户创新以及如何用更精简的团队完成更多工作。”这段话可以视为亚马逊内部AI动员的公开起点。不仅是几家巨头在2025年高调“全员AI”几乎是某种时尚。Shopify提出“反射式使用AI”的概念表示这现在是公司的基础要求。所谓“反射式使用”意思是“像条件反射一样用AI”员工遇到任务时首先应该想到能否借助AI完成。公司还要求团队在申请增加人手和资源之前必须先回答一个问题为什么这项工作不能由AI完成多邻国更是公开表示公司将转向“AI优先”能用AI的不用外包能用AI的不招新人在员工评价中也会考察其使用AI的情况。这种趋势一定程度上也延宕到今年。今年3月黄仁勋公开表示假如英伟达年薪50万美元的工程师一年没有消耗至少25万美元的AI Token自己会感到“非常担忧”。当被问到英伟达是否准备每年为工程团队花费约20亿美元购买Token时黄仁勋的回答是“我们正在努力。”去年底在英伟达内部举行的一次全员大会上黄仁勋质问曾建议团队“少用AI”的高管“你们疯了吗”并明确要求员工尽可能用AI自动化所有可以自动化的任务同时向员工保证AI不会夺走他们的饭碗。要说哪家公司最激进Meta当仁不让。2025年11月Meta首席人力官贾内尔·盖尔Janelle Gale宣布从2026年起“AI驱动的影响力”将成为员工的核心期待正式进入绩效评价。到了今年4月Meta内部又出现了一块名为“Claudeonomics”的排行榜它追踪超过8.5万名员工消耗的Token数量列出前250名并授予“Token传说”“缓存大师”等称号。短短30天内榜单记录的Token消耗量超过60万亿个AI使用变成了一场相互厮杀的内部游戏。BCG在《AI Radar 2026》报告中调查了2360名企业高管其中包括六百多名CEO。结果显示94%的组织表示即使AI投资在2026年无法立即带来回报它们也会继续投入。报告预计企业用于AI的投入占营收比例将从2025年的约0.8%提高至2026年的约1.7%几乎翻倍。72%的CEO表示自己已经是公司AI决策的主要负责人一半CEO甚至认为如果AI投入无法取得成效自己的职位都会受到影响。对这些公司来说AI成为CEO亲自下注的一场转型重要的是不能显得自己比同行慢一步。【巨头纷纷踩刹车】然而这场AI使用大赛还没热闹多久硅谷巨头们就开始踩刹车了。最先打自己脸的正是此前要求员工“尽可能使用和试验AI”的亚马逊。今年5月底亚马逊被曝关闭了一项名为“KiroRank”的内部排行榜这个由员工自行制作的榜单用来显示员工使用AI工具时消耗的Token数量。据《金融时报》报道一些员工开始使用亚马逊内部AI智能体平台MeshClaw运行非必要任务以提高自己的AI使用数据。MeshClaw原本可以代替员工发起代码部署、分拣邮件或与Slack等应用交互但当Token消耗被放进排行榜员工运行这些智能体的目的就可能从完成真正需要的工作变成单纯“刷榜”。这种行为甚至有了一个专门的名字Tokenmaxxing意思就是尽可能刷高Token消耗量。虽然亚马逊没有披露员工究竟运行了哪些无效任务但在相关社区讨论中有用户已经直接设想过这种“冲榜”方式把MeshClaw挂在后台让它持续对源代码包进行静态分析Token自然会不断累积。Hacker News上还有用户称自己认识的员工在公司开始考核“花掉多少Token”后干脆让不同AI智能体互相接收对方输出、循环运行因为真正需要大量Token的工作根本没有那么多。亚马逊最后不得不叫停这场比赛。公司高级副总裁戴夫·特雷德韦尔Dave Treadwell在内部提醒员工“请不要为了使用AI而使用AI。使用AI是为了帮助你解决客户问题、解决业务问题、实现创新。”这距离贾西亲自鼓动员工“拥抱AI”还不到一年。亚马逊不是唯一一个开始收手的巨头。今年5月中旬微软开始取消内部大部分Claude Code许可证。巨头之下中小公司也撑不住了。去年4月多邻国CEO路易斯·冯·安Luis von Ahn还宣布公司转向“AI优先”但一年后他承认公司已经撤回了这项考核标准。整整一年后他在播客中表示员工曾经向公司提出质疑是不是为了显得公司足够“AI优先”大家就必须为了使用AI而使用AI最终多邻国不再将员工是否使用AI作为正式绩效指标。冯·安表示真正重要的是员工能不能把工作做好。AI适合某些任务但并不适合所有任务公司也不应该强迫员工在不适合的地方硬用AI。【AI使用成本高】曾经迫不及待让员工“拥抱AI”的公司当然没有放弃AI它们只是终于发现员工不用AI是一个问题但员工为了排名、绩效和自保而狂烧Token可能是另一个更“贵”的麻烦。“造AI”很烧钱“用AI”也同样如此。一个典型是Uber今年4月就花光了全年的AI预算。遥想去年12月Uber向约5000名工程师开放了Anthropic旗下的AI编程工具Claude Code。前文提到今年5月微软开始取消内部大部分Claude Code许可证微软对内解释称这是为了将工具链统一到自家的Copilot CLI。但据The Verge报道这同时也是一项财务决定。Claude Code授权将在6月底也就是微软当前财年结束前被大规模关闭以便在新财年开始前削减一部分运营成本。而更值得注意的是在微软推动员工迁回Copilot CLI之际Copilot本身的收费方式也正在改变。今年4月GitHub宣布从6月1日起面向企业和团队用户的GitHub Copilot付费方案将转向基于使用量的计费模式。过去这些客户主要按照订阅套餐和高级请求次数付费新方案下每个套餐只包含一定额度的GitHub AI Credits超出额度后需要按照实际使用量继续付费。这笔费用按照员工使用过程中消耗的输入Token、输出Token和缓存Token计算。GitHub在官方公告中表示随着Copilot开始承担分析、修改和迭代等更复杂的智能体任务不同任务的算力消耗差异越来越大因此需要改用按实际使用量计费。Anthropic也采取了类似的计费逻辑。目前Claude企业版的座席费只覆盖平台访问权限并不包含实际使用量。员工使用Claude、Claude Code和Cowork时产生的每一个Token都要按照标准API价格另外计费。更直接的是Anthropic官方帮助文档明确提醒企业在新的按使用量计费方案下团队没有单独分配好的Token额度。一名员工大量使用AI并不会减少其他员工可用的额度只会让组织最终收到的账单更高。旧的固定座席方案也将在续约时逐步转入这种按使用量计费的模式。OpenAI的动作稍有不同。它没有宣布将所有企业方案统一改为按Token收费但在今年4月为ChatGPT Business和Enterprise团队推出了Codex按量付费选项企业可以不用支付固定座席费而是根据实际使用量为Codex付费。与此同时更强模型的调用成本也明显更高。今年4月进入API的GPT - 5.5调用成本相比GPT - 5.4进一步提高在标准API价格下其输入和输出Token单价均达到后者的两倍。【AI使用效果存疑】当公司要求员工“尽可能使用AI”AI厂商却把费用精确挂到每一次调用和每一个Token上事情就开始变得微妙了。问题还不只是AI贵更直击灵魂的叩问是当“全司AI向前冲”效果究竟好吗早就有人看出其中的逻辑漏洞让工程师以Token消耗量论英雄和以谁花钱更多来给营销团队成员打分有什么区别全行业都已经在使用AI但真正能把这种使用转化成利润的企业目前仍然只是少数。麦肯锡在《2025年AI现状》报告中调查了1993名企业受访者。结果显示只有39%的受访者表示AI已经对整个企业层面的息税前利润也就是EBIT产生了影响。麦肯锡还专门定义了一类“AI高绩效企业”既认为AI已经为公司创造显著价值又认为AI对企业EBIT的贡献达到至少5%。符合这两个条件的企业只占全部受访者的约6%。此外去年7月研究机构METR公布了一项随机对照实验。16名有经验的开源软件开发者在自己熟悉的代码库中完成246项真实任务其中一部分任务允许使用AI工具另一部分则不能使用AI。在实验开始前开发者预计AI可以让他们完成任务的时间缩短24%。实验结束后即便已经亲自使用过这些工具他们仍然认为AI让自己的工作速度提高了20%。但实际结果完全相反使用AI后这些开发者完成任务所需的时间反而增加了19%。这项研究针对的是熟悉大型开源代码库的资深开发者当然不能直接证明AI编程对所有人、所有任务都没有帮助。但它至少说明了员工感觉自己在用AI提效不等于效率真的提高了。公司看到AI使用量增长也不等于公司真的获得了与之匹配的产出。Token消耗变成绩效考核标准和“觉悟检测器”的时候闹剧的基调就已经被定下了。AI当然不会因此退潮但把Token消耗速率当成转型进度、把“多用AI”当成绩效答案的阶段可能已经快结束了。