AI动态简报之算力基建篇(2026.05.30)
⚡ 第1条NVIDIA Blackwell Ultra发布FP8训练性能达H100的2.3倍核心信息NVIDIA在Computex 2026上正式发布Blackwell Ultra数据中心GPUFP8精度下AI训练性能达到HopperH100的2.3倍同时发布自研Arm架构Vera CPU直接冲击Intel在数据中心的市场地位。性能/价格对比Blackwell Ultra集成192GB HBM3e内存内存带宽达8TB/s相较H100的80GB HBM3内存容量提升140%带宽提升60%。Vera CPU与Blackwell GPU协同设计算力密度大幅提升。对开发者/企业的影响训练万亿参数大模型的成本将进一步下降但NVIDIA的高端垄断格局短期仍难撼动替代方案AMD MI350、Google TPU 8的性价比窗口正在打开。信息来源IT之家 | 2026.05.25⚡ 第2条Google TPU 8登场推理性价比达GPU的4倍核心信息Google发布第八代TPU分为训练版TPU 8t和推理版TPU 8i。TPU 8i在混合专家模型MoE推理场景下单位美元推理性能约为同级别GPU的4倍直接服务Gemini大模型的降本增效。性能/价格对比TPU 8i单Pod含1152个单元配备288GB HBM、384MB片上SRAM带宽19.2TB/s对比同级别NVIDIA GPU推理成本降低约60-70%。对开发者/企业的影响使用Google Cloud的AI开发者将获得显著成本优势Anthropic等大模型厂商已有意向采用TPU替代部分GPU算力NVIDIA的推理市场份额面临实质挑战。信息来源西部数码 | 2026.05.25⚡ 第3条国产AI芯片出货量市占率突破41%昇腾DeepSeek V4生态闭环形成核心信息2026年国产AI芯片出货量约165万张在国内市场份额攀升至41%。DeepSeek V4于4月发布原生支持华为昇腾950全栈生态首次实现国产大模型国产芯片的完整闭环性能和性价比接近NVIDIA方案。性能/价格对比DeepSeek V4昇腾950组合的训练成本约为NVIDIA H100方案的55-65%且不受出口管制影响自主可控优势明显。2026年国产芯片出口管制压力反而加速了国内替代进程。对开发者/企业的影响国内AI企业采购算力的选择大幅增加昇腾生态的成熟意味着卡脖子风险显著降低政府和国企采购将加速向国产方案倾斜。信息来源搜狐财经 | 2026.05.28⚡ 第4条AI推理需求首次超越训练算力租赁价格半年涨40%核心信息据中国证券报报道2026年AI推理计算需求已达到训练需求的4-5倍成为算力市场的主导力量。推理算力租赁价格半年内涨幅接近40%算力中心建设重点从训练集群转向推理节点分布式部署。性能/价格对比推理专用芯片Cerebras WSE-3、Groq LPU的Token生成速度达到通用GPU的数倍但单卡采购成本较高中长期看推理专用架构的TCO总拥有成本更低。对开发者/企业的影响AI应用开发者需要重新评估算力采购策略——推理成本将成为AI产品盈利能力的核心变量提前锁定推理算力合约的企业将获得显著成本优势。信息来源IT之家 | 2026.05.29⚡ 第5条AMD MI350直逼Blackwell开放生态OAM/UBB挑战NVIDIA闭环核心信息AMD下一代MI350系列直接对标NVIDIA Blackwell架构采用CoWoS先进封装HBM3E内存互联带宽和内存容量具备竞争力。规划中的MI400系列将支持OAM/UBB开放生态试图打破NVIDIA NVLink/InfiniBand的闭环垄断。性能/价格对比MI350的FP8训练性能预计为Blackwell的85-90%但价格低15-20%开放生态意味着客户可以自由混用不同厂商的互联设备降低厂商锁定风险。对开发者/企业的影响超大规模算力采购方云厂商、AI实验室将首次拥有实质性议价能力NVIDIA的高毛利率模式面临挑战2026-2027年GPU价格有望松动。信息来源艾瑞咨询 | 2026.05 本简报由 英辰朗迪GEO整理。