作者王聪彬现在可以和金子对标增值的那一定是存储。不仅价格持续上行而且还没有现货交付周期已经要用年计算。从DRAM到颗粒再到硬盘和磁带几乎所有相关存储都面临严重的供给压力。存储在AI时代在算力之后也走到了台前。尤其是最近“龙虾”带动的推理爆发让我们一下进入Token经济时代数据的增长速度已经发生了质变。数据的爆发也为企业带来了多重压力91%以上的CIO已经将其存储改造列为首要议程运维成本和复杂度作为核心考量78%以上的企业已意识到仅靠扩容无法满足AI发展需求必须做到存算协同。IBM从客户实际使用场景出发将存储划分为热、温、冷、深冷不同层级构建覆盖AI全生命周期的存储体系既支撑传统核心业务也面向AI负载提供扩展能力。当AI走向数据存储成为新的基础设施分水岭现在企业对存储体系进行的结构性重构已经变为围绕数据流转效率与全链路协同进行重塑。很多企业开始重视“人工智能工厂”AI Factory的概念他的本质是一个将数据转化为智能的端到端系统从数据源到AI数据平台再到智能输出。像IBM Storage Scale数据平台、IBM Storage Scale System一体机就可以帮助企业构建真正的AI工厂端到端地处理数据。为了帮助企业以更低成本、更高效率从海量数据中挖掘价值GTC 2026大会上IBM与NVIDIA宣布了新的合作推动GPU原生数据分析、智能文档处理、本地及受监管环境的基础设施部署。NVIDIA选用了IBM存储方案为GPU原生高级分析引擎供给海量数据IBM Storage Scale System 6000可提供高达10PB的高性能存储将IBM的统一数据访问层及大规模并行吞吐能力与NVIDIA的GPU流水线深度整合。‌窥一斑就可知全豹IBM能够提供的是端到端、高性能、稳定的数据存储服务。“不同业务、不同负载对存储的诉求截然不同延迟、吞吐、成本、合规优先级各不相同。”IBM大中华区存储事业部总经理吴磊说道。IBM大中华区存储事业部总经理吴磊以传统金融为例AI已经被用于反欺诈场景过去信用卡被盗刷往往要两天后才接到通知今天则可以在分钟级完成识别。背后的关键在于模型与主机的深度耦合在刷卡瞬间完成判断而不是事后再去追溯与取证从源头减少损失。到了训练环节大模型已经进入万卡级集群时代GPU投资动辄数亿甚至数十亿哪怕1%的闲置都意味着上亿元的浪费。如果训练进行了数小时却在落盘阶段受阻导致checkpoint无法写入那么前序算力投入将被直接打水漂。而且合规要求正在变得愈发严格当大模型推理、决策时结果必须具备可回溯性这也对数据治理与存储体系提出了更高要求。最后银行的数据需要长期保存存放在闪存或硬盘上并不现实综合来看磁带依然是最具性价比与安全性的长期存储方案。对比过去数据更多是通过副本拷贝实现但当数据规模上升到100TB、PB级甚至更高时多次复制导致存储成本提升人工智能复制数据会导致数据安全问题企业需要有多套监管软件、安全软件来管理数据在千卡、万卡集群中高速网络本身已经非常昂贵如果再叠加大量副本传输对带宽和交换能力提出更高要求成本会被进一步放大当副本数量持续增加数据本身会变得难以管理。所以IBM认为未来的AI时代应该是让人工智能走向数据。AI时代的存储体系长什么样又该如何建IBM商业价值研究院年初的一项调研显示76%的CEO认为企业现有IT架构足以支撑发展但在CIO层面情况明显不同16%的CIO认为企业架构已严重落后于AI需求43%的CIO处于明显的焦虑之中。IBM中国区存储业务销售总经理金鑫在过去一年与客户的接触中感受到他们正面临五大挑战第一安全风险持续上升。勒索软件与网络攻击频发威胁企业业务连续性第二电力限制。不少用户的私有云机房里机柜实际只装了1/2甚至1/3本质是供电能力约束。如果机房在城区一个T42机柜通常只能承载6到7千瓦再往上电力就难以支撑第三运维水平。企业现有IT架构大多是多厂商、多产品组成CIO需要团队同时掌握不同产品体系同时私有云、多云环境整体运维压力显著上升第四AI创新带压力。一些企业明显处于被动投入不知如何推进AI进一步加剧了焦虑目前只有约一半的CIO做AI之前会先完成数据治理。第五成本高。一方面是存储等产品价格上涨另一方面是企业本身IT支出占比就较低多重投入之下成本压力更加明显。IBM中国区存储业务销售总经理金鑫IBM在其中能做些什么早在75年前IBM就已进入磁带这一数字存储领域甚至早于IBM主机。阿波罗登月任务期间IBM负责了相关IT建设其中3次任务共累计收集173卷磁带数据但这些数据在当时并未被深入分析。多年之后当NASA要重新挖掘这批历史数据时依然能从磁带中成功恢复出数十年前的数据。过去70多年里IBM一直在存储领域持续创新。进入人工智能时代其提出的核心思路是让人工智能走向数据而不是让数据走向人工智能。围绕这一理念IBM构建了一套覆盖AI全生命周期的存储家族底层弹性存储侧重节能环保、长期安全的数据的二级存储包括IBM 磁带/IBM Archive归档软件中间层核心存储包括适合企业级混合云IBM FlashSystem、IBM Fusion上层AI存储高性能包括IBM Storage Scale和IBM Storage Ceph。“通过基于策略实现自动化的数据分层和迁移企业可以在不同存储层之间实现数据的有序流动在性能、成本与效率之间取得平衡。”吴磊强调。国内一家头部智能驾驶芯片企业采用了IBM的整体解决方案不仅在本地数据中心部署还在北京、上海的研发与生产基地实现数据的统一管理提升产研效率同时降低存储与网络传输成本。当“数字自主”成为主流存储正在换一套逻辑闪存和AI可以说是天生一对AI工作负载对存储提出了超高的数据吞吐量、更低的访问延迟、支持频繁的读写操作的要求。市场侧给出了明显的反馈。CFM闪存市场最新数据显示2025年四季度全球DRAM/NAND Flash市场规模达755.1亿美元环比增长29.2%其中全球NAND市场规模环比增长27.8%至235.45亿美元。IBM也在今年第一季度发布了嵌入AI智能体的下一代闪存系统IBM FlashSystem实现持续性的数据保护、主动的威胁分析和定制化的恢复建议重新定义企业级 IT 弹性。为何要选择下一代闪存系统IBM FlashSystem最重要的一个理由就是FlashSystem上的FlashSystem.ai智能体可以通过无缝、自助式的操作帮助管理员管理、监控、诊断和修复整个数据路径上的故障和风险。FlashSystem.ai平台的AI模型由高质量的数据训练而成包括高级遥测技术收集的数百亿数据点以及多年的真实运营数据每天可执行数千个自动决策无需人工监督。“FlashSystem.ai是一个用不休息的存储管理员可以做概述、零点击配置、创建和更新。”金鑫说道。更关键的问题是它不能做什么比如FlashSystem.ai具备了保护、适应和执行能力。首先人机协作与强化专家经验及认知。系统部署大约两小时后便会开始学习所在环境逐步理解企业存储的内容、应用类型和负载特征。相比过去单纯追求IOPS的存储系统这一代产品更强调对业务环境的理解并给出配置建议。用户可以通过自然语言进行确认或调整在持续交互中完成优化同时系统也会基于资深管理员的反馈不断学习。其次是主动优化能力。以FCM为例其可与FlashSystem.ai协同根据数据规模和业务负载动态调整运行模式在业务高峰来临前转为高性能模式实现资源的前置调优让IT从被动排障转向主动创新。第三是情境感知安全能力。情境感知技术在IBM的技术体系中已发展多年与AI结合后可以在秒级识别IO异常。针对勒索软件写入时特有的IO特征系统能够快速感知并触发告警及时采取防护措施。最后是合规与动态响应能力。AI时代数据的流动更加频繁也带来更复杂的合规要求。FlashSystem.ai内置相关功能可自动生成审计报告帮助企业降低合规风险同时显著减少人工工作量。IBM FlashSystem另一个重要更新是第五代 FlashCore ModuleFCM5其内置了一颗IBM自研芯片主要用于压缩、去重和加密等操作。硬压缩可以实现最高约1:5的压缩比例如一块100GB的盘在开启压缩后可承载约500GB的数据。以更小的外形尺寸提供了更大的容量支持基于硬件的重复数据删除和压缩。革命性的硬件驱动器级智能提供真正的计算存储和量子安全硬件加密。根据内部测试借助内置芯片对数据进行优化排列整盘的使用寿命较普通NVMe可提升约57%。在国内电子、制造行业对IBM FlashSystem的兴趣相对较高究其原因主要在于这些行业系统复杂对存储高可用、安全要求高且运维人员资源相对有限。一家华东半导体企业处于产能爬坡阶段内部混用4家不同品牌的存储产品存在明显的数据竖井。IBM从IOPS入手进行梳理通过引入IBM FlashSystem与磁带库解决了双活架构下的性能与数据保存问题。写在最后“拎着锤子找钉子”的状态对于企业而言并不在少数。对于IBM而言这一轮AI浪潮既是压力也是重构基础设施的窗口借此构建一套更灵活、弹性、可扩展的基础架构。说到底AI时代对存储的核心要求无外乎三点一是能够在检查点将数据快速落盘避免高成本算力被浪费二是能够支撑万级节点规模并具备动态伸缩能力三是在完整的AI管道中让数据以安全、可靠且可控成本的方式流动。几十年来IBM始终保留命令行这一高效、简单的操作模式。在AI时代这种能力反而被进一步放大。在这样的基础上在Agentic AI时代企业可以通过智能体直接高效地对IBM的高端、中端、低端硬件和软件进行操作真正做到让人工智能走向数据。