38个词看懂整个AI产业链未来的AI一定会让世界天翻地覆现在我们只看到了它的1%。AI 技术体系就像一块五层蛋糕从触手可及的应用层到提供动力的能源层层层递进缺一不可。一、AI 五层蛋糕应用层终端用户层AI 应用层依托 API、RAG、微调等技术通过提示词工程落地 AIGC 产品分化 ToC/ToB 两条赛道产品形态从简单问答逐步向 AI Native、Agent 智能体进化。AI 五层蛋糕应用层1.1全品类产品清单ToC 个人 ToB 企业1. 1.1 通用对话大模型文本对话海外ChatGPT (OpenAI)、Claude (Anthropic)、Gemini (Google)、Perplexity、Mistral AI、Grok (X 推特)国内豆包、通义千问、文心一言、讯飞星火、智谱清言、Kimi、混元大模型、百川大模型、DeepSeek、MiniMax1.1.2 AIGC 图文生成类绘图Midjourney、DALL・E3、Stable Diffusion、即梦 AI、醒图 AI、美图 WHEE、通义万相文档 / PPTWPS AI、Gamma、PPT AI、豆包 PPT 生成1.1.3 AIGC 音视频AI 配音ElevenLabs、讯飞配音 AI、剪映 AI 配音AI 作曲Suno、UdioAI 视频Pika、Runway、可灵 AI、即梦视频、剪映 AI 成片1.1.4 办公效率 AI微软 Copilot (Office/Windows)、飞书妙计、钉钉 AI、Notion AI、石墨 AI1.1.5 代码开发 AI开发者应用GitHub Copilot、豆包代码助手、CodeLlama、Cursor、CodeGeeX1.1.6 ToB 行业垂直 AI智能客服智齿科技、网易七鱼 AI法律 AI北大法宝 AI、无讼 AI财税 AI金蝶 AI、用友智税工业质检 AI、医疗问诊 AI、教育 AI 题库系统1.1.7 AI 智能体产品 (Agent 落地产品)AutoGPT、GPTs、豆包智能体、Dify 应用、Coze 扣子智能体1.2 应用层专业名词1.2.1 AI 应用释义依托大模型能力开发、面向终端用户直接使用的成品软件 / 功能。作用把底层复杂模型封装成可视化产品普通人无需懂算法即可使用 AI 能力。1.2.2 AIGC全称人工智能生成内容。作用AI 自主生成文本、图片、音视频、代码、文案替代人工内容创作是应用层核心落地方向。1.2.3 ToC面向个人消费者的产品形态。作用面向普通用户多免费 会员订阅模式侧重易用、娱乐、日常使用豆包 APP、ChatGPT 网页。1.2.4 ToB面向企业、机构、政企客户。作用私有化部署、定制开发、年费付费解决企业生产、客服、财税等业务痛点。1.2.5 Token大模型文字最小计算单位中文约 1 汉字≈2token英文 1 单词≈1~3token。作用①API 调用计费计量单位②限制上下文长度超长对话超出 token 上限会被截断。1.2.6 API 接口模型厂商对外开放的标准化调用通道。作用开发者不用自研大模型调用 API 即可把 AI 能力嵌入自有 APP、小程序、系统。1.2.7 AI NativeAI 原生应用产品从架构底层基于大模型设计不是传统软件外挂 AI 插件。作用深度发挥大模型理解、生成、总结能力产品逻辑由 AI 驱动Kimi、Cursor。1.2.8 Agent 智能体具备自主思考、任务拆解、工具调用、多步骤自主执行的 AI。作用摆脱单轮问答限制自动联网、查数据、做报表、跨工具完成复杂任务下一代 AI 应用主流。1.2.9 提示词工程 (Prompt 工程)通过规范提问句式、角色设定、格式约束优化指令。作用不改动模型仅优化提问话术精准控制 AI 输出内容、格式、风格低成本提升 AI 效果。1.2.10 RAG 检索增强生成释义把自有知识库文档上传AI 回答时优先调取私有资料。作用解决大模型知识过时、幻觉问题企业知识库、私有文档问答必备技术。1.2.11 GPTs定制小应用OpenAI 推出的轻量化定制 AI 应用。作用普通用户不用代码靠提示词 文档上传快速搭建专属小 AI 工具。1.2.12 微调 (Fine-tuning)在通用大模型基础上用行业专属数据二次训练。作用让大模型适配特定行业术语法律、医疗提升垂直领域回答准确度多用于 ToB 定制。1.2.13 幻觉 (Hallucination)大模型编造不存在的事实、数据。作用应用层优化重点指标RAG、提示词优化就是用来抑制 AI 幻觉。1.2.14 上下文窗口 (Context Window)模型单次能读取的全部对话 文档 token 总量。作用决定 AI 能记住多长历史对话、读取多大篇幅文件Kimi 靠超大上下文做长文档阅读。1.2.15 私有化部署企业把大模型部署在自己本地服务器不使用公有云 API。作用保障企业数据不外流金融、政务等涉密行业刚需。1.2.16 Embedding 向量嵌入把文字转化为计算机可识别的数字向量。作用RAG 知识库检索底层技术实现文档关键词智能匹配。1.2.17 SFT 监督微调大模型对齐人类指令的训练方式。作用让 AI 听懂人类自然语言指令不会胡乱输出是通用对话产品基础。二、AI 五层蛋糕模型层AI 大脑层模型层以通用基础大模型开源 闭源为核心原料依托预训练、SFT、RLHF、LoRA 等技术衍生出多模态、代码、行业垂直细分模型向上输出 API / 微调能力支撑全品类 AI 应用向下消耗芯片层算力与能源层电力。AI 的大脑内核介于基础设施算力 / 芯片与应用层中间向下依托 GPU 算力训练向上封装成 API、二次微调产出各类 AI 产品豆包 / ChatGPT 等分为【闭源商用底座、开源底座、垂直细分模型、模型开发平台】四大类。AI 五层蛋糕模型层AI 大脑层2.1 模型层主流产品清单四大分类2.1.1 海外闭源基础大模型权重不公开仅对外输出 APIOpenAIGPT-4o、GPT-4 Turbo、GPT-3.5 系列AnthropicClaude 3/4 全系列Opus/Sonnet/HaikuGoogleGemini Ultra/Pro/Nano多模态通用底座xAIGrok3/Grok4特点不开放模型权重厂商自研训练应用厂商只能调用 API无法本地私有化部署完整模型2.1.2 国内闭源商用大模型云厂商自研底座通义千问 Max、文心 4.0、混元大模型 Pro、讯飞星火 V4、Kimi 底座月之暗面、DeepSeek 商用版、MiniMax 01 大模型2.1.3 全球开源基础大模型权重可下载、本地部署、二次微调模型层核心开源资产海外开源Meta Llama2/Llama3 全系列、Mistral法国、Falcon阿联酋、Gemma谷歌开源、Mistral MixtralMoE 混合专家国产开源Qwen 通义开源系列、ChatGLM智谱、Baichuan 百川、DeepSeek 开源版、Yi-34B 零一万物、InternLM 书生浦语2.1.4 垂直细分专用模型在通用底座上微调而来细分赛道模型代码专用模型CodeLlama、Qwen-Coder、StarCoder多模态图文模型Qwen-VL、LLaVA、Gemini-V 开源版看图、识图、图文生成底座音频 / 语音模型WhisperOpenAI 语音转写底座、SenseVoice行业垂直模型法律大模型 LawGLM、医疗大模型 Med-PaLM、金融大模型 Qwen-Finance2.1.5 模型开发 托管平台模型层中间产品管理、微调、托管各类大模型百度千帆、阿里灵积 ModelScope、腾讯混元云平台、Hugging Face全球开源模型仓库、ModelArts 华为昇思、Dify开源模型部署平台2.2 模型层核心名词释义含基础架构、训练、参数、模型分类附作用2.2.1 LLM 大语言模型释义Large Language Model基于 Transformer 架构、海量文本训练的通用文本大模型GPT、Llama 都属于 LLM作用模型层最核心品类是所有对话、文案类 AI 应用的底层大脑。2.2.2 LMM 多模态大模型释义Large Multimodal Model可同时处理文字、图片、音频、视频的模型Gemini、Qwen-VL作用支撑 AI 画图、识图、图文问答、AI 视频理解类 AIGC 应用。2.2.3 Foundation Model 基础模型释义预训练完成的通用底座大模型未经过行业微调作用如同 AI 操作系统经过 SFT / 微调后可快速衍生出成千上万个垂直小模型是模型层的原材料。2.2.4 Transformer 架构释义当前 99% 大模型统一底层结构由注意力机制 编码器 / 解码器构成作用大模型的骨架决定模型理解上下文、长文本的能力GPT/Gemini 全部基于该架构开发。2.2.5 MoE 混合专家模型释义稀疏架构海量参数拆分多个专家模块运算时只激活部分模块作用在超大参数量下大幅降低算力消耗实现低成本超大模型GPT-4、Mixtral 采用此架构。2.2.6 预训练 Pre-training释义模型第一阶段训练用万亿级无标注互联网数据任务为「预测下一个 Token」作用让模型自学语言、常识、百科知识搭建基础知识库预训练质量直接决定模型智商下限。2.2.7 SFT 监督微调指令微调释义预训练后第二步用人工标注的【指令 - 标准答案】数据集训练作用教会模型听懂人类提问、按要求输出内容让原生预训练模型从 “会认字” 变成 “听得懂指令”。2.2.8 RLHF 人类反馈强化学习释义SFT 后第三阶段人工对模型答案打分排序用打分数据迭代优化模型作用对齐人类价值观减少胡说、有害内容、AI 幻觉是模型变好用、人性化关键技术。2.2.9 LoRA 低秩微调释义轻量化微调技术冻结大模型主体权重只训练少量小参数作用低成本、低算力给通用大模型做行业定制微调企业落地垂直模型主流方案不用全量重训百亿参数大模型。2.2.10 模型权重 Weights释义模型训练后存储的参数文件是模型 “学到的知识” 载体作用开源 / 闭源分界线开源开放权重可本地部署闭源不开放权重只能调用 API。2.2.11 参数规模参数量 B释义模型神经元权重总数单位 B十亿如 7B、70B 大模型作用决定模型推理、逻辑、长文本能力上限参数越大基础能力越强、算力成本越高。2.2.12 上下文窗口 Context Length释义模型单次能读取的总 Token 上限作用决定 AI 能记住多长对话、一次性读取多大文档Kimi 超长文档依托超大上下文窗口模型底座。2.2.13 Embedding 向量模型释义轻量化小模型把文字 / 图片转为数字向量作用RAG 知识库底层必备模型实现文档语义检索、相似度匹配连接大模型与私有知识库。2.2.14 涌现能力 Emergent Ability释义模型参数、数据突破临界点后突然出现训练未专门学习的能力数学推理、代码、逻辑作用解释大模型越大越聪明是超大参数模型的核心价值来源。2.2.15 幻觉 Hallucination释义大模型凭空编造不存在的事实、数据、文献作用模型层优化核心指标靠 RAG、微调、提示词优化抑制幻觉是垂直模型落地重点优化项。2.2.16 全量微调 Full Fine-tune释义改动模型全部权重参数的完整训练作用深度改造通用大模型高度定制行业专属底座但算力、数据成本极高多用于头部大厂自研行业大模型。2.2.17 蒸馏模型 Distill释义用大模型输出数据训练小参数量模型作用把百亿参数大模型能力压缩到几亿参数小模型实现边缘设备本地部署手机端离线 AI。三、AI 五层蛋糕基础设施层算力基建层基础设施层依靠GPU 集群 分布式框架 云调度平台把零散芯片硬件封装成可租用的训练 / 推理算力向下承接芯片硬件向上支撑各类大模型训练与 API 服务落地。连接芯片层 ↔ 模型层负责把 GPU/CPU 硬件资源整合成集群、云平台、训练环境给大模型提供训练 推理算力服务俗称「AI 工厂」。3.1 基础设施层产品清单3.1.1 公有云 AI 算力平台大厂算力云对外出租算力国内阿里云 PAI、华为 ModelArts、腾讯云 TI-ONE、百度智能云千帆算力、火山引擎方舟、天翼云智算海外AWS SageMaker、谷歌 Vertex AI、微软 Azure ML3.1.2 智算中心 / 超算集群大型物理算力园区国家超算中心天河、神威、阿里云张北智算、腾讯清远智算、华为乌兰察布智算、商汤智算中心3.1.3 容器 调度基础设施AI 底层运维软件Kubernetes (K8s)、Docker、KubeflowAI 专属调度框架3.1.4 分布式训练框架模型训练工具PyTorch、TensorFlow、PaddlePaddle (飞桨)、Megatron-LM、DeepSpeed3.1.5 存储产品海量数据集存放分布式存储阿里云 OSS、腾讯 COS、华为 OBS、Ceph 分布式存储、Alluxio 加速缓存3.1.6 AI 中间件 / 算力调度产品灵骏阿里云算力调度、昇腾 CANN 配套集群软件、Ray 分布式计算框架3.2 基础设施层专业名词 释义 作用3.2.1 算力集群 Cluster释义几十 / 上万张 GPU 服务器组网形成的统一算力池。作用大模型无法单卡训练依靠多机多卡分布式并行是大模型训练必备硬件集群。3.2.2 训练集群 / 推理集群训练集群高规格 A100/H100 集群用于预训练、微调大模型推理集群经济型 GPU用于上线 API、日常用户请求调用作用分开部署降成本训练重算力推理重并发吞吐。3.2.3 分布式训练释义把大模型参数、数据拆分到多张 GPU 并行运算。作用千亿参数大模型单张显卡装不下靠分布式拆分完成训练。3.2.4 算力调度平台释义统一管理全机房 GPU 资源的系统。作用按需分配空闲显卡避免算力闲置多家研发团队共用一个算力中心。3.2.5 Kubeflow释义基于 K8s 的 AI 全流程运维框架。作用一站式管理数据集、训练任务、模型上线工业级 AI 流水线标配。3.2.6 机器学习框架PyTorch/TensorFlow/Paddle释义搭建神经网络、编写模型代码的编程库。作用模型研发工程师依托框架写大模型底层自动对接 GPU 加速。3.2.7 数据集存储分布式存储释义海量文本、图片训练数据的集群存储。作用大模型预训练需要万亿级数据单机硬盘存不下依靠分布式集群存数据。3.2.8 算力租赁 / 按量计费释义云厂商按小时出租 GPU 算力。作用中小公司不用自建机房按需租用云端显卡训练模型。3.2.9 显存带宽释义GPU 显卡和内存之间数据传输速率。作用决定多卡分布式训练的数据同步快慢带宽瓶颈会大幅拖慢训练速度。3.2.10 冷热分层存储释义高频训练数据放高速缓存冷门原始数据放低成本冷存储。作用在存储成本和读取速度之间平衡大幅降低基建开支。3.2.11 Ray 分布式引擎释义通用分布式计算框架。作用用于 Agent、RAG 知识库批量向量化、海量数据预处理。3.2.12 私有化智算部署释义企业自建机房集群不使用公有云。作用金融、政务涉密数据不能出内网自建算力基础设施。3.2.13 算力利用率释义GPU 实际运算占用时间 / 总开机时间。作用基建层核心考核指标利用率越高单位 AI 产出成本越低。四、AI 五层蛋糕芯片层算力引擎层芯片层依靠 GPU、ASIC、NPU 各类算力芯片依托先进制程与 HBM 显存向上为算力基建层提供物理硬件算力是 AI 算力最核心硬件载体。4.1 芯片层代表产品4.1.1 国外 GPUAI 训练 / 推理主力芯片NVIDIAA100、H100、H200、A800、L4、L4SAMDMI250、MI300 系列4.1.2 国外通用 CPUIntel Xeon、AMD EPYC服务器 CPU辅助算力4.1.3 国产 AI 专用芯片ASIC昇腾 910/910B/310、壁仞 BR100、沐曦曦云、寒武纪思元系列4.1.4 边缘端 NPU手机 / 终端 AI 芯片高通骁龙 NPU、苹果 A 系列 NPU、华为麒麟 NPU、瑞芯微 NPU4.1.5 光芯片新型 AI 算力硬件硅光引擎、相干光算力芯片4.2 芯片层专业名词 释义 作用GPU 图形处理器释义并行计算架构芯片大模型训练首选硬件。 作用海量并行运算承载大模型预训练、推理算力需求。ASIC 专用集成电路释义专为 AI 运算定制的专用芯片。 作用相比 GPU 功耗更低、算力性价比高多用于云端推理。NPU 神经网络处理器释义面向轻量化 AI 的嵌入式芯片。 作用手机、智能设备本地离线 AI 运算。显存 HBM 高带宽内存释义堆叠式高速显存配套高端 AI 芯片。 作用解决大模型海量参数读写高带宽避免算力闲置。FP16/FP8 数据精度释义AI 运算浮点精度规格。 作用FP8 降低算力与功耗是当前大模型规模化降本关键。算力 TFLOPS释义芯片每秒浮点运算次数算力计量单位。 作用衡量芯片 AI 运算性能高低。Chiplet 芯粒释义多颗小芯片封装成一颗大芯片的封装技术。 作用降低超大算力芯片制造难度、提升良率。IP 核释义芯片内部成熟算力模块。 作用芯片厂商基于成熟 IP 快速设计自研 NPU/ASIC。制程工艺nm 纳米释义芯片晶体管加工尺寸3nm/4nm/7nm。 作用制程越小同功耗下算力越高、芯片体积更小。推理芯片释义优化低成本、低功耗的应用型芯片。 作用支撑线上 API 并发调用、量产落地 AI 应用。训练芯片释义超大显存、超高算力规格芯片。 作用用于千亿参数大模型预训练。算力集群互连NVLink释义芯片高速互联总线。 作用多 GPU 之间高速数据互通支撑分布式训练。五、AI 五层蛋糕能源层供电底座层能源层依托市电 储能 绿电三大供电来源搭配温控配电设备为芯片机房持续供电控温是整个人工智能产业的能耗天花板与底层资源约束。5.1 能源层相关产品5.1.1 供电基建产品高压变电站、智能配电柜、UPS 不间断电源、柴油备用发电机组、PDU 精密机柜配电单元5.1.2 绿电发电设备光伏组件、风电发电机组、储能锂电池组、抽水蓄能电站、氢能发电设备5.1.3 机房节能温控设备冷水机组、间接蒸发冷却空调、液冷散热设备、精密空调、热管散热模组5.1.4 储能配套磷酸铁锂储能电站、电网侧储能设备5.2 能源层专业名词 释义 作用PUE 电源使用效率释义数据中心总耗电 / IT 设备耗电比值基准1。 作用衡量智算中心节能水平PUE 越低空调配电损耗越小、能源利用率越高。绿电可再生能源释义光伏、风电、水电等零碳排放电力。 作用智算中心降低用电成本、实现低碳算力是大型 AI 算力园首选电源。UPS 不间断电源释义断电瞬时切换的后备供电设备。 作用突发停电瞬间保服务器不断电避免大模型训练任务中断、数据损坏。液冷散热释义液体直接接触芯片导热的散热方案。 作用替代传统风冷高功耗 AI 机柜大幅降低制冷耗电优化 PUE。峰谷电价释义用电高峰、低谷时段差异化电费定价。 作用算力中心错峰夜间低谷电价运行显著降低算力用电成本。电化学储能释义大型锂电池储能电站。 作用低谷存电、高峰放电平抑电价波动保障算力基地供电稳定。自备电厂释义算力园区自建光伏 / 燃气发电机组。 作用减少对公网市电依赖规避限电、电价上涨风险。市电直供释义优化配电架构减少多级电源转换损耗。 作用缩减变电耗电损耗提升能源利用效率。碳配额释义碳排放额度指标。 作用算力企业使用绿电可结余碳配额控制算力项目碳排放成本。负荷削峰释义储能 错峰调度降低电网峰值用电。 作用避免算力机房峰值用电超标被电网限电。结束