天数智芯不是只用一个“自研大模型框架”而是在自家软件栈上兼容并封装了主流开源框架典型就是 DeepSpeed / Megatron-DeepSpeed / Colossal-AI / BMTrain 这一套再加上自家推理引擎和 DeepSpark 社区模型库。文章由ai生成可以理解成天数智芯 “国产 GPU 自研软件栈 兼容主流开源框架DeepSpeed/Megatron/Colossal-AI 等 自研推理引擎 DeepSpark 生态”1. 训练侧用什么框架做预训练 / 微调官方公开资料里天数智芯明确说自己支持的大模型训练框架包括DeepSpeedMegatron-DeepSpeedMegatron-LM DeepSpeed 的 3D 并行组合Megatron-LMColossal-AIBMTrain 等一些典型说法产品页写得很直接支持包括 DeepSpeed、Megatron-DeepSpeed、Megatron-LM、Colossal-AI 等主流框架智源大会上演讲也强调天垓、智铠系列通用 GPU 广泛支持 DeepSpeed、Colossal、BMTrain 等各种大模型框架还和潞晨 Colossal-AI 做了专门的兼容互认证。所以实战上大模型预训练 / 微调在天数智芯上常见组合就是DeepSpeed Megatron-LMMegatron-DeepSpeed做 TPPPZeRO 3D 并行和你在 NVIDIA/A100 上用的一模一样或者Colossal-AI / BMTrain这类更偏“易用国产适配”的框架。天数智芯自己主要做的是自研算子库 IXCCL 通信库 驱动/运行时把上面这些框架“搬到”自家 GPU 上跑在 DeepSpark 社区里提供一堆已经适配好的训练/推理示例和脚本。2. 推理侧用什么框架做部署推理侧天数智芯也是“兼容为主自研加速”官方明确说自家推理框架无缝兼容 vLLM 和 TGIText Generation Inference展会上也强调智铠系列推理卡兼容 GPTQ、vLLM 等量化和推理引擎DeepSpark 社区里还有基于自研推理引擎 IGIE / IxRT 的示例以及 vLLM / Megatron-DeepSpeed / Firefly 等的训练/推理示例。典型推理栈大语言模型在线服务天数智芯 GPU 自研推理引擎 / vLLM / TGI配合量化GPTQ 等。多模态 / 视觉语言模型同样是 vLLM / 自研引擎只是模型换成 VLM 版本。3. 和华为昇腾的对比帮你串一下你之前问的是“DeepSeek 适配华为昇腾是不是做了类似框架”现在看天数智芯会更清楚华为昇腾底层CANN HCCL训练MindSpeed‑LLM Megatron‑LM昇腾版 Megatron推理MindIE / vLLM‑Ascend→ 明确有一套“昇腾版 Megatron 自研推理引擎”的栈。天数智芯底层自研算子库 IXCCL 驱动训练直接用开源框架DeepSpeed / Megatron-DeepSpeed / Colossal-AI / BMTrain不是另起一个“天数版 Megatron”推理自研推理引擎 兼容 vLLM / TGI→ 是“兼容主流开源框架 自研底层栈”不是“再造一个 Megatron”。4. 一句话总结天数智芯没有搞一个完全独立的“天数大模型框架”而是训练用DeepSpeed / Megatron-DeepSpeed / Colossal-AI / BMTrain等开源框架跑在天垓/智铠卡上推理用自研推理引擎 vLLM / TGI等主流量化/推理引擎生态DeepSpark 社区提供大量适配好的模型和脚本。所以如果你要在天数智芯上做大模型训练技术栈和你在 NVIDIA 上用 DeepSpeed Megatron 基本是一套只是底层从 CUDANCCL 换成了天数自家的算子库 IXCCL。文章由ai生成