【Qwen3】Qwen3是MoE，Qwen3.5 原生多模态

张

张建站

2026/5/25 16:30:42

10分钟阅读

1. 关于 Qwen3[1] Qwen3 Technical Reporthttps://arxiv.org/pdf/2505.09388核心架构变化混合专家模型 (MoE)指出 Qwen3 包含Dense稠密和Mixture-of-Experts (MoE)两种架构。这相比 Qwen2.5主要为 Dense是一个重大升级旨在提高训练和推理效率。参数规模从 0.6B 到 235B 不等。关键技术创新更先进的RoPE变体或支持更超长上下文如 256K。SwiGLU FFN的进一步优化。GQA (Grouped-Query Attention)的广泛应用或优化为 MQAMulti-Query Attention以加速推理。RMSNorm继续使用。多语言能力强化了对更多语言的零样本/少样本支持。2. 关于 Qwen 3.5Qwen 3.5 Explained: Architecture, Upgrades Over Qwen 3核心定位原生多模态 (Native Multimodal)。这意味着它不仅仅是文本模型而是在架构层面原生支持视觉、音频、文本的联合建模。架构升级点多模态输入头可能引入了新的 Tokenizer 或投影层用于处理图像、视频和音频特征直接注入 Transformer 块。Agent 能力架构中可能嵌入了工具调用Tool Use、代码执行和长程规划的特殊模块或训练信号。推理效率针对多模态推理进行了专门优化可能在 MoE 路由机制上有所调整以优先激活多模态相关的专家。上下文窗口可能支持更长的多模态上下文例如同时理解长视频和长文档。模块对比Qwen3的核心特征是MoE 架构和235B 规模的大模型。Qwen 3.5的核心特征是原生多模态 (Vision/Audio/Text)和Agent 智能体能力。模块Qwen2.5Qwen3Qwen 3.5基本架构Dense TransformerDense MoEDense MoE位置编码RoPE优化版 RoPE / 更超长上下文优化版 RoPEFFNSwiGLUSwiGLUSwiGLU归一化RMSNormRMSNormRMSNorm注意力GQA/MQAGQAGQA模态纯文本纯文本(主要)原生多模态(文本视觉音频)主要用途通用对话、代码、数学高效推理、更大规模任务多模态理解、Agent 智能体

题解：洛谷 P10971 Cookies

本文分享的必刷题目是从蓝桥云课、洛谷、AcWing等知名刷题平台精心挑选而来，并结合各平台提供的算法标签和难度等级进行了系统分类。题目涵盖了从基础到进阶的多种算法和数据结构，旨在为不同阶段的编程学习者提供一条清晰、平稳的学习提升路径。欢迎大…...

2026/5/25 16:30:37 阅读更多 →

具身智能｜浅谈具身智能与低空经济融合

文章目录一、融合的逻辑：从“移动平台”到“飞行作业者” 二、四大核心应用场景 1. 低空物流的“最后五米” 2. 自主化低空巡检与维护 3. 城市空中交通的智能驾驶 4. 低空应急与群体协作三、技术融合的突破点四、挑战与方向低空经济正从“能飞”迈向“会做”，而具身智能恰…...

2026/5/25 16:29:19 阅读更多 →

在线协同编辑哪家好？15款主流工具横评

远程办公常态下，协同文档选型要同时看实时协作、权限审计、数据安全与跨端同步。本文横评15款主流工具，并把坚果云作为首推：凭借智能增量同步、文件历史版本与公安部信息系统安全等级保护三级备案等合规能力，兼顾效率与可控性。一…...

2026/5/25 16:29:07 阅读更多 →

【限时解密】Claude 3.5 Sonnet专属编程模式：仅开放给前500家企业的上下文感知补全协议

更多请点击： https://kaifayun.com 第一章：Claude 3.5 Sonnet编程辅助的核心能力边界与适用场景 Claude 3.5 Sonnet 在编程辅助领域展现出显著的推理深度与上下文理解能力，但其本质仍是基于大规模语言模型的生成式系统，不具备实时…...

2026/5/24 0:03:18 阅读更多 →

RMAN 增量备份（Incremental Backup）

1、概念RMAN 增量备份是指 RMAN 只备份自上次备份以来发生过更改的数据块，而不是备份整个数据库的所有数据块。它是 Oracle 为解决大型数据库全量备份时间长、占用空间大的问题而设计的核心特性，也是现代企业级备份策略的基础。简单类比：全库…...

2026/5/24 0:04:53 阅读更多 →

终极指南：掌握ProperTree跨平台Plist编辑器的10个高效技巧

终极指南：掌握ProperTree跨平台Plist编辑器的10个高效技巧【免费下载链接】ProperTree Cross platform GUI plist editor written in python. 项目地址: https://gitcode.com/gh_mirrors/pr/ProperTree 想要轻松编辑macOS和iOS的配置文件却苦于复杂的XML语法…...

2026/5/24 0:21:30 阅读更多 →

ScriptHookV解决方案：如何安全扩展GTA V游戏功能而不修改原始文件

ScriptHookV解决方案：如何安全扩展GTA V游戏功能而不修改原始文件【免费下载链接】ScriptHookV An open source hook into GTAV for loading offline mods 项目地址: https://gitcode.com/gh_mirrors/sc/ScriptHookV ScriptHookV是一个专为《侠盗猎车手V》&…...

2026/5/24 0:26:45 阅读更多 →