8GB显存跑Qwen3.6 35B MoE视觉模型：从3t/s到30t/s的跨越

张

张建站

2026/6/5 10:10:04

10分钟阅读

8GB显存跑Qwen3.6 35B MoE视觉模型：从3t/s到30t/s的跨越

本文记录了在RTX 5060 Laptop 8GB显存、32GB内存的笔记本上，成功运行Qwen3.6-35B-A3B MoE视觉语言模型的全过程。从最初3 tokens/s的龟速，到最终稳定25-30 tokens/s，速度提升了10倍。同时对比分析了LM Studio和llama.cpp两种工具的配置差异，深入解释为什么只有llama.cpp需要手动加载mmproj文件。一、硬件配置与挑战设备信息笔记本型号：ThinkBook 16 G7+ IAH显卡：NVIDIA GeForce RTX 5060 Laptop GPU（8GB 显存）内存：32GBCPU：Intel Core Ultra 7 255H核心挑战在8GB显存的限制下运行350亿参数的Qwen3.6-35B-A3B MoE（混合专家）视觉语言模型，面临两个主要问题：显存不足：模型Q4_K_M量化后约22GB，远超8GB显存推理

AI比你更懂你想看什么：娱乐产业正在被算法重塑

AI比你更懂你想看什么：娱乐产业正在被算法重塑你有没有过这样的体验——周末晚上躺在沙发上，打开某个视频平台，系统自动推荐了一部剧，你一看就停不下来，连刷了整整三集。或者你刷到一个短视频，刚划了两下就…...

2026/6/5 10:07:02 阅读更多 →

Anthropic公开Claude安全架构、Cursor停卖无限订阅、DeepSeek融资500亿｜今日科技

每天更新，带你读懂科技圈。今日看点： Anthropic 首次公开了 Claude 在多产品线中的安全隔离架构——不是概念文章，是实打实的工程方案。另一边，Cursor 正式取消无限订阅，AI 编程工具从"跑马圈地"进入"…...

2026/6/5 10:03:12 阅读更多 →

手写遗传算法：从字符串进化到Hello World的完整实现

1. 项目概述：这不是在写“算法课件”，而是在复现生命演化的底层逻辑你有没有盯着一段随机生成的字符串发过呆？比如"Xq7#mKp2"，然后突然想到：如果让这串字符自己“繁殖”、“变异”、“被环境筛选”&#xff…...

2026/6/5 10:02:31 阅读更多 →

AnolisOS 8.8安装源配置踩坑实录：从‘设置基础软件仓库时出错’到成功联网的保姆级指南

AnolisOS 8.8安装源配置实战指南：从诊断到解决方案的全流程解析当你在安装AnolisOS 8.8时遇到"设置基础软件仓库时出错"的提示，这通常意味着系统无法访问或识别安装源。这个问题看似简单，但背后可能涉及网络配置、镜像选择、启动参…...

2026/6/3 16:54:28 阅读更多 →

Lindy路线图前瞻：3个已被验证的信号，预示Q3将启动下一代AI原生平台重构

更多请点击： https://intelliparadigm.com 第一章：Lindy路线图前瞻：3个已被验证的信号，预示Q3将启动下一代AI原生平台重构信号一：核心基础设施层API调用量连续8周突破临界阈值 Lindy平台的 /v2/execute与 /v3/plan端…...

2026/6/3 1:19:41 阅读更多 →

【AI工具智能排行榜TOP10】：2024年实测数据驱动的生产力跃迁指南（仅限本周开放下载）

更多请点击： https://kaifayun.com 第一章：AI工具智能排行榜TOP10的底层逻辑与评估范式 AI工具排行榜并非主观评分的产物，而是由多维可量化指标驱动的系统性工程。其核心在于构建一个兼顾能力广度、推理深度、工程鲁棒性与生态协同性的评估范…...

2026/6/4 8:46:30 阅读更多 →

3步解决博德之门3模组管理难题：BG3ModManager完整使用指南

3步解决博德之门3模组管理难题：BG3ModManager完整使用指南【免费下载链接】BG3ModManager A mod manager for Baldurs Gate 3. This is the only official source! 项目地址: https://gitcode.com/gh_mirrors/bg/BG3ModManager BG3ModManager是专为《博德之…...

2026/6/4 10:59:42 阅读更多 →