本文手把手教你如何在不订阅 Claude 官方的情况下通过小米 Token Plan 使用 Claude Code并给出经过验证的 Token 优化策略帮你有效控制成本。一、小米 Token Plan 简介小米 MiMo 开放平台近期推出了Token Plan预付费套餐允许开发者按量付费调用 MiMo 系列模型包括mimo-v2.5-pro、mimo-v2.5、mimo-v2-flash等。相比官方 Claude 订阅Token Plan 的特点无需固定月费用多少扣多少适合间歇性使用。价格透明1M token 输入最低 0.7 元根据上下文长度阶梯计价。兼容 Claude Code通过修改 API 端点即可无缝接入。新用户福利通过邀请码注册可得 ¥10 体验金有效期 40 天。邀请码U8X436注册链接https://platform.xiaomimimo.com?refU8X436注册后进入控制台 → API 密钥管理 → 创建密钥保存好。二、环境准备安装 Claude Code 与配置工具2.1 安装 Claude Codenpminstall-ganthropic-ai/claude-code验证安装claude --version2.2 安装 CC-Switch推荐方便多模型切换CC-Switch 是图形化工具可一键切换 API 供应商避免手动改配置。下载地址GitHub 搜索CC-Switch选择对应操作系统的最新 release。安装后打开切换到「Claude Code」标签页。点击「 添加供应商」→ 搜索「Xiaomi MiMo」→ 填入 API Key。模型映射按如下填写Claude Code 内部角色推荐 MiMo 模型说明主模型mimo-v2.5-pro旗舰模型能力最强Sonnet 默认模型mimo-v2.5主力模型性价比最高Haiku 默认模型mimo-v2.5轻量任务也用这个够用且便宜Opus 默认模型mimo-v2.5-pro复杂推理用旗舰保存后CC-Switch 会自动修改 Claude Code 的配置文件。2.3 手动配置不用 CC-Switch 的情况找到 Claude Code 的全局配置文件Windows%USERPROFILE%\.claude\settings.jsonmacOS/Linux~/.claude/settings.json如果不存在则新建。写入以下内容替换YOUR_API_KEY{env:{ANTHROPIC_BASE_URL:https://api.xiaomimimo.com/anthropic,ANTHROPIC_AUTH_TOKEN:YOUR_API_KEY,ANTHROPIC_MODEL:mimo-v2.5-pro,ANTHROPIC_DEFAULT_HAIKU_MODEL:mimo-v2.5,ANTHROPIC_DEFAULT_SONNET_MODEL:mimo-v2.5,ANTHROPIC_DEFAULT_OPUS_MODEL:mimo-v2.5-pro}}保存重启 Claude Code 生效。三、Token 优化策略详细版以下策略适用于任何 API 后端能显著降低输入/输出 token 消耗。3.1 排除无关文件.claude/ignoreClaude Code 在探索项目时会自动扫描目录树。如果包含node_modules、venv、__pycache__等大目录会浪费大量 token。操作步骤在项目根目录创建.claude/ignore文件。按以下模板填写可根据项目类型增减# 依赖与缓存 node_modules/ venv/ .venv/ __pycache__/ *.pyc *.pyo # 构建输出 dist/ build/ .out/ .output/ *.egg-info/ # 日志与临时文件 *.log *.tmp *.swp .DS_Store Thumbs.db # 大文件避免意外读取 *.zip *.tar.gz *.png *.jpg *.mp4 # 敏感配置 .env .env.* *.pem *.key保存后Claude Code 会自动忽略这些路径。效果大型前端项目可减少 80% 扫描 token。3.2 编写CLAUDE.md固化项目知识每次新会话Claude 需要了解项目结构、技术栈、编码规范。如果每次都手动说明既麻烦又浪费 token。CLAUDE.md可以解决这个问题。操作步骤在项目根目录创建CLAUDE.md写入以下内容根据实际修改# 项目名称学生管理系统 ## 技术栈 - Python 3.10 - FastAPI - SQLAlchemy 2.0 (异步) - MySQL ## 目录结构 - app/main.py - 入口 - app/api/ - 路由 - app/core/ - 配置、数据库、日志 - app/models/ - SQLAlchemy 模型 ## 编码规范 - 所有数据库操作使用 async/await - 函数必须有 docstring - 使用类型注解 ## 常用命令 - 启动uvicorn app.main:app --reload - 测试pytest - 迁移alembic upgrade headClaude Code 会在每次会话开始时自动读取该文件无需重复说明。注意CLAUDE.md本身会计入输入 token但有缓存机制如果 API 支持多次会话中只计费一次。3.3 手动压缩对话/compact命令长时间对话会累积大量历史导致后续请求的输入 token 急剧增加。/compact可将历史智能摘要丢弃冗余信息。使用时机对话超过 30 轮。感觉 Claude 开始重复之前说过的话。完成一个子任务准备进入下一个子任务。操作直接在 Claude Code 会话中输入/compact。效果后续请求的输入 token 减少 30%~50%且几乎不影响回答质量。3.4 限制输出长度maxOutputTokens模型有时会输出过长内容包含不必要的解释或重复。通过限制单次回答的最大 token 数可以强制模型更精炼。配置方法在settings.json中添加{maxOutputTokens:4096}建议值2048适合简单问答、代码片段。4096适合中等复杂度的函数生成。8192适合长篇文档或复杂重构但输出成本更高。3.5 设置自动压缩阈值autoCompactThreshold当对话历史超过一定 token 数时自动触发/compact避免手动忘记。配置{autoCompactThreshold:80000}表示当累积 token 超过 80k 时自动压缩。如果不希望自动压缩可设置为一个很大的值如999999并养成手动压缩习惯。3.6 清空会话/clear命令当任务完全切换例如从修 bug 切换到写文档旧的历史对话不再有用。此时使用/clear彻底清空上下文比/compact更彻底。操作输入/clear。效果开启一个全新的会话但保留系统指令和CLAUDE.md。3.7 调整权限防止意外读取大文件默认情况下Claude Code 可以自动读取文件。如果项目中有大文件比如 10MB 的日志可能会被意外读入浪费 token。配置在settings.json中添加{permissions:{read:ask,write:ask,bash:ask},maxFileSizeBytes:50000}read: ask每次读取文件前询问。maxFileSizeBytes超过此大小的文件不会自动读取需要手动指定行数范围。3.8 启用 Prompt Caching如果 API 支持Prompt Caching 可以让重复的系统指令如CLAUDE.md内容只计费一次。小米 API 尚未明确公开支持但可以尝试开启无效也无副作用。{enablePromptCaching:true}3.9 模型分级让简单任务用便宜模型根据任务复杂度选择不同模型任务类型推荐模型价格输入/百万简单问答、格式化、注释生成mimo-v2.50.7 元常规编码、单元测试、小范围重构mimo-v2.50.7 元复杂架构设计、全项目重构、疑难 Bugmimo-v2.5-pro1.4 元在 CC-Switch 中已经通过模型映射自动做了分配Haiku/Sonnet → v2.5Opus → v2.5-pro。你也可以在对话中临时使用/model mimo-v2.5手动切换。3.10 监控与分析定期查看用量小米控制台提供 Token 使用明细按模型、时间维度展示。在 Claude Code 中输入/stats可查看当前会话的 token 统计部分 API 支持。建议每周检查一次找出消耗大户针对性优化。四、常见问题与排查Q1配置后 Claude Code 报错 401 Unauthorized检查 API Key 是否正确有无多余空格。确认小米账户余额或 Token Plan 额度充足。重新生成 API Key 并更新配置。Q2Claude Code 显示 1.2M token但小米后台显示 50M 消耗这是正常现象原因小米后台统计的是Credits包含模型倍率Pro 模型消耗更高。Claude Code 发送的请求中携带了系统指令、工具定义等框架成本这些在客户端统计中可能不全。缓存未命中或写入时有一次性的高开销。建议以小米后台实际扣费为准并通过上述优化策略降低原始 token 消耗。Q3如何确认配置已生效在 Claude Code 中输入/stats如果能正常显示 token 信息或至少没有报错说明配置成功。也可以发一条简单消息观察是否正常回复。Q4CC-Switch 需要一直开着吗不需要。CC-Switch 只在切换模型时修改配置文件修改完成后可以关闭。如需使用本地代理模式高级功能则需要保持运行。五、总结通过小米 Token Plan 接入 Claude Code你可以无需订阅 Claude 官方按实际使用量付费。利用小米 MiMo 模型的 Agent 优化特性获得较高的性价比。通过.claude/ignore、/compact、CLAUDE.md、maxOutputTokens等优化手段进一步降低 Token 开销。快速上手命令速查表目的命令/配置排除大文件项目根目录创建.claude/ignore固化项目知识创建CLAUDE.md手动压缩对话/compact清空会话/clear查看统计/stats切换模型/model 模型名限制输出长度settings.json中maxOutputTokens自动压缩阈值settings.json中autoCompactThreshold邀请码U8X436注册链接https://platform.xiaomimimo.com?refU8X436理性选择工具按需优化让 AI 编程真正提升效率而不是增加负担。本文配置与优化方法已在 Windows 11 Claude Code 0.5.x 小米 MiMo API 环境下验证通过。如有变动请以官方最新文档为准。