一文搞懂：Token、Prompt、Context

张

张建站

2026/5/26 2:02:32

10分钟阅读

本文深入剖析了在使用大模型时不同用户间效果差异巨大的原因。核心在于模型的上限由其本身决定但用户能获得多少则取决于其输入质量。文章详细阐述了Token、Context、Prompt体系和Memory这四大核心概念揭示了它们如何影响模型的表现。理解并善用这些概念用户可以更高效地与AI互动提升工作效率和成果质量。文章强调关键不在于让模型更聪明而在于让模型看得更清楚通过精细化管理输入实现AI的优化利用。同一个模型为什么有人用得好有人用得差先说一个我亲眼见过的场景。两个同事同时在用 ChatGPT 写一份产品分析报告。A 同学输入的是「帮我分析一下我们产品」。B 同学输入的是「你是一名有 10 年经验的 SaaS 产品经理现在需要帮我分析一款面向中小企业的 CRM 工具。重点围绕用户留存问题展开输出格式为问题定义 → 数据推断 → 可能原因 → 改进建议每个部分不超过 150 字。」同一个模型同一个时间两个人拿到的结果差了不止一个量级。A 同学拿到了一段废话连篇的通用套话B 同学拿到了一份可以直接汇报的分析框架。这件事说明了一个很基本的道理大模型的上限由模型本身决定但你能拿到多少由你的输入决定。很多人觉得 AI 用起来效果一般第一反应是这个模型不行。但真实的问题往往不在模型而在于他们根本没想清楚自己在输入什么、输入了多少、输入对了没有。本文想系统讲清楚大模型输入层的几个核心概念Token、Context、Prompt 体系、Memory。不是为了讲概念而讲是因为只要你在用 AI 做事这几件事搞不清楚就永远在低效摸索。一、Token模型看到的不是字而是碎片很多人以为模型是一个字一个字读进去的就像人看文章一样。其实不是。模型处理的基本单位是 Token而 Token 既不是字也不是词是一种介于字和词之间的语言碎片。用一个例子感受一下。英文句子 “Understanding” 在 GPT 的分词系统里会被切成 Under stand ing 三个 Token。中文相对特殊大致每 1.5 到 2 个汉字对应 1 个 Token——也就是说中文的 Token 效率天然低于英文同样的内容用中文写消耗的 Token 更多。这件事有两个非常直接的影响第一个影响上下文长度有上限。每个模型都有一个最大处理窗口比如 128K Token、200K Token超出这个范围的内容模型根本看不到。这意味着你跟模型聊得越久越早期的对话就越可能被丢掉。第二个影响Token 就是钱。调用 API 是按 Token 计费的输入多少、输出多少都要算。一个写得冗长啰嗦的 Prompt可能比精炼版本多消耗 3 倍 Token。规模一大这个成本差距相当可观。所以话说太多和话说太少都是问题。太多浪费 Token占用有限的上下文空间太少信息不足模型只能靠猜。理解 Token本质上是理解模型的视力范围和计费逻辑。二、Context模型的工作台不是记忆而是视野很多人有一个根深蒂固的误解以为 AI 有记忆就像跟一个人聊天一样说过的事它都记得。实际情况截然不同。大模型没有记忆它只有一个当前视野。每次模型处理你的请求它其实是在看一份完整的文件——这份文件里装着所有它当前能看到的内容这整个东西叫做 Context上下文。Context 里通常包含四类东西System Prompt开发者或产品预设的系统指令相当于模型的岗位说明对话历史你和模型之前聊过的所有内容当前输入你这一轮发的消息工具结果如果模型调用了搜索、代码执行等工具返回的结果也装在这里模型每次回答都是基于这整份文件来推理的而不是想起了之前聊过什么。这个区别很重要因为它解释了两类常见的 AI 失效现象上下文污染对话里掺入了矛盾信息、无关内容或者你中途改变了需求但没有明确说明模型开始混乱给出前后不一致的回答。上下文截断对话轮次太多最早的内容超出了 Token 窗口模型看不到了。你以为它记得其实它已经忘了——不是故意的是物理上看不见了。理解了这个机制就知道为什么有时候多说两句背景会让效果好很多——不是在哄模型是在给它补全工作台上缺失的信息。管好 Context 的核心原则是让每一个出现在视野里的 Token 都是有价值的。无关的历史对话没用的废话都会稀释真正重要信息的权重。三、Prompt 体系你如何组织给模型的指令Prompt 这个词现在被说滥了但真正理解它的人并不多。很多人以为 Prompt 是一种技巧好像背几个模板就能立竿见影。我更倾向于把它理解成一种信息组织能力——你有多大能力把一件事说清楚Prompt 就能写多好。Prompt 不是玄学它有结构有层次有工程化的方法论。我把它分成三个层次来讲3.1 用户 Prompt一次对话的信息结构一个好的用户 Prompt通常包含四个要素目标你要模型做什么越具体越好背景这件事发生在什么场景下有哪些前置条件约束不能做什么有什么限制比如字数、语气、禁止使用某些词输出格式你希望拿到什么形式的结果缺了哪一个模型都要靠猜。而模型猜出来的东西往往不是你真正想要的。差 Prompt 的典型问题有三类第一类是过于模糊。“帮我写一篇文章”文章是什么主题面向谁多少字什么风格模型只能给你一个最通用的东西。第二类是信息缺失。“帮我回复这封邮件”但没说你和对方是什么关系、邮件内容是什么、你想达到什么目的。第三类是格式失控。没有说清楚输出格式模型可能给你一大段散文可能给你一个 Markdown 表格可能给你一堆 JSON猜。3.2 System Prompt藏在对话背后的总指挥如果你只是自己用用 AIUser Prompt 就够了。但如果你在做一个 AI 产品或者管理一个团队在用 AISystem Prompt 就变得至关重要。System Prompt 是在对话开始之前写入 Context 的系统指令用户通常看不见它但它对模型的影响往往大于用户的每一条输入。它主要负责三件事角色定义这个 AI 是谁有什么专业背景用什么语气说话规则设定可以做什么不能做什么遇到哪些情况要如何处理边界划定比如客服场景里不允许谈竞争对手内容审核场景里不允许输出某类内容一个设计得好的 System Prompt可以让一个通用模型变成一个垂直领域的专家助手而一个没有 System Prompt 的 AI 产品就相当于让一个新员工不经过任何培训直接上岗。User Prompt 管的是这一次做什么System Prompt 管的是一直以来是谁。两者分工不同缺一不可。3.3 Prompt Template从手工操作到工程化会写 Prompt 只是第一步让 Prompt 可以规模化使用才是工程化的关键。Prompt Template提示词模板的本质是把一个好 Prompt 里固定不变的部分抽象成结构把每次需要变化的部分留成变量。举个例子一个客服场景的 Prompt 模板可能长这样你是{品牌名称}的客服代表语气{语气要求}。用户问题类型{问题类型}用户原始提问{用户输入}请参考以下知识库内容作答{知识库片段}输出格式先道歉/表示理解再给出解决方案控制在 100 字以内。每次对话进来只需要把变量填进去一个经过精心设计的 Prompt 就能稳定运行而不是每次都临时发挥。这种模板化思路在三类场景里价值尤其明显客服统一语气、统一格式、统一边界避免模型跑偏销售话术根据不同客户类型和阶段动态填充个性化信息内容生成批量生产同类内容比如批量写商品描述、批量生成周报摘要从手写 Prompt 到 Prompt Template是从个人技巧到团队工程化的关键跨越。四、Memory突破 Context 的边界让模型记住你前面讲过Context 是有上限的而且每次对话结束Context 就清空了下次又是白板一张。这就带来了一个问题如果你想让 AI 助手越用越懂你怎么办答案是 Memory记忆机制。Memory 和 Context 的核心区别在于Context 是被动的装什么是当下决定的Memory 是主动管理的有人或系统在有意识地挑选、存储、调用信息。Memory 通常分两种短期记忆在一次会话内有效。比如你跟 AI 说我叫小李做市场的这个信息在这次对话里一直有效但下次打开新对话就消失了。长期记忆跨会话持久保存。你说过的偏好、你处理过的事情、你的背景信息被系统记录下来下次对话时自动带入 Context。好的个性化 AI 助手核心竞争力往往在这里。值得一提的是RAG检索增强生成本质上也是一种外挂记忆——不是把所有知识都塞进 Context而是在需要的时候检索出相关片段再放进来。这是目前最主流的解决知识太多、Context 装不下这个矛盾的工程方案。Memory 的出现让 AI 从每次都陌生变成了越用越懂你这是从工具到助手的关键一步。总结把前面所有内容放在一起大模型输入层的完整结构大概是这样的Token → 成本与长度的硬约束一切的基础单位Context → 模型当前的信息视野装着它能看到的一切 ├ System Prompt → 全局角色与规则定义模型是谁 └ 对话历史 → 当前会话的信息流动态更新Prompt 体系 → 意图传递的组织方式决定模型做什么 ├ User Prompt → 单次任务的信息结构 └ Template → 工程化复用从个人到团队Memory → 跨越 Context 边界的持续积累让模型记住你很多人在想怎么让 AI 更聪明但这个问题问错了方向。模型本身的智能不是你能控制的。你能控制的是它看到了什么。不是怎么让模型更聪明而是怎么让模型看得更清楚。把 Token 管好是成本意识把 Context 管好是信息密度意识把 Prompt 写好是表达结构意识把 Memory 设计好是系统思维。这些不是 AI 专家的专属技能是每一个想用好 AI 的人迟早都要补上的基本功。最后对于正在迷茫择业、想转行提升或是刚入门的程序员、编程小白来说有一个问题几乎人人都在问未来10年什么领域的职业发展潜力最大答案只有一个人工智能尤其是大模型方向当下人工智能行业正处于爆发式增长期其中大模型相关岗位更是供不应求薪资待遇直接拉满——字节跳动作为AI领域的头部玩家给硕士毕业的优质AI人才含大模型相关方向开出的月基础工资高达5万—6万元即便是非“人才计划”的普通应聘者月基础工资也能稳定在4万元左右。再看阿里、腾讯两大互联网大厂非“人才计划”的AI相关岗位应聘者月基础工资也约有3万元远超其他行业同资历岗位的薪资水平对于程序员、小白来说无疑是绝佳的转型和提升赛道。如果你还不知道从何开始我自己整理一套全网最全最细的大模型零基础教程我也是一路自学走过来的很清楚小白前期学习的痛楚你要是没有方向还没有好的资源根本学不到东西下面是我整理的大模型学习资源希望能帮到你。扫码免费领取全部内容最后1、大模型学习路线2、从0到进阶大模型学习视频教程从入门到进阶这里都有跟着老师学习事半功倍。3、入门必看大模型学习书籍文档.pdf书面上的技术书籍确实太多了这些是我精选出来的还有很多不在图里4、AI大模型最新行业报告2026最新行业报告针对不同行业的现状、趋势、问题、机会等进行系统地调研和评估以了解哪些行业更适合引入大模型的技术和应用以及在哪些方面可以发挥大模型的优势。5、面试试题/经验【大厂 AI 岗位面经分享107 道】【AI 大模型面试真题102 道】【LLMs 面试真题97 道】6、大模型项目实战配套源码适用人群四阶段学习规划共90天可落地执行第一阶段10天初阶应用该阶段让大家对大模型 AI有一个最前沿的认识对大模型 AI 的理解超过 95% 的人可以在相关讨论时发表高级、不跟风、又接地气的见解别人只会和 AI 聊天而你能调教 AI并能用代码将大模型和业务衔接。大模型 AI 能干什么大模型是怎样获得「智能」的用好 AI 的核心心法大模型应用业务架构大模型应用技术架构代码示例向 GPT-3.5 灌入新知识提示工程的意义和核心思想Prompt 典型构成指令调优方法论思维链和思维树Prompt 攻击和防范…第二阶段30天高阶应用该阶段我们正式进入大模型 AI 进阶实战学习学会构造私有知识库扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架抓住最新的技术进展适合 Python 和 JavaScript 程序员。为什么要做 RAG搭建一个简单的 ChatPDF检索的基础概念什么是向量表示Embeddings向量数据库与向量检索基于向量检索的 RAG搭建 RAG 系统的扩展知识混合检索与 RAG-Fusion 简介向量模型本地部署…第三阶段30天模型训练恭喜你如果学到这里你基本可以找到一份大模型 AI相关的工作自己也能训练 GPT 了通过微调训练自己的垂直大模型能独立训练开源多模态大模型掌握更多技术方案。到此为止大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗为什么要做 RAG什么是模型什么是模型训练求解器损失函数简介小实验2手写一个简单的神经网络并训练它什么是训练/预训练/微调/轻量化微调Transformer结构简介轻量化微调实验数据集的构建…第四阶段20天商业闭环对全球大模型从性能、吞吐量、成本等方面有一定的认知可以在云端和本地等多种环境下部署大模型找到适合自己的项目/创业方向做一名被 AI 武装的产品经理。硬件选型带你了解全球大模型使用国产大模型服务搭建 OpenAI 代理热身基于阿里云 PAI 部署 Stable Diffusion在本地计算机运行大模型大模型的私有化部署基于 vLLM 部署大模型案例如何优雅地在阿里云私有部署开源大模型部署一套开源 LLM 项目内容安全互联网信息服务算法备案…扫码免费领取全部内容3、这些资料真的有用吗这份资料由我和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理现任上海殷泊信息科技CEO其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证服务航天科工、国家电网等1000企业以第一作者在IEEE Transactions发表论文50篇获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。资料内容涵盖了从入门到进阶的各类视频教程和实战项目无论你是小白还是有些技术基础的技术人员这份资料都绝对能帮助你提升薪资待遇转行大模型岗位。这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

外贸CRM怎么选？5大核心选型维度，避开外贸企业踩坑误区

摘要：外贸企业选CRM，稍不留神就会踩坑：订单没有明显增长、功能不适配业务、不少功能闲置、各系统数据没有打通、业务员不愿用……本文从五个关键维度出发，帮你彻底理清选型逻辑。外贸企业买CRM，很多人花了不少钱&#…...

2026/5/26 1:57:16 阅读更多 →

第二周（第12周）

1.单电源供电的二阶低通滤波器2.功率放大电路...

2026/5/26 1:55:56 阅读更多 →

别再为数据不平衡发愁了！手把手教你用Python的imbalanced-learn搞定分类难题

破解数据不平衡难题：imbalanced-learn实战指南与深度调优策略在信用卡欺诈检测的实际项目中，我们常常遇到一个令人头疼的现象——正常交易记录占据了99.9%的数据，而欺诈交易仅有0.1%。当我们将这样的数据集直接输入逻辑回归或随机森林模型时&…...

2026/5/26 1:55:03 阅读更多 →

【限时解密】Claude 3.5 Sonnet专属编程模式：仅开放给前500家企业的上下文感知补全协议

更多请点击： https://kaifayun.com 第一章：Claude 3.5 Sonnet编程辅助的核心能力边界与适用场景 Claude 3.5 Sonnet 在编程辅助领域展现出显著的推理深度与上下文理解能力，但其本质仍是基于大规模语言模型的生成式系统，不具备实时…...

2026/5/24 0:03:18 阅读更多 →

RMAN 增量备份（Incremental Backup）

1、概念RMAN 增量备份是指 RMAN 只备份自上次备份以来发生过更改的数据块，而不是备份整个数据库的所有数据块。它是 Oracle 为解决大型数据库全量备份时间长、占用空间大的问题而设计的核心特性，也是现代企业级备份策略的基础。简单类比：全库…...

2026/5/24 0:04:53 阅读更多 →

终极指南：掌握ProperTree跨平台Plist编辑器的10个高效技巧

终极指南：掌握ProperTree跨平台Plist编辑器的10个高效技巧【免费下载链接】ProperTree Cross platform GUI plist editor written in python. 项目地址: https://gitcode.com/gh_mirrors/pr/ProperTree 想要轻松编辑macOS和iOS的配置文件却苦于复杂的XML语法…...

2026/5/24 0:21:30 阅读更多 →

ScriptHookV解决方案：如何安全扩展GTA V游戏功能而不修改原始文件

ScriptHookV解决方案：如何安全扩展GTA V游戏功能而不修改原始文件【免费下载链接】ScriptHookV An open source hook into GTAV for loading offline mods 项目地址: https://gitcode.com/gh_mirrors/sc/ScriptHookV ScriptHookV是一个专为《侠盗猎车手V》&…...

2026/5/24 0:26:45 阅读更多 →