小白程序员必看:收藏这份AI知识地图,轻松入门大模型世界!
学习一个陌生领域第一步应该是要构建起这个领域的知识地图。很多朋友包括我自己在内第一次想要深入学习AI这个领域的时候其实会被一大堆概念所困扰。比如ChatGPT、gpt-5.5、Claude、claude opus4.6、Gemini、gemini-3.1pro、DeepSeek、Llama、Cursor、Claude Code、Agent、RAG、向量数据库、LangChain、n8n、提示词工程、上下文工程。因此建立一个理解框架来让这些概念对号入座其实是非常有必要的。下面是我和 AI 学习讨论之后所总结出来的一张理解框架图。将这些概念分成三层框架。模型层能力基座这是 AI 的「大脑」一切能力的源头。1.1 大语言模型LLM概念解释Transformer2017 年 Google 提出的神经网络架构几乎所有现代大模型的基础。核心是「注意力机制」Attention注意力机制让模型能「关注」输入中最重要的部分。例如「我把杯子放在桌上它很重」→ 模型知道「它」 杯子Token词元模型不直接看文字而是把文本拆成 token。1 个汉字 ≈ 1-2 token1 个英文单词 ≈ 1-3 token参数Parameters模型的「脑容量」。7B 70亿参数参数越多通常越聪明但也越贵越慢预训练Pre-training用海量文本几乎整个互联网训练模型学习语言规律、常识、推理。成本极高数百万到上亿美元微调Fine-tuning在通用模型基础上用特定领域数据再训练适配具体任务如医疗、法律RLHF人类反馈强化学习让人类给模型回答打分训练模型产生更好、更安全的回答。ChatGPT 的关键突破之一幻觉Hallucination模型一本正经地胡说八道——生成看似合理但事实错误的内容。LLM 最大的已知缺陷1.2 其他模型类型模型类型代表做什么多模态模型Gemini · GPT-4o · Qwen-VL同时理解文字 图片 音频 视频语音模型Whisper · CosyVoice语音识别听和语音合成说图像模型DALL·E · Stable Diffusion根据文字描述生成图片视频模型Sora · Kling根据文字/图片生成视频1.3 其他核心概念概念作用直觉Temperature温度控制输出随机性0 最确定保守1 更创意随机上下文窗口Context Window模型一次能「看到」的最大文本量GPT-4 约 128K tokens ≈ 一本20万字的书Embedding嵌入把文本转成数学向量用于搜索、相似度比较等向量数据库存储和检索 Embedding 向量的数据库RAG 的基础设施工程层能力增强与环境设计原始模型很强但很「野生」工程层让它变得可控、可靠、可用。2.1 Prompt Engineering提示词工程一句话告诉模型怎么回答你是一个资深 Python 工程师。回答要简洁给出代码示例。通过精心设计输入文本引导模型输出你想要的结果技巧角色设定、Few-shot 示例、思维链Chain of Thought等2.2 Context Engineering上下文工程一句话告诉模型知道什么不只是写提示词而是系统性地设计模型能看到的所有信息包括系统提示词、对话历史、检索到的文档、工具返回的结果等与 Prompt 的区别Prompt 一句话指令Context 模型看到的完整信息环境系统提示 用户输入 检索结果 工具输出 …2.3 RAG检索增强生成一句话给模型接上外部知识库减少幻觉用户提问 → 从知识库检索相关内容 → 把相关内容塞进上下文 → 模型基于这些内容回答解决的问题模型训练数据有截止日期、不了解你的私有数据核心技术栈Embedding 向量数据库 LLM2.4 推理引擎一句话让模型跑得更快更省代表技术vLLM、TensorRT-LLM、SGLang涉及模型量化压缩、KV Cache 优化、批处理调度等不改变模型能力只优化速度和成本2.5 Harness Engineering驾驭工程一句话设计 Agent 的工作环境与工作流定义 Agent 能用什么工具、遵循什么规则、怎么协作包括工具注册、权限控制、记忆管理、多 Agent 协作编排这个概念较新强调的是环境设计而非单纯的提示词设计想要具体了解的可以先看看这篇文章《工程技术在智能体优先的世界中利用 Codex》[1]应用层产品形态把模型和工程能力包装成用户可以直接使用的产品。3.1 Chatbot对话机器人代表ChatGPT、Claude、豆包特点一问一答的对话形式最直接的 AI 产品形态3.2 Agent App智能体应用代表Cursor编程、Coze搭建、Codex编程特点不只是聊天而是能自主规划、调用工具、执行任务核心概念Agent LLM 工具 记忆 规划能力能搜索网页、读写文件、调用 API、多步推理3.3 CLI 工具代表Claude Code、Gemini CLI、OpenCode特点在终端/命令行中运行的 AI 工具面向开发者优势与开发工作流无缝集成、可脚本化、高效举个例子你在豆包里问「帮我写一封请假邮件明天请病假」你说了一句话 ↓┌──────────────────────────────────┐│ ️ 应用层豆包 App ││ ││ 收到你的消息显示在聊天框里 ││ 决定调用哪个模型来回答 ││ 拿到回答后排版好展示给你 │└──────────┬───────────────────────┘ ↓┌──────────────────────────────────┐│ ⚙️ 工程层 ││ ││ ① 组装完整消息发给模型 ││ 系统提示你是一个中文助手 ││ 你的消息帮我写请假邮件... ││ 你之前的对话记录如果有 ││ ││ ② 设定参数 ││ 温度 0.7稍微灵活一点 ││ 上下文窗口 8K tokens │└──────────┬───────────────────────┘ ↓┌──────────────────────────────────┐│ 模型层大语言模型 ││ ││ 收到完整 Prompt ││ ↓ ││ 逐字生成 ││ 尊敬 → 的 → 领导 → ... ││ ↓ ││ 输出一封完整的请假邮件 │└──────────┬───────────────────────┘ ↓ 回到应用层展示给你简单来说层干了啥这个例子里应用层收消息、展示结果豆包 App 的聊天界面工程层组装 Prompt、设参数把系统提示 你的问题 对话历史打包发给模型模型层思考、生成回答一个字一个字「预测」写出请假邮件普通人如何抓住AI大模型的风口领取方式在文末为什么要学习大模型目前AI大模型的技术岗位与能力培养随着人工智能技术的迅速发展和应用 大模型作为其中的重要组成部分 正逐渐成为推动人工智能发展的重要引擎 。大模型以其强大的数据处理和模式识别能力 广泛应用于自然语言处理 、计算机视觉 、 智能推荐等领域 为各行各业带来了革命性的改变和机遇 。目前开源人工智能大模型已应用于医疗、政务、法律、汽车、娱乐、金融、互联网、教育、制造业、企业服务等多个场景其中应用于金融、企业服务、制造业和法律领域的大模型在本次调研中占比超过30%。随着AI大模型技术的迅速发展相关岗位的需求也日益增加。大模型产业链催生了一批高薪新职业人工智能大潮已来不加入就可能被淘汰。如果你是技术人尤其是互联网从业者现在就开始学习AI大模型技术真的是给你的人生一个重要建议最后只要你真心想学习AI大模型技术这份精心整理的学习资料我愿意无偿分享给你但是想学技术去乱搞的人别来找我在当前这个人工智能高速发展的时代AI大模型正在深刻改变各行各业。我国对高水平AI人才的需求也日益增长真正懂技术、能落地的人才依旧紧缺。我也希望通过这份资料能够帮助更多有志于AI领域的朋友入门并深入学习。真诚无偿分享vx扫描下方二维码即可加上后会一个个给大家发【附赠一节免费的直播讲座技术大佬带你学习大模型的相关知识、学习思路、就业前景以及怎么结合当前的工作发展方向等欢迎大家~】大模型全套学习资料展示自我们与MoPaaS魔泊云合作以来我们不断打磨课程体系与技术内容在细节上精益求精同时在技术层面也新增了许多前沿且实用的内容力求为大家带来更系统、更实战、更落地的大模型学习体验。希望这份系统、实用的大模型学习路径能够帮助你从零入门进阶到实战真正掌握AI时代的核心技能01教学内容从零到精通完整闭环【基础理论 →RAG开发 → Agent设计 → 模型微调与私有化部署调→热门技术】5大模块内容比传统教材更贴近企业实战大量真实项目案例带你亲自上手搞数据清洗、模型调优这些硬核操作把课本知识变成真本事02适学人群应届毕业生无工作经验但想要系统学习AI大模型技术期待通过实战项目掌握核心技术。零基础转型非技术背景但关注AI应用场景计划通过低代码工具实现“AI行业”跨界。业务赋能突破瓶颈传统开发者Java/前端等学习Transformer架构与LangChain框架向AI全栈工程师转型。vx扫描下方二维码即可【附赠一节免费的直播讲座技术大佬带你学习大模型的相关知识、学习思路、就业前景以及怎么结合当前的工作发展方向等欢迎大家~】本教程比较珍贵仅限大家自行学习不要传播更严禁商用03入门到进阶学习路线图大模型学习路线图整体分为5个大的阶段04视频和书籍PDF合集从0到掌握主流大模型技术视频教程涵盖模型训练、微调、RAG、LangChain、Agent开发等实战方向新手必备的大模型学习PDF书单来了全是硬核知识帮你少走弯路不吹牛真有用05行业报告白皮书合集收集70报告与白皮书了解行业最新动态0690份面试题/经验AI大模型岗位面试经验总结谁学技术不是为了赚$呢找个好的岗位很重要07 deepseek部署包技巧大全由于篇幅有限只展示部分资料并且还在持续更新中…真诚无偿分享vx扫描下方二维码即可加上后会一个个给大家发【附赠一节免费的直播讲座技术大佬带你学习大模型的相关知识、学习思路、就业前景以及怎么结合当前的工作发展方向等欢迎大家~】