掌握LLM连接与系统设计：小白程序员进阶AI工程师的必学之路（收藏版）

张

张建站

2026/5/12 18:34:09

10分钟阅读

本文详细梳理了AI工程师成长的四个阶段从掌握基础知识、构建RAG系统到生产工程再到高级专业化让读者了解如何将LLM模型连接到数据库、内部工具、API和工作流实现AI在生产环境中的应用。文章强调了AI工程师需要具备系统工程师的思维而非单纯的数据科学家思维并通过实际项目和案例分析为想要成为AI工程师的读者提供了清晰的进阶路线图。大多数想要成为 AI 工程师的人都在为错误的目标而学习花费大量精力学习神经网络、苦练 Kaggle 项目、背诵机器学习理论而那些真正拿着高薪的 AI 工程师们实际上做着完全不同的事情。他们正在将 OpenAI、Anthropic 和开源团队的 LLM 集成到真实世界的生产系统中支撑企业运营这才是 AI 工程师真正的职业路径。公司不是招聘 AI 工程师来发明新的 LLM 模型的而是需要有人能够将 LLM 模型连接到数据库、内部工具、API和工作流让 AI 能真正完成工作为公司提供客服机器人、文档处理、分析和自动化服务。那些拿高薪的人不是一味追逐研究论文的人而是那些构建系统的人。如果想要成为一名有价值的 AI 工程师需要像一个部署和使用 AI 的系统工程师一样思考而不是像一个使用 Python 的数据科学家那样思考。AI 工程师是做什么的大多数人听到“AI工程师”时会想到调整神经网络、修改损失函数或者在 PyTorch 中运行长达数周的训练任务。相信我这并不是大多数公司招聘的 AI 工程师职位。如今的 AI 工程师已经不是人工智能研究者了研究人员负责发明新引擎而 AI 工程师负责打造客户使用的系统并保持运行。2026年大多数真实的 AI 工程职位如下所述“可以从 OpenAI、Anthropic 或开源项目中获取 LLM给模型提供上下文比如公司数据、用户历史、文档给模型提供工具、数据库、API 和内部系统然后让模型可靠、安全、高效且快速的工作并将其部署到人们使用的产品或工作流程中。2026 年的 AI 工程师角色不再是训练基础模型而是围绕模型进行工程设计这意味着 AI 工程师需要大规模连接模型与数据库将模型连接到内部文档和知识库中集成工单系统、CRM 和支付 API添加护栏、重试和备份逻辑防止 LLM 幻觉、数据泄露以及成本失控不需要做论文研究实验而是要运行生产系统。要做到这一点不需要从零开始训练模型而是需要工程判断、稳健的代码和现实世界的可靠性。如果浏览 2026 年的 AI 工程师招聘信息会发现同样的 AI 技术栈会反复出现Python —— 人工智能系统的通用语提示 —— 不是聊天而是结构化、受控的输入输出设计RAG —— 用于真实数据上下文的检索增强生成LangChain —— 流水线、工具、内存、编排向量数据库 —— 大规模语义检索云 —— 部署、扩展、监控公司不需要招聘懂 transformers 工作原理的人而是要招聘那些懂得如何在真实系统中使 transformers 变得有用的人正如 Andrew Ng 曾谈及实际 AI 岗位时所说““大多数机器学习应用并不涉及从零开始训练模型。”这一直是他所有课程和演讲中反复出现的主题包括谷歌提供的免费机器学习速成课程。2026 年成为 AI 工程师首先需要成为系统构建者然后再成为模型用户。2026 年高价值 AI 工程师职业道路高价值 AI 工程师职位存在的原因与炒作无关而是源于简单的供需失衡。在需求端每家大型公司都在试图构建四个系统内部文档的 AI 搜索为客户和员工提供支持的 AI 代理将原始数据转化为决策的 AI 分析替代人工劳动的 AI 工作流这些不仅是实验而是涉及收入、合规和客户体验的运营系统。从技术角度看这四种都要求采用相同的架构推理大语言模型基于私人数据的检索系统工具调用内部 API多步骤工作流的编排层监控、记录与访问控制与其说是研究不如说是大规模产品化工程。现在我们看看供应端大多数开发者大致分为两类。其中一类懂软件API数据库云分布式系统但他们不明白嵌入上下文窗口提示控制模型行为另一组懂机器学习模型训练评估但他们不知道如何部署如何扩展如何与真实业务系统集成很少有人同时知道这两者这就是为什么公司愿意为综合技能支付溢价。当一家公司构建 AI 支持代理时并不是在购买模型而是在购买文档导入流水线向量搜索基础设施API 网关权限系统记录与监测备份与安全逻辑一个故障的 AI 系统可能让公司损失数百万所以当一家公司找到一个能够从模型到生产全栈能力的工程师时并不是在为一行代码而招聘而是为了业务成果。这也是为什么 AI 应用工程师增长速度快于研究岗位以及为什么最优秀的工程师在 2026 年能拿到极高的薪资。一方面有公司花费数百万美元试图将 AI 接入其核心系统。另一方面有些开发者要么懂软件要么懂机器学习但几乎不可能两者都懂得并且能在生产环境中工作这就使得具有综合能力的 AI 工程师拥有极高的溢价。问题是大多数 AI 工程师的学习路径并不会告诉你如何达到那个目标它们要么让你深入机器学习理论要么让你只能做普通软件再加上一点 AI。所以与其再给一个模糊的路线图不如说说我认为 2026 年顶尖 AI 工程师的实际路径。不论年龄或学位只看先学什么、接下来要建立什么以及掌握什么才能跻身市场顶端。路线图分为四个清晰的阶段。第一阶段掌握基础知识第1-2个月目标理解 LLM 实际工作原理和控制其行为的因素和方式i. 面向生产环境的 Python 技能Python 熟练度是排名第一的 GenAI 需求技能你需要能够熟练处理API 调用和异步操作JSON 处理和数据结构错误处理和重试环境管理推荐免费教学资源CS50 哈佛大学 Python 导论谷歌的 Python 课程练习内容从 API 拉取数据并写入 CSV 的 GitHub 仓库使用 argparse 的 CLI 工具从 .env 文件加载密钥并干净处理错误的脚本如果能做到这三点已经领先于大多数自称 AI 工程师的人。ii. Git 和 GitHub如果不会 Git就无法在真正的团队中工作。你应该能够创建仓库提交变更创建功能分支安全的进行合并打开并审核 pull request推荐免费教学资源Pro Git官方 Git 书GitHub 学习实验室沉浸式 Git练习内容fork 一个真正的开源项目并提交 pull request自己运行一个带有 issue 和里程碑的仓库创建特性分支并合并iii. 掌握机器学习词汇不需要成为数据科学家但需要理解模型的语言否则 API、论文和文档都会变得像噪音一样。你必须明白训练与推理嵌入是什么令牌和上下文窗口的含义何谓损失与准确度衡量模型实际输出的是什么这不是可选项而是避免构建出有问题的 AI 系统的方法。推荐免费教学资源谷歌机器学习速成课程fast.ai 实用机器学习Distill练习内容用 Scikit Learn 训练一个微型分类器生成嵌入并计算相似性用 Hugging Face 分词句子并检查词元学完这些就不会觉得模型像魔法一样了。iv. LLM API公司唯一关心的部分真正的 AI 工程是 API 工程必须了解以下内容发送请求处理速率限制处理 token 限制重试部分失败解析结构化响应应该学习一个托管 API 和一个开源栈因为托管模型部署起来更快。推荐免费教学资源OpenAI APIAnthropic Claude API这些能为你提供强模型零基础设施基于使用量的定价开源模型能为你提供成本控制数据隐私本地部署HuggingFace 是最快的入门方式有一些参考资源可以帮助你学习HuggingFace 课程HuggingFace 推理 API如果能同时使用封闭和开放模型你就会变得更为不可替代。v. LLM 参数理解理解参数不是高级知识 —— 而是基础。Temperature温度控制输出的随机性Temperature 0 确定性输出数据提取、分类Temperature 0.7-0.9 创造性输出内容生成、头脑风暴在 temperature 为 0 时贪婪采样选择概率最高的词产生确定性且专注的输出非常适合需要事实准确性的任务Top_p和Top_k控制词汇选择的多样性Top_p使用累积概率更灵活Top_k限制在前K个候选词更严格Max_tokens最大令牌数限制响应长度直接影响成本在生产环境中每个令牌都等于金钱为什么这很重要在生产环境中我曾看到一个团队因为 temperature 设置为 0.8在单个摘要任务上一天就花费了 500 美元因为生成了不必要的冗长、多样化的响应。将 temperature 调整为0.3可以让 token 使用量减少 60%。推荐免费教学资源OpenAI API文档Anthropic Claude 文档vi. 提示工程基础自然语言提示工程和检索增强生成Retrieval-Augmented Generation, RAG技能对于使用 LLM 的软件工程师至关重要。零样本提示模型在没有示例的情况下响应的最简单方法在任务简单时效果很好适合测试基线能力少样本提示展示特定示例以突出任务复杂性引导模型朝向期望的行为对于复杂或特定领域的任务至关重要思维链将复杂任务分解为更简单的步骤引导模型产生更好的最终输出对于推理任务至关重要结构化输出获得一致的JSON、XML或格式化响应对于生产集成必不可少需要仔细的提示设计推荐免费教学资源ChatGPT 提示工程DeepLearning.AIDAIR.AI 提示工程指南OpenAI 官方提示工程指南Microsoft 提示工程指南Anthropic 提示设计指南练习内容强制模型返回有效的 JSON将用户意图分类为固定标签在严格长度限制下总结文本当模型输出不符合格式时不是责怪模型而是修正提示这才是真正的 AI 工程。vii. Token、成本和上下文大多数 AI 初学者在这里会看到第一笔账单模型按 token 收费有硬性上下文限制。如果你不明白提示词有多长回复的长度有多长对话历史如何增长应用要么会失败要么会变得昂贵。所以必须设计简洁、结构化且可重复使用的提示。推荐免费教学资源OpenAI 使用与成本指南OpenAI 分词器练习内容测量令牌计数修剪提示总结对话历史这将帮助你学会保持生产系统廉价/稳定的艺术。viii. 第一个实践项目一旦掌握了 Python Git ML/LLM 基础应该先做一个入门的 AI 工程项目这里有一个简单却强大的 AI 入门项目创意初级 AI 项目用 CLI 构建 LLM API 包装器目标创建一个小型 Python 工具可以接收用户文本输入调用 LLM API写入结构化 JSON 输出处理错误和速率限制记录结果日志你将学会API 请求认证JSON 解析CLI 用户体验日志记录与错误处理Git 项目结构你可以使用FastAPI 或 Streamlit。这个 AI 项目证明了你可以集成 LLM控制输出运行一个 AI 系统成为 AI 工程师的第一阶段不是学很多概念而是建立自信和流利度。后续阶段将假设你可以独立阅读文档调试故障用干净的代码构建真实的 AI 项目这已经让你领先于大多数学习 AI 的人。到目前为止你一直在调用模型。接下来你将开始运行系统包括 RAG、代理、工具调用、编排。第二阶段RAG 系统构建第3-4个月目标学习构建基于私有数据进行检索的 LLM 系统通用 LLM 很强大但在企业环境中上下文就是一切——这就是 RAG 发挥作用的地方。i. 为什么RAG很重要我合作过的每家公司都需要他们的 LLM 能够回答关于内部文档的问题引用特定的政策或程序处理专有数据基于事实信息确保准确检索增强生成Retrieval-Augmented Generation, RAG就是实现这一目标的方法。ii. 核心RAG概念文档处理分块策略固定大小分块简单但粗糙基于句子的分块保持意义基于段落的分块保持上下文语义分块在主题边界处分割对于法律合同使用基于章节的分块来尊重文档结构。对于技术文档语义分块效果更好。关键问题你如何在分块之间保持上下文关于A方义务的条款在不知道A方是谁的情况下毫无意义。嵌入和向量数据库什么是嵌入文本的数值表示捕捉语义含义。相似的概念具有相似的嵌入。你应该了解的向量数据库Pinecone托管易于使用Weaviate开源功能丰富ChromaDB轻量级适合原型开发Meta 开源的 FAISS相似性搜索找到与查询语义相似的文档即使它们不共享完全相同的关键词。iii. 检索策略这里变得有趣了大多数候选人只知道基本的向量搜索。那些脱颖而出的人理解混合方法。向量搜索找到语义相似的内容适合同义词和意译可能错过精确的关键词匹配BM25关键词搜索基于词频的传统搜索适合精确匹配错过语义相似性混合搜索结合两种方法使用重排序选择最佳结果通常优于任何单一方法何时使用什么当文档包含精确关键词但上下文错误时向量搜索会失败当同义词和意译重要时BM25 会失败带重排序模型的混合搜索通常优于任何单一方法iv. 构建 RAG 系统实践项目特定领域问答系统构建一个关于特定领域回答问题的对话AI技术文档公司政策研究论文产品信息要求文档处理流水线用于存储的向量数据库检索机制用于生成的 LLM 集成基本评估指标关键学习不要只是让它工作要理解为什么工作。用检索失败的查询进行测试记录什么会出问题以及为什么。v. 评估的重要性大多数候选人构建 RAG 系统但从不正确评估。这在面试中是一个危险信号。应该跟踪的指标对于检索PrecisionK在前K个检索到的文档中有多少是相关的召回率你是否找到了相关文档MRR平均倒数排名相关结果出现的速度有多快对于生成忠实性响应是否基于检索到的文档答案相关性它是否真正解决了查询上下文精度你是否使用了正确的分块生产现实延迟用户不会等待 10stoken 使用直接影响预算用户反馈最终标准vi. 免费学习 RAG 的参考资源LangChain RAG 文档 https://python.langchain.com/docs/use_cases/question_answering/[30]OpenAI 检索指南 https://platform.openai.com/docs/guides/retrieval[31]v. 智能体聊天机器人回答问题智能体采取行动。代理读取输入决定行动调用工具评估结果并决定下一步。这意味着它可以查询数据库、调用 API、更新记录并触发工作流。这就是 AI 从支持机器人转变为业务操作员的方式。一旦给模型工具就需要权限、日志记录、重试和安全检查这就是 AI 工程。了解智能体 AI 框架LangChain 代理 https://python.langchain.com/docs/modules/agents/[32]OpenAI 工具调用 https://platform.openai.com/docs/guides/function-calling[33]CrewAI 开源代理框架 https://docs.crewai.com/[34]练习内容创建调用 API 的工具让模型选择工具链接每一步动作记录每一步作为一名 AI 工程师学习这些知识将帮助你理解如何自动化实际工作。vi. 编排真正的 AI 技能真正的 AI 系统不是单一的提示而是流水线单个用户请求可能涉及分类、检索、推理、工具调用、验证和响应格式化。像 LangChain、Langgraph 和 Autogen 这样的框架存在是因为没人愿意每次都硬编码这些逻辑。但了解框架并不是唯一目标需要理解编排存在的原因。练习内容分类用户意图通往不同流水线的路由结合 RAG、代理和验证这就是你开始理解 AI 如何成为基础设施的地方。第三阶段生产工程第5-6个月目标学习在生产环境中部署和维护 LLM 系统所需的知识公司期望候选人部署模型而不仅仅是在笔记本中进行构建。现实检查这是大多数候选人面试失败的地方。他们可以构建演示但没有考虑生产环境。i. API 设计LLM 应用需要可访问意味着需要构建适当的 API。必备项REST 或 GraphQL 端点身份验证和授权速率限制防止滥用请求验证错误处理和重试超时管理示例结构app.post(/chat) asyncdef chat_endpoint( request: ChatRequest, user: User Depends(get_current_user) ): try: # 速率限制检查 await check_rate_limit(user.id) # 验证输入 validate_message(request.message) # 带超时调用LLM response await call_llm_with_timeout( request.message, timeout30 ) return ChatResponse( messageresponse, tokens_usedcount_tokens(response) ) except RateLimitError: raise HTTPException(429, Rate limit exceeded) except TimeoutError: raise HTTPException(504, Request timeout) except Exception as e: log_error(e) raise HTTPException(500, Internal error)ii. 监控和可观察性应该监控什么性能指标延迟P50、P95、P99 —— 不仅仅是平均值每个请求的 token 使用量吞吐量每秒请求数质量指标响应忠实性和答案相关性幻觉率用户满意度分数成本指标总 token 消耗每次用户交互的成本缓存命中率安全指标提示/响应中的 PII 检测提示注入尝试恶意输入模式LLM 可观察性提供端到端追踪对每个步骤的输入、输出、延迟、token 使用和错误具有可见性。需要学习的工具LangSmith 用于 LLM 可观察性Weights Biases 用于实验跟踪自定义日志记录和指标仪表板iii. 提示词版本控制将提示词视为代码。提示词版本控制系统应该包括版本控制Git变更的 A/B 测试每个版本的指标跟踪回滚能力变更原因的文档为什么这很重要你向生产环境推送了一个新提示突然用户满意度下降了15%能否识别是什么造成变化能否快速回滚没有版本控制就是在盲目修改。iv. 成本优化在生产环境中token 使用量会快速累积。管理成本的策略缓存缓存常见查询尽可能重用嵌入对相似查询使用语义缓存提示词优化移除不必要的冗长使用更短、更清晰的指令测试更少的示例是否同样有效模型选择尽可能使用较小的模型为复杂查询保留昂贵的模型实现回退链首先尝试便宜模型Token 管理设置适当的 max_tokens智能截断上下文监控并在使用量激增时发出警报v. 生产项目构建并部署一个具有完整生产设置的 RAG 系统要求带身份验证的适当 API监控仪表板提示版本控制系统错误处理和日志记录成本跟踪A/B 测试能力部署到云AWS、GCP 或 Azure成功指标能否解释每个生产决策为什么选择那个数据库为什么选择那个缓存策略为什么选择那些监控指标第四阶段高级专业化第7-8个月目标通过在一个领域的深度专业知识脱颖而出此时你已经掌握了基础知识。现在通过专业化来让自己与众不同。i. 选择你的路径路径A智能体 AI你将学习多智能体系统工具使用和函数调用能够独立思考和行动的自主系统智能体内存和状态管理为什么重要智能体AI系统采用专门的智能体——路由智能体将查询定向到专门的智能体协调智能体管理复杂工作流程工具智能体执行具体操作。项目构建一个多智能体自动化系统路径BLLMOps你将学习LLM 系统的 CI/CD 管道自动化模型评估和回滚大规模提示管理性能调优和成本优化为什么重要随着 LLM 系统变得越来越关键确保它们的可靠性、性能和成本效益成为一项专业技能。项目构建一个完整的 LLMOps 平台ii. 高级技能掌握函数调用和工具使用为LLM定义自定义函数处理函数调用错误和回退构建可以与外部系统交互的智能体记忆管理短期记忆对话上下文长期记忆用户偏好和历史向量记忆和检索高级RAG技术知识图谱集成层次化检索自我修正RAGiii. 系统架构真正的AI工程师需要理解整体系统架构可扩展性模式水平扩展LLM服务负载均衡和故障转移数据分区和分片策略安全考虑数据加密和隐私保护提示注入防护访问控制和审计集成模式微服务架构中的LLM事件驱动的AI系统传统应用的AI集成iv. 职业发展策略建立你的个人品牌在 GitHub 上发布项目写技术博客参与开源项目在技术会议上演讲求职准备准备一个作品集项目练习系统设计面试建立技术人脉网络了解市场薪酬水平持续学习关注 AI 研究进展参加在线课程和研讨会加入专业社区寻找导师指导技能组合扎实的软件工程基础深度的LLM专业知识生产环境经验系统架构能力业务理解能力v. 作品集示例1. 企业 RAG 决策系统公司有成千上万份文件但员工无法快速找到正确的答案来做出决策。支持、法务和合规团队浪费数小时搜索 PDF 和内部 wiki。错误或过时的信息会导致真正的财务和法律风险。这个 AI 项目说明你可以将非结构化公司数据转化为可用的 AI 系统证明你理解检索、准确性和可解释性而这些正是企业所重视的。现在每家大型公司都在内部努力建立这个项目。2. 自然语言到 SQL 分析系统业务团队只能等分析师去查询数据决策进展缓慢洞察被 SQL 和 BI 工具困住了。而领导现在就需要答案而不是等仪表盘更新。这个 AI 项目说明你可以将 AI 与真实商业数据连接起来而不仅仅是文本。证明你懂得模式推理、数据安全和分析工作流程。这样就能向招聘经理证明你能打造一个成为决策引擎而不仅仅是聊天机器人的 AI 系统。参考源代码虽然目前还没有太多开源仓库示例但 Bedrock agent text2sql 展示了一个真实可部署的 LLM 代理文本转 SQL 集成示例https://github.com/build-on-aws/bedrock-agent-txt2sql[39]3. AI 工作流编排器团队在手动转发邮件、工单和请求上浪费时间。重要问题会丢失、延迟或处理不一致。规模化运营通常意味着雇佣更多人而不是自动化工作。这个 AI 项目证明你能打造一个能采取行动的 AI而不仅仅是给出答案。它展示了真实世界的编排、工具调用和系统可靠性。这正是公司愿意花大价钱购买的系统类型。参考源代码500 AI 代理项目/用例可以找到许多示例学习构建包含数十种实用代理模式https://github.com/ashishpatel26/500-AI-Agents-Projects[40]vi. 认证认证有助于自动筛查招聘经理认可的几个例子IBM AI 工程专业证书[41]Azure AI Engineer[42]Databricks 生成式人工智能工程师[43]AWS 认证 AI 从业者[44]证书不能替代项目但能帮助你的简历被看见为简历锦上添花。结论你的 AI 工程师之路成为高薪 AI 工程师不能一蹴而就但是一个非常可实现的目标。关键是要建立坚实的基础不要跳过基础知识专注于实际应用构建真实的项目而不仅仅是教程考虑生产环境从第一天起就思考可扩展性、可靠性和成本持续学习AI 领域发展迅速保持更新至关重要建立网络与其他 AI 工程师建立联系寻找导师这个领域才刚刚开始爆发性增长。现在开始学习这个技能组合将在未来十年内处于非常有利的位置。记住AI 工程不是关于知道每个工具而是关于构建不会被破坏的系统。如果你已经了解软件工程就不是从零开始而是在扩展技能组合。专注于基础、动手构建、理解权衡。持续这样做 6-12 个月就将领先于大多数试图进入 AI 领域的人。最后对于正在迷茫择业、想转行提升或是刚入门的程序员、编程小白来说有一个问题几乎人人都在问未来10年什么领域的职业发展潜力最大答案只有一个人工智能尤其是大模型方向当下人工智能行业正处于爆发式增长期其中大模型相关岗位更是供不应求薪资待遇直接拉满——字节跳动作为AI领域的头部玩家给硕士毕业的优质AI人才含大模型相关方向开出的月基础工资高达5万—6万元即便是非“人才计划”的普通应聘者月基础工资也能稳定在4万元左右。再看阿里、腾讯两大互联网大厂非“人才计划”的AI相关岗位应聘者月基础工资也约有3万元远超其他行业同资历岗位的薪资水平对于程序员、小白来说无疑是绝佳的转型和提升赛道。对于想入局大模型、抢占未来10年行业红利的程序员和小白来说现在正是最好的学习时机行业缺口大、大厂需求旺、薪资天花板高只要找准学习方向稳步提升技能就能轻松摆脱“低薪困境”抓住AI时代的职业机遇。如果你还不知道从何开始我自己整理一套全网最全最细的大模型零基础教程我也是一路自学走过来的很清楚小白前期学习的痛楚你要是没有方向还没有好的资源根本学不到东西下面是我整理的大模型学习资源希望能帮到你。扫码免费领取全部内容1、大模型学习路线2、从0到进阶大模型学习视频教程从入门到进阶这里都有跟着老师学习事半功倍。3、入门必看大模型学习书籍文档.pdf书面上的技术书籍确实太多了这些是我精选出来的还有很多不在图里4、AI大模型最新行业报告2026最新行业报告针对不同行业的现状、趋势、问题、机会等进行系统地调研和评估以了解哪些行业更适合引入大模型的技术和应用以及在哪些方面可以发挥大模型的优势。5、面试试题/经验【大厂 AI 岗位面经分享107 道】【AI 大模型面试真题102 道】【LLMs 面试真题97 道】6、大模型项目实战配套源码适用人群四阶段学习规划共90天可落地执行第一阶段10天初阶应用该阶段让大家对大模型 AI有一个最前沿的认识对大模型 AI 的理解超过 95% 的人可以在相关讨论时发表高级、不跟风、又接地气的见解别人只会和 AI 聊天而你能调教 AI并能用代码将大模型和业务衔接。大模型 AI 能干什么大模型是怎样获得「智能」的用好 AI 的核心心法大模型应用业务架构大模型应用技术架构代码示例向 GPT-3.5 灌入新知识提示工程的意义和核心思想Prompt 典型构成指令调优方法论思维链和思维树Prompt 攻击和防范…第二阶段30天高阶应用该阶段我们正式进入大模型 AI 进阶实战学习学会构造私有知识库扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架抓住最新的技术进展适合 Python 和 JavaScript 程序员。为什么要做 RAG搭建一个简单的 ChatPDF检索的基础概念什么是向量表示Embeddings向量数据库与向量检索基于向量检索的 RAG搭建 RAG 系统的扩展知识混合检索与 RAG-Fusion 简介向量模型本地部署…第三阶段30天模型训练恭喜你如果学到这里你基本可以找到一份大模型 AI相关的工作自己也能训练 GPT 了通过微调训练自己的垂直大模型能独立训练开源多模态大模型掌握更多技术方案。到此为止大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗为什么要做 RAG什么是模型什么是模型训练求解器损失函数简介小实验2手写一个简单的神经网络并训练它什么是训练/预训练/微调/轻量化微调Transformer结构简介轻量化微调实验数据集的构建…第四阶段20天商业闭环对全球大模型从性能、吞吐量、成本等方面有一定的认知可以在云端和本地等多种环境下部署大模型找到适合自己的项目/创业方向做一名被 AI 武装的产品经理。硬件选型带你了解全球大模型使用国产大模型服务搭建 OpenAI 代理热身基于阿里云 PAI 部署 Stable Diffusion在本地计算机运行大模型大模型的私有化部署基于 vLLM 部署大模型案例如何优雅地在阿里云私有部署开源大模型部署一套开源 LLM 项目内容安全互联网信息服务算法备案…扫码免费领取全部内容3、这些资料真的有用吗这份资料由我和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理现任上海殷泊信息科技CEO其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证服务航天科工、国家电网等1000企业以第一作者在IEEE Transactions发表论文50篇获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。资料内容涵盖了从入门到进阶的各类视频教程和实战项目无论你是小白还是有些技术基础的技术人员这份资料都绝对能帮助你提升薪资待遇转行大模型岗位。这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

从“能装上”到“可复现”：Python 团队如何正确使用 requirements.txt、锁定文件与依赖分组

从“能装上”到“可复现”：Python 团队如何正确使用 requirements.txt、锁定文件与依赖分组团队 Python 项目最常见的混乱，往往不是代码写错，而是环境不一致：A 同事本地能跑，B 同事 pip install -r requirements.txt…...

2026/5/12 18:24:32 阅读更多 →

Modbus RTU 与 Modbus TCP 深入指南-结束语

结束语本指南涵盖了Modbus RTU和Modbus TCP的物理层、数据链路层、报文格式、CRC算法、通信模型、功能码详解、性能优化、安全加固、故障排查、工程实践、过渡策略及现代替代方案。核心要点回顾：RTU：串口，远距离，简单可靠&#xf…...

2026/5/12 18:21:25 阅读更多 →

4 生成器模式

生成器模式的核心是：将一个复杂对象的构建与它的表示分离，使得同样的构建过程可以创建不同的表示。简单说：像搭积木一样，用相同的步骤可以搭出不同样式的房子。建造房子的步骤是固定的：打地基建墙体安装屋顶装修内部但…...

2026/5/12 18:21:24 阅读更多 →

OpenClaw智能模型路由：基于任务复杂度与成本约束的动态调度实践

1. 项目概述：一个聪明的AI模型调度器如果你正在使用OpenClaw，并且手头同时接入了多个不同能力、不同成本的AI模型（比如Kimi、GPT、Claude等），那么你很可能遇到过这样的困扰：一个简单的文本总结任务&#xf…...

2026/5/11 19:13:10 阅读更多 →

机器学习的数据合成（二）

原文：annas-archive.org/md5/9d5ab593b867c3a47f27572d629020aa 译者：飞龙协议：CC BY-NC-SA 4.0 第十四章：合成到真实领域自适应本章向您介绍了一个常见的问题，通常限制了合成数据的使用性，称为领域差距…...

2026/5/12 14:55:27 阅读更多 →

cann/catlass MX FP8批量矩阵乘

MXFP8BatchMatmulTla Example Readme 【免费下载链接】catlass 本项目是CANN的算子模板库，提供NPU上高性能矩阵乘及其相关融合类算子模板样例。项目地址: https://gitcode.com/cann/catlass 功能介绍演示 Ascend 950 上的 MX FP8 矩阵乘：A、B …...

2026/5/12 17:56:15 阅读更多 →