11.从Demo到工程：RAG/Agent系统的日志、配置与异常处理

张

张建站

2026/7/4 18:08:39

10分钟阅读

目录前言第一步加logging第二步加异常处理第三步做配置管理前言今天主要任务是给咱们的系统增加一些日志、异常处理并且加配置管理这样咱们系统在出错时可以不再看traceback而是能看清楚哪一步挂了。此外咱们前面的代码API KEY、路径和模型名字是写死在代码中的今天咱们将添加配置管理让他们从代码中解耦。第一步加logging首先创建一个设置日志的函数logger_config.pyimportloggingdefsetup_logger():logging.basicConfig(levellogging.INFO,format%(asctime)s | %(levelname)s | %(name)s | %(message)s)returnlogging.getLogger(rag_agent)然后在app.py、agent.py、rag_system.py里都引入fromlogger_configimportsetup_logger loggersetup_logger()关于日志这里需要补充一些相关知识1、关于日志设置的字段%(xxx)s是占位符其中%(asctime)s日志记录的时间戳如 2024-01-15 10:30:45,123%(levelname)s日志级别INFO、WARNING、ERROR、DEBUG等%(name)s日志记录器的名称通常是模块名或自定义名称%(message)s实际的日志消息内容2、levellogging.INFO语句设置日志等级为信息级这个级别以下的信息会被忽略关于日志级别CRITICAL (50) ← 最严重最少输出↓ERROR (40)↓WARNING (30)↓INFO (20)↓DEBUG (10) ← 最不严重最多输出第二步加异常处理前面的代码默认我们的每一步都成功但是在做工程项目的时候我们最好假设每一步都“可能失败”所以我们需要对各种操作加上异常处理app.py中的/ask我们需要加上异常处理fromfastapiimportHTTPExceptionapp.post(/ask)defask_question(req:QueryRequest):try:answerrun_agent(req.question,TOOLS,rag)return{question:req.question,answer:answer}exceptExceptionase:logger.exception(Error occurred in /ask)raiseHTTPException(status_code500,detailstr(e))前面我们定义的get_embedding函数可能因为网络不稳导致embedding失败我们同样可以加上异常处理importtimeimportnumpyasnpdefget_embedding(text,max_retries3):forattemptinrange(max_retries):try:responseclient2.embeddings.create(modeltext-embedding-3-small,inputtext)returnnp.array(response.data[0].embedding,dtypefloat32)exceptExceptionase:logger.warning(fEmbedding failed, retry{attempt1}/{max_retries}:{e})time.sleep(2)logger.error(Embedding failed after all retries)raiseRuntimeError(Embedding generation failed)choose_tool中模型有时可能不按要求返回JSON所以这里也要加保护defchoose_tool(query,tools):tool_desc\n.join([f{t[name]}:{t[description]}fortintools])promptf You are an AI agent. Available tools:{tool_desc}User question:{query}Return JSON: {{tool: ..., input: ...}} try:responseclient.chat.completions.create(modelCHAT_MODEL,messages[{role:user,content:prompt}])contentresponse.choices[0].message.contentreturnjson.loads(content)except:logger.warning(fTool decision parse failed:{content})return{tool:llm,input:query}第三步做配置管理这里容易踩坑所以要特别说一下为什么要做配置管理咱们再代码中写死API KEY、BASE URL、DATA路径以及模型名字刚开始代码肯定能跑但是有可能在日后出现问题因为系统有可能会遇到换模型、换平台、上传服务器部署以及上Django这种情况如果遇到代码量又比较大那么就得一个个改很麻烦所以咱们做一个配置管理以后想要换的话只需要修改配置文件就可以了。咱们前面在根目录创建过一个.env文件那个时候咱们在里面放了两个API KEY这回咱们将内容丰富一下写成下面的样子DEEPSEEK_API_KEY你的deepseek_key DEEPSEEK_BASE_URLhttps://api.deepseek.com EMBEDDING_API_KEY你的embedding_key EMBEDDING_BASE_URLhttps://api.shubiaobiao.com/v1 CHAT_MODELdeepseek-chat EMBEDDING_MODELtext-embedding-3-small DATA_DIRdata随后创建一个config.py文件在里面引入咱们所有的配置信息fromdotenvimportload_dotenvimportos load_dotenv()DEEPSEEK_API_KEYos.getenv(DEEPSEEK_API_KEY)DEEPSEEK_BASE_URLos.getenv(DEEPSEEK_BASE_URL,https://api.deepseek.com)EMBEDDING_API_KEYos.getenv(EMBEDDING_API_KEY)EMBEDDING_BASE_URLos.getenv(EMBEDDING_BASE_URL)CHAT_MODELos.getenv(CHAT_MODEL,deepseek-chat)EMBEDDING_MODELos.getenv(EMBEDDING_MODEL,text-embedding-3-small)DATA_DIRos.getenv(DATA_DIR,data)然后咱们就可以修改咱们代码中用到大模型的地方了比如llm_utils.py中咱们模型的调用部分可以按照下面的方式修改fromdotenvimportload_dotenvimportos load_dotenv()DEEPSEEK_API_KEYos.getenv(DEEPSEEK_API_KEY)DEEPSEEK_BASE_URLos.getenv(DEEPSEEK_BASE_URL,https://api.deepseek.com)EMBEDDING_API_KEYos.getenv(EMBEDDING_API_KEY)EMBEDDING_BASE_URLos.getenv(EMBEDDING_BASE_URL)CHAT_MODELos.getenv(CHAT_MODEL,deepseek-chat)EMBEDDING_MODELos.getenv(EMBEDDING_MODEL,text-embedding-3-small)DATA_DIRos.getenv(DATA_DIR,data)如果这篇文章对你有帮助可以点个赞完整代码地址https://github.com/1186141415/A-Paper-Rag-Agent

12、webpack如何实现持久化缓存

目录一、先建立认知：持久化缓存是什么？ 核心目标实现前提二、Webpack 持久化缓存的核心：Hash 策略 Webpack 提供三种 Hash 1. hash 2. chunkhash 3. contenthash（推荐） 面试亮点说法三、只有 Hash 还不够…...

2026/7/4 18:08:36 阅读更多 →

AI原生研发必须跨过的5道合规关卡：从模型训练数据溯源到部署阶段审计日志全链路合规验证指南

第一章：AI原生软件研发合规性要求解读 2026奇点智能技术大会(https://ml-summit.org) AI原生软件并非传统软件的简单增强，其核心特征在于模型即逻辑、数据即资产、推理即服务。这种范式转变直接触发了监管视角的根本性迁移——合规性不再仅聚焦于代码安…...

2026/6/16 19:04:29 阅读更多 →

如何编写安全的SQL查询_使用参数化查询彻底杜绝注入

string.Format拼SQL必然导致SQL注入，因用户输入会直接混入SQL结构；必须用参数化查询（如SqlCommand.Parameters.Add）隔离值与结构，并对动态表名/列名等采用白名单校验。为什么 string.Format 拼 SQL 一定会出事因为数据…...

2026/6/18 3:02:50 阅读更多 →

华为OD机试2025C卷-字符串变换最小次数[100分]（ Java _ Python3 _ C++ _ C语言 _ JsNode _ Go）实现100%通过率

📫 个人主页：深夜coding算法 📣 专栏系列：2026年华为最新OD机试题库详解 🔥 一次订阅，永久解锁 | 持续更新100篇 | 6语言全覆盖文章目录❄️前言：☀️一：题目描述🌙 题目…...

2026/7/1 9:02:25 阅读更多 →

快人一步，预发掘的监控系统

快人一步：基于AI预发掘与多角色评审的下一代监控系统架构设计摘要传统监控系统长期面临一个核心矛盾：监控覆盖率的完备性与报警的精准性之间的博弈。运维团队往往在"漏报"与"误报"的夹缝中疲于奔命。本报告提出并完整设计了一种…...

2026/7/3 23:10:56 阅读更多 →

Workflow 系列（01）：基础理论——三种执行模型与 Anthropic 5 种模式

工作流不是流程图传统工作流是确定性的：每个节点是一段代码，分支条件是布尔表达式，失败是预定义的异常类型。相同输入给相同输出，跑一百次和跑一次结果一样。 Agent Workflow 打破了这个假设：传统 Workflow（Airflow / n8n）：节点 = Python 函数 / API 调用（…...

2026/7/2 8:44:59 阅读更多 →