声明本篇博客是以吴恩达的【Agent智能体】教程为基础并对其中的内容做了笔记整理以及个人收获的总结。上一篇【Agent智能体9 | 反思设计模式-提示词工程的进阶法则】主要是聚焦提示词工程讨论了如何写好的提示词例如多给几个样本给出审查标准等来让语言模型进行自我反思。这篇主要是用了一个更为复杂的例子可视化咖啡销量视角切换到了智能体工作流 agentic workflow方面且引入了多模型协作的例子通过这个例子你可以肉眼可见地感受到引入反思机制后AI 输出结果的惊人进化任务背景可视化咖啡销量Visualizing coffee sales输入数据一份包含日期date、价格price和咖啡名称coffee_name的原始表格数据用户需求“创建一个图表比较 2024 年和 2025 年第一季度Q1的咖啡销量” (Create a plot comparing Q1 coffee sales in 2024 and 2025)。分析如果只是简单地把这个需求丢给普通的 LLM它可能会写出一段能运行但图表效果很差的代码。智能体工作流就是为了解决这个问题。图表生成的智能体工作流 Chart generation agentic workflow整个流程展示了 AI 如何通过“迭代”来完成任务步骤 1初次生成 (Write python code)用户输入提示词后LLM 首先生成了第一版 Python 代码V1 code利用pandas和matplotlib处理数据并绘图。步骤 2执行并输出 (Execute V1 code)系统在后台运行这段代码生成了第一版图表plot.png。可以看到左下角的第一版图表是一个“堆叠柱状图”。这种图表虽然没有明显的语法错误但很难让人直观地对比不同咖啡在两年的销量变化阅读体验很差。步骤 3反思与批评 (Critique image, update code)这是智能体工作流的关键系统并没有直接把第一版图表交给用户而是将生成的图表和代码再次交给 LLM 进行审查。LLM 发现图表不够清晰于是修改了代码生成 V2 code。步骤 4再次执行得到最终结果 (Execute new code)运行第二版代码后得到了右下角的新图表plot_v2.png。这变成了一个“分组柱状图”将 2024 和 2025 年的数据并列放置清晰明了地展示了每种咖啡的销量对比使用不同的 LLM 进行反思Reflection with a different LLM模型 1生成器 - Code generation负责根据用户的提示词写出第一版基础代码。提示词“编写 Python 代码生成可视化图表以回答用户的问题 {用户提示词}”模型 2审查员 - Reflection负责扮演“质检员”。可以是同一个模型也可以是一个能力更强、专门用于分析不同视角的其他 LLM。系统会将第一版代码、生成的图片以及对话历史发给它。提示词“你是一位专家级数据分析师负责提供建设性的反馈。第一步审查附带的图表的可读性、清晰度和完整性。第二步编写新代码来落实你的改进建议。”这样充分利用不同LLM的优势可以得到质量更高的结果总结这套流程展示了Agentic Workflow智能体工作流相较于传统的Zero-shot零样本一次性生成的巨大优势但是反思在一些应用上提升有限在另一些应用上提升明显还有些应用几乎没有提升。不过了解反思对应用影响是很有帮助的。下篇文章将简单讲述评估反射的一些方式。如果这篇文章对你有帮助欢迎点赞、评论、关注、收藏。你们的支持是我前进的动力