<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>Loop on Steve Sun</title><link>https://sund.site/tags/loop/</link><description>Recent content in Loop on Steve Sun</description><generator>Hugo</generator><language>zh</language><copyright>版权所有 © 2013-2026, Steve Sun</copyright><lastBuildDate>Thu, 02 Jul 2026 00:00:01 +0800</lastBuildDate><follow_challenge><feedId>41397727810093074</feedId><userId>56666701051455488</userId></follow_challenge><atom:link href="https://sund.site/tags/loop/index.xml" rel="self" type="application/rss+xml"/><item><title>【译文】每个 AI 工程师都应该知道的 20 个循环设计模式</title><link>https://sund.site/posts/2026/20-loop-design-patterns-every-ai-engineer-should-know/</link><pubDate>Thu, 02 Jul 2026 00:00:01 +0800</pubDate><guid>https://sund.site/posts/2026/20-loop-design-patterns-every-ai-engineer-should-know/</guid><description>&lt;p&gt;&lt;figure
 class="image-caption"
&gt;
 
 &lt;img src="https://raw.githubusercontent.com/stevedsun/blog-img/main/20-loop-patterns-swirl-v2-header.png" alt="header" loading="lazy" /&gt;
 
 &lt;figcaption&gt;header&lt;/figcaption&gt;
&lt;/figure&gt;
&lt;/p&gt;
&lt;blockquote&gt;
&lt;p&gt;&lt;strong&gt;原文&lt;/strong&gt;：&lt;a href="https://x.com/sairahul1/status/2072258045460226373"&gt;20 Loop Design Patterns Every AI Engineer Should Know&lt;/a&gt;&lt;br&gt;
&lt;strong&gt;作者&lt;/strong&gt;：Rahul (@sairahul1)&lt;br&gt;
&lt;strong&gt;声明&lt;/strong&gt;：本文由 AI 翻译，可能包含错误&lt;/p&gt;&lt;/blockquote&gt;
&lt;p&gt;大多数 AI 工程师知道如何构建一个 agent。&lt;/p&gt;
&lt;p&gt;但很少有人知道如何构建一个能在首次尝试后不断变好的系统。&lt;/p&gt;
&lt;p&gt;这个差距值六位数美金。&lt;/p&gt;
&lt;p&gt;区别在哪里：&lt;/p&gt;
&lt;p&gt;Agent 是一个工人。&lt;/p&gt;
&lt;p&gt;Loop（循环）是让工人进步的机制。&lt;/p&gt;
&lt;p&gt;当今生产环境中最强大的 AI 系统，不是单次模型调用。&lt;/p&gt;
&lt;p&gt;它们是循环。&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;生成 → 评估 → 学习 → 改进。&lt;/strong&gt;&lt;/p&gt;
&lt;p&gt;一遍又一遍。&lt;/p&gt;
&lt;p&gt;直到输出真正变好。&lt;/p&gt;
&lt;p&gt;以下是生产级 AI 系统中反复出现的 20 个循环设计模式。&lt;/p&gt;
&lt;p&gt;收藏这篇文章。你会用到它们的。&lt;/p&gt;
&lt;h2 id="agent-vs-loop"&gt;Agent vs Loop&lt;/h2&gt;
&lt;p&gt;旧方式：Prompt → Response → Done。&lt;/p&gt;
&lt;p&gt;新方式：Generate → Critique → Rewrite → Score → Retry → Remember → Improve。&lt;/p&gt;
&lt;p&gt;一个是流水线工人，做一次就完事。&lt;/p&gt;
&lt;p&gt;另一个是流水线工人，研究每一个错误，重写操作手册，每个班次进步 3%。&lt;/p&gt;
&lt;p&gt;现在能交付生产级 AI 的团队，他们不是在写更好的 prompt。&lt;/p&gt;
&lt;p&gt;他们在构建更好的循环。&lt;/p&gt;
&lt;p&gt;&lt;figure
 class="image-caption"
&gt;
 
 &lt;img src="https://raw.githubusercontent.com/stevedsun/blog-img/main/20-loop-patterns-agents-vs-loops.jpg" alt="Agents vs Loops" loading="lazy" /&gt;
 
 &lt;figcaption&gt;Agents vs Loops&lt;/figcaption&gt;
&lt;/figure&gt;
&lt;/p&gt;
&lt;h2 id="类别-1--质量改进循环让输出在离开系统前就变好"&gt;类别 1 — 质量改进循环（让输出在离开系统前就变好）&lt;/h2&gt;
&lt;h3 id="1-generate--critique--rewrite"&gt;1. Generate → Critique → Rewrite&lt;/h3&gt;
&lt;p&gt;AI 工程中最重要的循环。&lt;/p&gt;
&lt;p&gt;生成输出。评论家审阅。生成器根据反馈重写。重复直到质量达标。&lt;/p&gt;
&lt;p&gt;不是一个模型。两个角色。一条流水线。&lt;/p&gt;
&lt;pre tabindex="0"&gt;&lt;code&gt;[Generator] → 初稿
[Critic] → &amp;#34;第三段含糊不清，缺少证据，语气不对&amp;#34;
[Generator] → 根据批评重写
[Critic] → &amp;#34;好多了，但结尾还是薄弱&amp;#34;
[Generator] → 最终重写
&lt;/code&gt;&lt;/pre&gt;&lt;p&gt;适用于：写作、代码审查、报告、策略文档、销售邮件。&lt;/p&gt;
&lt;p&gt;洞察：负责生成的模型不是自己输出的最佳评判者。&lt;/p&gt;
&lt;p&gt;独立的评论家每次都能发现生成器遗漏的问题。&lt;/p&gt;
&lt;h3 id="2-score-and-retry-loop"&gt;2. Score-and-Retry Loop&lt;/h3&gt;
&lt;p&gt;生成。打分。低于阈值就重试。&lt;/p&gt;
&lt;p&gt;简单。强大。被严重低估。&lt;/p&gt;
&lt;pre tabindex="0"&gt;&lt;code&gt;score = evaluate(output)

while score &amp;lt; threshold:
 output = generate(prompt)
 score = evaluate(output)
 attempts += 1
 if attempts &amp;gt; max_retries:
 return best_so_far
&lt;/code&gt;&lt;/pre&gt;&lt;p&gt;最适合质量可衡量的场景——提取准确率、格式合规性、事实正确性、线索评分。&lt;/p&gt;
&lt;p&gt;生成器不知道自己在被评分。&lt;/p&gt;
&lt;p&gt;评估者知道。&lt;/p&gt;
&lt;p&gt;这个分离就是模式本身。&lt;/p&gt;
&lt;h3 id="3-multi-critic-loop"&gt;3. Multi-Critic Loop&lt;/h3&gt;
&lt;p&gt;一个评论家有盲点。&lt;/p&gt;
&lt;p&gt;那就用四个。&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;strong&gt;正确性评论家&lt;/strong&gt;：事实准确吗？&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;风格评论家&lt;/strong&gt;：清晰且文笔好吗？&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;安全评论家&lt;/strong&gt;：合适且安全吗？&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;领域评论家&lt;/strong&gt;：符合专业标准吗？&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;每个独立评估。&lt;/p&gt;
&lt;p&gt;最终输出必须同时满足四个才能放行。&lt;/p&gt;
&lt;p&gt;用于：医疗 AI、法律文档审查、金融分析、受监管内容。&lt;/p&gt;
&lt;h3 id="4-adversarial-critique-loop"&gt;4. Adversarial Critique Loop&lt;/h3&gt;
&lt;p&gt;评论家唯一的任务是打破这个答案。&lt;/p&gt;
&lt;p&gt;不是改进它。是打破它。&lt;/p&gt;
&lt;p&gt;对抗性评论家会问的问题：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;这里什么假设会失效？&lt;/li&gt;
&lt;li&gt;缺少什么证据？&lt;/li&gt;
&lt;li&gt;怀疑论者会说什么？&lt;/li&gt;
&lt;li&gt;什么地方自信地错了？&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;生成器随后要么辩护，要么重写。&lt;/p&gt;
&lt;p&gt;最好的答案在攻击中存活下来。&lt;/p&gt;
&lt;p&gt;用于：研究综合、投资论点评审、战略规划、风险分析。&lt;/p&gt;
&lt;h3 id="5-judge-ensemble-loop"&gt;5. Judge Ensemble Loop&lt;/h3&gt;
&lt;p&gt;一个评委打分有噪声。&lt;/p&gt;
&lt;p&gt;五个评委平均掉噪声。&lt;/p&gt;
&lt;p&gt;将同一个输出送进多个评估器。&lt;/p&gt;
&lt;p&gt;汇总分数。&lt;/p&gt;
&lt;p&gt;只有高共识的输出才晋级。&lt;/p&gt;
&lt;p&gt;用于：单一模型评估不可靠、风险高、边界情况重要的场景。&lt;/p&gt;
&lt;h2 id="类别-2--记忆循环从发生过的事情中学习"&gt;类别 2 — 记忆循环（从发生过的事情中学习）&lt;/h2&gt;
&lt;h3 id="6-reflexion-loop"&gt;6. Reflexion Loop&lt;/h3&gt;
&lt;p&gt;这是最重要的自我改进模式，没有之一。&lt;/p&gt;
&lt;p&gt;Agent 失败。Agent 分析失败原因。Agent 存储教训。Agent 带着教训重新尝试。&lt;/p&gt;
&lt;p&gt;每一次迭代都比上一次更聪明。&lt;/p&gt;
&lt;pre tabindex="0"&gt;&lt;code&gt;attempt 1: 失败
reflection: &amp;#34;我以为 X 是对的，但 X 是错的。下次先验证 X。&amp;#34;
attempt 2: 融入教训 → 部分成功
reflection: &amp;#34;好多了。但我跳过了 Y。加上 Y 检查。&amp;#34;
attempt 3: 成功
&lt;/code&gt;&lt;/pre&gt;&lt;p&gt;一个系统&amp;quot;失败一次&amp;quot;和&amp;quot;只失败一次&amp;quot;之间的区别。&lt;/p&gt;
&lt;h3 id="7-memory-update-loop"&gt;7. Memory Update Loop&lt;/h3&gt;
&lt;p&gt;每次任务完成后存储三样东西：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;做了什么决定&lt;/li&gt;
&lt;li&gt;结果是什么&lt;/li&gt;
&lt;li&gt;下次会怎么不同做&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;未来的运行继承这些知识。&lt;/p&gt;
&lt;p&gt;第 6 个月的系统已经不是第 1 个月的那个系统了。&lt;/p&gt;
&lt;p&gt;它读了 6 个月的自己历史。&lt;/p&gt;
&lt;h3 id="8-error-library-loop"&gt;8. Error Library Loop&lt;/h3&gt;
&lt;p&gt;存储每一次失败。&lt;/p&gt;
&lt;p&gt;错误答案。糟糕输出。执行失败。边界情况。&lt;/p&gt;
&lt;p&gt;在处理新任务之前：&lt;/p&gt;
&lt;p&gt;先搜索错误库。&lt;/p&gt;
&lt;p&gt;如果类似的失败存在 → 在开始之前就应用已知修复。&lt;/p&gt;
&lt;p&gt;系统不再重复犯同一个错误。&lt;/p&gt;
&lt;p&gt;这是生产级 AI 中最被低估的模式。&lt;/p&gt;
&lt;h3 id="9-success-pattern-loop"&gt;9. Success Pattern Loop&lt;/h3&gt;
&lt;p&gt;大多数工程师只存失败。&lt;/p&gt;
&lt;p&gt;也要存成功。&lt;/p&gt;
&lt;p&gt;当任务顺利时：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;保存方法&lt;/li&gt;
&lt;li&gt;保存上下文&lt;/li&gt;
&lt;li&gt;保存什么让它奏效&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;遇到类似任务时检索成功模式。&lt;/p&gt;
&lt;p&gt;从胜利中学习，而不仅仅是错误。&lt;/p&gt;
&lt;h3 id="10-memory-compression-loop"&gt;10. Memory Compression Loop&lt;/h3&gt;
&lt;p&gt;记忆永远在增长。&lt;/p&gt;
&lt;p&gt;无限记忆 = 不可用的记忆。&lt;/p&gt;
&lt;p&gt;当积累到 N 条之后：&lt;/p&gt;
&lt;p&gt;压缩它们。&lt;/p&gt;
&lt;p&gt;将许多具体记忆 → 变成少数高层抽象。&lt;/p&gt;
&lt;pre tabindex="0"&gt;&lt;code&gt;压缩前：
&amp;#34;任务 A 因为 X 失败了&amp;#34;
&amp;#34;任务 B 因为 X 失败了&amp;#34;
&amp;#34;任务 C 因为 X 失败了&amp;#34;

压缩后：
&amp;#34;模式：X 导致失败。总是先检查 X。&amp;#34;
&lt;/code&gt;&lt;/pre&gt;&lt;p&gt;上下文保持可控。模式保持可访问。系统保持快。&lt;/p&gt;
&lt;h2 id="类别-3--规划循环当现实变化时调整计划"&gt;类别 3 — 规划循环（当现实变化时调整计划）&lt;/h2&gt;
&lt;h3 id="11-plan--execute--replan"&gt;11. Plan → Execute → Replan&lt;/h3&gt;
&lt;p&gt;AI Agent 设计中最常见的错误：&lt;/p&gt;
&lt;p&gt;把计划当作固定的。&lt;/p&gt;
&lt;p&gt;计划在接触现实时会破裂。&lt;/p&gt;
&lt;p&gt;模式：&lt;/p&gt;
&lt;p&gt;制定计划 → 执行步骤 → 观察结果 → 更新计划 → 继续&lt;/p&gt;
&lt;p&gt;不是瀑布。&lt;/p&gt;
&lt;p&gt;是螺旋。&lt;/p&gt;
&lt;p&gt;每一圈收紧方法。&lt;/p&gt;
&lt;p&gt;用于：环境变化、任务有依赖关系、长期目标。&lt;/p&gt;
&lt;h3 id="12-dynamic-workflow-loop"&gt;12. Dynamic Workflow Loop&lt;/h3&gt;
&lt;p&gt;大多数流水线是固定的。&lt;/p&gt;
&lt;p&gt;Step 1 → Step 2 → Step 3。永远如此。&lt;/p&gt;
&lt;p&gt;动态工作流根据结果改变：&lt;/p&gt;
&lt;p&gt;如果输出 A → 走分支 X；如果输出 B → 走分支 Y；如果输出 C → 跳到步骤 5。&lt;/p&gt;
&lt;p&gt;流水线在运行时决定自己的形状。&lt;/p&gt;
&lt;p&gt;用于：多文档研究、客服路由、自适应内容流水线。&lt;/p&gt;
&lt;h3 id="13-goal-decomposition-loop"&gt;13. Goal Decomposition Loop&lt;/h3&gt;
&lt;p&gt;大目标进入。&lt;/p&gt;
&lt;p&gt;系统分解为子目标。&lt;/p&gt;
&lt;p&gt;每个子目标分解为任务。&lt;/p&gt;
&lt;p&gt;每个任务分解为步骤。&lt;/p&gt;
&lt;p&gt;持续分解直到每个单元小到一次调用可以完成。&lt;/p&gt;
&lt;pre tabindex="0"&gt;&lt;code&gt;目标：&amp;#34;写一份全面的竞争分析&amp;#34;
↓
子目标 1：&amp;#34;识别前 5 名竞争对手&amp;#34;
子目标 2：&amp;#34;分析每个竞争对手的产品&amp;#34;
子目标 3：&amp;#34;对比定价模式&amp;#34;
子目标 4：&amp;#34;识别差距&amp;#34;
↓
每个子目标 → 任务 → 单独的模型调用
&lt;/code&gt;&lt;/pre&gt;&lt;p&gt;循环持续分解，直到系统可以行动。&lt;/p&gt;
&lt;h3 id="14-progress-evaluation-loop"&gt;14. Progress Evaluation Loop&lt;/h3&gt;
&lt;p&gt;每 N 步：停下来问：&lt;/p&gt;
&lt;p&gt;&amp;ldquo;我们真的在接近目标吗？&amp;rdquo;&lt;/p&gt;
&lt;p&gt;如果是：继续当前策略。
如果不是：改变策略、工具或计划。&lt;/p&gt;
&lt;p&gt;系统监控自己的进度。&lt;/p&gt;
&lt;p&gt;而不是盲目执行。&lt;/p&gt;
&lt;p&gt;用于：长时间运行的研究 agent、多天自主任务、调试 agent。&lt;/p&gt;
&lt;h3 id="15-constraint-satisfaction-loop"&gt;15. Constraint Satisfaction Loop&lt;/h3&gt;
&lt;p&gt;持续运行直到所有约束被满足。&lt;/p&gt;
&lt;pre tabindex="0"&gt;&lt;code&gt;while not all_constraints_satisfied(output):
 output = improve(output, unsatisfied_constraints)

constraints = [
 budget_under_limit,
 quality_above_threshold,
 latency_under_200ms,
 tone_matches_brand,
 no_hallucinations
]
&lt;/code&gt;&lt;/pre&gt;&lt;p&gt;在生产系统中非常常见。&lt;/p&gt;
&lt;p&gt;输出在每一条业务规则通过之前都不算完成。&lt;/p&gt;
&lt;h2 id="类别-4--探索循环通过尝试多条路径找到最佳答案"&gt;类别 4 — 探索循环（通过尝试多条路径找到最佳答案）&lt;/h2&gt;
&lt;h3 id="16-branch-and-explore-loop"&gt;16. Branch-and-Explore Loop&lt;/h3&gt;
&lt;p&gt;不要只走一条路。&lt;/p&gt;
&lt;p&gt;同时探索多条路径。&lt;/p&gt;
&lt;pre tabindex="0"&gt;&lt;code&gt;paths = [
 generate(approach=&amp;#34;conservative&amp;#34;),
 generate(approach=&amp;#34;aggressive&amp;#34;),
 generate(approach=&amp;#34;creative&amp;#34;)
]

scores = [evaluate(p) for p in paths]
best = paths[scores.index(max(scores))]
&lt;/code&gt;&lt;/pre&gt;&lt;p&gt;对比结果。选择最佳分支。丢弃其余。&lt;/p&gt;
&lt;p&gt;用于：内容变体、架构决策、多假设调试、A/B 生成。&lt;/p&gt;
&lt;h3 id="17-tree-search-loop"&gt;17. Tree Search Loop&lt;/h3&gt;
&lt;p&gt;Branch-and-Explore 只深入一层。&lt;/p&gt;
&lt;p&gt;Tree Search 需要多深就走多深。&lt;/p&gt;
&lt;p&gt;扩展最有希望的节点。剪掉最弱的。持续探索直到找到解。&lt;/p&gt;
&lt;pre tabindex="0"&gt;&lt;code&gt;root → [A, B, C]
A → [A1, A2] # A 看起来有希望，扩展它
B → prune # B 太弱，停在这里
A1 → [A1a, A1b]
A1a → solution ✓
&lt;/code&gt;&lt;/pre&gt;&lt;p&gt;用于：复杂推理链、多步规划、代码调试、研究综合。&lt;/p&gt;
&lt;p&gt;计算成本高，但能找到单次调用无法找到的解。&lt;/p&gt;
&lt;h3 id="18-debate-loop"&gt;18. Debate Loop&lt;/h3&gt;
&lt;p&gt;两个 agent。一个话题。相反的立场。&lt;/p&gt;
&lt;p&gt;Agent A 为答案辩护。Agent B 反对它。&lt;/p&gt;
&lt;p&gt;每一轮挑战假设、要求证据、暴露逻辑漏洞。&lt;/p&gt;
&lt;p&gt;最终答案通过分歧产生。&lt;/p&gt;
&lt;p&gt;不是通过一致。&lt;/p&gt;
&lt;p&gt;对抗性压力能发现自信的单 agent 答案遗漏的东西。&lt;/p&gt;
&lt;p&gt;用于：投资决策、战略规划、风险评估、研究评论。&lt;/p&gt;
&lt;h2 id="类别-5--系统优化循环循环改进循环本身"&gt;类别 5 — 系统优化循环（循环改进循环本身）&lt;/h2&gt;
&lt;h3 id="19-prompt-optimization-loop"&gt;19. Prompt Optimization Loop&lt;/h3&gt;
&lt;p&gt;大多数工程师写一个 prompt 就不再碰它。&lt;/p&gt;
&lt;p&gt;Prompt 优化循环改变了这一点。&lt;/p&gt;
&lt;p&gt;系统：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;在测试集上运行 prompt&lt;/li&gt;
&lt;li&gt;对每个输出评分&lt;/li&gt;
&lt;li&gt;识别 prompt 失败的地方&lt;/li&gt;
&lt;li&gt;重写 prompt 修复这些失败&lt;/li&gt;
&lt;li&gt;重新运行并重新评分&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;Prompt 自动变好。&lt;/p&gt;
&lt;p&gt;不需要人碰。&lt;/p&gt;
&lt;pre tabindex="0"&gt;&lt;code&gt;current_prompt = &amp;#34;Summarize this document.&amp;#34;

for iteration in range(max_iterations):
 outputs = [run(current_prompt, doc) for doc in test_set]
 scores = [evaluate(o) for o in outputs]
 avg_score = mean(scores)

 if avg_score &amp;gt;= target:
 break

 failures = [o for o, s in zip(outputs, scores) if s &amp;lt; threshold]
 current_prompt = improve_prompt(current_prompt, failures)
&lt;/code&gt;&lt;/pre&gt;&lt;p&gt;用于：生产流水线、自动化内容系统、分类任务。&lt;/p&gt;
&lt;p&gt;生产级 AI 中最好的 prompt 不是人写的。&lt;/p&gt;
&lt;p&gt;它们是进化出来的。&lt;/p&gt;
&lt;h3 id="20-workflow-optimization-loop"&gt;20. Workflow Optimization Loop&lt;/h3&gt;
&lt;p&gt;这才是真正有趣的地方。&lt;/p&gt;
&lt;p&gt;循环改进循环本身。&lt;/p&gt;
&lt;p&gt;系统测量自己的性能：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;&lt;strong&gt;延迟&lt;/strong&gt;：每一步花了多久？&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;成本&lt;/strong&gt;：每次调用用了多少 token？&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;质量&lt;/strong&gt;：每个阶段的输出得分多少？&lt;/li&gt;
&lt;/ul&gt;
&lt;p&gt;然后它修改自己的工作流。&lt;/p&gt;
&lt;p&gt;太慢了？并行化两个步骤。
太贵了？在质量能保持的地方用一个更小的模型替换 GPT-4 调用。
质量下降了？在最终输出前加一个评论家。&lt;/p&gt;
&lt;pre tabindex="0"&gt;&lt;code&gt;metrics = measure_workflow(outputs, latency, cost)

if metrics.latency &amp;gt; target_latency:
 workflow = parallelize(slow_steps)

if metrics.cost &amp;gt; budget:
 workflow = replace_with_cheaper_model(high_cost_steps)

if metrics.quality &amp;lt; threshold:
 workflow = add_critic_before(final_output_step)
&lt;/code&gt;&lt;/pre&gt;&lt;p&gt;这就是真正的自我改进系统的起点。&lt;/p&gt;
&lt;p&gt;不只是输出在改进。&lt;/p&gt;
&lt;p&gt;是系统在重新设计自己。&lt;/p&gt;
&lt;h2 id="所有-20-个模式背后的统一模式"&gt;所有 20 个模式背后的统一模式&lt;/h2&gt;
&lt;p&gt;每一个循环都共享一个结构：&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;Act → Observe → Evaluate → Adjust&lt;/strong&gt;&lt;/p&gt;
&lt;p&gt;这就是完整的配方。&lt;/p&gt;
&lt;p&gt;输出在第一次尝试时从来不是最终的。&lt;/p&gt;
&lt;p&gt;输出是一个起点。&lt;/p&gt;
&lt;p&gt;循环才是把起点变成生产级作品的东西。&lt;/p&gt;
&lt;h2 id="全景图"&gt;全景图&lt;/h2&gt;
&lt;p&gt;&lt;strong&gt;类别 1 — 质量循环&lt;/strong&gt;（让输出在离开前变好）&lt;/p&gt;
&lt;ol&gt;
&lt;li&gt;Generate → Critique → Rewrite&lt;/li&gt;
&lt;li&gt;Score-and-Retry&lt;/li&gt;
&lt;li&gt;Multi-Critic&lt;/li&gt;
&lt;li&gt;Adversarial Critique&lt;/li&gt;
&lt;li&gt;Judge Ensemble&lt;/li&gt;
&lt;/ol&gt;
&lt;p&gt;&lt;strong&gt;类别 2 — 记忆循环&lt;/strong&gt;（从发生过的事情中学习）
6. Reflexion
7. Memory Update
8. Error Library
9. Success Pattern
10. Memory Compression&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;类别 3 — 规划循环&lt;/strong&gt;（当现实变化时适应）
11. Plan → Execute → Replan
12. Dynamic Workflow
13. Goal Decomposition
14. Progress Evaluation
15. Constraint Satisfaction&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;类别 4 — 探索循环&lt;/strong&gt;（通过尝试多条路径找到最佳答案）
16. Branch-and-Explore
17. Tree Search
18. Debate&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;类别 5 — 系统优化循环&lt;/strong&gt;（循环改进循环）
19. Prompt Optimization
20. Workflow Optimization&lt;/p&gt;
&lt;hr&gt;
&lt;p&gt;大多数工程师认为 agent 是未来。&lt;/p&gt;
&lt;p&gt;Agent 只是工人。&lt;/p&gt;
&lt;p&gt;循环才是让工人进步的东西。&lt;/p&gt;
&lt;p&gt;AI 领域正在发生的最大的转变不是更好的模型。&lt;/p&gt;
&lt;p&gt;是从 &lt;strong&gt;Prompt → Response&lt;/strong&gt;&lt;/p&gt;
&lt;p&gt;转向 &lt;strong&gt;Generate → Evaluate → Learn → Improve&lt;/strong&gt;&lt;/p&gt;
&lt;p&gt;掌握循环设计的团队不会写出更好的 prompt。&lt;/p&gt;
&lt;p&gt;他们会构建出每天都在变好的系统。&lt;/p&gt;
&lt;p&gt;部署之后，不需要任何人碰它们。&lt;/p&gt;</description></item></channel></rss>