X Article · @AnatoliKopadze

Loops 详解：Claude、GPT、Mira 与真正有效的东西

一篇 905 万浏览的爆款文章，拆解 AI loop 的五大 building blocks、token 成本复利陷阱、Ralph Wiggum 静默烧钱 loop——以及一个把自家产品和巨头并列的产品软广套路。读懂它，你比时间线上 99% 的人更懂 loop。

~6000 全文翻译 + 深度解读字数

15 min 预计阅读时间

X Article 来源 · 905 万浏览 / 4352 赞

中级难度 · 需了解 LLM 基础

工程级深度解读

先看穿这篇文章的「双层结构」：A 层是真正的工程干货，B 层是产品软广。把 Mira 和 Claude/GPT 并列是经典的偷换概念——前者是应用层，后者是基础模型。

这篇文章的双层结构

A 层 · 前 60%

真·工程干货

loop 工程方法论：五大 building blocks、Verify 是心脏、maker-checker、cost per accepted change、判断是否需要 loop 的四条。与 Anthropic 官方 agent 工程指南高度一致，值得逐字精读。

B 层 · 后 40%

产品软广

引出 Mira（Telegram bot），讲它能连 500+ app、做内容、当教练。作者与 Mira 存在强利益相关。标题把 Mira 和 Claude、GPT 并列是精心设计的修辞——应用层冒充基础模型。

loop 五大 building blocks（全文唯一值钱的部分）

作者这部分写得相当准确，下面用工程视角补全含可验证的对应物。Claude Code 和 Codex 现在这五个全内置了。

#	部件 / 职责	在 Claude Code / Codex 里的对应物	可验证
1	Automation（自动化/心跳） — 让它"会自己跑"，而不是你只跑一次	`/loop`（按间隔重跑）、`/goal`（跑到条件成立）、hooks、cron / GitHub Actions	✓ 可验证
2	Skill（可复用指令） — 把规则/模式/禁区存成文件，按名调用	Claude Code 的 `SKILL.md`、Anthropic Agent Skills	✓ 可验证
3	Sub-agents（干活/检查分离） — 写手和审查者用不同 agent，甚至不同模型/不同 effort	Claude Code 的 Task / Agent 工具、多 subagent 并发	✓ 可验证
4	Connectors（连接器） — 让 agent 真去行动（开 PR、@ 人），而非只"建议"	MCP servers、GitHub / Linear / Slack 集成	✓ 可验证
5	Verifier（验证器/闸门） — 自动拒绝坏输出，唯一决定 loop 帮你还是烧你钱	测试、类型检查、lint、build	✓ 可验证

最关键的洞察在第 3 和第 5 条：maker-checker 分离（让模型 A 写、模型 B 查）解决了学术界说的 self-grading bias；而没有 verifier 的 loop = 烧钱机器。

DIY 对比：手搓 vs Claude Code 原生 vs Mira

把文章刻意隐去的选项补回来，这才是完整的决策图景。注意"被作者刻意忽略的竞品"那几行——尤其是 Claude Code 官方 Telegram channels。

维度	手搓（cron + LLM API + 自写 verifier）	Claude Code 原生（/loop + skill + subagent + hooks + MCP）	Mira（Telegram bot）
搭建成本	高（要写代码、托管、鉴权）	中（会写 prompt + skill 即可）	低（发消息描述需求）
可控性	完全	完全	黑盒
成本透明	完全透明（你直接付 API）	完全透明（你自己的 API key）	不透明（"免费"背后接付费 LLM API）
数据安全	自己掌控	自己掌控	发给第三方
适合任务	重型、定制化、生产级	中重型工程、coding	轻量生活/办公自动化
生态连接	自己接	MCP（官方标准，越来越丰富）	Composio 500+ app

被作者刻意忽略的竞品（沉默的证据）

Claude Code 官方 Telegram channels（@trq212，Anthropic Claude Code team，2026-03-19 发布）——用 Telegram 直接控制 Claude Code session，比 Mira 更深度集成、更可控
ChatGPT 的 scheduled tasks / Operator
n8n、Zapier AI、Make（成熟的工作流自动化平台）
Cursor、Replit、Devin（coding agent）

选型决策框架（基于你的真实场景）

写代码、改代码库、跑测试 → Claude Code 原生（/loop + subagent + verifier），你已经有，不需要 Mira
重复性工程任务，每周 ≥ 1 次，有客观成功标准 → 搭正式 loop（四条全满足才搭）
一次性任务 → 一个好 prompt，别上 loop
轻量生活/办公自动化 → n8n / Zapier / Make 或 Mira，但先想清楚数据要不要发给第三方
质量是主观口味（写作、设计）→ 别用 loop，人类判断还是赢

两个被严重低估的指标

cost per accepted change

每个被采纳改动的成本

比"花了多少 token"重要十倍。loop 的产出要经过人工 gate，只有被你采纳的才算数。跑出 10 个 PR、merge 3 个、扔 7 个——那 7 个的 token 成本是纯浪费。接受率 < 50%，loop 就是负 ROI。

Ralph Wiggum loop

静默烧钱循环

Geoffrey Huntley 提出：agent 过早宣布"完成"然后退出，但 loop 调度器不知道，继续触发、继续花钱、产出为零。不报错，只在你睡觉时悄悄扣账。防御手段：硬迭代上限 + 真正的 verifier 闸门。

一、全文翻译

作者 Anatoli Kopadze（@AnatoliKopadze，"Adapt or die"），2026-06-20 发布，905 万浏览 / 4352 赞 / 649 转发。A 层干货部分逐字翻译，配工程视角的旁注。

多数人怎么用 AI？

AI 进到每个人手里已经好几年了。但大多数每天都在用它的人，用的却是最慢的方式：敲一个请求，等，改，再问，全程手动。

不是因为更快的方式有多复杂，而是因为没人给他们看过更快的方式长什么样。

更快的方式是一个 loop（循环），而现在，全世界最顶尖的 AI 工程师只关心这一件事。这篇文章补上的是「没人给你解释过」的那一块。

读完之后，你会比时间线上几乎所有人都更懂 loop：它是什么、底层究竟怎么运作、什么时候值得用、什么时候是个坑、如何在 Claude 或 ChatGPT 里手搓一个基础版，以及哪些简单的 loop 值得在你自己的生活里跑起来。

Loop 是什么？

一个 prompt（提示词）是一条指令。一个 loop 是一个目标，AI 会持续朝着它工作直到达成。把它理解成一个递归目标（recursive goal）：你定义一个目的，AI 反复迭代直到完成。

prompt 给你一个答案然后等你决定下一步。loop 则是自己跑完整个循环：Plan → Act → Verify → Fix → Repeat，其中 Verify 是核心。

这五个里，有三个干了几乎全部真正的活，也正是人们最容易搞错 loop 的地方：

Verify（验证）是 loop 的心脏

没有对结果的真实检查，你拥有的不是一个 loop，而是 agent 在反复附和自己。检查这一步，把「重复」变成「进步」。它可以是一个硬测试（"代码能不能通过"）、一个可衡量的条件（"这个数是不是高于 X"）、或者一个让模型对照打分的评分量表（rubric）。没有这道闸门，就是 agent 给自己的作业打分——而干活的那个模型，打分宽松得离谱。

State（状态）是让 loop 能学习的东西

每一轮，AI 必须记住自己已经试过什么，否则它会永远重复同一个错误。一个真正的 loop 会在旁边记一份小记录：什么做完了、什么失败了、下一步是什么。明天的运行是从断点续上，而不是从零开始。这也正是它开始变贵的地方。

停止条件（stop condition）是让它保持清醒的东西

一个没有出口的 loop，要么跑到成功，要么崩掉，要么掏空你的账户。每一个严肃的 loop 都有两种停止方式：成功，以及一个硬上限（"试了 8 次之后，停下来汇报"）。跳过这一步，你就造了一台能白白跑一整夜的机器。

你到底需不需要一个 loop？

多数文章在你搞清楚「什么时候它是个错误」之前，就先把 loop 卖给你了。这里有一个真正严肃的人会用的测试。只有当下面四条全部成立时，才值得搭一个 loop：

重复频率 — 这个任务会重复，至少每周一次。低于这个频率，搭建成本永远收不回来。

有硬闸门 — 有东西能自动拒绝坏输出（测试、类型检查、构建、linter、硬规则）。

端到端 — agent 能真正自己把这活干完，而不是把一半踢回给你。

客观完成 — "完成"是客观的，不是主观判断。质量是口味问题，人类还是赢。

少打一个勾，就把它留在手动 prompt。整个话题的诚实版本是：loop 工程是真实的，但多数人还不需要那个重版本。

为代码而生的那一个版本

Loop 先在软件领域爆发，因为代码是这个世界上最容易验证的东西。测试通过或失败，没有可争辩的余地。底层看，一个真正的 loop 由五个 building blocks 组装而成（Claude Code 和 Codex 现在全内置了）：自动化（心跳）、技能（可复用指令）、子代理（干活/检查分离）、连接器（让它去行动）、验证器（闸门）。

把这些叠起来，你就得到了大团队现在大规模运行的东西：同一个活儿上 looping 的 agent 舰队。有个工程师用这样一个 loop，在大约六天里把一整个代码库从一种编程语言重写到另一种语言——这活儿手工干要花将近一年。而它带着一个 demo 永远不会展示的代价。

没人提的成本

Loop 跑在 token 上，而 token 就是钱。问题不在于每一步都花钱。问题在于成本怎么 compound（复利式增长）。

loop 每转一圈，agent 就重新读一遍它的上下文：目标、代码、上一个结果、什么失败了。这一整堆每一次迭代都被送进模型，而且每一轮都在变大。一个跑十次的 loop，成本不是十个 prompt。它是十个各自越来越大的 prompt。

那个真正重要、却几乎没人追踪的指标，是 cost per accepted change（每个被采纳的改动的成本）。接受率低于 50%，它花出去的比它给你的多。

loop 还会静默失败。工程师 Geoffrey Huntley 把它叫作 "Ralph Wiggum loop"：agent 过早判定自己完成了，在一个半成品上退出，loop 却继续跑、继续花钱，同时什么都不产出。没有一道能让活儿「挂掉」的硬闸门，loop 不会崩溃——它会在沉默中给你计费。

真正有效的顺序

如果你真要搭一个，顺序比工具更重要。跳过前面、去调度一个你还没手动跑可靠的活，正是 loop 在你睡觉时炸掉的方式。

先手动证明

手动跑可靠，证明这个活可以稳定完成。

再硬化它

加 verifier 闸门、迭代上限、错误处理。

然后才自动化

接 cron / hooks / /loop，让它自己跑。

同一个思想，用于你的真实生活（→ B 层软广开始）

剥掉代码和成本，剩下的是一个简单、真正有用的概念：一个自己运行的任务，按调度或在某事发生的那一刻，不需要你记住它或在场。

它叫 Mira，住在 Telegram 里。你像跟朋友发消息一样跟它说话，它跑起来的 loop 叫作 Skills（技能）。作者声称它连 500+ app（Composio）、有长期记忆、是 model-agnostic。

注意：这部分是产品转化层。Mira 的"免费"是获客话术——它接的是 GPT/Claude/Gemini 的付费 API。你的数据发给第三方。作者只字未提 Anthropic 2026 年 3 月发布的官方 Claude Code Telegram channels。

这对你到底意味着什么

loop 不是趋势，是一次谁在干活的转移。AI 不再等你推着它走过每一步，而是开始自己跑完整个活儿。

话虽如此，这不是你应该去追逐、或强行塞进它不属于的地方的东西。更多时候，你只会为了什么都没有而烧钱。

二、苏格拉底对话

loop 到底新在哪，我要不要上 Mira？——通过对话推演，带出"任何把概念科普和特定产品焊在一起的文章，先问被省略的官方方案是什么"。

学生 · 尾巴这篇文章把 loop 说得神乎其神，又是 Claude Code 又是 Mira 的。但底下那条评论说得对——这不就是 Unix 时代的 batch job + cron 吗？AI loop 到底"新"在哪？

老师好问题。你抓住了一个很多人没看到的点。来，我们拆一下：cron job 和 AI loop，循环的外壳是不是一样的？

学生外壳一样——都是"按时间间隔，重复执行一段逻辑"。

老师对。那它们的判断"这一轮成功没成功"的逻辑，有什么不同？

学生 cron job 是确定的——脚本退出码是 0 就是成功，非 0 就是失败。但 AI loop……它的"成功"是模型自己说的算？比如它说"代码改好了"，就算成功？

老师这就是全文最关键的那一刀。文章说"Verify 是 loop 的心脏"，你想想，如果验证器是 AI 自己、而不是一个硬测试，会发生什么？

学生那就是它给自己作业打分……模型会放水，说自己成功了，然后下一轮还接着跑？

老师完全正确。这就是 Geoffrey Huntley 说的 "Ralph Wiggum loop"——AI 过早宣布完成、loop 却继续触发、继续烧钱、产出为零。所以你看，AI loop 相比 cron job 真正"新"的，只有一样东西：把"判断任务是否完成"这件事，从确定性代码，换成了模型。

学生那这个"新"，到底是好是坏？

老师取决于你有没有 verifier。如果你有一个硬闸门（测试通过、类型检查过、数字达标），那 AI loop 就是真的进步——它能处理 cron 处理不了的模糊任务。如果你没有硬闸门，让它自己评判自己……

学生 ……就是一台烧钱机器。那好，假设我有 verifier，我也搭起了 maker-checker，我自己已经用 Claude Code 的 skill 和定时任务在跑了。那我还需要 Mira 吗？

老师你刚才自己回答了——你已经在用更正统的方式做 loop 了。那我问你：Mira 比你这个方案，多给了你什么，又拿走了什么？

学生多给了"不用写代码、发条消息就能建自动化"。拿走了……可控性、成本透明、数据安全。因为我的活儿跑在它服务器上、用的是它接的 API。

老师而且你还漏了一个——作者没告诉你的选项是什么？

学生官方的 Claude Code Telegram channels？2026 年 3 月 Anthropic 自己发的那个？

老师对。那你觉得，一个作者把 Mira 和 Claude/GPT 并列、却只字不提官方更深度集成的方案，意味着什么？

学生 ……他和 Mira 有利益关系。这篇不是中立推荐，是软广。

老师这就是我想让你带走的判断力——任何把"概念科普"和"特定产品"焊在一起的文章，先问一句：被省略的那个官方/开源方案是什么？那个沉默的选项，往往才是答案。留给你的问题：你自己的生活/工作里，有没有一个任务，既每周重复、又有客观成功标准、又能端到端自动化？如果有，它才是你该认真搭 loop 的地方；如果没有，一个好 prompt 就够了。

三、个性化洞察

基于 QA 工程师 + 重度 Claude Code 用户 + 已有 skill/自动化体系的身份，这篇文章的价值是验证性的、不是启发性的——它讲的"重版本 loop"，你已经在做了。

验证而非启发

1. 你不需要 Mira，你已经是重版本 loop 的实践者

你日常用的就是文章说的「skill（SKILL.md）+ automation（定时任务）+ sub-agents（多 subagent 并发）+ verifier（QA 背景，测试自闭环就是你的闸门）」。文章 B 层推的 Mira 是给"不会写代码、想要轻量生活自动化"的人，不是给你。

你可以怎么做：把五大 building blocks 当 checklist，审计你现有的 skill 体系——哪个 skill 缺了 verifier 闸门？哪个该拆成 maker-checker 双 agent？

新增指标

2. cost per accepted change 纳入 skill 评估

你有 quality-eval skill，可以加一个维度：一个 loop/skill 跑出来的结果，你的采纳率是多少？

你可以怎么做：在重复性 skill（follow-builders、ai-news-digest）上加"人工采纳率"统计，低于 50% 的就该加 verifier 或换更强模型，而不是让它空转烧 token。

理论命名

3. Ralph Wiggum loop 命名了你踩过的坑

你 CLAUDE.md 里那条"禁止裸启动常驻进程"、cleanup-qmd-mcp-orphan 脚本——本质就是在防"loop 静默失败堆积"。这篇文章给了你一个理论框架：不是"孤儿进程"，而是"verifier 闸门缺失导致的静默烧资源"。

你可以怎么做：下次再写定时任务，先问它有没有硬迭代上限 + 真正的成功判断？没有就别上 cron。

流程硬化

4. 先手动证明 → 硬化 → 再自动化（最被低估）

文章这个"顺序"洞察是全文最被低估的——你跳过手动验证直接上自动化的地方，就是你半夜被叫起来 debug 的地方。

你可以怎么做：在 skillify（提取技能）工作流里加一道前置门——任何要固化为自动化 skill 的流程，必须先手动完整跑通 3 次并记录失败点，才允许自动化。

内容产品范本

5. 这篇文章本身是值得拆解的内容产品范本

它的"干货引流 + 产品转化"结构、把自家产品和巨头并列的修辞、用真概念给软广背书的手法——是技术自媒体的成熟套路。905 万浏览、4352 赞证明它有效。

你可以怎么做：正向用（你的干货是真的、转化的是你自己认可的产品），反向用（看到别人文章时 3 秒识别出"A 层干货 / B 层软广"的分界线，不被带节奏）。

核心金句

带走的判断力

任何把"概念科普"和"特定产品"焊在一起的文章，先问一句：被省略的那个官方/开源方案是什么？

中文在上
Any article that welds "concept explainer" to "specific product" — first ask: what's the official / open-source option they left out?

精选评论

从 133 条回复里挑出有信息量的——包括当场抓出流程图方向错误的读者，和指出"这不就是 Unix batch job"的犀利一问。

有信息量的评论

@TerjeJacobsen（5 赞）：可惜那张流程图把整个 loop 快速终结在了 cost 框上 😂 发图之前检查一下箭头方向吧——细节上不够严谨。
@wu96318（7 赞）：我才刚开始用 Claude，让它根据我旧网站重建一个。结果惊人。我连 CSS 和 JavaScript 都不懂，却得到了一个专业的艺术网站。
@Ren_Web3AI（1 赞）：搭建一个持久化系统、而不是每次从零开始，是唯一的工作方式。终极的"适应或灭亡"操作，是把指令抽象成外部的 SKILL.md 文件——这样你的系统能瞬间热插拔到 Gemini 或 Ollama。
@curonianai（1 赞）：Anatoli 的 18 个步骤里有 7 个是真技术：Projects + 项目指令、让 Claude 先问你问题、陪练式攻击再钢人证、通过样本分析克隆风格、元提示、输出长度+开场白控制、每个话题开新对话。
@SundarR02215714（1 赞）：一个"蠢问题"——Unix 和 Linux 时代他们不就在跑 batch jobs 了吗？（犀利一问，直指 loop 的历史血脉）

作者未回应的质疑

流程图方向错误未被作者修正——@TerjeJacobsen 指出 loop 错误地快速终结在 cost 框，作者没有回应或修改。
"六天重写整个代码库"缺乏出处——可能是 cherry-pick，作者未提供案例链接。
Mira 的"免费"是获客话术——接的是 GPT/Claude/Gemini 的付费 API，羊毛出在羊身上，作者未披露成本结构。
官方竞品被完全省略——Claude Code Telegram channels（2026-03-19 发布）、ChatGPT scheduled tasks、n8n / Zapier 全部只字未提。
可观测性——loop 工程的真问题（怎么知道一个跑了 8 小时的 loop 是在进步还是在空转），文章几乎没碰。