Ralph Wiggum 编程法:循环很简单,提示词才是关键
Matt Nolan
创始人
更新于 2026年1月6日
如果您最近关注过AI开发相关的推特,一定见过这个现象:Ralph Wiggum编程法。
这个方法以《辛普森一家》中那个屡败屡战的角色命名,技术本身简单得出奇:让AI编程代理在循环中运行。让它失败。让它重试。持续运行直到成功或达到限制条件。

效果令人瞩目。这一方法的先驱Geoffrey Huntley,仅花费297美元API成本就完成了价值5万美元的合同。Claude Code的创建者Boris Cherny在30天内完成了259个PR,每一行代码都由AI编写。Anthropic发布了官方插件。
热门帖子关注的重点都在循环上。bash脚本。自动化运行。
但他们搞错了重点。
循环本身微不足道
整个技术就是这样:
while :; do cat PROMPT.md | claude ; done
就这些。您用三十秒就能写出来。
那么,为什么有些开发者获得了颠覆性的结果,而另一些却只能看着代理无用地旋转、白白消耗API额度呢?
答案不在循环,而在您输入的内容。
提示词质量才是真正的突破口
官方文档直接指出:“Ralph的成功取决于编写优质提示词,而不仅仅是拥有好的模型。”
大多数报道止步于”具体明确”和”包含完成标准”。这只是基础要求。获得显著成果的开发者已经在另一个层次上运作了。
对比一下:
注定失败的提示词:
构建一个待办事项API,做得好一些。
有效的提示词:
/ralph-wiggum:ralph-loop "实现待办事项的REST API。
要求:
- 待办事项的CRUD端点
- 所有字段的输入验证
- 错误处理及适当的HTTP状态码
成功标准:
- 所有端点正确响应
- 测试通过,覆盖率>80%
如果15次迭代后仍未完成:
- 记录阻塞问题
- 列出尝试过的方法
完成时输出<promise>COMPLETE</promise>。" --max-iterations 30
第二个提示词做了第一个没有做的三件事:明确定义成功标准、告诉代理如何验证其工作,以及包含如何有效失败的说明。
最后一点是区分优秀提示词和卓越提示词的关键。
提示词质量层次
在多个项目中运行这些循环后,我认为提示词质量分为三个层次:
第一层:完成标准。 代理知道何时停止。大多数人能达到这里。
第二层:自我验证。 代理能检查自己的工作。Boris Cherny称这是”可能最重要的事情”。给Claude提供验证输出的方式,质量会提升一倍。
第三层:故障恢复。 提示词包含遇到困难时的应对措施。不只是”重试”,而是诊断步骤、替代方案和优雅降级。这里才是真正的杠杆所在,但几乎没人谈论这一点。
大多数失败发生是因为提示词只适用于理想情况,没有恢复策略。代理陷入困境,旋转50次迭代,却毫无有用产出。
设计良好的提示词将失败视为信息。您失去的不是毫无收获的两小时,而是有所收获的两小时。
反直觉的真相
热门帖子没有提到的是:在提示词中塞入更多细节往往适得其反。
研究表明最佳上下文利用率是40-60%。超过这个范围,模型在所有方面的性能都会下降,不仅仅是新指令。
获得稳定结果的实践者保持提示词精简。他们告诉Claude如何找到信息,而不是预先塞入所有内容。他们将大任务拆分为小循环。
更多细节感觉像是更多控制。但对于大语言模型,超过某个点,更多细节就意味着能力下降。
发展趋势
我的观点是:我们对如何与这些系统协作的理解才刚刚开始。
目前,大多数人认为瓶颈是模型能力。其实不是。瓶颈是我们清晰传达意图的能力,清晰到机器能够自主行动的程度。这是一种技能。像任何技能一样,早期掌握它的人将拥有巨大优势。
Ralph Wiggum技术是通向那个未来的窗口。不是因为循环巧妙,而是因为它无情地暴露了您的提示词是否真正优秀。每次失败的迭代都是反馈。每次成功的运行都证明您已经学会了以机器能够执行的方式思考。
将此视为bash脚本技巧的开发者错失了更大的转变。将其视为人机协作新学科的开发者将构建出我们其他人还无法想象的东西。
循环很简单。提示词才是关键。
我们正在使用这些技术加速多个项目的开发。如果您也在应对类似挑战,请联系我们。