Loop:
智能体的心跳
为什么 2026 年讨论从 harness(马具) 拉近到了 loop(循环)——一份给 CEO 的第一性原理拆解。
260614 · Wayne研究室 · 14 页 · 7 篇核心来源
Harness 没过气——
讨论在「拉近镜头」
Loop 不是 harness 的替代品,而是 harness 最关键的那颗心脏。刷屏的本质:行业把焦点从「整副马具」聚焦到「让马具跑起来的那个循环」。
嵌套,不是对立
循环被包在 harness 里,是其中的引擎,二者不在同一层。
智能在循环里
模型能力相近时,胜负更看循环设计,而非单纯堆参数。
护城河在外壳
换模型很便宜,重做 harness 很贵——投资在循环。
先把这几个词说人话
循环
AI 自己「做一步、看结果、再决定下一步」,反复到完成。
外壳 / 马具
套在模型外面、让它能干活的整套装备:工具+记忆+循环+护栏。
工作流
人提前画好的固定路线,AI 照走,不自己改路。
上下文
模型的「桌面/短期记忆」,就这么大,塞太多就乱。
智能体
会自己用工具、自己跑循环达成目标的 AI,不只是聊天。
四件套
Goal 方向 · Loop 引擎 · Workflow 轨道 · Harness 车身。
同一周,全球都在写 Loop
「你让 Claude 跑一个任务,它干完一轮,停下来,等你说下一句。这是大多数人用 Claude Code 的方式——一问一答,像在跟一个反应很快、但没什么主见的助理对话。」
他的解法正是标题三件套:Goal + Loop + Workflows。下文逐层拆开。
什么是 Loop
一个会自我推进的循环:观察 → 推理 → 行动 → 拿反馈,再来一轮,直到目标达成或触发停止。
- ▸ 与「一问一答」不同:它自己决定下一步
- ▸ 与「链 Chain」不同:链是 A→B→C 直线;循环能回退、重试、收敛
- ▸ 主流范式源自 ReAct:把「想(推理)」和「做(行动)」交织①
① ReAct, Yao et al., ICLR 2023(普林斯顿×谷歌)—— loop 的主流范式之一,并非唯一起源。
一问一答 vs 自动循环
直线、可预测、易追踪。但遇错不会自己修,每一步都要你喂下一句。
动态、会回退、能重试。自己闭合反馈缺口,跑到目标达成才停。
关键差别:循环把「判断下一步」的权力交给了模型自己。
一个好循环的 5 个零件
明确目标
「跑通所有测试」是终止条件;「做得更好」会无限循环。
工具集
能跑代码、读文件、查文档——不能行动的循环只是空想。
上下文管理
每轮都在生成历史;要压缩、要修剪,否则撑爆窗口。
终止逻辑
成功/失败/升级三种出口。没有地板,循环就是资源黑洞。
错误恢复
同样的错重复试 = 空转;要会换策略,不是傻重试。
循环 ≠ 模型
模型相近时,好坏更多在这 5 个零件,而非底座模型。
⚠ 2026 热点难题:长任务里循环会「越跑越歪」(long-horizon degradation)——终止与纠偏是工程核心。
Loop 干什么用
编码天生是迭代的——没人一次写对。循环让 Agent 能跑、看错、改、再跑,闭合人类工程师天天在做的反馈环。Claude Code / Devin / Codex 的内核都是它。
单次生成的工具抓不到运行期错误;循环能。这就是 Agent 编码碾压自动补全的原因。
概念家谱:谁包着谁
由内向外,一层套一层:
- Model —— 只会「给输入、出输出」的推理引擎
- Inner Harness —— 单次调用的包装:提示词、工具定义、输出校验
- Loop —— 反复调用模型、执行工具、决定何时停(心脏)
- Harness —— 外壳全集:循环 + 工具 + 记忆 + 护栏 + 路由
所以「harness vs loop」是伪命题——它们是包含关系,不是竞争关系。
从 Prompt 到 Loop:四次聚焦
每一代术语都不是推翻上一代,而是把关注点往「更决定成败的那一层」收。这正面回答了你的问题——harness 没死,它被 loop「放大特写」了。
注:harness / loop engineering 多为厂商造词;学术界更常说「agent 架构 / 控制循环」。
「Agent Loop 是新的操作系统」
| 操作系统 | Agent 世界 |
|---|---|
| CPU | LLM 推理引擎 |
| RAM 内存 | 上下文窗口(有限!) |
| 系统调用 | 工具调用 / MCP |
| 内核 Kernel | MCP Server / Harness |
| 进程调度 | Agent Loop |
设计类比、非严格等价;循环跑在 host(Claude Desktop/Cursor),MCP Server 才是 kernel。
工具数 → 吞掉的上下文预算
所以呢:工具塞太多,AI 反而变笨变慢。
数据:Harness MCP(128K 窗口,估算/示意)· 工具数 O(1)、能力 O(n) 才是设计目标
Loop 跟这些概念什么关系
| 概念 | 和 Loop 的关系 | 一句话 |
|---|---|---|
| Workflow 工作流 | 光谱两端 | 循环=模型自主决定路径,工作流=人预设路径;可靠性↔灵活性权衡,常混合用 |
| ReAct | 祖先 | 现代循环的起源 pattern:推理与行动交织 |
| Harness 马具 | 父集 | 循环是 harness 里的引擎,被它包住 |
| Context Eng. 上下文工程 | 燃料 | 每轮循环都靠它喂对信息,否则撑爆 RAM |
| MCP / Tools | I/O 接口 | 循环的「系统调用」,负责对外行动与取反馈 |
| Multi-Agent 多智能体 | 循环的嵌套 | 多循环协同;更强但协调/成本高,未必默认更好 |
怎么知道循环改好了?靠 evals + 可观测性——harness 工程常被忽略的第三支柱。
一句话记忆:Goal 给方向,Loop 给引擎,Workflow 给轨道,Harness 给车身。
我应该做什么
把「一问一答」升级为「目标+循环」
千图 AI 工具别停在单次生成;给清晰 Goal + 自检循环(生成→评估→重出),逼近"自己把图做对"。
外壳是壁垒,不是模型
模型可替换;记忆、工具、循环、护栏组成的 harness 才是别人抄不走的。投资在这。
把内容生产设计成循环
选题→生成→质检→改→发,每环留反馈口与终止条件,而非一条直线人肉串。
上下文即 RAM,省着花
工具/提示越精简,留给推理的预算越多——这是质量与成本的同一个旋钮。
回到你的问题
「Loop 文章多,是不是 harness 不火了?」——恰恰相反。Loop 是 harness 的心脏;满屏 Loop,说明行业终于把镜头对准了最决定成败的那一环。两者一起热,且是嵌套关系。
来源 SOURCES
① Mr Panda(@PandaTalk8)《Goal+Loop+Workflows 三大利器》X 长文, 2026-06-13 · ② MindStudio《What Is Loop Engineering?》2026-06-09 · ③ MindStudio《What Is Harness Engineering?》2026-05-28 · ④ Harness.io《The Agent Loop Is the New OS》2026-05 · ⑤ Anthropic《Building Effective Agents》(智能体=模型在循环里用工具) · ⑥ ReAct(推理+行动), Yao et al., Princeton×Google, ICLR 2023 · ⑦ O'Reilly / Addy Osmani《Agent Harness Engineering》2026-04