2026 AI Agent 核心概念研究

Loop：
智能体的心跳

为什么 2026 年讨论从 harness（马具） 拉近到了 loop（循环）——一份给 CEO 的第一性原理拆解。

什么是 Loop 干什么用概念关系图谱

260614 · Wayne研究室 · 14 页 · 7 篇核心来源

TL;DR · 一句话结论

Harness 没过气——
讨论在「拉近镜头」

Loop 不是 harness 的替代品，而是 harness 最关键的那颗心脏。刷屏的本质：行业把焦点从「整副马具」聚焦到「让马具跑起来的那个循环」。

人话harness 直译「马具/挽具」——套在模型这匹马身上、让它能拉车干活的整套装备。

事实

嵌套，不是对立

循环被包在 harness 里，是其中的引擎，二者不在同一层。

观点

智能在循环里

模型能力相近时，胜负更看循环设计，而非单纯堆参数。

CEO 视角

护城河在外壳

换模型很便宜，重做 harness 很贵——投资在循环。

小白友好 · 30 秒词典

先把这几个词说人话

Loop

循环

AI 自己「做一步、看结果、再决定下一步」，反复到完成。

Harness

外壳 / 马具

套在模型外面、让它能干活的整套装备：工具+记忆+循环+护栏。

Workflow

工作流

人提前画好的固定路线，AI 照走，不自己改路。

Context

上下文

模型的「桌面/短期记忆」，就这么大，塞太多就乱。

Agent

智能体

会自己用工具、自己跑循环达成目标的 AI，不只是聊天。

记忆口诀

四件套

Goal 方向 · Loop 引擎 · Workflow 轨道 · Harness 车身。

语境 · 为什么突然刷屏

同一周，全球都在写 Loop

06-13 · X 长文Mr Panda：Goal+Loop+Workflows 三大利器中文圈引爆，72 赞 / 13 转 —— 你的引子。

06-09 · MindStudio「Loop Engineering：新的 Meta」把循环设计上升为独立工程学科。

05-18 · Harness.io「The Agent Loop is the New OS」一家叫 Harness 的公司，把循环捧成操作系统。

04 · O'Reilly / Addy Osmani「Harness Engineering：AI 控制平面」外壳工程被正式命名。

你的引子 · Mr Panda 原文

「你让 Claude 跑一个任务，它干完一轮，停下来，等你说下一句。这是大多数人用 Claude Code 的方式——一问一答，像在跟一个反应很快、但没什么主见的助理对话。」

他的解法正是标题三件套：Goal + Loop + Workflows。下文逐层拆开。

第一性定义 · 本质

什么是 Loop

一个会自我推进的循环：观察 → 推理 → 行动 → 拿反馈，再来一轮，直到目标达成或触发停止。

▸ 与「一问一答」不同：它自己决定下一步
▸ 与「链 Chain」不同：链是 A→B→C 直线；循环能回退、重试、收敛
▸ 主流范式源自 ReAct：把「想(推理)」和「做(行动)」交织^①

① ReAct, Yao et al., ICLR 2023（普林斯顿×谷歌）—— loop 的主流范式之一，并非唯一起源。

对比 · Mr Panda 的引子拆解

一问一答 vs 自动循环

Chain · 一问一答

直线、可预测、易追踪。但遇错不会自己修，每一步都要你喂下一句。

Loop · 自动循环

动态、会回退、能重试。自己闭合反馈缺口，跑到目标达成才停。

人话链 = 照菜谱一步步走、不回头；循环 = 边做边尝边调，错了重来。

关键差别：循环把「判断下一步」的权力交给了模型自己。

解剖 · Loop Engineering

一个好循环的 5 个零件

01 Goal

明确目标

「跑通所有测试」是终止条件；「做得更好」会无限循环。

02 Tools

工具集

能跑代码、读文件、查文档——不能行动的循环只是空想。

03 Context

上下文管理

每轮都在生成历史；要压缩、要修剪，否则撑爆窗口。

04 Stop

终止逻辑

成功/失败/升级三种出口。没有地板，循环就是资源黑洞。

05 Recover

错误恢复

同样的错重复试 = 空转；要会换策略，不是傻重试。

本质

循环 ≠ 模型

模型相近时，好坏更多在这 5 个零件，而非底座模型。

⚠ 2026 热点难题：长任务里循环会「越跑越歪」（long-horizon degradation）——终止与纠偏是工程核心。

用途 · 为什么编码最先爆发

Loop 干什么用

编码天生是迭代的——没人一次写对。循环让 Agent 能跑、看错、改、再跑，闭合人类工程师天天在做的反馈环。Claude Code / Devin / Codex 的内核都是它。

单次生成的工具抓不到运行期错误；循环能。这就是 Agent 编码碾压自动补全的原因。

关系图谱 · 核心

概念家谱：谁包着谁

由内向外，一层套一层：

Model —— 只会「给输入、出输出」的推理引擎
Inner Harness —— 单次调用的包装：提示词、工具定义、输出校验
Loop —— 反复调用模型、执行工具、决定何时停（心脏）
Harness —— 外壳全集：循环 + 工具 + 记忆 + 护栏 + 路由

人话像套娃／洋葱：最里面是模型，一层层往外包，最外层才是完整 harness。

所以「harness vs loop」是伪命题——它们是包含关系，不是竞争关系。

脉络 · 镜头一路拉近

从 Prompt 到 Loop：四次聚焦

每一代术语都不是推翻上一代，而是把关注点往「更决定成败的那一层」收。这正面回答了你的问题——harness 没死，它被 loop「放大特写」了。

⊂每一代被下一代「包住」

同热Context / Harness / Loop 同时在热

≠死Harness 是被聚焦，不是被淘汰

注：harness / loop engineering 多为厂商造词；学术界更常说「agent 架构 / 控制循环」。

洞见 · Harness.io

「Agent Loop 是新的操作系统」

操作系统	Agent 世界
CPU	LLM 推理引擎
RAM 内存	上下文窗口（有限！）
系统调用	工具调用 / MCP
内核 Kernel	MCP Server / Harness
进程调度	Agent Loop

人话把 AI 想成办公室：上下文=桌面就这么大，工具塞太多就没地方思考。

设计类比、非严格等价；循环跑在 host（Claude Desktop/Cursor），MCP Server 才是 kernel。

工具数 → 吞掉的上下文预算

所以呢：工具塞太多，AI 反而变笨变慢。

数据：Harness MCP（128K 窗口，估算/示意）· 工具数 O(1)、能力 O(n) 才是设计目标

关系总表 · Loop 与它的邻居

Loop 跟这些概念什么关系

概念	和 Loop 的关系	一句话
Workflow 工作流	光谱两端	循环=模型自主决定路径，工作流=人预设路径；可靠性↔灵活性权衡，常混合用
ReAct	祖先	现代循环的起源 pattern：推理与行动交织
Harness 马具	父集	循环是 harness 里的引擎，被它包住
Context Eng. 上下文工程	燃料	每轮循环都靠它喂对信息，否则撑爆 RAM
MCP / Tools	I/O 接口	循环的「系统调用」，负责对外行动与取反馈
Multi-Agent 多智能体	循环的嵌套	多循环协同；更强但协调/成本高，未必默认更好

怎么知道循环改好了？靠 evals + 可观测性——harness 工程常被忽略的第三支柱。

一句话记忆：Goal 给方向，Loop 给引擎，Workflow 给轨道，Harness 给车身。

CEO 视角 · 千图网落地

我应该做什么

产品

把「一问一答」升级为「目标+循环」

千图 AI 工具别停在单次生成；给清晰 Goal + 自检循环（生成→评估→重出），逼近"自己把图做对"。

护城河

外壳是壁垒，不是模型

模型可替换；记忆、工具、循环、护栏组成的 harness 才是别人抄不走的。投资在这。

内容流水线

把内容生产设计成循环

选题→生成→质检→改→发，每环留反馈口与终止条件，而非一条直线人肉串。

成本

上下文即 RAM，省着花

工具/提示越精简，留给推理的预算越多——这是质量与成本的同一个旋钮。

收束

回到你的问题

「Loop 文章多，是不是 harness 不火了？」——恰恰相反。Loop 是 harness 的心脏；满屏 Loop，说明行业终于把镜头对准了最决定成败的那一环。两者一起热，且是嵌套关系。

Loop引擎 · 心脏

Harness车身 · 外壳（含 Loop）

Workflow轨道 · 预设路径

来源 SOURCES

① Mr Panda(@PandaTalk8)《Goal+Loop+Workflows 三大利器》X 长文, 2026-06-13 · ② MindStudio《What Is Loop Engineering?》2026-06-09 · ③ MindStudio《What Is Harness Engineering?》2026-05-28 · ④ Harness.io《The Agent Loop Is the New OS》2026-05 · ⑤ Anthropic《Building Effective Agents》（智能体=模型在循环里用工具） · ⑥ ReAct（推理+行动）, Yao et al., Princeton×Google, ICLR 2023 · ⑦ O'Reilly / Addy Osmani《Agent Harness Engineering》2026-04