Part II: Agent Loop -- 循环的艺术
核心循环:Agent 就是一个 Message --> Think --> Act --> Observe 的循环。理解这个循环,就理解了 AI Agent 的心跳。
这个 Part 要解决什么问题
当你告诉 Agent「帮我重构这个函数」,它不是调一次 API 就完事。它可能要读文件、理解上下文、写代码、跑测试、发现报错、再改代码——一连串动作构成一个循环。这个循环怎么实现?API 怎么调?流式响应怎么处理?错误怎么恢复?对话越来越长、上下文窗口快爆了怎么办?
Part II 拆解 Agent 的心跳。从外层的查询引擎(会话管理、状态维护、预算控制)到内层的查询函数(API 调用、工具执行、循环判断),再到让整个系统能够长期运行的上下文管理机制。三章读完,你将理解一个生产级 Agent 从接收用户输入到产出最终回复的完整生命周期。
包含章节
Chapter 3: Agent Loop 解剖 -- 一轮对话的完整旅程。 为什么把循环拆成两层(查询引擎 + 查询函数)?为什么选择 AsyncGenerator 而不是回调或事件发射器?分层的好处是什么?这一章带你走完循环的每一步。
Chapter 4: 与 LLM 对话 -- API 调用、流式响应与错误恢复。 调一次 API 看似只需三行代码,但生产环境下藏着一百种失败方式:过载、超时、token 超限、服务器错误。流式传输如何让用户不用盯着空白屏幕?自动重试的策略是什么?
Chapter 5: 上下文窗口管理 -- 有限记忆下的生存之道。 200K token 听起来很多,但 Agent 场景下几十分钟就能花光。六层压缩管线——从 microcompact 的精准外科手术到 autocompact 的全量摘要替换——如何用最小代价保持上下文可用?
与其他 Part 的关系
- 前置知识:Part I 中的心智模型和架构全景,特别是 Chapter 2 的「一条消息的旅程」。
- 后续延伸:Agent Loop 是工具执行(Part III)的运行时容器——工具调用发生在循环内部。权限检查(Part IV)嵌入在循环的工具执行阶段。多 Agent 编排(Part V)本质上是多个循环的协调。上下文管理(Chapter 5)与记忆系统(Part VI, Chapter 17)紧密互补。