Adam Chow's Life Journals

详解 OpenAI Agents SDK

OpenAI Agents SDK 主要支持两种多代理协作模式：

切换协作 (Handoff Collaboration)：一个代理可以将控制权完全交给另一个代理。这种模式非常灵活，适用于开放式或对话式的工作流，其中每个代理都可以决定何时将任务转交给更合适的代理来处理。
代理即工具 (Agent as a Tool)：在这种模式下，一个中心代理（通常被称为“编排者”或“Orchestrator”）会像调用工具一样调用其他专门的代理。

“代理即工具”（或称为“编排者-子代理”架构）是目前文档更丰富、更结构化的主流协作模式。下面的时序图和解析将重点围绕这种模式展开。

多代理协作时序图 (Orchestrator-Subagent 模式)

此图展示了一个典型的多代理协作流程。当用户发起一个复杂请求时，编排者代理（Orchestrator Agent）会将其分解，并调度不同能力的子代理（Sub-agents）来协同完成任务，最后汇总结果并返回给用户。

工作原理解析

这个工作流程的核心在于任务的分解与调度。

用户请求与任务分解 用户向作为总入口的“编排者代理”发起一个复杂的、需要多步骤或多领域知识才能解决的请求。编排者代理的首要任务是理解这个请求，并将其智能地分解成一系列更小、更具体的子任务。
任务委派给专业的子代理 编排者根据每个子任务的性质，将其“委派”给最适合处理它的“子代理”。在这个例子中：
- 网页搜索代理：专门负责执行实时网络搜索，获取最新的信息。
- 文档检索代理 (RAG)：专门负责从一个预定义的知识库（如公司内部文档、产品手册等）中进行检索，提供精准的内部信息。
- 代码执行代理：专门负责执行代码，进行数据计算、数据可视化或运行复杂的算法模型。
子代理执行与结果返回 每个子代理独立地执行被委派的任务。它们拥有自己的指令集 (instructions) 和所需的工具。完成任务后，它们会将执行结果返回给编排者代理。
信息汇总与最终响应 编排者代理会收集所有子代理返回的结果。它的最后一个关键任务是将这些来自不同渠道的、零散的信息进行整合、提炼和润色，最终形成一个逻辑清晰、内容完整的最终报告，并将其返回给用户。
透明度与调试 整个工作流程可以通过 OpenAI Traces 等工具进行监控，这为开发者提供了极大的便利，可以清晰地看到每一步的调用情况、输入输出，从而进行有效的调试和优化。

协作模式的优势

模块化与可扩展性：每个代理都是一个独立的模块，专注于特定任务。这使得系统更容易维护，并且可以方便地增加新的专业代理来扩展系统的能力。
专业化与效率：让专业的代理处理专业的事，可以显著提升任务完成的质量和效率，避免单一通用大模型在处理复杂、多阶段任务时的不足。
清晰与可控：编排者-子代理的架构使得整个工作流的逻辑非常清晰，便于开发者理解、控制和调试。

多代理协作时序图 (Orchestrator-Subagent 模式) ​

工作原理解析 ​

协作模式的优势 ​

多代理协作时序图 (Orchestrator-Subagent 模式)

工作原理解析

协作模式的优势