🤖 OMO (Oh-My-OpenAgent) 深度解析：AI 多智能体编排引擎实战报告

作者：Q 师傅

基于 Sisyphus 框架 + OMO 插件的真实项目经验

2026-05-15

一、OMO 是什么

OMO（Oh-My-OpenAgent）是 OpenCode 生态中的多智能体编排插件。它不是某个单一的 AI 能力，而是一套智能体调度系统，负责：

把复杂任务拆解成子任务
并行调度多个 AI 智能体执行
汇总各智能体结果形成最终输出
维护任务状态和上下文连续性

一句话总结

OMO = AI 的 AI 调度器 — 一个 AI 负责指挥一群 AI 干活。

二、核心协调机制

2.1 智能体类型体系

OMO 定义了多种智能体类型，每种专精一个领域：

智能体	角色	能力	成本
Sisyphus	主控大脑	全局协调、任务拆分、结果整合	主模型
explore	代码搜索员	全仓搜索、模式发现、文件定位	免费 🔥
librarian	知识研究员	查外部文档、GitHub 示例、官方 API	低成本
oracle	高阶顾问	复杂架构设计、疑难 Bug 诊断	高成本
metis	计划顾问	需求分析、歧义消除、任务规划	中成本
momus	质量审查	方案评审、完整性检查、合规性验证	中成本
multimodal-looker	多模态观察员	PDF/图片/图表内容提取	中成本
quick	快速执行员	简单修改、类型修复、一键任务	低成本
visual-engineering	前端工程师	UI/UX、样式、动画、前端组件	视觉优化
ultrabrain	深度思考者	复杂逻辑、算法设计、架构推演	高成本
deep	自主研究者	端到端问题解决 + 深度调研	高成本
artistry	创意解题者	非常规问题的创造性方案	中成本

2.2 调度流程

用户需求
    ↓
Sisyphus（主控）：分析意图 → 判断复杂度
    ├── 简单任务 → 直接执行（自己干）
    ├── 搜索需求 → 派 explore/librarian（并行多个）
    ├── 复杂问题 → 派 oracle（单独深度思考）
    ├── 架构设计 → 派 metis 规划 → momus 评审
    └── 多模块任务 → 拆解 → 并行派多个子 agent
    ↓
结果汇总 → 交叉验证 → 输出

2.3 关键机制：并行执行

OMO 最强大的能力是并行。一个任务可以同时派出 3-5 个 agent 做不同的事：

实际例子（Halo 故障排查）：

用户："Halo POST 为什么 500？"
↓
Sisyphus 分析：涉及网络、代码、配置三个维度
↓
并行派出：
  ├── explore → 搜本地代码中的错误模式
  ├── SSH 直连 → 查服务器日志（直接工具）
  └── 思考分析 → 结合已知信息推理
↓
汇总：WAF 拦截？external-url 错误？NPE Bug？

2.4 关键机制：背景任务

任务可以"在后台跑"，主控不用等：
┌─ 主对话 ──────────────────────────┐
│ 用户：帮我查 Halo 服务器状态       │
│ Sisyphus：好的，我先派 agent 去查   │
│ （继续聊别的...）                    │
│ [系统通知] 后台任务完成！            │
│ Sisyphus：结果出来了，是 NPE Bug     │
└────────────────────────────────────┘

反模式：不要在同一个任务上同时派人和自己做——浪费资源。

2.5 关键机制：Skill 注入

Skills 不是死板配置文件，而是 OMO 调度时的上下文注入：

task(category="quick", load_skills=["powershell-reliable"], ...)
                    ↑
              Agent 启动时自动加载此 skill
              知道 PowerShell 的坑：不能用 &&、cd 坏了等

Skill 的选择直接影响 agent 的工作质量——选错 skill 等于派错人。

三、实战模式：发挥 OMO 最大价值

模式 1：AI 自循环实验（破解甲骨文案例）

背景：解读花东甲骨文数据集，需要 OCR + 模式匹配 + 频次分析。

传统做法：人工逐片识别 → 对照字典 → 统计频次 → 分析规律。几个月。

OMO 做法：

阶段1：explore × 2 → 并行扫描数据集，找文件结构
    ↓
阶段2：直接工具 → Python 脚本批量 OCR 提取
    ↓
阶段3：分析结果 → 发现问题 → 修复 → 重跑
    ↓
阶段4：直到结果稳定 → 输出报告

核心：AI 自己发现问题 → 自己修复 → 自己验证 → 形成循环。人只做决策。

模式 2：多源交叉验证（AFG 编号提取）

背景：从 Excel + DWG 图纸提取 150 个机柜编号，两种数据源可能不一致。

做法：

并行派出：
  ├── Python 脚本 → 解析 Excel 提取编号
  └── DWG 解析脚本 → 提取系统图编号
交叉比对 → 发现差异 → 人工确认

关键：OMO 可以同时执行多个脚本，让数据互相验证。

模式 3：系统性故障排查（Halo 500 诊断）

背景：Halo API POST 返回 500，GET 正常。

OMO 排查链：

① 本地 curl 测试 → 确认不是网络问题
② SSH 进服务器查日志 → 发现 NPE 栈跟踪
③ 看进程启动命令 → 发现 external-url 配置错误
④ 修正后重启 → 仍然 500 → 推翻假设
⑤ 再查日志 → 确认是 Halo Pro 2.24.2 NPE Bug

关键：OMO 不只会"修"，更会推理。推翻自己的假设重新来过。

模式 4：文档双发流水线（OCR → SiYuan + Halo）

背景：技术文档图片需要 OCR 后同时发到思源笔记和 Halo 博客。

OMO 流水线：

① OCR 提取文字（pytesseract）
② 整理现代 MD（含表格、代码块）
③ 上传图片到 SiYuan → 替换引用路径
④ 发布到 SiYuan（REST API）
⑤ 上传图片到 Halo → 替换引用路径
⑥ 发布到 Halo（create draft → publish）

关键：OMO 可以把多次手动操作串成一次自动流水线。

模式 5：并行探索 + Oracle 深度诊断

模式：先用低成本 explore 广泛搜索，再用高成本 oracle 深度分析。

用户：网站 POST 500
↓
explore × 2（并行搜索日志 / 代码）
  → 找到线索：external-url 配置
↓
oracle（深度推理）
  → 推测是 license 校验失败
↓
验证 → 推翻 → 再查
  → 最终确认：NPE Bug

四、关键决策：什么时候派什么人

选人原则

任务类型	派谁	不要派
搜文件/找代码	explore（免费）	oracle（太贵）
查 API 文档	librarian（免费）	ultrabrain（杀鸡用牛刀）
复杂 Bug 诊断	oracle	quick（不够深）
前端 UI	visual-engineering	ultrabrain
简单修改	quick	任何高级 agent
架构设计	ultrabrain / oracle	explore
写文档	writing	ultrabrain

成本意识

explore / librarian ≈ 免费
quick / unspecified ≈ 低成本
oracle / ultrabrain ≈ 高成本

让高成本 agent 只做只有它才能做的事。

五、避坑记录

踩坑 1：先干活再分析

❌ 接到需求直接派 oracle → 浪费钱
✅ 先派 explore 搜集信息 → 再决定是否需要 oracle

踩坑 2：重复搜索

❌ 派了 explore 又自己手动 grep → 重复劳动
✅ 派出去就信它，自己干别的

踩坑 3：背景任务不收集

❌ 派了背景任务不等结果就继续 → 结果丢失
✅ 等系统通知 → collect → 再用

踩坑 4：Skill 选错

❌ 前端任务派 quick 不带 frontend-design skill → 输出平庸
✅ 前端任务 = visual-engineering + frontend-design

踩坑 5：一口吃不成胖子

❌ 一个任务塞 10 个步骤 → agent 迷失
✅ 拆成 3-5 分钟的子任务 → 逐个完成

六、与 Superpowers 的协同

OMO 和 Superpowers 是互补关系：

	OMO	Superpowers
角色	智能体调度引擎	开发方法论
管什么	派谁干、并行执行、任务状态	怎么干、步骤顺序、质量标准
典型	explore/oracle/deep	brainstorming → plan → TDD → review
协作	OMO 执行 Superpowers 定义的流程	Superpowers 告诉 OMO 下一步该做什么

配合方式：

Superpowers 定义流程：
  brainstorm → 写计划 → 子 agent 执行 → 验证 → 完成
                    ↓
OMO 执行子步骤：
  "派一个 explore 去搜代码，
   派一个 quick 去改文件，
   派一个 momus 去审查"

七、总结

OMO 不是"另一个 AI 功能"，它是把 AI 从单兵作战变成兵团作战的指挥系统。

实战价值矩阵

能力	价值	实际效果
并行执行	⭐⭐⭐⭐⭐	3-5 倍效率提升
智能体分工	⭐⭐⭐⭐⭐	各取所长，成本最优
背景任务	⭐⭐⭐⭐	不等不阻塞
Skill 注入	⭐⭐⭐⭐	领域知识即插即用
自循环实验	⭐⭐⭐⭐⭐	AI 自己迭代改进

一句话

OMO 让 AI 从"一个人干"变成"一个团队干"——你只需要当 CEO。

本文基于 Oh-My-OpenAgent 插件的实际使用经验编写
运行环境：OpenCode + OMO + Superpowers 三件套

🤖 OMO (Oh-My-OpenAgent) 深度解析：AI 多智能体编排引擎实战报告

🤖 OMO (Oh-My-OpenAgent) 深度解析：AI 多智能体编排引擎实战报告

一、OMO 是什么

一句话总结

二、核心协调机制

2.1 智能体类型体系

2.2 调度流程

2.3 关键机制：并行执行

2.4 关键机制：背景任务

2.5 关键机制：Skill 注入

三、实战模式：发挥 OMO 最大价值

模式 1：AI 自循环实验（破解甲骨文案例）

模式 2：多源交叉验证（AFG 编号提取）

模式 3：系统性故障排查（Halo 500 诊断）

模式 4：文档双发流水线（OCR → SiYuan + Halo）

模式 5：并行探索 + Oracle 深度诊断

四、关键决策：什么时候派什么人

选人原则

成本意识

五、避坑记录

踩坑 1：先干活再分析

踩坑 2：重复搜索

踩坑 3：背景任务不收集

踩坑 4：Skill 选错

踩坑 5：一口吃不成胖子

六、与 Superpowers 的协同

七、总结

实战价值矩阵

一句话

文章目录

评论