🤖 OMO (Oh-My-OpenAgent) 深度解析:AI 多智能体编排引擎实战报告
作者:Q 师傅
基于 Sisyphus 框架 + OMO 插件的真实项目经验
2026-05-15
一、OMO 是什么
OMO(Oh-My-OpenAgent)是 OpenCode 生态中的多智能体编排插件。它不是某个单一的 AI 能力,而是一套智能体调度系统,负责:
- 把复杂任务拆解成子任务
- 并行调度多个 AI 智能体执行
- 汇总各智能体结果形成最终输出
- 维护任务状态和上下文连续性
一句话总结
OMO = AI 的 AI 调度器 — 一个 AI 负责指挥一群 AI 干活。
二、核心协调机制
2.1 智能体类型体系
OMO 定义了多种智能体类型,每种专精一个领域:
| 智能体 | 角色 | 能力 | 成本 |
|---|---|---|---|
| Sisyphus | 主控大脑 | 全局协调、任务拆分、结果整合 | 主模型 |
| explore | 代码搜索员 | 全仓搜索、模式发现、文件定位 | 免费 🔥 |
| librarian | 知识研究员 | 查外部文档、GitHub 示例、官方 API | 低成本 |
| oracle | 高阶顾问 | 复杂架构设计、疑难 Bug 诊断 | 高成本 |
| metis | 计划顾问 | 需求分析、歧义消除、任务规划 | 中成本 |
| momus | 质量审查 | 方案评审、完整性检查、合规性验证 | 中成本 |
| multimodal-looker | 多模态观察员 | PDF/图片/图表内容提取 | 中成本 |
| quick | 快速执行员 | 简单修改、类型修复、一键任务 | 低成本 |
| visual-engineering | 前端工程师 | UI/UX、样式、动画、前端组件 | 视觉优化 |
| ultrabrain | 深度思考者 | 复杂逻辑、算法设计、架构推演 | 高成本 |
| deep | 自主研究者 | 端到端问题解决 + 深度调研 | 高成本 |
| artistry | 创意解题者 | 非常规问题的创造性方案 | 中成本 |
2.2 调度流程
用户需求
↓
Sisyphus(主控):分析意图 → 判断复杂度
├── 简单任务 → 直接执行(自己干)
├── 搜索需求 → 派 explore/librarian(并行多个)
├── 复杂问题 → 派 oracle(单独深度思考)
├── 架构设计 → 派 metis 规划 → momus 评审
└── 多模块任务 → 拆解 → 并行派多个子 agent
↓
结果汇总 → 交叉验证 → 输出
2.3 关键机制:并行执行
OMO 最强大的能力是并行。一个任务可以同时派出 3-5 个 agent 做不同的事:
实际例子(Halo 故障排查):
用户:"Halo POST 为什么 500?"
↓
Sisyphus 分析:涉及网络、代码、配置三个维度
↓
并行派出:
├── explore → 搜本地代码中的错误模式
├── SSH 直连 → 查服务器日志(直接工具)
└── 思考分析 → 结合已知信息推理
↓
汇总:WAF 拦截?external-url 错误?NPE Bug?
2.4 关键机制:背景任务
任务可以"在后台跑",主控不用等:
┌─ 主对话 ──────────────────────────┐
│ 用户:帮我查 Halo 服务器状态 │
│ Sisyphus:好的,我先派 agent 去查 │
│ (继续聊别的...) │
│ [系统通知] 后台任务完成! │
│ Sisyphus:结果出来了,是 NPE Bug │
└────────────────────────────────────┘
反模式:不要在同一个任务上同时派人和自己做——浪费资源。
2.5 关键机制:Skill 注入
Skills 不是死板配置文件,而是 OMO 调度时的上下文注入:
task(category="quick", load_skills=["powershell-reliable"], ...)
↑
Agent 启动时自动加载此 skill
知道 PowerShell 的坑:不能用 &&、cd 坏了等
Skill 的选择直接影响 agent 的工作质量——选错 skill 等于派错人。
三、实战模式:发挥 OMO 最大价值
模式 1:AI 自循环实验(破解甲骨文案例)
背景:解读花东甲骨文数据集,需要 OCR + 模式匹配 + 频次分析。
传统做法:人工逐片识别 → 对照字典 → 统计频次 → 分析规律。几个月。
OMO 做法:
阶段1:explore × 2 → 并行扫描数据集,找文件结构
↓
阶段2:直接工具 → Python 脚本批量 OCR 提取
↓
阶段3:分析结果 → 发现问题 → 修复 → 重跑
↓
阶段4:直到结果稳定 → 输出报告
核心:AI 自己发现问题 → 自己修复 → 自己验证 → 形成循环。人只做决策。
模式 2:多源交叉验证(AFG 编号提取)
背景:从 Excel + DWG 图纸提取 150 个机柜编号,两种数据源可能不一致。
做法:
并行派出:
├── Python 脚本 → 解析 Excel 提取编号
└── DWG 解析脚本 → 提取系统图编号
交叉比对 → 发现差异 → 人工确认
关键:OMO 可以同时执行多个脚本,让数据互相验证。
模式 3:系统性故障排查(Halo 500 诊断)
背景:Halo API POST 返回 500,GET 正常。
OMO 排查链:
① 本地 curl 测试 → 确认不是网络问题
② SSH 进服务器查日志 → 发现 NPE 栈跟踪
③ 看进程启动命令 → 发现 external-url 配置错误
④ 修正后重启 → 仍然 500 → 推翻假设
⑤ 再查日志 → 确认是 Halo Pro 2.24.2 NPE Bug
关键:OMO 不只会"修",更会推理。推翻自己的假设重新来过。
模式 4:文档双发流水线(OCR → SiYuan + Halo)
背景:技术文档图片需要 OCR 后同时发到思源笔记和 Halo 博客。
OMO 流水线:
① OCR 提取文字(pytesseract)
② 整理现代 MD(含表格、代码块)
③ 上传图片到 SiYuan → 替换引用路径
④ 发布到 SiYuan(REST API)
⑤ 上传图片到 Halo → 替换引用路径
⑥ 发布到 Halo(create draft → publish)
关键:OMO 可以把多次手动操作串成一次自动流水线。
模式 5:并行探索 + Oracle 深度诊断
模式:先用低成本 explore 广泛搜索,再用高成本 oracle 深度分析。
用户:网站 POST 500
↓
explore × 2(并行搜索日志 / 代码)
→ 找到线索:external-url 配置
↓
oracle(深度推理)
→ 推测是 license 校验失败
↓
验证 → 推翻 → 再查
→ 最终确认:NPE Bug
四、关键决策:什么时候派什么人
选人原则
| 任务类型 | 派谁 | 不要派 |
|---|---|---|
| 搜文件/找代码 | explore(免费) | oracle(太贵) |
| 查 API 文档 | librarian(免费) | ultrabrain(杀鸡用牛刀) |
| 复杂 Bug 诊断 | oracle | quick(不够深) |
| 前端 UI | visual-engineering | ultrabrain |
| 简单修改 | quick | 任何高级 agent |
| 架构设计 | ultrabrain / oracle | explore |
| 写文档 | writing | ultrabrain |
成本意识
explore / librarian ≈ 免费
quick / unspecified ≈ 低成本
oracle / ultrabrain ≈ 高成本
让高成本 agent 只做只有它才能做的事。
五、避坑记录
踩坑 1:先干活再分析
❌ 接到需求直接派 oracle → 浪费钱
✅ 先派 explore 搜集信息 → 再决定是否需要 oracle
踩坑 2:重复搜索
❌ 派了 explore 又自己手动 grep → 重复劳动
✅ 派出去就信它,自己干别的
踩坑 3:背景任务不收集
❌ 派了背景任务不等结果就继续 → 结果丢失
✅ 等系统通知 → collect → 再用
踩坑 4:Skill 选错
❌ 前端任务派 quick 不带 frontend-design skill → 输出平庸
✅ 前端任务 = visual-engineering + frontend-design
踩坑 5:一口吃不成胖子
❌ 一个任务塞 10 个步骤 → agent 迷失
✅ 拆成 3-5 分钟的子任务 → 逐个完成
六、与 Superpowers 的协同
OMO 和 Superpowers 是互补关系:
| OMO | Superpowers | |
|---|---|---|
| 角色 | 智能体调度引擎 | 开发方法论 |
| 管什么 | 派谁干、并行执行、任务状态 | 怎么干、步骤顺序、质量标准 |
| 典型 | explore/oracle/deep | brainstorming → plan → TDD → review |
| 协作 | OMO 执行 Superpowers 定义的流程 | Superpowers 告诉 OMO 下一步该做什么 |
配合方式:
Superpowers 定义流程:
brainstorm → 写计划 → 子 agent 执行 → 验证 → 完成
↓
OMO 执行子步骤:
"派一个 explore 去搜代码,
派一个 quick 去改文件,
派一个 momus 去审查"
七、总结
OMO 不是"另一个 AI 功能",它是把 AI 从单兵作战变成兵团作战的指挥系统。
实战价值矩阵
| 能力 | 价值 | 实际效果 |
|---|---|---|
| 并行执行 | ⭐⭐⭐⭐⭐ | 3-5 倍效率提升 |
| 智能体分工 | ⭐⭐⭐⭐⭐ | 各取所长,成本最优 |
| 背景任务 | ⭐⭐⭐⭐ | 不等不阻塞 |
| Skill 注入 | ⭐⭐⭐⭐ | 领域知识即插即用 |
| 自循环实验 | ⭐⭐⭐⭐⭐ | AI 自己迭代改进 |
一句话
OMO 让 AI 从"一个人干"变成"一个团队干"——你只需要当 CEO。
本文基于 Oh-My-OpenAgent 插件的实际使用经验编写
运行环境:OpenCode + OMO + Superpowers 三件套