Skip to content

FCoP / Engineering Boundary + Failure Routing + Admin Escalation Mechanism #9

Description

@joinwell52-AI

核心问题(已在系统中反复出现)

当前系统的根因不是状态不足,而是:

  • FCoP(编排层)与工程语义(成功/失败/可行性)边界混用
  • FAIL 被当作终态,而不是分流事件
  • 生命周期 / execution / report 三条写入链互相污染
  • 缺少统一“裁决层 + 通知机制”

一、必须明确的系统分界

1. FCoP 层(只做编排)

职责:

  • task 生命周期流转(inbox/active/done/cancelled/archived)
  • agent dispatch / routing
  • dependency gating

❌ 不负责:

  • 成功/失败判断
  • QA结果解释

2. 工程评估层(Evaluation Layer)

职责:

  • PASS / FAIL / BLOCKED / INFEASIBLE 判断
  • report 语义解析(含正文 FAIL)
  • dependency + artifact 判断

👉 输出:Evaluation Result(不是 state)


3. Execution 层

职责:

  • agent 执行状态
  • runtime job 状态

二、关键机制:FAIL → 必须分流,而不是终态

FAIL 不再直接写入 task state

FAIL → Evaluation Layer → Routing:

  • RETRY(重开)
  • ABANDON(作废/归档)
  • ACCEPT(强制通过)
  • SUPERSEDE(被新任务替代)
  • INFEASIBLE(不可达)

三、必须新增:Finalizer(唯一裁决点)

所有以下写入必须经过 Finalizer:

  • report → task state
  • execution → lifecycle
  • dependency → dispatch

规则:

Only Finalizer can mutate lifecycle state


四、工程侧必须增加:Admin Escalation(PM主动通知机制)

当前缺失能力:

PM无法主动触发 ADMIN 介入

需要新增机制:

触发条件:

  • INFEASIBLE
  • repeated FAIL (>= N)
  • dependency deadlock
  • conflicting reports

行为:

  • PM 自动生成 escalation event
  • push ADMIN task / issue
  • 附带 evaluation context + reports

示例:

  • create_issue("ADMIN Escalation: Task requires decision")

五、五桶(artifact lifecycle)边界澄清

五桶仅负责:

  • 文件归档 / 可见性 / 生命周期

❌ 不参与任务成功判断


六、目标效果

修复后系统保证:

  • 不再出现 FAIL 误当 DONE
  • QA 不会提前 dispatch
  • 子任务不会堆叠污染
  • 0003 / dependency 不会引发状态爆炸
  • PM 可主动升级 ADMIN 决策链

七、结论

系统必须从:

❌ 状态驱动系统
→ 改为

✔ 事件 + 裁决 + 分流 + 通知系统

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions