AGENT

AI工程控制平面与系统收敛方案

2026/04/24 6 min read AGENT AI改造计划 AI工程控制平面与系统收敛方案

ai很蠢,他不知道上一次的工程进行到哪里了,只会乱建立。还会建立一堆

\control-plane\

简单说:/control-plane/ 就是“控制平面”的目录/路径,指系统里负责做决策、发指令、管配置的那部分核心逻辑,和真正跑业务数据的“数据平面(data-plane)”分开。 ### 一、大白话类比 - 控制平面(control-plane)= 大脑/指挥中心 负责:规划路线、下发规则、管理状态、调度资源。 - 数据平面(data-plane)= 公路/运输队 负责:按规则高速转发数据包/请求,不思考,只干活。 ### 二、/control-plane/ 路径含义 你看到的 \control-plane\(Windows 反斜杠)或 /control-plane/(Linux/URL 斜杠),一般是: 1. 目录名:代码/配置里专门放控制平面相关代码、配置、证书的文件夹; 2. URL 路径:访问控制平面接口的地址,例如 https://xxx/control-plane/api/...; 3. K8s/云原生语境:特指集群管控组件(kube-apiserver、etcd、scheduler 等)所在的逻辑/物理分区。 ### 三、核心职责(以 K8s/服务网格为例) - 认证、授权、鉴权; - 集群状态存储(etcd); - 调度决策(把 Pod 分到哪个节点); - 下发流量规则、负载均衡、熔断、灰度策略; - 监控、健康检查、自愈控制。 ### 四、和数据平面的区别 | 对比 | 控制平面(control-plane) | 数据平面(data-plane) | |---|---|---| | 角色 | 决策者、管理者 | 执行者、转发者 | | 工作 | 复杂计算、策略管理、状态维护 | 高速转发、低延迟处理 | | 性能 | 可靠性优先,毫秒/秒级 | 速度优先,微秒级 | | 例子 | K8s apiserver、istiod | K8s kube-proxy、Envoy 边车 | ### 五、你遇到的场景 你之前的报错是 AI 会话的技能插件问题,这里的 /control-plane/ 大概率是: - AI 服务后端的控制平面接口路径; - 用于管理插件(skills)、会话配置、权限校验的那部分系统路径。 一句话总结:/control-plane/ 是系统的“管控入口/核心目录”,管决策和配置,不管实际业务数据转发。 要不要我结合你用的具体工具(比如 K8s、Istio 或某款 AI 框架),帮你定位这个 /control-plane/ 对应的具体组件和配置文件?

你这个判断是对的,而且不是你一个人的问题——这是默认用 AI 做工程时几乎必然发生的结构性问题
AI倾向于“再起一套”而不是“在既有体系里约束修改”,结果就是系统越滚越多、越接不上。

但这不是“AI不行”,而是缺少约束层(governance)。你要做的是把它变成只能在一条轨道上工作的工具

下面给你一套能落地的收敛方案,不是概念。


🧠 一句话本质

AI默认是“生成器”
你要把它变成“在现有系统内修改的执行器”

🔥 一、为什么会出现“多套系统 + 屎山”

AI的默认行为:

问题 → 直接给一套完整方案 → 新建文件 → 新结构

不会主动:

分析现有系统 → 复用 → 修改

👉 所以你现在的情况是:

A系统(旧)
B系统(AI新造)
C系统(再新造)
 
→ 三套并存 → 无法维护

🚀 二、解决思路(核心)

你要做的不是“让AI更聪明”,而是:

👉 限制 AI 的操作空间
👉 强制它只在“已有结构”里工作

🧱 三、工程级约束(必须落地)

1️⃣ 单一入口(最重要)

你必须有一个:

PROJECT_ROOT = 唯一工作区

👉 AI必须遵守:

✔ 只能修改 PROJECT_ROOT 内文件
❌ 禁止创建平行系统
❌ 禁止新建重复模块

2️⃣ 模块声明(你之前其实已经做了)

你有:

modules/
control-plane/
gateway/

👉 继续强化:

每个模块必须有 module.json

例如:

{
  "name": "deploy-center",
  "owns": [
    "codex/mcps/deploy-center/**"
  ],
  "exports": [
    "deploy-openclaw-dev.ps1"
  ]
}

👉 AI只能:

✔ 改这个模块内部
❌ 不允许复制一个 deploy-center-v2

3️⃣ 禁止“新系统生成”(关键规则)

你要明确写进规则:

禁止:
- 创建新 gateway 实现
- 创建新 deploy 系统
- 创建新 key-pool

👉 允许:

只在已有实现上:
- 修改
- 修复
- 扩展

🔥 四、给你一条“强制执行命令模板”(最关键)

以后你所有任务都这样下👇


任务规则:
 
1. 必须先分析现有系统结构
2. 必须复用已有模块
3. 禁止新建同类系统(gateway / deploy / key-pool)
4. 修改必须发生在现有文件路径内
5. 输出必须包含:
   - 修改的文件路径
   - 为什么不新建系统
   - 如何与现有结构对齐
 
如果发现已有系统冲突:
优先删除冗余实现,而不是新增

👉 这条会直接让 AI 行为改变


🧠 五、你现在系统的真实问题(帮你点出来)

你现在已经有:

✔ AI Gateway
✔ Key Pool
✔ Deploy Center
✔ Control Plane

但同时:

❌ 多套 deploy routing
❌ 本地池 + 服务器池混用
❌ 多入口(scripts / config / registry)

👉 本质:

控制平面没有被“锁死”

🚀 六、你下一步最该做的(不是继续写代码)

👉 做一件事:

收敛架构(Architecture Freeze)

你要写一份:

SYSTEM_MAP.md

内容只要这些:


1. 唯一 gateway:谁?
2. 唯一 key pool:谁?
3. 唯一 deploy:谁?
4. control-plane:在哪?
5. 每个模块负责什么

👉 然后加一条规则:

AI 不得违反 SYSTEM_MAP.md

🔥 七、最狠的一招(推荐你用)

👉 “删优先原则”

你以后要这样命令 AI:

如果发现重复系统:
优先删除旧的 / 错的
而不是新增一个

👉 这句话能直接防止屎山


🧠 八、你现在其实已经到一个分水岭了

你已经不是在:

写代码

而是在:

设计一个 AI 能持续维护的系统

👉 如果你不加约束:

3周后 → 彻底不可控

👉 如果你加了:

系统会稳定演进

🚀 如果你要,我可以帮你做一个完整的

👉 “AI工程约束规范(可直接给Codex用)”

包括:

  • 禁止生成新系统规则

  • 模块边界

  • 文件归属检查

  • 自动防屎山策略


你只要说:

给我规范

我直接给你一份可以长期用的版本。