
#管理提效 #ai研究 #important

---
`powellli`


## 一、背景与目标

随着公司 AI 工具和模型使用的普及，员工在研发、文档生成、客户方案、测试、运营等工作中大量消耗 AI token。当前采购模式按量付费，如果无限制使用，可能导致成本迅速增长，同时无法保证业务产出与 token 消耗之间的合理性。

**治理目标**：

1. **成本可控**：确保 token 使用不超预算、可监控。
2. **效率最大化**：提高单位 token 对业务价值的贡献。
3. **组织可复用**：形成标准化流程、模板、工具链，使 AI 能力可持续复用。
4. **文化建设**：形成 AI 使用最佳实践传播与奖励机制，提升全员 token 使用意识。
5. **工具分层**：鼓励非工程类需求使用 Chatbot 进行日常辅助，减少高成本模型负荷，将 token 资源集中用于工程类、高价值任务。

---

## 二、治理原则

1. **按业务价值驱动**：token 使用不是目标，业务产出才是关键。
2. **可视化、可度量**：建立完整报表和统计体系，使管理者和员工可清楚看到使用情况。
3. **分层管理**：结合个人额度、项目额度和高成本模型审批。
4. **渐进推进**：先做可见性和轻约束，中期用工具干预优化，长期形成组织能力和文化沉淀。
5. **分工分层使用**：非工程类需求优先 Chatbot，工程类、高消耗任务依赖 Agent/Harness 管理，使用ClawPro进行员工和组织之间的协作。
6. **国产优先、国外兜底**（新增）：在工具/Agent 类调用中，默认使用国产模型，仅高度复杂、规划性强的任务才走国外高价模型。

---

## 三、短期治理措施（0–2 个月）

### 1. 个人额度与超额申请

- 每位员工每月初始 token 配额，超过需申请额外额度。
- 超额申请由系统自动生成材料，包括会话数、平均 token、Top 高成本会话、模型占比、项目归因及任务类型，员工填写简短说明即可（100–300 字）。

### 2. 《token 使用报表》MVP

- **个人视图**：会话数、轮次、平均 token、模型占比、上下文效率指标、Prompt 使用情况
- **团队视图**：团队内分布、Top 高成本会话、P50/P80/P95/P99、趋势分析
- **项目归因**：自动归因 + 员工轻量修正 + 高成本会话补充
- **异常提醒**：单次调用异常高成本、夜间异常、连续重试、重复上下文

### 3. 管理分析看板

面向管理者的统一驾驶舱，与个人/团队报表互补，定位为"做决策、看节奏、抓异常"：

- **团队使用情况总览**：各团队 token 消耗趋势、人均消耗、活跃用户占比、Chatbot vs Agent 占比、国产/国外模型占比
- **员工申请额度分析**：申请频次分布、申请通过率、申请理由 Top 标签（业务驱动/探索学习/异常消耗）、超额员工画像
- **高成本会话排行**：Top N 高成本会话明细、责任人、对应任务类型、是否产出有效成果
- **模型选择健康度**：简单任务误用高价模型比例、长上下文比例、重试比例、被熔断任务数
- **专项奖项候选池**：自动汇聚低单位 token 成本、高复用 Prompt、跨团队分享案例的候选名单
- **预算预警**：按月度/季度预算口径预测超支风险，触发管理者干预节点

### 4. 模型使用规范

- 简单任务默认低成本模型，复杂任务可选择高成本模型；初期以建议为主，降低员工抵触。
- **国产优先**：工具/Agent 调用默认走国产模型；仅当任务被识别为"高度复杂规划性"时才允许国外高价模型。

### 5. 非工程类需求 Chatbot 引导

- 明确划线：日常问答、文案润色、信息检索、流程梳理、邮件起草、PPT 文案、知识查询等，**默认走 Chatbot，不进 Agent/Harness 通道**。
- 鼓励员工在**免费/低成本 Chatbot**中尝试更复杂的能力（多轮对话、结构化输出、简单 RAG、思维导图、图片生成），积累"零成本能办成事"的样本。
- 报表中独立标记 Chatbot 通道的消耗与产出，避免与工程消耗混计。

### 6. Token 提效专项奖项

- 第一阶段就开放奖项申报通道，**每月评一次**，门槛低、节奏快，目的是先把"好习惯—被看见—被奖励"的飞轮转起来。
- 短期奖项类目：
  - **最佳节流案例**：单位 token 成本下降最多
  - **最佳 Chatbot 玩法**：用免费/低成本 Chatbot 完成原本要走 Agent 的复杂任务
  - **最佳报表洞察**：基于报表/看板提出可落地的优化建议
  - **异常自查之星**：主动发现并修复自己/团队的高成本异常
- 奖励形式：内部认可 + 小额奖金/培训额度，重点在曝光和样板效应。

### 7. 技术实现前提

- **后台用量数据拉取**：要求支持 token 记录、会话归因、模型路由、异常告警、数据脱敏。
- **无后台数据时**：利用现有工具/日志抓取高成本会话、异常调用和基础统计。

---

## 四、中期治理措施（2–6 个月）

### 1. 工具支持与流程优化

- **Prompt 前置助手**：任务完整性检查、上下文瘦身、模型选择建议、长会话压缩、输出验收提醒
- **Batch 提交工具**：适用于批量生成文档、测试用例、知识库更新等
- **Token Review 工具**：个人自查、团队复盘、异常排查、最佳实践沉淀

### 2. 任务类型体系

- 建议建立 8–12 个任务类型：文档生成、代码生成、代码审查、Debug 排查、测试生成、数据分析、知识库问答、Agent 自动执行等
- 所有指标、模型建议、Prompt 检查均按任务类型分层统计

### 3. Harness 工程化专项（中高消耗任务）

- **Subagent 化**：将复杂任务拆解为 Planner、Context、Code、Test、Review、Summary 等子任务，明确输入输出和预算
- **Skill/MCP 精简与工具路由**：按任务动态加载工具，压缩描述，减少无关能力暴露
- **上下文选择器**：按 git diff、报错堆栈、依赖图、代码索引、历史解决方案选取最小必要上下文
- **状态压缩/检查点**：阶段性生成结构化状态，防止长会话膨胀
- **任务预算与熔断机制**：每个任务设置 token 上限、调用次数、工具调用次数、测试次数和失败熔断条件
- **任务规格化**：明确定义目标、输入、允许修改范围、禁止修改范围、验收标准、测试命令、预算上限、人工确认节点
- **测试闭环与 diff-first 工作流**：通过可验证循环降低返工轮次，保证任务围绕变更收敛
- **项目知识缓存**：沉淀技术栈、目录结构、规范、常见报错、历史解决方案
- **效果评估**：记录 token 消耗、模型调用次数、生成 diff、测试结果、人工修改比例、单位有效 diff token 成本、采纳率

### 4. 非工程类 AI 需求 Chatbot 深化

- 在短期"分流"的基础上，**主动建设 Chatbot 玩法库**：把员工提交的高质量 Prompt、工作流模板、复杂任务的 Chatbot 拆解方案，结构化沉淀。
- 设立"Chatbot 复杂任务挑战"赛季：例如"用 Chatbot 完成客户方案初稿"、"用 Chatbot 完成竞品调研报告"、"用 Chatbot 完成数据透视分析"，鼓励员工挑战原本认为必须用 Agent 的任务。
- 报表中持续追踪：**Chatbot 替代率**（原本走 Agent 现走 Chatbot 的任务占比）、**Chatbot 复杂任务占比**。
- 对应专项奖项继续在中期强化（见下文 §6）。

### 5. ClawPro 协作与知识共识专项

ClawPro 作为公司内部部署的企业级 OpenClaw 管理平台，是中期治理的关键抓手。专项目标：**让 AI 使用从"个人单点高效"升级为"团队协作 + 知识共识"**。

- **会话/产出沉淀**：将 ClawPro 上的高价值会话、Prompt、Skill、Subagent 配置统一归档，作为团队共享资产，减少重复造轮子
- **协作模式**：基于 ClawPro 实现多人协同同一项目（共享上下文、共享记忆、共享任务清单），降低重复加载上下文的 token 浪费
- **知识共识输出**：以 ClawPro 为载体，定期把团队共识（架构决策、规范、常见错误）固化为 Skill 或知识库，所有成员的 Agent 调用自动加载，避免"每人一套上下文"
- **权限与成本归因**：ClawPro 内置项目/团队/个人三层归因，配合短期看板做更精细的成本分摊
- **模型路由统一管控**：在 ClawPro 中统一配置"国产优先 / 国外兜底"路由策略，员工无需手动选择
- **专项 KPI**：Skill 复用次数、共享会话数、跨成员上下文命中率、单位任务的人均 token

### 6. Token 提效专项奖项（中期升级）

- 在短期奖项基础上，新增：
  - **最佳 ClawPro 共享 Skill**：被复用次数最多、显著降低团队 token 消耗
  - **最佳 Chatbot 复杂任务案例**：在免费/低成本 Chatbot 中实现复杂工作流
  - **最佳团队协作案例**：通过 ClawPro 协同显著降低重复消耗
- 评选频次升级到月度+季度双层；季度奖加重奖励力度。

---

## 五、长期治理措施（6–18 个月）

### 1. 项目级 token 管理

- **双额度体系**：个人探索额度 + 项目生产额度
- **项目 AI Token Owner**：负责项目额度分配、模板管理、复盘和产出评估

### 2. 组织能力资产建设

- 标准模板库（Prompt、任务流程、Batch 工具、测试脚本）
- 项目知识库（文档、代码、常见问题、业务规则、评测集）
- 领域 Agent 与模型路由策略
- 优秀使用案例沉淀与复用
- **ClawPro 资产中心化**：所有 Skill / Subagent / 知识库统一在 ClawPro 长期演进

### 3. 模型供应商治理

- 内部模型矩阵：成本等级、适用任务、推荐场景、不适用场景
- 持续评估厂商成本、质量、延迟、稳定性、安全策略
- **国产模型为主、国外为高价值兜底**的供应链结构长期化

### 4. 非工程类 Chatbot 文化

- 长期目标：让"先想想能不能用 Chatbot 解决"成为全员第一反射
- 把 Chatbot 玩法库纳入新员工 onboarding，作为基础能力
- 持续办"Chatbot 极限挑战"季度赛，发掘 0 成本完成复杂任务的样板

### 5. 团队文化建设

- **Token 提效专项奖项**（贯穿全周期）：结合 Token Review、团队复盘，奖励提出优化方案、共享高效 Prompt 或 Batch 模板、降低单位任务 token 成本的员工
- 月度+季度+年度三级评选，年度设"Token 提效之星"
- 文化目标：鼓励经验分享、形成良性竞争，推动 token 使用效率在中长期持续提升

---

## 六、阶段性推进路线（更新）

|阶段|时间|核心目标|关键动作|
|---|---|---|---|
|短期|0–2 月|可见性 + 轻约束 + 文化启动|AI Gateway 日志、个人额度、报表 MVP、**管理分析看板**、模型规范（国产优先）、基础告警、**非工程类 Chatbot 引导**、**专项奖项启动（月度）**|
|中期|2–6 月|工具干预 + 流程标准化 + 协作共识|Prompt Coach、Batch、Token Review、任务类型体系、Harness 工程化、**Chatbot 复杂任务挑战**、**ClawPro 协作与知识共识专项**、专项奖项升级|
|长期|6–18 月|项目责任制 + 组织能力复用 + 文化沉淀|项目额度、Token Owner、知识库、模板库、领域 Agent、模型供应商管理、ClawPro 资产中心化、**Chatbot 全员反射**、Token 提效奖项年度化|

---

## 七、关键风险与对策

|风险|对策|
|---|---|
|员工对报表和额度感到负担|自动生成报表、简化申请材料、轻量化审批|
|高成本模型滥用|模型选择建议、预算告警、高价模型使用分析、国产优先策略|
|Agent 或脚本失控消耗|Harness 工程化、熔断机制、异常告警|
|数据安全/客户信息泄露|脱敏处理、私有模型、内网调用、敏感项目隔离、ClawPro 内网部署|
|指标滥用变绩效工具|管理者只看趋势、团队对比、项目归因，不做个人排名|
|Chatbot 与 Agent 边界模糊|附表明确选择路径 + 报表通道独立 + 月度复盘|

---

## 八、总结

本治理方案通过**短中长期分层推进、数据可见性、工具干预、Harness 工程化、ClawPro 协作共识、Chatbot 分流、项目责任制、文化激励**八大模块，将 AI token 从"不可控成本"转变为"可预算、可度量、可优化的生产资源"。

- 短期：建立报表+管理看板和轻约束，启动专项奖项，明确 Chatbot 分流
- 中期：工具和 Harness 工程化降低无效消耗，ClawPro 沉淀团队协作与知识共识，Chatbot 挑战复杂任务
- 长期：按项目管理 token、沉淀组织能力资产、形成 AI 原生工作流，让 Chatbot 优先成为全员反射，国产模型为主长期结构化

---

## 附表 A：需求—AI 工具选择决策表

> 用法：员工拿到一个 AI 需求，从上往下逐条匹配，命中即停。

### A.1 决策主路径

| 序号 | 判断条件 | 推荐工具 | 默认模型 | 备注 |
|---|---|---|---|---|
| 1 | 一次性问答、信息查询、文案润色、邮件起草、PPT 文案、流程梳理、知识查询 | **Chatbot（免费/低成本）** | 国产 Chatbot | 不进 Agent 通道，零工程成本 |
| 2 | 多轮对话但**不需要持久上下文**、不需要沉淀产出物 | **Chatbot** | 国产 Chatbot | 鼓励先在 Chatbot 中尝试 |
| 3 | 需要上传文档/截图做一次性分析（合同审阅、报告解读、图表识别） | **Chatbot（带文件能力）** | 国产 Chatbot | 复杂版本可挑战 Chatbot 极限 |
| 4 | 需要**自行维护上下文**（跨会话记忆、项目级背景、长期演进） | **工具/Agent（ClawPro）** | **国产模型** | 走 Harness 通道 |
| 5 | 需要**沉淀产出物**（代码 diff、文档版本、测试报告、可复用 Skill） | **工具/Agent（ClawPro）** | **国产模型** | 走 Harness 通道 |
| 6 | 需要批量处理（批量生成、批量校验、批量翻译） | **Batch 工具** | **国产模型** | 走 Batch 通道，避免交互浪费 |
| 7 | **高度复杂的规划性任务**（跨模块架构设计、复杂重构方案、深度推理、长链路 Agent 规划） | **工具/Agent** | **国外高价模型** | 需走审批/专项预算 |
| 8 | 涉及敏感数据/客户信息 | **私有部署模型 / ClawPro 内网通道** | 内部国产模型 | 不走公网 Chatbot |

### A.2 关键判断要点

- **是否需要持久上下文 / 沉淀产出物**：是 → 工具；否 → Chatbot
- **是否高度复杂规划性**：是 → 国外模型；否 → 国产模型
- **是否敏感数据**：是 → 内网/私有；否 → 按上述常规路径

### A.3 反例（容易走错的情况）

| 错误做法 | 正确做法 |
|---|---|
| 用 Agent + 国外高价模型润色一段邮件 | 用免费 Chatbot |
| 用 Chatbot 做需要跨会话记忆的项目分析 | 用 ClawPro 工具，国产模型 |
| 用国产模型硬啃跨模块架构重构 | 申请国外高价模型 + Agent 规格化任务 |
| 把客户数据贴进公网 Chatbot | 用内网私有模型 / ClawPro |
| 一次性把 100 个文件交互式喂给 Agent | 走 Batch 工具 |

### A.4 默认值速记口诀

> **"先 Chatbot，后工具；工具默认国产，复杂规划用国外；敏感数据不出内网。"**

