中期，也就是两到六个月，治理要从“看见成本”升级为“工具干预加 Harness 工程化”。第一层是工具支持，包括 Prompt 前置助手、Batch 提交工具和 Token Review 工具，目的是在任务开始前减少无效上下文和错误模型选择。第二层是任务类型体系，建议建立八到十二类任务，让模型建议、Prompt 检查和指标统计具备可比性。第三层是 Harness 工程化，通过 Subagent、上下文选择器、状态压缩、预算熔断、任务规格化和测试闭环，把高消耗任务拆解、预算化、可验证化。