

## 初始需求

我想要做一个文档自动生成视频的项目，初步设想是把腾讯云的计算产品的一些操作文档自动变成视频，也就是分以下几步：
1. 给出文档链接
2. 调用自建的deepseek api判断是否适合变成操作视频。给出几个不同的视频梗概计划
3. 选定计划后生成详细的视频脚本
4. 通过脚本生成音频，可以使用edge ttc的免费能力
5. 通过脚本生成一系列的图片，这些图片就是文档中的文字概述或者操作界面
6. 通过Python的moviepy把图片变成视频，加上一些动态效果。并且载入音频

有几个要求：
1. 每个阶段的输出物（视频计划、视频脚本、音频、图片、最终视频）都要保存起来，以后程序可以从其中任何一步开始
2. 每个阶段输出都可以引入“人在环中”的环节，可以有人工确认、直接调整、和补充需求之后要求重新生成的选项
3. 每一步通过ai工具生成内容都希望做到更好的可扩展性，以便以后换模型或工具