# 使用场景

常见工作流及 VideoDB 所实现的功能。代码详情请参阅 [api-reference.md](api-reference.md)、[capture.md](capture.md)、[editor.md](editor.md) 和 [search.md](search.md)。

***

## 视频搜索与精彩片段

### 创建精彩集锦

上传长视频（会议演讲、讲座、会议录音），按主题（"产品发布"、"问答环节"、"演示"）搜索关键片段，并自动将匹配的片段汇编成可分享的精彩集锦。

### 构建可搜索视频库

批量上传视频到集合中，为语音内容建立索引以便搜索，然后在整个库中进行查询。即时在数百小时的内容中找到特定主题。

### 提取特定片段

搜索与查询匹配的片段（"预算讨论"、"行动项"），并将每个匹配的片段提取为独立的剪辑，拥有自己的流媒体 URL。

***

## 视频增强

### 增添专业质感

获取原始素材并进行增强：

* 根据语音自动生成字幕
* 在特定时间戳添加自定义缩略图
* 背景音乐叠加
* 带有生成图像的开场/结尾序列

### AI 增强内容

将现有视频与生成式 AI 结合：

* 根据转录内容生成文本摘要
* 创建与视频时长匹配的背景音乐
* 生成标题卡和叠加图像
* 将所有元素混合成精美的最终输出

***

## 实时录制（桌面/会议）

### 带 AI 的屏幕 + 音频录制

同时捕获屏幕、麦克风和系统音频。实时获取：

* **实时转录** - 语音即时转文本
* **音频摘要** - 定期生成的 AI 讨论摘要
* **视觉索引** - AI 对屏幕活动的描述

### 带摘要功能的会议录制

录制会议并实时转录所有参与者的发言。获取包含关键讨论点、决策和行动项的定期摘要，实时交付。

### 屏幕活动追踪

通过 AI 生成的描述追踪屏幕活动：

* "用户正在 Google Sheets 中浏览电子表格"
* "用户切换到了包含 Python 文件的代码编辑器"
* "正在进行屏幕共享的视频通话"

### 会话后处理

录制结束后，录音将导出为永久视频。然后：

* 生成可搜索的转录稿
* 在录制内容中搜索特定主题
* 提取重要时刻的片段
* 通过流媒体 URL 或播放器链接分享

***

## 直播流智能处理（RTSP/RTMP）

### 连接外部流

从 RTSP/RTMP 源（安全摄像头、编码器、广播）摄取实时视频。实时处理和索引内容。

### 实时事件检测

定义要在直播流中检测的事件：

* "人员进入限制区域"
* "十字路口交通违规"
* "货架上可见产品"

当事件发生时，通过 WebSocket 或 webhook 获取警报。

### 直播流搜索

在已录制的直播流内容中搜索。从数小时的连续素材中找到特定时刻并生成剪辑。

***

## 内容审核与安全

### 自动化内容审查

使用 AI 索引视频场景并搜索有问题内容。标记包含暴力、不当内容或违反政策的视频。

### 脏话检测

检测并定位音频中的脏话。可选择在检测到的时间戳叠加哔声。

***

## 平台集成

### 社交媒体格式调整

为不同平台调整视频格式：

* 垂直（9:16）用于 TikTok、Reels、Shorts
* 方形（1:1）用于 Instagram 动态
* 横屏（16:9）用于 YouTube

### 为分发转码

针对不同的分发目标更改分辨率、比特率或质量。为网页、移动端或广播输出优化的流。

### 生成可分享链接

每次操作都会生成可播放的流媒体 URL。可嵌入网页播放器、直接分享或与现有平台集成。

***

## 工作流摘要

| 目标 | VideoDB 方法 |
|------|------------------|
| 在视频中查找片段 | 索引语音/场景 → 搜索 → 汇编剪辑 |
| 创建精彩集锦 | 搜索多个主题 → 构建时间线 → 生成流 |
| 添加字幕 | 索引语音 → 添加字幕叠加层 |
| 录制屏幕 + AI | 开始录制 → 运行 AI 流水线 → 导出视频 |
| 监控直播流 | 连接 RTSP → 索引场景 → 创建警报 |
| 为社交媒体调整格式 | 调整为目标宽高比 |
| 合并剪辑 | 使用多个素材构建时间线 → 生成流 |
