36 lines
1.3 KiB
Markdown
36 lines
1.3 KiB
Markdown
# 实现方案
|
||
|
||
开始时间:2026-05-18-23-35-23
|
||
|
||
## 忽略策略
|
||
|
||
- 在 `.gitignore` 中加入 `待配音视频/`,确保原始视频、配音音频、中间文件和最终成片都不会进入 Gitea。
|
||
- 在 `.dockerignore` 中加入 `待配音视频`,避免后续 Docker 构建上下文夹带大视频素材。
|
||
|
||
## 配音稿
|
||
|
||
- 按 `配音生成工作流-Agent.md` 要求创建 4 段式配音稿:
|
||
- 系统定位与价值。
|
||
- 上传样例和双视频预览。
|
||
- 运行分割、帧级结果和多方法对比。
|
||
- Docker/公网访问与总结。
|
||
- 文案控制在约 1 分钟可朗读长度。
|
||
|
||
## TTS 生成
|
||
|
||
- 优先检查讯飞环境变量与 PowerShell 可用性。
|
||
- 当前环境不满足讯飞脚本运行条件时,使用 Linux 可运行的中文 TTS 生成 mp3。
|
||
- 生成后使用 `ffprobe` 检查配音时长。
|
||
|
||
## 视频处理
|
||
|
||
- 将原始 85.6 秒视频按配音目标时长进行轻度变速,使最终成片约 60 秒。
|
||
- 使用 H.264/AAC、yuv420p 和 faststart 输出,保证浏览器和常见播放器兼容。
|
||
- 原始录屏音频静音,仅保留新配音,避免两路声音叠加。
|
||
|
||
## 输出路径
|
||
|
||
- 配音稿:`待配音视频/配音稿-ISISeg系统使用视频.md`
|
||
- 配音音频:`待配音视频/02_audio/...`
|
||
- 最终成片:`待配音视频/05_outputs/ISISeg-系统使用视频-配音版.mp4`
|