2026-05-18-23-35-23 生成系统使用配音视频

2026-05-18 23:58:10 +08:00
parent e5d31e4e6b
commit 8bf1ba0347
6 changed files with 135 additions and 0 deletions
--- a/工程分析/实现方案-2026-05-18-23-35-23.md
+++ b/工程分析/实现方案-2026-05-18-23-35-23.md
@@ -0,0 +1,35 @@
+# 实现方案
+
+开始时间：2026-05-18-23-35-23
+
+## 忽略策略
+
+- 在 `.gitignore` 中加入 `待配音视频/`，确保原始视频、配音音频、中间文件和最终成片都不会进入 Gitea。
+- 在 `.dockerignore` 中加入 `待配音视频`，避免后续 Docker 构建上下文夹带大视频素材。
+
+## 配音稿
+
+- 按 `配音生成工作流-Agent.md` 要求创建 4 段式配音稿：
+  - 系统定位与价值。
+  - 上传样例和双视频预览。
+  - 运行分割、帧级结果和多方法对比。
+  - Docker/公网访问与总结。
+- 文案控制在约 1 分钟可朗读长度。
+
+## TTS 生成
+
+- 优先检查讯飞环境变量与 PowerShell 可用性。
+- 当前环境不满足讯飞脚本运行条件时，使用 Linux 可运行的中文 TTS 生成 mp3。
+- 生成后使用 `ffprobe` 检查配音时长。
+
+## 视频处理
+
+- 将原始 85.6 秒视频按配音目标时长进行轻度变速，使最终成片约 60 秒。
+- 使用 H.264/AAC、yuv420p 和 faststart 输出，保证浏览器和常见播放器兼容。
+- 原始录屏音频静音，仅保留新配音，避免两路声音叠加。
+
+## 输出路径
+
+- 配音稿：`待配音视频/配音稿-ISISeg系统使用视频.md`
+- 配音音频：`待配音视频/02_audio/...`
+- 最终成片：`待配音视频/05_outputs/ISISeg-系统使用视频-配音版.mp4`