2026-05-18-23-35-23 生成系统使用配音视频

This commit is contained in:
2026-05-18 23:58:10 +08:00
parent e5d31e4e6b
commit 8bf1ba0347
6 changed files with 135 additions and 0 deletions

View File

@@ -207,3 +207,35 @@ B. 产生问题原因:自动化测试和 Docker 构建前已运行 Python 代
C. 解决问题方案:重新打包时排除 `__pycache__``.pyc`、临时目录和发布目录,并新增 `.gitignore` 避免后续误提交。
D. 后续如何避免问题:发布包生成后必须执行包内文件检查,至少确认无缓存、无临时目录、无本地数据和无敏感配置外泄。
## 2026-05-18-23-35-23 使用视频配音与成片
### 1. 待配音素材不能进入 Gitea
A. 具体问题:`待配音视频` 下包含原始录屏、配音音频、中间文件和最终成片,文件体积较大且属于交付素材,不应上传到源码仓库。
B. 产生问题原因:该目录不在原 `.gitignore` 中,后续如果手动 `git add .` 容易误提交视频素材。
C. 解决问题方案:在 `.gitignore` 中加入 `待配音视频/`,并用 `git check-ignore` 校验原始视频、旁白音频和最终成片均被忽略。
D. 后续如何避免问题:所有录屏、配音、导出视频和临时剪辑目录都应先加入忽略规则,再生成大文件,提交前必须查看 `git status --short`
### 2. 讯飞配音脚本运行条件不满足
A. 具体问题:配音工作流文档默认使用讯飞 PowerShell 脚本,但当前环境未设置讯飞三项环境变量,也没有 PowerShell 运行时。
B. 产生问题原因:该工作流来自 Windows/讯飞环境,当前执行环境是 Linux缺少对应账号环境与脚本运行时。
C. 解决问题方案保留工作流中的四段式配音稿、TTS、时长检查和视频合成步骤TTS 引擎替换为当前环境可运行的中文神经配音工具,并记录实际声音和时长。
D. 后续如何避免问题:配音工作流应预先区分“讯飞凭证可用”和“本地/在线替代 TTS”两条路径任务开始时先检查环境变量和运行时避免到合成阶段才发现不可用。
### 3. 原视频时长与旁白时长不一致
A. 具体问题:原始录屏约 85.6 秒,目标视频约 1 分钟,直接换音轨会出现画面比旁白长的问题。
B. 产生问题原因:录屏展示节奏偏慢,而旁白文案按介绍视频压缩到了约 64 秒。
C. 解决问题方案:用 `ffprobe` 计算原视频和旁白时长,按 `85.636 / 64.272 = 1.332400` 对视频做轻度变速,原始音频静音并替换为新旁白,输出 H.264/AAC 兼容格式。
D. 后续如何避免问题:合成介绍视频时先确定旁白时长,再用可接受的变速范围调整画面;如果变速超过自然范围,应优先重新剪辑画面而不是强行加速。