Files
ISISeg/工程分析/实现方案-2026-05-18-23-35-23.md

36 lines
1.3 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
# 实现方案
开始时间2026-05-18-23-35-23
## 忽略策略
-`.gitignore` 中加入 `待配音视频/`,确保原始视频、配音音频、中间文件和最终成片都不会进入 Gitea。
-`.dockerignore` 中加入 `待配音视频`,避免后续 Docker 构建上下文夹带大视频素材。
## 配音稿
-`配音生成工作流-Agent.md` 要求创建 4 段式配音稿:
- 系统定位与价值。
- 上传样例和双视频预览。
- 运行分割、帧级结果和多方法对比。
- Docker/公网访问与总结。
- 文案控制在约 1 分钟可朗读长度。
## TTS 生成
- 优先检查讯飞环境变量与 PowerShell 可用性。
- 当前环境不满足讯飞脚本运行条件时,使用 Linux 可运行的中文 TTS 生成 mp3。
- 生成后使用 `ffprobe` 检查配音时长。
## 视频处理
- 将原始 85.6 秒视频按配音目标时长进行轻度变速,使最终成片约 60 秒。
- 使用 H.264/AAC、yuv420p 和 faststart 输出,保证浏览器和常见播放器兼容。
- 原始录屏音频静音,仅保留新配音,避免两路声音叠加。
## 输出路径
- 配音稿:`待配音视频/配音稿-ISISeg系统使用视频.md`
- 配音音频:`待配音视频/02_audio/...`
- 最终成片:`待配音视频/05_outputs/ISISeg-系统使用视频-配音版.mp4`