视频配音¶
完整的 STT → 翻译 → TTS → Mix 管道,生成另一种语言的视频文件, 并替换语音轨。原始音频被丢弃;新的配音轨同步到字幕。
您需要什么¶
PATH中的 FFmpeg——参见 FFmpeg 设置。- 一个 STT 后端(默认本地 Whisper,无需设置)
- 一个 TTS 后端——Edge TTS(默认)、ElevenLabs、Google Cloud TTS、 Gemini TTS 或 Piper TTS(完全离线;每语言语音通过 设置 → 语音 → Piper TTS → 立即下载语音一次性下载)
- 已配置的 LLM(用于翻译步骤)
步骤¶
- 点击侧边栏中的配音。
- 拖入一个或多个视频文件(
.mp4、.webm、.mkv、.avi、.mov、.wmv)。 - 选择源语言(视频中说的语言)和要配音到的目标语言。
- 点击开始配音(
Ctrl+Enter)。 - 在历史表格中观察每任务进度。它经过四个阶段:
| 阶段 | 范围 | 发生什么 |
|---|---|---|
| STT | 5–25% | 转录源音频 |
| 翻译 | 25–50% | LLM 翻译每条字幕 |
| TTS | 50–90% | 为每条合成目标语言语音 |
| Mix | 90–100% | FFmpeg 替换音频轨 |
- 完成后,点击行上的打开播放配音视频。
输出¶
每个输入视频在输出目录中得到四个文件:
movie.mp4
movie_dubbed_en_fr.mp4 ← 配音视频
movie_subtitle_en.srt ← 原始语言字幕
movie_subtitle_fr.srt ← 翻译字幕
movie_voice_fr.mp3 ← 合成语音轨
恢复暂停 / 崩溃的运行¶
管道在每个阶段后做检查点。如果您按停止、退出应用或崩溃,在行上 按继续从最后完成的阶段恢复——如果 STT 或翻译已完成,您不会再次 为它们付费。
右键单击 Done / Failed 条目以获得这些选项:
- 继续——从最后的检查点恢复,不再询问。
- 重新配音——重新打开语言选择器;如果您选择新目标,翻译和 TTS 检查点被丢弃(您不会再次为 STT 付费)。选择相同目标实际上从最后 检查点重新运行,就像继续一样。
- 打开——播放配音视频。
注意事项¶
嘴型同步
配音匹配源音频的时间戳,而不是嘴部动作。比原始更长的翻译行听起来 很匆忙;短得多的行会留下沉默。对于专业配音,通常在此过程后手动 重新计时——这是未来的功能。
预飞行检查
页面在开始前验证 FFmpeg + 您的 TTS 后端密钥。缺少密钥 → 友好对话框, 不是半运行的配音。选择 Piper TTS 时,它还检查每语言 Piper 语音 是否在磁盘上;缺少语音 → 带打开设置按钮的模态对话框,将您带到 语音库,以免您耗费 STT + 翻译时间却在 TTS 步骤失败。
更改目标语言
重新定位时管道丢弃翻译 + TTS 检查点(它们的内容对新语言不再有效) 但保留 STT 检查点——您节省转录成本。
快捷键¶
| 快捷键 | 操作 |
|---|---|
Ctrl+Enter |
开始配音 |
Ctrl+O |
浏览 |
Ctrl+F |
聚焦历史搜索 |
Ctrl+P |
暂停活动队列 |
Ctrl+G |
继续(恢复)活动队列 |
文本输入获得焦点时 Ctrl+P / Ctrl+G 被抑制,所以它们不会与打字冲突。