跳转至

视频配音

完整的 STT → 翻译 → TTS → Mix 管道,生成另一种语言的视频文件, 并替换语音轨。原始音频被丢弃;新的配音轨同步到字幕。

您需要什么

  • PATH 中的 FFmpeg——参见 FFmpeg 设置
  • 一个 STT 后端(默认本地 Whisper,无需设置)
  • 一个 TTS 后端——Edge TTS(默认)、ElevenLabs、Google Cloud TTS、 Gemini TTS 或 Piper TTS(完全离线;每语言语音通过 设置 → 语音 → Piper TTS → 立即下载语音一次性下载)
  • 已配置的 LLM(用于翻译步骤)

步骤

  1. 点击侧边栏中的配音
  2. 拖入一个或多个视频文件(.mp4.webm.mkv.avi.mov.wmv)。
  3. 选择源语言(视频中的语言)和要配音到的目标语言
  4. 点击开始配音(Ctrl+Enter)。
  5. 在历史表格中观察每任务进度。它经过四个阶段:
阶段 范围 发生什么
STT 5–25% 转录源音频
翻译 25–50% LLM 翻译每条字幕
TTS 50–90% 为每条合成目标语言语音
Mix 90–100% FFmpeg 替换音频轨
  1. 完成后,点击行上的打开播放配音视频。

输出

每个输入视频在输出目录中得到四个文件:

movie.mp4
movie_dubbed_en_fr.mp4              ← 配音视频
movie_subtitle_en.srt               ← 原始语言字幕
movie_subtitle_fr.srt               ← 翻译字幕
movie_voice_fr.mp3                  ← 合成语音轨

恢复暂停 / 崩溃的运行

管道在每个阶段后做检查点。如果您按停止、退出应用或崩溃,在行上 按继续从最后完成的阶段恢复——如果 STT 或翻译已完成,您不会再次 为它们付费。

右键单击 Done / Failed 条目以获得这些选项:

  • 继续——从最后的检查点恢复,不再询问。
  • 重新配音——重新打开语言选择器;如果您选择新目标,翻译和 TTS 检查点被丢弃(您不会再次为 STT 付费)。选择相同目标实际上从最后 检查点重新运行,就像继续一样。
  • 打开——播放配音视频。

注意事项

嘴型同步

配音匹配源音频的时间戳,而不是嘴部动作。比原始更长的翻译行听起来 很匆忙;短得多的行会留下沉默。对于专业配音,通常在此过程后手动 重新计时——这是未来的功能。

预飞行检查

页面在开始前验证 FFmpeg + 您的 TTS 后端密钥。缺少密钥 → 友好对话框, 不是半运行的配音。选择 Piper TTS 时,它还检查每语言 Piper 语音 是否在磁盘上;缺少语音 → 带打开设置按钮的模态对话框,将您带到 语音库,以免您耗费 STT + 翻译时间却在 TTS 步骤失败。

更改目标语言

重新定位时管道丢弃翻译 + TTS 检查点(它们的内容对新语言不再有效) 但保留 STT 检查点——您节省转录成本。

快捷键

快捷键 操作
Ctrl+Enter 开始配音
Ctrl+O 浏览
Ctrl+F 聚焦历史搜索
Ctrl+P 暂停活动队列
Ctrl+G 继续(恢复)活动队列

文本输入获得焦点时 Ctrl+P / Ctrl+G 被抑制,所以它们不会与打字冲突。