콘텐츠로 이동

비디오 더빙

음성 트랙이 교체된 다른 언어의 비디오 파일을 생성하는 완전한 STT → 번역 → TTS → 믹스 파이프라인입니다. 원본 오디오는 폐기됩니다; 새로운 더빙 트랙은 자막에 시간 맞춤됩니다.

필요한 것

  • PATHFFmpegFFmpeg 설정 참조.
  • STT 백엔드 (기본 로컬 Whisper, 설정 불필요)
  • TTS 백엔드 — Edge TTS (기본), ElevenLabs, Google Cloud TTS, Gemini TTS 또는 Piper TTS (완전 오프라인; 언어별 음성은 설정 → 음성 → Piper TTS → 지금 음성 다운로드를 통해 한 번 다운로드)
  • 번역 단계를 위해 구성된 LLM

단계

  1. 사이드바에서 더빙 클릭.
  2. 하나 이상의 비디오 파일 드롭 (.mp4, .webm, .mkv, .avi, .mov, .wmv).
  3. 소스 언어 (비디오에서 말하는 언어)와 더빙할 대상 언어 선택.
  4. 더빙 시작 클릭 (Ctrl+Enter).
  5. 히스토리 테이블에서 작업별 진행률을 관찰하세요. 네 단계로 진행됩니다:
단계 범위 무엇이 진행 중
STT 5–25% 소스 오디오 전사 중
번역 25–50% LLM이 각 자막 줄 번역 중
TTS 50–90% 각 줄에 대해 대상 언어 음성 합성 중
믹스 90–100% FFmpeg가 오디오 트랙 교체 중
  1. 완료되면 행에서 열기를 클릭하여 더빙된 비디오 재생.

출력

각 입력 비디오에 대해 출력 디렉터리에서 네 개의 파일을 얻습니다:

movie.mp4
movie_dubbed_en_fr.mp4              ← 더빙된 비디오
movie_subtitle_en.srt               ← 원본 언어 자막
movie_subtitle_fr.srt               ← 번역된 자막
movie_voice_fr.mp3                  ← 합성된 음성 트랙

일시 중지 / 크래시된 실행 재개

파이프라인은 각 단계 후 체크포인트합니다. 중지를 누르거나, 앱을 종료하거나, 크래시되면 행에서 계속을 누르면 마지막 완료된 단계 부터 재개합니다 — STT 또는 번역이 이미 완료되었다면 다시 비용을 지불하지 않습니다.

이 옵션에 대해 Done / Failed 항목을 마우스 오른쪽 버튼으로 클릭하세요:

  • 계속 — 다시 묻지 않고 마지막 체크포인트에서 재개.
  • 재더빙 — 언어 선택기 다시 열기; 새 대상을 선택하면 번역 및 TTS 체크포인트가 폐기됩니다 (STT는 다시 비용을 지불하지 않음). 동일한 대상을 선택하면 계속과 마찬가지로 마지막 체크포인트에서 다시 실행.
  • 열기 — 더빙된 비디오 재생.

주의사항

립싱크

더빙은 소스 오디오의 타임스탬프와 일치합니다, 입 모양과는 아닙니다. 원본보다 훨씬 긴 번역된 줄은 서두르는 것처럼 들립니다; 훨씬 짧은 줄은 침묵을 남깁니다. 전문 더빙의 경우 이 패스 후에 수동으로 다시 타이밍을 맞추는 것이 일반적 — 미래 기능입니다.

사전 비행 검사

페이지는 시작하기 전에 FFmpeg + TTS 백엔드의 키를 검증합니다. 키 누락 → 친근한 대화 상자, 절반 실행된 더빙이 아닙니다. Piper TTS 선택 시, 언어별 Piper 음성이 디스크에 있는지도 확인합니다; 음성 누락 → 음성 라이브러리로 안내하는 설정 열기 버튼이 있는 모달 대화 상자, 따라서 STT + 번역 시간을 태우고 TTS 단계에서 실패하지 않습니다.

대상 언어 변경

재타겟 시 파이프라인은 번역 + TTS 체크포인트를 폐기 (해당 콘텐츠 가 새 언어에 더 이상 유효하지 않음)하지만 STT 체크포인트는 유지합니다 — 전사 비용을 절약합니다.

단축키

단축키 동작
Ctrl+Enter 더빙 시작
Ctrl+O 찾아보기
Ctrl+F 히스토리 검색에 포커스
Ctrl+P 활성 큐 일시 중지
Ctrl+G 활성 큐 계속 (재개)

텍스트 입력이 포커스를 가질 때 Ctrl+P / Ctrl+G는 억제되므로, 타이핑과 충돌하지 않습니다.