비디오 더빙¶
음성 트랙이 교체된 다른 언어의 비디오 파일을 생성하는 완전한 STT → 번역 → TTS → 믹스 파이프라인입니다. 원본 오디오는 폐기됩니다; 새로운 더빙 트랙은 자막에 시간 맞춤됩니다.
필요한 것¶
PATH의 FFmpeg — FFmpeg 설정 참조.- STT 백엔드 (기본 로컬 Whisper, 설정 불필요)
- TTS 백엔드 — Edge TTS (기본), ElevenLabs, Google Cloud TTS, Gemini TTS 또는 Piper TTS (완전 오프라인; 언어별 음성은 설정 → 음성 → Piper TTS → 지금 음성 다운로드를 통해 한 번 다운로드)
- 번역 단계를 위해 구성된 LLM
단계¶
- 사이드바에서 더빙 클릭.
- 하나 이상의 비디오 파일 드롭 (
.mp4,.webm,.mkv,.avi,.mov,.wmv). - 소스 언어 (비디오에서 말하는 언어)와 더빙할 대상 언어 선택.
- 더빙 시작 클릭 (
Ctrl+Enter). - 히스토리 테이블에서 작업별 진행률을 관찰하세요. 네 단계로 진행됩니다:
| 단계 | 범위 | 무엇이 진행 중 |
|---|---|---|
| STT | 5–25% | 소스 오디오 전사 중 |
| 번역 | 25–50% | LLM이 각 자막 줄 번역 중 |
| TTS | 50–90% | 각 줄에 대해 대상 언어 음성 합성 중 |
| 믹스 | 90–100% | FFmpeg가 오디오 트랙 교체 중 |
- 완료되면 행에서 열기를 클릭하여 더빙된 비디오 재생.
출력¶
각 입력 비디오에 대해 출력 디렉터리에서 네 개의 파일을 얻습니다:
movie.mp4
movie_dubbed_en_fr.mp4 ← 더빙된 비디오
movie_subtitle_en.srt ← 원본 언어 자막
movie_subtitle_fr.srt ← 번역된 자막
movie_voice_fr.mp3 ← 합성된 음성 트랙
일시 중지 / 크래시된 실행 재개¶
파이프라인은 각 단계 후 체크포인트합니다. 중지를 누르거나, 앱을 종료하거나, 크래시되면 행에서 계속을 누르면 마지막 완료된 단계 부터 재개합니다 — STT 또는 번역이 이미 완료되었다면 다시 비용을 지불하지 않습니다.
이 옵션에 대해 Done / Failed 항목을 마우스 오른쪽 버튼으로 클릭하세요:
- 계속 — 다시 묻지 않고 마지막 체크포인트에서 재개.
- 재더빙 — 언어 선택기 다시 열기; 새 대상을 선택하면 번역 및 TTS 체크포인트가 폐기됩니다 (STT는 다시 비용을 지불하지 않음). 동일한 대상을 선택하면 계속과 마찬가지로 마지막 체크포인트에서 다시 실행.
- 열기 — 더빙된 비디오 재생.
주의사항¶
립싱크
더빙은 소스 오디오의 타임스탬프와 일치합니다, 입 모양과는 아닙니다. 원본보다 훨씬 긴 번역된 줄은 서두르는 것처럼 들립니다; 훨씬 짧은 줄은 침묵을 남깁니다. 전문 더빙의 경우 이 패스 후에 수동으로 다시 타이밍을 맞추는 것이 일반적 — 미래 기능입니다.
사전 비행 검사
페이지는 시작하기 전에 FFmpeg + TTS 백엔드의 키를 검증합니다. 키 누락 → 친근한 대화 상자, 절반 실행된 더빙이 아닙니다. Piper TTS 선택 시, 언어별 Piper 음성이 디스크에 있는지도 확인합니다; 음성 누락 → 음성 라이브러리로 안내하는 설정 열기 버튼이 있는 모달 대화 상자, 따라서 STT + 번역 시간을 태우고 TTS 단계에서 실패하지 않습니다.
대상 언어 변경
재타겟 시 파이프라인은 번역 + TTS 체크포인트를 폐기 (해당 콘텐츠 가 새 언어에 더 이상 유효하지 않음)하지만 STT 체크포인트는 유지합니다 — 전사 비용을 절약합니다.
단축키¶
| 단축키 | 동작 |
|---|---|
Ctrl+Enter |
더빙 시작 |
Ctrl+O |
찾아보기 |
Ctrl+F |
히스토리 검색에 포커스 |
Ctrl+P |
활성 큐 일시 중지 |
Ctrl+G |
활성 큐 계속 (재개) |
텍스트 입력이 포커스를 가질 때 Ctrl+P / Ctrl+G는 억제되므로,
타이핑과 충돌하지 않습니다.