Terjemahan Live¶
Caption dan terjemahan real-time dari mikrofon, audio sistem, atau keduanya — dengan jendela overlay always-on-top opsional sehingga caption berada di atas apa pun yang sedang kamu tonton.
Apa yang bisa kamu lakukan¶
- Caption rapat live — caption panggilan Zoom / Meet / Teams dalam bahasa lain tanpa bergabung sebagai bot penerjemah.
- Belajar bahasa real-time — caption konten berbahasa asing (film, podcast, kuliah) dengan bahasa nativ kamu sebagai jalur terjemahan.
- Subtitle level sistem — tangkap audio sistem agar bisa membuat subtitle YouTube / Netflix / apa saja yang diputar di speaker kamu.
Yang kamu butuhkan¶
- FFmpeg di
PATH— lihat Setup FFmpeg. -
Backend STT, salah satu dari:
- faster-whisper — lokal, offline, gratis, default
- Soniox — cloud, berbayar, diarisasi pembicara real-time. Lihat Setup Soniox.
-
Untuk penangkapan audio sistem, backend yang tepat per OS dipilih otomatis: Linux menggunakan
parec(PulseAudio / PipeWire), Windows menggunakan WASAPI loopback native (tanpa software tambahan di sebagian besar kasus), macOS menggunakanffmpeg -f avfoundationterhadap perangkat loopback virtual (BlackHole / Loopback / dll.). Banner peringatan inline dengan link pemasangan yang dapat diklik muncul jika ada yang kurang. Lihat Setup → Audio sistem untuk instruksi pemasangan lengkap per OS.
Langkah demi langkah¶
- Klik Terjemahan Live di sidebar.
-
Konfigurasikan sekali di Pengaturan → Live:
- Bahasa sumber (bahasa yang diucapkan)
- Bahasa target (atau biarkan kosong untuk hanya transkripsi)
- Sumber audio: Mikrofon / Audio sistem / Keduanya
- Metode STT: Whisper / Soniox
-
Kembali di halaman Live, klik Mulai (
Ctrl+Enter). - Transkripsi mengisi panel utama kartu demi kartu. Jendela Overlay mengambang juga menampilkan caption (seret ke mana pun kamu mau).
- Klik Berhenti untuk mengakhiri sesi.
Tampilan transkripsi¶
Pilih layout di toolbar:
- Keduanya bertumpuk — asli + terjemahan, satu di atas yang lain
- Keduanya berdampingan — asli di kiri, terjemahan di kanan
- Hanya asli / Hanya terjemahan
Tombol toolbar menggunakan suffix ON / OFF untuk status
sekilas — misalnya TTS ON, TTS OFF, Timestamps ON, Overlay OFF.
Aktifkan/nonaktifkan timestamps dengan ikon jam. Aktifkan/ nonaktifkan pemutaran TTS dari baris terjemahan dengan ikon speaker. Mengikuti pilihan kamu di Pengaturan → Suara → Metode TTS — Edge TTS (default), ElevenLabs, Google Cloud TTS, Gemini TTS, atau Piper TTS (sepenuhnya offline). Dengan Piper terpilih, suara per-bahasa yang hilang diam-diam jatuh kembali ke Edge TTS di tengah stream — tidak ada pre-flight modal di halaman ini, karena memblokir aliran live dengan dialog unduhan akan lebih buruk daripada fallback.
Jendela overlay¶
Jendela alat yang dapat diseret, diubah ukurannya, dan selalu di atas. Pintasan:
| Pintasan | Tindakan |
|---|---|
Ctrl+[ / Ctrl+] |
Kurangi / tingkatkan opasitas |
Ctrl+Panah |
Pindahkan overlay |
Ctrl+0 / Ctrl+9 |
Perbesar / kecilkan |
Posisi, ukuran, opasitas, dan ukuran font tetap antar sesi.
Sinkronisasi langsung dengan Pengaturan¶
Kontrol ukuran font dan opasitas bekerja dua arah: menggeser
penggeser Ukuran font atau Opasitas di Pengaturan →
Terjemahan Langsung → Konfigurasi Overlay memperbarui overlay
yang terbuka secara real-time, dan sebaliknya, menekan + / -
/ Ctrl+[ / Ctrl+] di dalam overlay memperbarui penggeser di
Pengaturan. Tidak perlu memulai ulang overlay.
Placeholder status kosong¶
Sebelum audio ditangkap, overlay menampilkan placeholder ("Tekan Mulai..." idle / "Mendengarkan..." setelah Mulai diklik) yang mencerminkan status kosong jendela utama — pertukarannya tetap sinkron dengan pil status yang berjalan. Placeholder akan diskalakan dengan lebar × tinggi overlay saat ini sehingga tetap dapat dibaca pada ukuran jendela apa pun.
Mode keterangan minimal¶
Kotak centang Tampilkan keterangan minimal di Pengaturan → Terjemahan Langsung → Konfigurasi Overlay menyembunyikan label waktu dan pembicara di overlay sambil tetap menampilkannya di jendela utama. Berguna saat overlay dibagikan dengan audiens (mode presenter / berbagi layar) tetapi Anda tetap ingin metadata lengkap di tampilan kerja Anda. Sakelar ini hanya untuk overlay — tidak mengubah preferensi "Label pembicara" Anda untuk jendela utama.
Simpan transkripsi¶
Klik Simpan Transkripsi untuk mengekspor sesi ke file .txt
dengan timestamps, pembicara, baris asli, dan baris terjemahan.
Memilih backend STT¶
| Backend | Terbaik untuk | Biaya | Latensi |
|---|---|---|---|
| Whisper (lokal) | Offline, sensitif privasi | Gratis | Sedang (~1 d setelah akhir kalimat) |
| Soniox | Rapat multi-pembicara | Berbayar (~$0.005 / mnt) | Rendah (real-time) |
Peringatan¶
Pemilihan mikrofon
Input mikrofon selalu menggunakan perangkat default OS — tidak ada pemilih dalam aplikasi (sounddevice menampilkan terlalu banyak plugin ALSA virtual untuk berguna, dan OS sudah memiliki UI mikrofon default). Atur mikrofon pilihanmu di pengaturan suara OS sebelum mulai.
Backpressure TTS
Antrian TTS dibatasi pada 3 kalimat terbaru — audio antrian yang lebih lama dibuang jika sintesis tertinggal. Ini menjaga pemutaran ucapan dekat dengan caption di layar.
ElevenLabs tanpa kunci
Jika kamu mengatur metode TTS ke ElevenLabs tetapi tidak ada kunci API yang dikonfigurasi, halaman Live otomatis jatuh kembali ke Edge TTS dan mengumumkan fallback di label status.
Pintasan¶
| Pintasan | Tindakan |
|---|---|
Ctrl+Enter |
Mulai / Berhenti |
Ctrl+K |
Bersihkan log (dengan konfirmasi) |
Ctrl+[ / Ctrl+] |
Atur opasitas overlay |