即時翻譯¶
來自麥克風、系統音訊或兩者的即時字幕和翻譯 — 選用的始終置顶覆蓋視窗 讓字幕浮在你正在觀看的任何內容之上。
你能用它做什麼¶
- 即時會議字幕 — 為 Zoom / Meet / Teams 通話添加另一種語言的字幕, 無需作為翻譯機器人加入。
- 即時語言學習 — 為外語內容(電影、播客、講座)添加你母語的翻譯 字幕軌道。
- 系統級字幕 — 捕獲系統音訊,為 YouTube / Netflix / 任何在你喇叭 上播放的內容添加字幕。
你需要什麼¶
PATH中的 FFmpeg — 見 FFmpeg 設定。-
一個 STT 后端,以下之一:
- faster-whisper — 本地,離線,免費,預設
- Soniox — 雲端,付費,即時說話人分離。見 Soniox 設定。
-
對於系統音訊捕獲,每個 OS 的正確后端會自動選擇:Linux 使用
parec(PulseAudio / PipeWire),Windows 使用原生 WASAPI 環回(大多 數情況下無需額外軟體),macOS 使用ffmpeg -f avfoundation配合虛擬 環回設備(BlackHole / Loopback / 等)。如果缺少什麼,會顯示帶有可點擊 安裝鏈接的內聯警告橫幅。完整的每 OS 安裝說明見 設定 → 系統音訊。
操作步驟¶
- 在側欄點擊即時翻譯。
-
在設定 → Live 中設定一次:
- 源語言(說話的語言)
- 目标語言(或留空僅用於轉錄)
- 音訊源:麥克風 / 系統音訊 / 兩者
- STT 方法:Whisper / Soniox
-
回到 Live 頁面,點擊開始(
Ctrl+Enter)。 - 轉錄會逐張卡片填充主面板。浮動覆蓋視窗也顯示字幕(拖曳到你想 要的位置)。
- 點擊停止結束會話。
轉錄視圖¶
在工具列中選擇布局:
- 兩者堆疊 — 原文 + 翻譯,一上一下
- 兩者並排 — 原文在左,翻譯在右
- 僅原文 / 僅翻譯
工具列按鈕使用 ON / OFF 后綴來一目了然地顯示狀態 —
例如 TTS ON、TTS OFF、Timestamps ON、Overlay OFF。
用時鐘圖标切換時間戳開關。用喇叭圖标切換翻譯行的 TTS 播放。 遵循你在設定 → 語音 → TTS 方法中的選擇 — Edge TTS(預設)、 ElevenLabs、Google Cloud TTS、Gemini TTS 或 Piper TTS(完全離線)。 選擇 Piper 時,缺失的每語言語音會在流過程中靜默回到 Edge TTS — 此頁面沒有模態預檢查,因為用下載對話方塊阻塞即時流會比回退更糟糕。
覆蓋視窗¶
可拖曳、可調整大小、始終置顶的工具視窗。快速鍵:
| 快速鍵 | 操作 |
|---|---|
Ctrl+[ / Ctrl+] |
降低 / 提高不透明度 |
Ctrl+方向鍵 |
移動覆蓋視窗 |
Ctrl+0 / Ctrl+9 |
放大 / 縮小 |
位置、大小、不透明度和字型大小在會話之間保持。
與設定即時同步¶
字型大小和透明度控制項以雙向方式運作:在設定 → 即時翻譯 →
覆蓋層設定中拖曳字型大小或透明度滑桿會即時更新已
開啟的覆蓋層,反之亦然,在覆蓋層內按 + / - / Ctrl+[
/ Ctrl+] 會更新設定中的滑桿。無需重新開啟覆蓋層。
空狀態預留位置¶
在擷取任何音訊之前,覆蓋層會顯示預留位置(「按開始...」閒 置 / 「正在聆聽...」按下開始後),反映主視窗的空狀態 —— 切換會與執行中的狀態指示同步。預留位置會依覆蓋層目前的寬 度 × 高度進行縮放,以便在任何視窗大小下保持可讀。
精簡字幕模式¶
設定 → 即時翻譯 → 覆蓋層設定中的顯示精簡字幕核取方塊會 隱藏覆蓋層上的時間戳記和說話者標籤,但在主視窗中保持可 見。在向觀眾共用覆蓋層時(主持人模式 / 螢幕共用)有用,但 您希望在自己的工作檢視中保留完整的中繼資料。此切換僅適 用於覆蓋層 —— 不會變更主視窗的「說話者標籤」偏好。
儲存轉錄¶
點擊儲存轉錄將會話匯出為帶有時間戳、說話人、原始行和翻譯行的
.txt 檔案。
選擇 STT 后端¶
| 后端 | 最适合 | 成本 | 延遲 |
|---|---|---|---|
| Whisper(本地) | 離線,注重隱私 | 免費 | 中等(句末后約 1 秒) |
| Soniox | 多說話人會議 | 付費(約 $0.005 / 分鐘) | 低(即時) |
注意事项¶
麥克風選擇
麥克風輸入始終使用 OS 預設設備 — 應用內沒有選擇器(sounddevice 暴露的虛擬 ALSA 外掛太多無法實用,OS 已經擁有預設麥克風 UI)。開始 前在你的 OS 聲音設定中設定首選麥克風。
TTS 背壓
TTS 佇列限制為最近 3 個句子 — 如果合成跟不上,較舊的排隊音訊會被 丟棄。這能讓語音播放接近螢幕上的字幕。
無密鑰的 ElevenLabs
如果你將 TTS 方法設為 ElevenLabs 但沒有設定 API 密鑰,Live 頁面會 自動回到 Edge TTS,並在狀態標籤中宣布回退。
快速鍵¶
| 快速鍵 | 操作 |
|---|---|
Ctrl+Enter |
開始 / 停止 |
Ctrl+K |
清除記錄檔(帶確認) |
Ctrl+[ / Ctrl+] |
調整覆蓋視窗不透明度 |