跳轉到

即時翻譯

來自麥克風、系統音訊或兩者的即時字幕和翻譯 — 選用的始終置顶覆蓋視窗 讓字幕浮在你正在觀看的任何內容之上。

你能用它做什麼

  • 即時會議字幕 — 為 Zoom / Meet / Teams 通話添加另一種語言的字幕, 無需作為翻譯機器人加入。
  • 即時語言學習 — 為外語內容(電影、播客、講座)添加你母語的翻譯 字幕軌道。
  • 系統級字幕 — 捕獲系統音訊,為 YouTube / Netflix / 任何在你喇叭 上播放的內容添加字幕。

你需要什麼

  • PATH 中的 FFmpeg — 見 FFmpeg 設定
  • 一個 STT 后端,以下之一:

    • faster-whisper — 本地,離線,免費,預設
    • Soniox — 雲端,付費,即時說話人分離。見 Soniox 設定
  • 對於系統音訊捕獲,每個 OS 的正確后端會自動選擇:Linux 使用 parec(PulseAudio / PipeWire),Windows 使用原生 WASAPI 環回(大多 數情況下無需額外軟體),macOS 使用 ffmpeg -f avfoundation 配合虛擬 環回設備(BlackHole / Loopback / 等)。如果缺少什麼,會顯示帶有可點擊 安裝鏈接的內聯警告橫幅。完整的每 OS 安裝說明見 設定 → 系統音訊

操作步驟

  1. 在側欄點擊即時翻譯
  2. 設定 → Live 中設定一次:

    • 源語言(說話的語言)
    • 目标語言(或留空僅用於轉錄)
    • 音訊源:麥克風 / 系統音訊 / 兩者
    • STT 方法:Whisper / Soniox
  3. 回到 Live 頁面,點擊開始Ctrl+Enter)。

  4. 轉錄會逐張卡片填充主面板。浮動覆蓋視窗也顯示字幕(拖曳到你想 要的位置)。
  5. 點擊停止結束會話。

轉錄視圖

在工具列中選擇布局:

  • 兩者堆疊 — 原文 + 翻譯,一上一下
  • 兩者並排 — 原文在左,翻譯在右
  • 僅原文 / 僅翻譯

工具列按鈕使用 ON / OFF 后綴來一目了然地顯示狀態 — 例如 TTS ONTTS OFFTimestamps ONOverlay OFF

用時鐘圖标切換時間戳開關。用喇叭圖标切換翻譯行的 TTS 播放。 遵循你在設定 → 語音 → TTS 方法中的選擇 — Edge TTS(預設)、 ElevenLabs、Google Cloud TTS、Gemini TTS 或 Piper TTS(完全離線)。 選擇 Piper 時,缺失的每語言語音會在流過程中靜默回到 Edge TTS — 此頁面沒有模態預檢查,因為用下載對話方塊阻塞即時流會比回退更糟糕。

覆蓋視窗

可拖曳、可調整大小、始終置顶的工具視窗。快速鍵:

快速鍵 操作
Ctrl+[ / Ctrl+] 降低 / 提高不透明度
Ctrl+方向鍵 移動覆蓋視窗
Ctrl+0 / Ctrl+9 放大 / 縮小

位置、大小、不透明度和字型大小在會話之間保持。

與設定即時同步

字型大小和透明度控制項以雙向方式運作:在設定 → 即時翻譯 → 覆蓋層設定中拖曳字型大小透明度滑桿會即時更新已 開啟的覆蓋層,反之亦然,在覆蓋層內按 + / - / Ctrl+[ / Ctrl+] 會更新設定中的滑桿。無需重新開啟覆蓋層。

空狀態預留位置

在擷取任何音訊之前,覆蓋層會顯示預留位置(「按開始...」閒 置 / 「正在聆聽...」按下開始後),反映主視窗的空狀態 —— 切換會與執行中的狀態指示同步。預留位置會依覆蓋層目前的寬 度 × 高度進行縮放,以便在任何視窗大小下保持可讀。

精簡字幕模式

設定 → 即時翻譯 → 覆蓋層設定中的顯示精簡字幕核取方塊會 隱藏覆蓋層上的時間戳記和說話者標籤,但在主視窗中保持可 見。在向觀眾共用覆蓋層時(主持人模式 / 螢幕共用)有用,但 您希望在自己的工作檢視中保留完整的中繼資料。此切換僅適 用於覆蓋層 —— 不會變更主視窗的「說話者標籤」偏好。

儲存轉錄

點擊儲存轉錄將會話匯出為帶有時間戳、說話人、原始行和翻譯行的 .txt 檔案。

選擇 STT 后端

后端 最适合 成本 延遲
Whisper(本地) 離線,注重隱私 免費 中等(句末后約 1 秒)
Soniox 多說話人會議 付費(約 $0.005 / 分鐘) 低(即時)

注意事项

麥克風選擇

麥克風輸入始終使用 OS 預設設備 — 應用內沒有選擇器(sounddevice 暴露的虛擬 ALSA 外掛太多無法實用,OS 已經擁有預設麥克風 UI)。開始 前在你的 OS 聲音設定中設定首選麥克風。

TTS 背壓

TTS 佇列限制為最近 3 個句子 — 如果合成跟不上,較舊的排隊音訊會被 丟棄。這能讓語音播放接近螢幕上的字幕。

無密鑰的 ElevenLabs

如果你將 TTS 方法設為 ElevenLabs 但沒有設定 API 密鑰,Live 頁面會 自動回到 Edge TTS,並在狀態標籤中宣布回退。

快速鍵

快速鍵 操作
Ctrl+Enter 開始 / 停止
Ctrl+K 清除記錄檔(帶確認)
Ctrl+[ / Ctrl+] 調整覆蓋視窗不透明度