ライブ翻訳¶
マイク、システム音声、またはその両方からのリアルタイム字幕と翻訳 — オプションの常時最前面オーバーレイウィンドウで、視聴中のあらゆる コンテンツの上に字幕を表示。
何ができるか¶
- ライブ会議の字幕 — 翻訳ボットとして参加することなく、Zoom / Meet / Teams 通話に別言語の字幕を追加。
- リアルタイム言語学習 — 外国語コンテンツ(映画、ポッドキャスト、 講義)に母国語の翻訳トラックを字幕として追加。
- システム全体の字幕 — システム音声をキャプチャして YouTube / Netflix / スピーカーで再生されるあらゆるものに字幕を追加。
必要なもの¶
PATHに FFmpeg — FFmpeg セットアップを参照。-
STT バックエンド、以下のいずれか:
- faster-whisper — ローカル、オフライン、無料、デフォルト
- Soniox — クラウド、有料、リアルタイム話者分離。Soniox セットアップを参照。
-
システム音声キャプチャでは、OS ごとの適切なバックエンドが自動 選択されます:Linux は
parec(PulseAudio / PipeWire)、Windows は ネイティブ WASAPI ループバック(ほとんどの場合追加ソフトウェアなし)、 macOS は仮想ループバックデバイス(BlackHole / Loopback / etc.)に 対するffmpeg -f avfoundation。何かが不足していると、クリック可能 なインストールリンク付きのインライン警告バナーが表示されます。完全な OS 別インストール手順は セットアップ → システム音声 を参照。
ステップバイステップ¶
- サイドバーのライブ翻訳をクリック。
-
設定 → Live で一度設定:
- ソース言語(話されている言語)
- ターゲット言語(文字起こしのみの場合は空欄)
- 音声ソース:マイク / システム音声 / 両方
- STT メソッド:Whisper / Soniox
-
Live ページに戻り、開始(
Ctrl+Enter)をクリック。 - 文字起こしがメインペインをカードごとに埋めます。フローティング オーバーレイウィンドウも字幕を表示します(好きな場所にドラッグ)。
- 停止をクリックしてセッションを終了。
文字起こしビュー¶
ツールバーでレイアウトを選択:
- 両方積み重ね — 原文 + 翻訳、上下に
- 両方並列 — 原文を左、翻訳を右に
- 原文のみ / 翻訳のみ
ツールバーボタンは一目で分かる状態のために ON / OFF
サフィックスを使用 — 例:TTS ON、TTS OFF、Timestamps ON、
Overlay OFF。
時計アイコンでタイムスタンプをオン/オフ。スピーカーアイコンで翻訳 行の TTS 再生をオン/オフ。設定 → 音声 → TTS メソッドの選択を 尊重します — Edge TTS(デフォルト)、ElevenLabs、Google Cloud TTS、 Gemini TTS、または Piper TTS(完全オフライン)。Piper を選択した 場合、不足している言語ごとの音声はストリーム途中で静かに Edge TTS にフォールバックします — このページにはモーダルプリフライトがあり ません。ダウンロードダイアログでライブフローをブロックするのは フォールバックよりも悪いからです。
オーバーレイウィンドウ¶
ドラッグ可能、リサイズ可能、常時最前面のツールウィンドウ。 ショートカット:
| ショートカット | アクション |
|---|---|
Ctrl+[ / Ctrl+] |
不透明度を下げる / 上げる |
Ctrl+矢印 |
オーバーレイを移動 |
Ctrl+0 / Ctrl+9 |
拡大 / 縮小 |
位置、サイズ、不透明度、フォントサイズはセッション間で保持されます。
設定とのライブ同期¶
フォントサイズと不透明度は双方向で動作します。設定 → ライブ
翻訳 → オーバーレイ設定でフォントサイズまたは不透明
度のスライダーをドラッグすると開いているオーバーレイがリア
ルタイムで更新され、逆に、オーバーレイ内で + / - /
Ctrl+[ / Ctrl+] を押すと設定のスライダーも更新されます。
オーバーレイを再起動する必要はありません。
空状態のプレースホルダー¶
オーディオがキャプチャされる前、オーバーレイは(「開始を押し てください...」アイドル / 「聞き取り中...」開始クリック後)プ レースホルダーを表示します。これはメインウィンドウの空状態を 反映し、実行中のステータスピルと同期して切り替わります。プレ ースホルダーはオーバーレイの現在の幅×高さに合わせて拡大縮小さ れ、どのウィンドウサイズでも読みやすい状態を保ちます。
簡易キャプションモード¶
設定 → ライブ翻訳 → オーバーレイ設定の簡易キャプションを 表示チェックボックスは、メインウィンドウには表示したままで オーバーレイのタイムスタンプと話者のチップを非表示にします。 オーバーレイを聴衆と共有する場合(プレゼンモード / 画面共有) に便利ですが、作業ビューには完全なメタデータを保持したい場合 に役立ちます。この切り替えはオーバーレイ専用です — メインウ ィンドウの「話者ラベル」設定は変更しません。
文字起こしを保存¶
文字起こしを保存をクリックして、タイムスタンプ、話者、原文行、
翻訳行を含む .txt ファイルにセッションをエクスポート。
STT バックエンドの選択¶
| バックエンド | 最適 | コスト | レイテンシ |
|---|---|---|---|
| Whisper(ローカル) | オフライン、プライバシー重視 | 無料 | 中(文末から約 1 秒) |
| Soniox | 複数話者の会議 | 有料(約 $0.005 / 分) | 低(リアルタイム) |
注意事項¶
マイクの選択
マイク入力は常に OS デフォルトデバイスを使用します — アプリ内 セレクタはありません(sounddevice は仮想 ALSA プラグインを大量に 公開し有用ではなく、OS が既にデフォルトマイク UI を所有)。開始 前に OS のサウンド設定で希望のマイクを設定してください。
TTS バックプレッシャー
TTS キューは最新の 3 文に制限されます — 合成が追いつかない場合、 キューにある古い音声は破棄されます。これによりスピーチ再生が画面上 の字幕に近く保たれます。
キーなしの ElevenLabs
TTS メソッドを ElevenLabs に設定したが API キーが構成されていない 場合、Live ページは自動的に Edge TTS にフォールバックし、ステータス ラベルでフォールバックを通知します。
ショートカット¶
| ショートカット | アクション |
|---|---|
Ctrl+Enter |
開始 / 停止 |
Ctrl+K |
ログをクリア(確認あり) |
Ctrl+[ / Ctrl+] |
オーバーレイの不透明度を調整 |