コンテンツにスキップ

ライブ翻訳

マイク、システム音声、またはその両方からのリアルタイム字幕と翻訳 — オプションの常時最前面オーバーレイウィンドウで、視聴中のあらゆる コンテンツの上に字幕を表示。

何ができるか

  • ライブ会議の字幕 — 翻訳ボットとして参加することなく、Zoom / Meet / Teams 通話に別言語の字幕を追加。
  • リアルタイム言語学習 — 外国語コンテンツ(映画、ポッドキャスト、 講義)に母国語の翻訳トラックを字幕として追加。
  • システム全体の字幕 — システム音声をキャプチャして YouTube / Netflix / スピーカーで再生されるあらゆるものに字幕を追加。

必要なもの

  • PATHFFmpegFFmpeg セットアップを参照。
  • STT バックエンド、以下のいずれか:

    • faster-whisper — ローカル、オフライン、無料、デフォルト
    • Soniox — クラウド、有料、リアルタイム話者分離。Soniox セットアップを参照。
  • システム音声キャプチャでは、OS ごとの適切なバックエンドが自動 選択されます:Linux は parec(PulseAudio / PipeWire)、Windows は ネイティブ WASAPI ループバック(ほとんどの場合追加ソフトウェアなし)、 macOS は仮想ループバックデバイス(BlackHole / Loopback / etc.)に 対する ffmpeg -f avfoundation。何かが不足していると、クリック可能 なインストールリンク付きのインライン警告バナーが表示されます。完全な OS 別インストール手順は セットアップ → システム音声 を参照。

ステップバイステップ

  1. サイドバーのライブ翻訳をクリック。
  2. 設定 → Live で一度設定:

    • ソース言語(話されている言語)
    • ターゲット言語(文字起こしのみの場合は空欄)
    • 音声ソース:マイク / システム音声 / 両方
    • STT メソッド:Whisper / Soniox
  3. Live ページに戻り、開始Ctrl+Enter)をクリック。

  4. 文字起こしがメインペインをカードごとに埋めます。フローティング オーバーレイウィンドウも字幕を表示します(好きな場所にドラッグ)。
  5. 停止をクリックしてセッションを終了。

文字起こしビュー

ツールバーでレイアウトを選択:

  • 両方積み重ね — 原文 + 翻訳、上下に
  • 両方並列 — 原文を左、翻訳を右に
  • 原文のみ / 翻訳のみ

ツールバーボタンは一目で分かる状態のために ON / OFF サフィックスを使用 — 例:TTS ONTTS OFFTimestamps ONOverlay OFF

時計アイコンでタイムスタンプをオン/オフ。スピーカーアイコンで翻訳 行の TTS 再生をオン/オフ。設定 → 音声 → TTS メソッドの選択を 尊重します — Edge TTS(デフォルト)、ElevenLabs、Google Cloud TTS、 Gemini TTS、または Piper TTS(完全オフライン)。Piper を選択した 場合、不足している言語ごとの音声はストリーム途中で静かに Edge TTS にフォールバックします — このページにはモーダルプリフライトがあり ません。ダウンロードダイアログでライブフローをブロックするのは フォールバックよりも悪いからです。

オーバーレイウィンドウ

ドラッグ可能、リサイズ可能、常時最前面のツールウィンドウ。 ショートカット:

ショートカット アクション
Ctrl+[ / Ctrl+] 不透明度を下げる / 上げる
Ctrl+矢印 オーバーレイを移動
Ctrl+0 / Ctrl+9 拡大 / 縮小

位置、サイズ、不透明度、フォントサイズはセッション間で保持されます。

設定とのライブ同期

フォントサイズと不透明度は双方向で動作します。設定 → ライブ 翻訳 → オーバーレイ設定フォントサイズまたは不透明 度のスライダーをドラッグすると開いているオーバーレイがリア ルタイムで更新され、逆に、オーバーレイ内で + / - / Ctrl+[ / Ctrl+] を押すと設定のスライダーも更新されます。 オーバーレイを再起動する必要はありません。

空状態のプレースホルダー

オーディオがキャプチャされる前、オーバーレイは(「開始を押し てください...」アイドル / 「聞き取り中...」開始クリック後)プ レースホルダーを表示します。これはメインウィンドウの空状態を 反映し、実行中のステータスピルと同期して切り替わります。プレ ースホルダーはオーバーレイの現在の幅×高さに合わせて拡大縮小さ れ、どのウィンドウサイズでも読みやすい状態を保ちます。

簡易キャプションモード

設定 → ライブ翻訳 → オーバーレイ設定の簡易キャプションを 表示チェックボックスは、メインウィンドウには表示したままで オーバーレイのタイムスタンプと話者のチップを非表示にします。 オーバーレイを聴衆と共有する場合(プレゼンモード / 画面共有) に便利ですが、作業ビューには完全なメタデータを保持したい場合 に役立ちます。この切り替えはオーバーレイ専用です — メインウ ィンドウの「話者ラベル」設定は変更しません。

文字起こしを保存

文字起こしを保存をクリックして、タイムスタンプ、話者、原文行、 翻訳行を含む .txt ファイルにセッションをエクスポート。

STT バックエンドの選択

バックエンド 最適 コスト レイテンシ
Whisper(ローカル) オフライン、プライバシー重視 無料 中(文末から約 1 秒)
Soniox 複数話者の会議 有料(約 $0.005 / 分) 低(リアルタイム)

注意事項

マイクの選択

マイク入力は常に OS デフォルトデバイスを使用します — アプリ内 セレクタはありません(sounddevice は仮想 ALSA プラグインを大量に 公開し有用ではなく、OS が既にデフォルトマイク UI を所有)。開始 前に OS のサウンド設定で希望のマイクを設定してください。

TTS バックプレッシャー

TTS キューは最新の 3 文に制限されます — 合成が追いつかない場合、 キューにある古い音声は破棄されます。これによりスピーチ再生が画面上 の字幕に近く保たれます。

キーなしの ElevenLabs

TTS メソッドを ElevenLabs に設定したが API キーが構成されていない 場合、Live ページは自動的に Edge TTS にフォールバックし、ステータス ラベルでフォールバックを通知します。

ショートカット

ショートカット アクション
Ctrl+Enter 開始 / 停止
Ctrl+K ログをクリア(確認あり)
Ctrl+[ / Ctrl+] オーバーレイの不透明度を調整