ElevenLabs (TTS)¶
プレミアムニューラル テキスト読み上げ。TTS メソッドとして ElevenLabs を選択した場合に音声生成、 ダビング、ライブ翻訳 ページで使用。
API キーを取得¶
- https://elevenlabs.io でサインアップ
- https://elevenlabs.io/app/settings/api-keys を開く
- + Create New Key をクリック、名前を付け(例 "ai-translate")、
キーをコピー(
sk_...のように見える)
無料層は 1 か月あたり~10,000 文字を与えてくれ、テストに十分です。 本番使用は月 5 ドル程度から始まります。
アプリで構成¶
設定 → サービスで:
- キーを ElevenLabs API キー に貼り付け → 保存
- お好みの音声 ID を 音声 ID に入力(ID は https://elevenlabs.io/app/voice-lab で見つかります;音声の URL から ID をコピー)。ElevenLabs にデフォルトを選ばせるには空白に してください。
設定 → 音声で:
- TTS メソッド を ElevenLabs に設定
-
ElevenLabs モデルを選択:
モデル 最適 eleven_multilingual_v2(デフォルト)一般的な使用、バランスの取れたレイテンシ/品質 eleven_v3最高品質(本番ダビングに使用) eleven_flash_v2_5最低レイテンシ(ライブ翻訳に使用)
何を強化するか¶
| ページ | ElevenLabs を使う場面 |
|---|---|
| 音声生成 | 字幕ファイルからプレミアム品質のボイスオーバーが欲しい |
| ダビング | 翻訳されたビデオに高品質のダビングトラックが欲しい |
| ライブ翻訳 | 翻訳された字幕のリアルタイム音声再生が欲しい |
音声クローニング¶
ElevenLabs はカスタム音声クローニング(有料プラン)をサポートします。 ElevenLabs サイトで音声をクローンしたら、その音声 ID を設定 → サービス → 音声 ID に貼り付けて、ダビング / 音声生成パイプラインが それを使用します。
注意事項¶
プリフライトチェック
音声 / ダビングページは作業開始前に ElevenLabs API キーが設定 されていることを確認します。欠落している場合、半分実行された タスクではなく、設定を指す親切なダイアログが表示されます。
Live モードは自動的にフォールバック
ライブ翻訳ページで、ElevenLabs を選択したがキーを構成して いない場合、アプリは自動的に Edge TTS(無料)にフォール バックし、ステータスラベルでフォールバックを通知するので、便利 な時に修正できます。
FFmpeg はまだ必要
ElevenLabs はオーディオバイトを返します;アプリはフォーマット間 の変換と、タイミングのあるクリップを 1 つのファイルに結合する のに FFmpeg を引き続き使用します。FFmpeg セットアップ を参照。
よくあるエラー¶
| エラー | 考えられる原因 |
|---|---|
AUTH_ERROR |
間違った / 期限切れの API キー。設定 → サービスで再貼り付け。 |
QUOTA_ERROR |
無料層の文字制限に達した、または有料プランが枯渇。 |
MODEL_NOT_FOUND |
選択された ElevenLabs モデルがもう使用できません;設定 → 音声で別のものを選択。 |