Soniox (STT)¶
Soniox WebSocket API 経由のリアルタイム音声テキスト化。STT メソッド として Soniox を選択した場合に字幕 およびライブ翻訳ページで使用。
なぜ Soniox¶
- リアルタイム — 話者がまだ話している間にトークンが届きます。
- 話者ダイアライゼーション — トークンごとの話者ラベル(例: 話者 1: こんにちは…)。
- インストリーム翻訳 — Soniox は文字起こしながら翻訳できるので、 LLM の往復を 1 回節約できます。
- 多言語 — ストリーム途中でもソース言語を自動検出。
API キーを取得¶
- https://console.soniox.com でサインアップ
- API keys → Create new API key を開く
- コピー(
Bearer ...のように見える;Bearerプレフィックスなしで トークンだけコピー)。
価格はオーディオ分単位で課金(執筆時点で~$0.005/分)— 参照: https://soniox.com/pricing。
アプリで構成¶
設定 → サービスで:
- キーを Soniox API キー に貼り付け → 保存
設定 → Live (ライブ翻訳用) または 設定 → 字幕 (字幕生成用)で:
- STT メソッド を Soniox に設定
何を強化するか¶
| ページ | Soniox を使う場面 |
|---|---|
| 字幕 | SRT 内で話者ラベルが欲しい複数話者の録音(インタビュー、パネル、会議) |
| ライブ翻訳 | リアルタイム会議キャプション、特に複数話者の場合 |
用語集の用語¶
Soniox WebSocket は認識をバイアスする用語の用語集を受け入れます。 アプリはアクティブな用語集エントリを自動的に転送します — ブランド名 / 固有名詞 / 専門用語がより信頼性高く認識されます。
注意事項¶
オンライン専用
Soniox はクラウド専用です;オーディオが機密(医療、法律)の場合 は、代わりに Whisper(ローカル)を使用してください。
再接続
WebSocket は一時的な失敗時に指数バックオフで自動再接続します。 長いセッションは短いネットワーク中断を介して接続されたままです。
よくあるエラー¶
| エラー | 考えられる原因 |
|---|---|
AUTH_ERROR |
間違った / 期限切れの API キー。設定 → サービスで再貼り付け。 |
QUOTA_ERROR |
プラン制限を超過。 |
CONNECTION_ERROR |
ネットワークがブロック / ファイアウォール。別のネットワークから再試行。 |