Soniox (STT)¶
Soniox WebSocket API를 통한 실시간 음성-텍스트 변환. STT 방법으로 Soniox를 선택할 때 자막 및 라이브 번역 페이지에서 사용.
왜 Soniox¶
- 실시간 — 화자가 아직 말하는 동안 토큰이 도착합니다.
- 화자 분할 — 토큰당 화자 라벨(예: 화자 1: 안녕…).
- 스트림 내 번역 — Soniox는 전사하는 동안 번역할 수 있어 추가 LLM 왕복을 절약합니다.
- 다국어 — 스트림 중간에도 소스 언어를 자동 감지.
API 키 받기¶
- https://console.soniox.com에서 가입
- API keys → Create new API key 열기
- 복사(
Bearer ...처럼 보임;Bearer접두사 없이 토큰만 복사).
가격은 오디오 분당으로 측정됩니다(작성 시점에서 ~$0.005 / 분) — https://soniox.com/pricing 참조.
앱에서 구성¶
설정 → 서비스에서:
- 키를 Soniox API 키에 붙여넣기 → 저장
설정 → Live (라이브 번역용) 또는 설정 → 자막 (자막 생성용) 에서:
- STT 방법을 Soniox로 설정
무엇을 강화하는지¶
| 페이지 | 다음 경우 Soniox 사용 |
|---|---|
| 자막 | SRT에서 화자 라벨을 원하는 다중 화자 녹음(인터뷰, 패널, 회의) |
| 라이브 번역 | 실시간 회의 자막, 특히 여러 화자가 있을 때 |
용어집 용어¶
Soniox WebSocket은 인식을 바이어스하기 위한 용어 사전을 받아들입니다. 앱은 자동으로 활성 용어집 항목을 전달합니다 — 브랜드 이름 / 고유 명사 / 전문용어가 더 안정적으로 인식됩니다.
주의사항¶
온라인 전용
Soniox는 클라우드 전용입니다; 오디오가 민감한 경우(의료, 법률), 대신 Whisper(로컬)를 사용하세요.
재연결
WebSocket은 일시적인 실패 시 지수 백오프로 자동으로 재연결합니다. 긴 세션은 짧은 네트워크 끊김을 통해 연결 상태를 유지합니다.
일반적인 오류¶
| 오류 | 가능한 원인 |
|---|---|
AUTH_ERROR |
잘못된 / 만료된 API 키. 설정 → 서비스에서 다시 붙여넣기. |
QUOTA_ERROR |
플랜 한도 초과. |
CONNECTION_ERROR |
네트워크 차단 / 방화벽. 다른 네트워크에서 다시 시도. |