콘텐츠로 이동

Soniox (STT)

Soniox WebSocket API를 통한 실시간 음성-텍스트 변환. STT 방법으로 Soniox를 선택할 때 자막라이브 번역 페이지에서 사용.

왜 Soniox

  • 실시간 — 화자가 아직 말하는 동안 토큰이 도착합니다.
  • 화자 분할 — 토큰당 화자 라벨(예: 화자 1: 안녕…).
  • 스트림 내 번역 — Soniox는 전사하는 동안 번역할 수 있어 추가 LLM 왕복을 절약합니다.
  • 다국어 — 스트림 중간에도 소스 언어를 자동 감지.

API 키 받기

  1. https://console.soniox.com에서 가입
  2. API keysCreate new API key 열기
  3. 복사(Bearer ...처럼 보임; Bearer 접두사 없이 토큰만 복사).

가격은 오디오 분당으로 측정됩니다(작성 시점에서 ~$0.005 / 분) — https://soniox.com/pricing 참조.

앱에서 구성

설정 → 서비스에서:

  1. 키를 Soniox API 키에 붙여넣기 → 저장

설정 → Live (라이브 번역용) 또는 설정 → 자막 (자막 생성용) 에서:

  1. STT 방법Soniox로 설정

무엇을 강화하는지

페이지 다음 경우 Soniox 사용
자막 SRT에서 화자 라벨을 원하는 다중 화자 녹음(인터뷰, 패널, 회의)
라이브 번역 실시간 회의 자막, 특히 여러 화자가 있을 때

용어집 용어

Soniox WebSocket은 인식을 바이어스하기 위한 용어 사전을 받아들입니다. 앱은 자동으로 활성 용어집 항목을 전달합니다 — 브랜드 이름 / 고유 명사 / 전문용어가 더 안정적으로 인식됩니다.

주의사항

온라인 전용

Soniox는 클라우드 전용입니다; 오디오가 민감한 경우(의료, 법률), 대신 Whisper(로컬)를 사용하세요.

재연결

WebSocket은 일시적인 실패 시 지수 백오프로 자동으로 재연결합니다. 긴 세션은 짧은 네트워크 끊김을 통해 연결 상태를 유지합니다.

일반적인 오류

오류 가능한 원인
AUTH_ERROR 잘못된 / 만료된 API 키. 설정 → 서비스에서 다시 붙여넣기.
QUOTA_ERROR 플랜 한도 초과.
CONNECTION_ERROR 네트워크 차단 / 방화벽. 다른 네트워크에서 다시 시도.