ข้ามไปที่เนื้อหา

Soniox (STT)

Speech-to-text แบบเรียลไทม์ผ่าน Soniox WebSocket API ใช้โดยหน้า Subtitle และ Live Translation เมื่อคุณ เลือก Soniox เป็นวิธี STT

ทำไมต้อง Soniox

  • เรียลไทม์ — tokens มาถึงในขณะที่ผู้พูดยังพูดอยู่
  • การแยกผู้พูด — ป้ายผู้พูดต่อ token (เช่น Speaker 1: Hi…)
  • การแปลในสตรีม — Soniox สามารถแปลในขณะที่ถอดเสียง ประหยัด รอบ LLM พิเศษ
  • หลายภาษา — ตรวจจับภาษาต้นทางอัตโนมัติแม้ในระหว่างสตรีม

รับคีย์ API

  1. ลงทะเบียนที่ https://console.soniox.com
  2. เปิด API keysCreate new API key
  3. คัดลอก (ดูเหมือน Bearer ...; คัดลอกเฉพาะ token โดยไม่มี prefix Bearer)

ราคาคิดต่อนาทีของเสียง (~$0.005 / นาทีในเวลาที่เขียน) — ดู https://soniox.com/pricing

กำหนดค่าในแอป

ใน Settings → Service:

  1. วางคีย์ลงใน Soniox API keySave

ใน Settings → Live (สำหรับการแปลสด) หรือ Settings → Subtitle (สำหรับการสร้างคำบรรยาย):

  1. ตั้ง STT method เป็น Soniox

มันให้พลังอะไร

Page ใช้ Soniox เมื่อ
Subtitle การบันทึกหลายผู้พูด (สัมภาษณ์, แผง, การประชุม) ที่คุณต้องการป้ายผู้พูดใน SRT
Live Translation การใส่คำบรรยายการประชุมแบบเรียลไทม์ โดยเฉพาะกับหลายผู้พูด

คำศัพท์

Soniox WebSocket ยอมรับคำศัพท์เพื่อทำให้การจดจำเอนเอียง แอปจะ ส่งต่อรายการคำศัพท์ที่ใช้งานอยู่โดยอัตโนมัติ — ชื่อแบรนด์ / นาม เฉพาะ / ศัพท์เฉพาะจะถูกจดจำได้น่าเชื่อถือขึ้น

ข้อควรระวัง

ออนไลน์เท่านั้น

Soniox เป็นคลาวด์เท่านั้น; หากเสียงของคุณละเอียดอ่อน (การแพทย์, กฎหมาย) ให้ใช้ Whisper (ในเครื่อง) แทน

การเชื่อมต่อใหม่

WebSocket เชื่อมต่อใหม่อัตโนมัติในความล้มเหลวชั่วคราวด้วย backoff แบบเอ็กซ์โพเนนเชียล เซสชันยาวยังคงเชื่อมต่อผ่านการ กระตุกเครือข่ายสั้นๆ

ข้อผิดพลาดทั่วไป

Error สาเหตุที่เป็นไปได้
AUTH_ERROR คีย์ API ผิด / หมดอายุ วางใหม่ใน Settings → Service
QUOTA_ERROR เกินขีดจำกัดของแผน
CONNECTION_ERROR เครือข่ายถูกบล็อก / firewall ลองใหม่จากเครือข่ายอื่น