Перейти к содержанию

Живой перевод

Субтитры и переводы в реальном времени с микрофона, системного звука или обоих — с опциональным окном-оверлеем поверх всех окон, чтобы субтитры были над тем, что ты смотришь.

Что с этим можно делать

  • Субтитры для встреч в реальном времени — субтитруй звонок Zoom / Meet / Teams на другом языке, не подключаясь как бот-переводчик.
  • Изучение языка в реальном времени — субтитруй контент на иностранном языке (фильмы, подкасты, лекции) с твоим родным языком как дорожкой перевода.
  • Системные субтитры — захватывай системный звук, чтобы субтитровать YouTube / Netflix / что угодно, что играет на твоих колонках.

Что нужно

  • FFmpeg в PATH — см. Настройка FFmpeg.
  • STT-бэкенд, один из:

    • faster-whisper — локальный, оффлайн, бесплатный, по умолчанию
    • Soniox — облачный, платный, диаризация спикеров в реальном времени. См. Настройка Soniox.
  • Для захвата системного звука правильный бэкенд для каждой ОС выбирается автоматически: Linux использует parec (PulseAudio / PipeWire), Windows использует нативный WASAPI loopback (в большинстве случаев без дополнительного ПО), macOS использует ffmpeg -f avfoundation против виртуального loopback-устройства (BlackHole / Loopback / и т. д.). Встроенный баннер предупреждения с кликабельными ссылками для установки появится, если чего-то не хватает. См. Настройка → Системный звук для полных инструкций по установке для каждой ОС.

Пошагово

  1. Кликни Живой перевод в боковой панели.
  2. Настрой один раз в Настройки → Live:

    • Исходный язык (язык, на котором говорят)
    • Целевой язык (или оставь пустым для только транскрипции)
    • Источник звука: Микрофон / Системный звук / Оба
    • Метод STT: Whisper / Soniox
  3. Вернувшись на страницу Live, кликни Старт (Ctrl+Enter).

  4. Транскрипция заполняет основную панель карточка за карточкой. Плавающее окно Overlay также показывает субтитры (перетащи его, куда хочешь).
  5. Кликни Стоп, чтобы завершить сессию.

Вид транскрипции

Выбери раскладку в панели инструментов:

  • Оба стопкой — оригинал + перевод, один над другим
  • Оба бок о бок — оригинал слева, перевод справа
  • Только оригинал / Только перевод

Кнопки панели инструментов используют суффиксы ON / OFF для состояния на первый взгляд — например TTS ON, TTS OFF, Timestamps ON, Overlay OFF.

Переключай временные метки иконкой часов. Переключай TTS-воспроизведение переведённых строк иконкой динамика. Уважает твой выбор в Настройки → Голос → Метод TTS — Edge TTS (по умолчанию), ElevenLabs, Google Cloud TTS, Gemini TTS или Piper TTS (полностью оффлайн). С выбранным Piper отсутствующие голоса для языка молча откатываются на Edge TTS в середине потока — на этой странице нет модального pre-flight, потому что блокировать живой поток диалогом загрузки было бы хуже, чем откат.

Окно оверлея

Перетаскиваемое, изменяемое в размере, всегда сверху окно инструмента. Горячие клавиши:

Сочетание Действие
Ctrl+[ / Ctrl+] Уменьшить / увеличить непрозрачность
Ctrl+Стрелка Переместить оверлей
Ctrl+0 / Ctrl+9 Увеличить / уменьшить

Позиция, размер, непрозрачность и размер шрифта сохраняются между сессиями.

Синхронизация с настройками в реальном времени

Регулировки размера шрифта и непрозрачности работают в обоих направлениях: перетаскивание ползунка Размер шрифта или Непрозрачность в Настройки → Перевод в реальном времени → Настройка наложения обновляет открытое наложение в реальном времени, и наоборот, нажатие + / - / Ctrl+[ / Ctrl+] внутри наложения обновляет ползунки в Настройках. Перезапуск наложения не требуется.

Заглушка пустого состояния

Перед захватом аудио наложение показывает заглушку («Нажмите Старт...» в режиме ожидания / «Слушаю...» после нажатия Старт), которая отражает пустое состояние главного окна — переключение остаётся синхронизированным с индикатором текущего состояния. Заглушка масштабируется по текущей ширине × высоте наложения, оставаясь читаемой при любом размере окна.

Режим минимальных субтитров

Флажок Показывать минимальные субтитры в Настройки → Перевод в реальном времени → Настройка наложения скрывает метки времени и говорящего на наложении, оставляя их видимыми в главном окне. Удобно, когда наложение демонстрируется аудитории (режим докладчика / демонстрация экрана), но вы хотите сохранить полные метаданные в своем рабочем виде. Этот переключатель относится только к наложению — он не меняет ваше предпочтение «Метки говорящего» для главного окна.

Сохранить транскрипцию

Кликни Сохранить транскрипцию, чтобы экспортировать сессию в файл .txt с временными метками, спикерами, оригинальными строками и переведёнными строками.

Выбор STT-бэкенда

Бэкенд Лучше всего для Стоимость Задержка
Whisper (локальный) Оффлайн, чувствительные к приватности Бесплатно Средняя (~1 с после конца предложения)
Soniox Встречи с несколькими спикерами Платно (~$0.005 / мин) Низкая (реальное время)

Оговорки

Выбор микрофона

Вход микрофона всегда использует устройство ОС по умолчанию — в приложении нет селектора (sounddevice показывает слишком много виртуальных ALSA-плагинов, чтобы быть полезным, а ОС уже владеет UI микрофона по умолчанию). Установи свой предпочитаемый микрофон в настройках звука ОС перед началом.

Backpressure TTS

Очередь TTS ограничена 3 последними предложениями — более старое аудио в очереди отбрасывается, если синтез отстаёт. Это держит голосовое воспроизведение близко к субтитрам на экране.

ElevenLabs без ключа

Если ты установил метод TTS на ElevenLabs, но API-ключ не настроен, страница Live автоматически откатывается на Edge TTS и сообщает об этом откате в метке статуса.

Горячие клавиши

Сочетание Действие
Ctrl+Enter Старт / Стоп
Ctrl+K Очистить лог (с подтверждением)
Ctrl+[ / Ctrl+] Регулировать непрозрачность оверлея