Живой перевод¶
Субтитры и переводы в реальном времени с микрофона, системного звука или обоих — с опциональным окном-оверлеем поверх всех окон, чтобы субтитры были над тем, что ты смотришь.
Что с этим можно делать¶
- Субтитры для встреч в реальном времени — субтитруй звонок Zoom / Meet / Teams на другом языке, не подключаясь как бот-переводчик.
- Изучение языка в реальном времени — субтитруй контент на иностранном языке (фильмы, подкасты, лекции) с твоим родным языком как дорожкой перевода.
- Системные субтитры — захватывай системный звук, чтобы субтитровать YouTube / Netflix / что угодно, что играет на твоих колонках.
Что нужно¶
- FFmpeg в
PATH— см. Настройка FFmpeg. -
STT-бэкенд, один из:
- faster-whisper — локальный, оффлайн, бесплатный, по умолчанию
- Soniox — облачный, платный, диаризация спикеров в реальном времени. См. Настройка Soniox.
-
Для захвата системного звука правильный бэкенд для каждой ОС выбирается автоматически: Linux использует
parec(PulseAudio / PipeWire), Windows использует нативный WASAPI loopback (в большинстве случаев без дополнительного ПО), macOS используетffmpeg -f avfoundationпротив виртуального loopback-устройства (BlackHole / Loopback / и т. д.). Встроенный баннер предупреждения с кликабельными ссылками для установки появится, если чего-то не хватает. См. Настройка → Системный звук для полных инструкций по установке для каждой ОС.
Пошагово¶
- Кликни Живой перевод в боковой панели.
-
Настрой один раз в Настройки → Live:
- Исходный язык (язык, на котором говорят)
- Целевой язык (или оставь пустым для только транскрипции)
- Источник звука: Микрофон / Системный звук / Оба
- Метод STT: Whisper / Soniox
-
Вернувшись на страницу Live, кликни Старт (
Ctrl+Enter). - Транскрипция заполняет основную панель карточка за карточкой. Плавающее окно Overlay также показывает субтитры (перетащи его, куда хочешь).
- Кликни Стоп, чтобы завершить сессию.
Вид транскрипции¶
Выбери раскладку в панели инструментов:
- Оба стопкой — оригинал + перевод, один над другим
- Оба бок о бок — оригинал слева, перевод справа
- Только оригинал / Только перевод
Кнопки панели инструментов используют суффиксы ON / OFF
для состояния на первый взгляд — например TTS ON, TTS OFF,
Timestamps ON, Overlay OFF.
Переключай временные метки иконкой часов. Переключай TTS-воспроизведение переведённых строк иконкой динамика. Уважает твой выбор в Настройки → Голос → Метод TTS — Edge TTS (по умолчанию), ElevenLabs, Google Cloud TTS, Gemini TTS или Piper TTS (полностью оффлайн). С выбранным Piper отсутствующие голоса для языка молча откатываются на Edge TTS в середине потока — на этой странице нет модального pre-flight, потому что блокировать живой поток диалогом загрузки было бы хуже, чем откат.
Окно оверлея¶
Перетаскиваемое, изменяемое в размере, всегда сверху окно инструмента. Горячие клавиши:
| Сочетание | Действие |
|---|---|
Ctrl+[ / Ctrl+] |
Уменьшить / увеличить непрозрачность |
Ctrl+Стрелка |
Переместить оверлей |
Ctrl+0 / Ctrl+9 |
Увеличить / уменьшить |
Позиция, размер, непрозрачность и размер шрифта сохраняются между сессиями.
Синхронизация с настройками в реальном времени¶
Регулировки размера шрифта и непрозрачности работают в обоих
направлениях: перетаскивание ползунка Размер шрифта или
Непрозрачность в Настройки → Перевод в реальном времени →
Настройка наложения обновляет открытое наложение в реальном
времени, и наоборот, нажатие + / - / Ctrl+[ / Ctrl+]
внутри наложения обновляет ползунки в Настройках. Перезапуск
наложения не требуется.
Заглушка пустого состояния¶
Перед захватом аудио наложение показывает заглушку («Нажмите Старт...» в режиме ожидания / «Слушаю...» после нажатия Старт), которая отражает пустое состояние главного окна — переключение остаётся синхронизированным с индикатором текущего состояния. Заглушка масштабируется по текущей ширине × высоте наложения, оставаясь читаемой при любом размере окна.
Режим минимальных субтитров¶
Флажок Показывать минимальные субтитры в Настройки → Перевод в реальном времени → Настройка наложения скрывает метки времени и говорящего на наложении, оставляя их видимыми в главном окне. Удобно, когда наложение демонстрируется аудитории (режим докладчика / демонстрация экрана), но вы хотите сохранить полные метаданные в своем рабочем виде. Этот переключатель относится только к наложению — он не меняет ваше предпочтение «Метки говорящего» для главного окна.
Сохранить транскрипцию¶
Кликни Сохранить транскрипцию, чтобы экспортировать сессию в файл
.txt с временными метками, спикерами, оригинальными строками и
переведёнными строками.
Выбор STT-бэкенда¶
| Бэкенд | Лучше всего для | Стоимость | Задержка |
|---|---|---|---|
| Whisper (локальный) | Оффлайн, чувствительные к приватности | Бесплатно | Средняя (~1 с после конца предложения) |
| Soniox | Встречи с несколькими спикерами | Платно (~$0.005 / мин) | Низкая (реальное время) |
Оговорки¶
Выбор микрофона
Вход микрофона всегда использует устройство ОС по умолчанию — в приложении нет селектора (sounddevice показывает слишком много виртуальных ALSA-плагинов, чтобы быть полезным, а ОС уже владеет UI микрофона по умолчанию). Установи свой предпочитаемый микрофон в настройках звука ОС перед началом.
Backpressure TTS
Очередь TTS ограничена 3 последними предложениями — более старое аудио в очереди отбрасывается, если синтез отстаёт. Это держит голосовое воспроизведение близко к субтитрам на экране.
ElevenLabs без ключа
Если ты установил метод TTS на ElevenLabs, но API-ключ не настроен, страница Live автоматически откатывается на Edge TTS и сообщает об этом откате в метке статуса.
Горячие клавиши¶
| Сочетание | Действие |
|---|---|
Ctrl+Enter |
Старт / Стоп |
Ctrl+K |
Очистить лог (с подтверждением) |
Ctrl+[ / Ctrl+] |
Регулировать непрозрачность оверлея |