Tradução ao vivo¶
Legendas e traduções em tempo real do microfone, áudio do sistema, ou ambos — com uma janela de overlay sempre no topo opcional para que as legendas fiquem sobre o que você está assistindo.
O que dá para fazer com isso¶
- Legendas de reuniões ao vivo — legenda uma chamada de Zoom / Meet / Teams em outro idioma sem entrar como um bot tradutor.
- Aprendizado de idioma em tempo real — legenda conteúdo em idioma estrangeiro (filmes, podcasts, palestras) com seu idioma nativo como faixa de tradução.
- Legendas em todo o sistema — capture o áudio do sistema para legendar YouTube / Netflix / qualquer coisa que toque nos seus alto-falantes.
O que você precisa¶
- FFmpeg no
PATH— veja Definição do FFmpeg. -
Um backend STT, um destes:
- faster-whisper — local, offline, gratuito, padrão
- Soniox — nuvem, pago, diarização de falantes em tempo real. Veja Definição do Soniox.
-
Para captura de áudio do sistema, o backend correto por SO é auto-selecionado: Linux usa
parec(PulseAudio / PipeWire), Windows usa loopback WASAPI nativo (sem software extra na maioria dos casos), macOS usaffmpeg -f avfoundationcontra um dispositivo de loopback virtual (BlackHole / Loopback / etc.). Um banner de aviso inline com links de instalação clicáveis aparece se algo estiver faltando. Veja Definição → Áudio do sistema para instruções completas de instalação por SO.
Passo a passo¶
- Clique em Tradução ao vivo na barra lateral.
-
Configure uma vez em Definições → Live:
- Idioma de origem (idioma falado)
- Idioma de destino (ou deixe em branco para apenas transcrição)
- Fonte de áudio: Microfone / Áudio do sistema / Ambos
- Método STT: Whisper / Soniox
-
De volta à página Live, clique em Iniciar (
Ctrl+Enter). - A transcrição preenche o painel principal cartão por cartão. A janela Overlay flutuante também mostra legendas (arraste-a para onde quiser).
- Clique em Parar para terminar a sessão.
A visualização de transcrição¶
Escolha um layout na barra de ferramentas:
- Ambos empilhados — original + tradução, um acima do outro
- Ambos lado a lado — original à esquerda, tradução à direita
- Apenas original / Apenas tradução
Os botões da barra de ferramentas usam sufixos ON / OFF
para estado à primeira vista — ex. TTS ON, TTS OFF,
Timestamps ON, Overlay OFF.
Alterne timestamps com o ícone do relógio. Alterne a reprodução TTS das linhas traduzidas com o ícone do alto-falante. Respeita sua escolha em Definições → Voz → Método TTS — Edge TTS (padrão), ElevenLabs, Google Cloud TTS, Gemini TTS, ou Piper TTS (totalmente offline). Com Piper selecionado, vozes faltantes por idioma caem silenciosamente para Edge TTS no meio do stream — não há pre-flight modal nesta página, já que bloquear o fluxo ao vivo com um diálogo de download seria pior que o fallback.
A janela overlay¶
Uma janela de ferramenta arrastável, redimensionável e sempre no topo. Atalhos:
| Atalho | Ação |
|---|---|
Ctrl+[ / Ctrl+] |
Diminuir / aumentar opacidade |
Ctrl+Seta |
Mover o overlay |
Ctrl+0 / Ctrl+9 |
Aumentar / encolher |
Posição, tamanho, opacidade e tamanho da fonte persistem entre sessões.
Sincronização ao vivo com as definições¶
Os controlos de tamanho de letra e opacidade funcionam em ambos
os sentidos: arrastar o controlo deslizante Tamanho de letra
ou Opacidade em Definições → Tradução Ao Vivo →
Configuração de sobreposição atualiza a sobreposição aberta em
tempo real e, inversamente, premir + / - / Ctrl+[ /
Ctrl+] dentro da sobreposição atualiza os controlos
deslizantes em Definições. Não é necessário reabrir a
sobreposição.
Marcador de posição de estado vazio¶
Antes de qualquer áudio ser capturado, a sobreposição mostra um marcador de posição ("Prima Iniciar..." inativo / "A ouvir..." após clicar em Iniciar) que reflete o estado vazio da janela principal — a alternância mantém-se sincronizada com o indicador de estado em execução. O marcador de posição adapta-se à largura × altura atual da sobreposição para permanecer legível em qualquer tamanho de janela.
Modo de legendas mínimas¶
A caixa de verificação Mostrar legendas mínimas em Definições → Tradução Ao Vivo → Configuração de sobreposição oculta as etiquetas de tempo e orador na sobreposição mantendo-as visíveis na janela principal. Útil quando a sobreposição é partilhada com um público (modo apresentador / partilha de ecrã) mas pretende manter os metadados completos na sua vista de trabalho. A alternância é apenas para a sobreposição — não altera a sua preferência de "Etiquetas de orador" para a janela principal.
Guardar a transcrição¶
Clique em Guardar transcrição para exportar a sessão para um
ficheiro .txt com timestamps, falantes, linhas originais e linhas
traduzidas.
Escolhendo um backend STT¶
| Backend | Melhor para | Custo | Latência |
|---|---|---|---|
| Whisper (local) | Offline, sensível à privacidade | Gratuito | Média (~1 s após fim de frase) |
| Soniox | Reuniões com múltiplos falantes | Pago (~$0,005 / min) | Baixa (tempo real) |
Resguardas¶
Seleção de microfone
A entrada de microfone sempre usa o dispositivo padrão do SO — não há seletor no app (o sounddevice expõe plugins ALSA virtuais demais para ser útil, e o SO já é dono da UI de microfone padrão). Defina seu microfone preferido nas definições de som do SO antes de começar.
Backpressure de TTS
A fila TTS é limitada às 3 frases mais recentes — o áudio em fila mais antigo é descartado se a síntese ficar para trás. Isso mantém a reprodução falada próxima das legendas na ecrã.
ElevenLabs sem chave
Se você definiu o método TTS para ElevenLabs mas nenhuma chave de API está configurada, a página Live cai automaticamente para Edge TTS e anuncia o fallback no rótulo de status.
Atalhos¶
| Atalho | Ação |
|---|---|
Ctrl+Enter |
Iniciar / Parar |
Ctrl+K |
Limpar log (com confirmação) |
Ctrl+[ / Ctrl+] |
Ajustar opacidade do overlay |