Perguntas frequentes¶

Geral¶

Funciona offline?¶

Em grande parte sim. Especificamente:

A tradução precisa de um LLM. A API Gemini gratuita é online; Ollama / LM Studio local através das definições de Provedor Personalizado é completamente offline.
OCR com Tesseract ou EasyOCR é offline.
STT com Whisper (padrão) é offline.
TTS com Edge TTS (padrão) é online; ElevenLabs / Google Cloud TTS / Gemini TTS são online (gratuitos ou pagos); Piper TTS é TTS neural completamente offline — sem chave, sem chamadas de rede uma vez baixada a voz por idioma (ficheiro ONNX de ~25–60 MB) via Definições → Voz → Piper TTS → Descarregar vozes agora.

Para um setup totalmente air-gapped: Provedor Personalizado → LLM local, Tesseract ou EasyOCR para OCR, Whisper para STT, e Piper TTS para saída de voz.

Onde meus ficheiros traduzidos são guardados?¶

Ao lado do original por padrão, com sufixo _translated_<src>_<tgt> (ex. report_translated_en_fr.docx). Sobrescreva por funcionalidade em Definições → Geral → Caminho de armazenamento de traduções.

Onde minhas definições são armazenadas?¶

Ficheiro INI em:

OS	Caminho
Linux	`~/.config/ai-translate/settings.ini`
macOS	`~/Library/Preferences/ai-translate/settings.ini`
Windows	`%APPDATA%\ai-translate\settings.ini`

Chaves de API ficam no chaveiro do OS (não no INI). O histórico de tradução fica em um BD SQLite no diretório de dados.

Como meus dados são manipulados?¶

Local-first — texto nunca deixa sua máquina a menos que você esteja chamando um serviço LLM / OCR / STT / TTS na nuvem.
Sem telemetria — o app não chama de volta. A única requisição de saída que o app faz por si só é a verificação opcional de atualização do GitHub Releases (toggle em Definições → Geral); backends de nuvem só chamam seus respectivos vendedores.
Chaves de API — armazenadas no chaveiro do seu OS. O fallback do chaveiro do app desktop é um INI em texto plano quando nenhum daemon de chaveiro está disponível.

Posso traduzir um Google Doc / página Notion?¶

Não diretamente. Exporte para .docx primeiro, traduza, depois importe o ficheiro traduzido de volta. Mesma coisa para Notion (exporte como Markdown / HTML), Confluence (exporte como .docx), etc.

Escolhendo modelos / motores¶

Qual modelo LLM devo usar?¶

Para a maioria dos utilizadors:

Qualquer variante Gemini Flash — camada gratuita, rápido, surpreendentemente bom. Use para traduções diárias. Os nomes parecem gemini-2.5-flash, gemini-3-flash-preview, etc., dependendo do que está disponível.
Qualquer variante Gemini Pro — pagamento por token, qualidade superior. Use para documentos importantes (legais, técnicos, voltados ao cliente).
Ollama local com um modelo 7B-13B — quando você precisa de offline / privacidade.

O seletor de modelo por funcionalidade significa que você pode usar um modelo rápido para tradução estilo chat e reservar o caro para documentos.

Qual motor OCR devo usar?¶

Tesseract para texto impresso limpo nos scripts principais. Gratuito, offline, rápido.
EasyOCR para scripts não-latinos (CJK especialmente) e imagens mais ruidosas.
Google Cloud Vision para escrita à mão, scripts mistos, e a maior precisão quando você puder pagar.

Qual método STT devo usar?¶

Whisper local para offline / privacidade.
Soniox para gravações multi-falantes — labels de falante fazem round-trip no seu SRT.
Google Cloud STT para áudio telefônico / médico (seus modelos de domínio são bons).
Gemini Live para tradução speech-to-speech em tempo real.

Qual backend TTS?¶

Edge TTS para vozes gratuitas de alta qualidade.
ElevenLabs para vozes premium / com marca / clonadas.
Google Cloud TTS para vozes WaveNet em idiomas long-tail onde Edge tem cobertura rala.
Gemini TTS para vozes prebuilt naturais gratuitas reusando sua chave de API Gemini existente.
Piper TTS quando você precisa de saída de voz offline / air-gapped. Trade-off: cada idioma precisa de um download único de voz de ~25–60 MB via Definições → Voz → Piper TTS → Descarregar vozes agora, e 13 dos 45 idiomas do app não têm voz Piper (esses caem silenciosamente para Edge TTS).

Workflow¶

Como traduzo uma pasta inteira?¶

Solte a pasta na drop zone de Traduzir documento. Ficheiros suportados dentro (recursivamente) entram na fila; tudo o mais é silenciosamente ignorado. Há um cap de 100 ficheiros por drop; lotes maiores → divida em múltiplos drops.

Posso pausar e retomar traduções?¶

Sim. Saia do app a qualquer momento — tarefas Pending / Translating retomam no próximo lançamento. O checkpointing por tarefa significa que a página 47 de 100 de um PDF não é refeita quando você retoma.

Posso editar uma tradução à mão?¶

Para Traduzir texto — sim, clique no painel direito e digite. A edição guarda automaticamente no registo de histórico da entrada.

Para Traduzir documento — abra o ficheiro traduzido no seu editor habitual (Word, LibreOffice, etc.) e edite lá. O app não faz round-trip das edições de volta no histórico.

Posso traduzir em massa uma lista de strings?¶

Use o CLI:

ait *.txt --target French

Ou para strings in-process (ex. strings UI extraídas do código), chame a ferramenta MCP translate_text com uma lista, ou use a API Python diretamente:

from src.core.llm_engine import translate_text
out = translate_text(texts=["Hello", "World"], target_lang="French")

Glossário¶

Por que o LLM não está usando meu glossário?¶

Três coisas para verificar:

O conjunto está ativo (checkbox marcado).
O termo fonte no seu glossário aparece de fato no texto fonte (a compressão por chamada só envia ao LLM as entradas que correspondem ao texto do batch — economiza tokens, mas significa que um termo fonte com erro de digitação é invisível).
O modelo é forte o suficiente — flash-lite às vezes ignora dicas que flash e pro honram.

Termos do glossário são pareados independente de acentos?¶

Sim. Tanto a busca do glossário quanto a barra de busca na página Glossário usam uma função de normalização que remove acentos e case. Então cafe, Café e CAFE todos correspondem a uma entrada cuja fonte é Café.

Privacidade¶

Vocês coletam dados de uso?¶

Não. O app não tem SDK de analytics. A verificação opcional de atualização consulta um único endpoint GitHub Releases na inicialização; é togglable em Definições → Geral.

Minhas chaves de API estão seguras?¶

São armazenadas no chaveiro do seu OS (Keychain no macOS, Credential Manager no Windows, Secret Service no Linux). Outros processos não podem lê-las sem sua permissão explícita. O fallback (quando nenhum daemon de chaveiro está disponível — tipicamente servidores Linux headless) é um INI em texto plano sob o diretório de definição do seu utilizador; nesse modo as chaves são protegidas por permissões de ficheiro mas não criptografadas.