Motores OCR¶

OCR é usado para ler texto de imagens — tanto na página Extrair texto quanto como recuo dentro da tradução de Documento quando uma página está digitalizada (sem camada de texto) ou quando você liga Traduzir imagens incorporadas.

Você pode escolher entre três motores OCR.

Tesseract (padrão recomendado)¶

Gratuito, rápido, offline. Precisa de uma instalação de sistema.

macOSUbuntu / DebianFedora / RHELWindows

brew install tesseract tesseract-lang

sudo apt install tesseract-ocr tesseract-ocr-all

tesseract-ocr-all traz todos os idiomas suportados. Para economizar disco, instale apenas o que precisa (ex. tesseract-ocr-fra para francês).

sudo dnf install tesseract tesseract-langpack-eng tesseract-langpack-fra

Descarregue o instalador em releases do Tesseract da UB Mannheim. Execute, aceite os padrões — pacotes de idioma vêm embutidos.

Verificar:

tesseract --version
tesseract --list-langs

No app desktop: Definições → OCR → Método OCR = Tesseract. Pronto.

EasyOCR¶

Gratuito, offline. Ótimo para scripts não-latinos (chinês, coreano, japonês, tailandês). Modelos baixam no primeiro uso (~1 GB total).

uv sync --extra easyocr

No app desktop: Definições → OCR → Método OCR = EasyOCR.

A primeira vez que você usa para um idioma, o modelo relevante baixa para ~/.EasyOCR/. Execuções subsequentes são instantâneas.

Google Cloud Vision¶

Cloud, pago (1.000 solicitações grátis / mês). Maior precisão, especialmente em conteúdo ruidoso / manuscrito / multi-script.

Crie um projeto Google Cloud
Habilite a Vision API
Crie uma chave de API
No app desktop: Definições → Serviço → Chave de API Google Cloud → cole
Definições → OCR → Método OCR = Google Cloud OCR

A mesma chave API Google Cloud alimenta Vision OCR, Speech-to-Text e Text-to-Speech se você também habilitar essas APIs.

Comparando precisão¶

A aba Definições → OCR tem uma pequena tabela de comparação embutida — cobertura de idiomas, online/offline, custo, precisão. Releia sempre que estiver tentado a trocar.

Quando o OCR é usado¶

Lugar	Comportamento
Página Extrair texto (quando método = OCR)	OCR direto nas imagens soltadas
Traduzir documento → PDF	Recuo OCR em páginas apenas digitalizadas (sem camada de texto)
Traduzir documento → Office com Traduzir imagens incorporadas ligado	OCR + LLM vision em cada imagem incorporada

Dicas¶

Escolha o idioma de origem

A maioria dos motores OCR é muito mais precisa quando você diz a eles qual idioma esperar. As páginas Legenda / Documento / Extrair texto encaminham todas o seu seletor Idioma de origem para o motor OCR.

Tesseract é suficiente para texto impresso limpo

Não pule para OCR cloud até que Tesseract / EasyOCR tenha realmente falhado no seu conteúdo. Eles são grátis, rápidos e surpreendentemente bons.