Motori OCR¶

L'OCR è usato per leggere il testo dalle immagini — sia sulla pagina Estrai testo sia come ripiego dentro la traduzione di Documento quando una pagina è scansionata (senza livello di testo) o quando attivi Traduci immagini incorporate.

Puoi scegliere tra tre motori OCR.

Tesseract (predefinito raccomandato)¶

Gratuito, veloce, offline. Richiede un'installazione di sistema.

macOSUbuntu / DebianFedora / RHELWindows

brew install tesseract tesseract-lang

sudo apt install tesseract-ocr tesseract-ocr-all

tesseract-ocr-all porta ogni lingua supportata. Per risparmiare disco, installa solo ciò di cui hai bisogno (es. tesseract-ocr-fra per il francese).

sudo dnf install tesseract tesseract-langpack-eng tesseract-langpack-fra

Scarica l'installer da le release di Tesseract di UB Mannheim. Eseguilo, accetta i valori predefiniti — i pacchetti di lingua sono inclusi.

Verifica:

tesseract --version
tesseract --list-langs

Nell'app desktop: Impostazioni → OCR → Metodo OCR = Tesseract. Fatto.

EasyOCR¶

Gratuito, offline. Ottimo per script non-latini (cinese, coreano, giapponese, thai). I modelli si scaricano al primo uso (~1 GB totali).

uv sync --extra easyocr

Nell'app desktop: Impostazioni → OCR → Metodo OCR = EasyOCR.

La prima volta che lo usi per una lingua, il modello pertinente si scarica in ~/.EasyOCR/. Le esecuzioni successive sono istantanee.

Google Cloud Vision¶

Cloud, a pagamento (1.000 richieste gratuite / mese). Massima precisione, specialmente su contenuti rumorosi / scritti a mano / multi-script.

Crea un progetto Google Cloud
Abilita la Vision API
Crea una chiave API
Nell'app desktop: Impostazioni → Servizio → Chiave API Google Cloud → incolla
Impostazioni → OCR → Metodo OCR = Google Cloud OCR

La stessa chiave API Google Cloud alimenta Vision OCR, Speech-to-Text e Text-to-Speech se abiliti anche quelle API.

Confrontando la precisione¶

La scheda Impostazioni → OCR ha una piccola tabella di confronto integrata — copertura linguistica, online/offline, costo, precisione. Rileggila ogni volta che sei tentato di cambiare.

Quando viene usato l'OCR¶

Posto	Comportamento
Pagina Estrai testo (quando metodo = OCR)	OCR diretto sulle immagini rilasciate
Traduci documento → PDF	Ripiego OCR su pagine solo-scansionate (senza livello di testo)
Traduci documento → Office con Traduci immagini incorporate attivo	OCR + LLM vision su ogni immagine incorporata

Suggerimenti¶

Scegli la lingua di origine

La maggior parte dei motori OCR è molto più precisa quando dici loro quale lingua aspettarsi. Le pagine Sottotitolo / Documento / Estrai testo inoltrano tutte il tuo selettore Lingua di origine al motore OCR.

Tesseract è sufficiente per testo stampato pulito

Non saltare all'OCR cloud finché Tesseract / EasyOCR non ha effettivamente fallito sul tuo contenuto. Sono gratuiti, veloci e sorprendentemente buoni.