Motori OCR¶
L'OCR è usato per leggere il testo dalle immagini — sia sulla pagina Estrai testo sia come ripiego dentro la traduzione di Documento quando una pagina è scansionata (senza livello di testo) o quando attivi Traduci immagini incorporate.
Puoi scegliere tra tre motori OCR.
Tesseract (predefinito raccomandato)¶
Gratuito, veloce, offline. Richiede un'installazione di sistema.
tesseract-ocr-all porta ogni lingua supportata. Per risparmiare
disco, installa solo ciò di cui hai bisogno (es. tesseract-ocr-fra
per il francese).
Scarica l'installer da le release di Tesseract di UB Mannheim. Eseguilo, accetta i valori predefiniti — i pacchetti di lingua sono inclusi.
Verifica:
Nell'app desktop: Impostazioni → OCR → Metodo OCR = Tesseract. Fatto.
EasyOCR¶
Gratuito, offline. Ottimo per script non-latini (cinese, coreano, giapponese, thai). I modelli si scaricano al primo uso (~1 GB totali).
Nell'app desktop: Impostazioni → OCR → Metodo OCR = EasyOCR.
La prima volta che lo usi per una lingua, il modello pertinente si
scarica in ~/.EasyOCR/. Le esecuzioni successive sono istantanee.
Google Cloud Vision¶
Cloud, a pagamento (1.000 richieste gratuite / mese). Massima precisione, specialmente su contenuti rumorosi / scritti a mano / multi-script.
- Crea un progetto Google Cloud
- Abilita la Vision API
- Crea una chiave API
- Nell'app desktop: Impostazioni → Servizio → Chiave API Google Cloud → incolla
- Impostazioni → OCR → Metodo OCR = Google Cloud OCR
La stessa chiave API Google Cloud alimenta Vision OCR, Speech-to-Text e Text-to-Speech se abiliti anche quelle API.
Confrontando la precisione¶
La scheda Impostazioni → OCR ha una piccola tabella di confronto integrata — copertura linguistica, online/offline, costo, precisione. Rileggila ogni volta che sei tentato di cambiare.
Quando viene usato l'OCR¶
| Posto | Comportamento |
|---|---|
| Pagina Estrai testo (quando metodo = OCR) | OCR diretto sulle immagini rilasciate |
| Traduci documento → PDF | Ripiego OCR su pagine solo-scansionate (senza livello di testo) |
| Traduci documento → Office con Traduci immagini incorporate attivo | OCR + LLM vision su ogni immagine incorporata |
Suggerimenti¶
Scegli la lingua di origine
La maggior parte dei motori OCR è molto più precisa quando dici loro quale lingua aspettarsi. Le pagine Sottotitolo / Documento / Estrai testo inoltrano tutte il tuo selettore Lingua di origine al motore OCR.
Tesseract è sufficiente per testo stampato pulito
Non saltare all'OCR cloud finché Tesseract / EasyOCR non ha effettivamente fallito sul tuo contenuto. Sono gratuiti, veloci e sorprendentemente buoni.