Motores OCR¶
El OCR se usa para leer texto de imágenes — tanto en la página Extraer texto como como repliegue dentro de la traducción de Documento cuando una página está escaneada (sin capa de texto) o cuando activas Traducir imágenes integradas.
Puedes elegir entre tres motores OCR.
Tesseract (predeterminado recomendado)¶
Gratis, rápido, offline. Necesita una instalación de sistema.
tesseract-ocr-all trae todos los idiomas soportados. Para
ahorrar disco, instala solo lo que necesites (p. ej.
tesseract-ocr-fra para francés).
Descarga el instalador desde los releases de Tesseract de UB Mannheim. Ejecútalo, acepta los valores por defecto — los paquetes de idioma vienen incluidos.
Verificar:
En la app desktop: Configuración → OCR → Método OCR = Tesseract. Listo.
EasyOCR¶
Gratis, offline. Ideal para escrituras no-latinas (chino, coreano, japonés, tailandés). Los modelos se descargan al primer uso (~1 GB en total).
En la app desktop: Configuración → OCR → Método OCR = EasyOCR.
La primera vez que lo uses para un idioma, el modelo relevante se
descarga a ~/.EasyOCR/. Las ejecuciones siguientes son
instantáneas.
Google Cloud Vision¶
Cloud, de pago (1.000 solicitudes gratis / mes). Precisión máxima, especialmente en contenido ruidoso / manuscrito / multi-escritura.
- Crea un proyecto Google Cloud
- Habilita la Vision API
- Crea una clave API
- En la app desktop: Configuración → Servicio → Clave API Google Cloud → pega
- Configuración → OCR → Método OCR = Google Cloud OCR
La misma clave API Google Cloud alimenta Vision OCR, Speech-to-Text y Text-to-Speech si también habilitas esas APIs.
Comparando precisión¶
La pestaña Configuración → OCR tiene una pequeña tabla de comparación integrada — cobertura de idiomas, online/offline, coste, precisión. Reléela cada vez que estés tentado a cambiar.
Cuándo se usa OCR¶
| Lugar | Comportamiento |
|---|---|
| Página Extraer texto (cuando método = OCR) | OCR directo sobre las imágenes soltadas |
| Traducir documento → PDF | Repliegue OCR en páginas solo escaneadas (sin capa de texto) |
| Traducir documento → Office con Traducir imágenes integradas activado | OCR + LLM vision en cada imagen integrada |
Consejos¶
Elige el idioma origen
La mayoría de motores OCR son mucho más precisos cuando les dices qué idioma esperar. Las páginas Subtítulo / Documento / Extraer texto reenvían todas tu selector Idioma origen al motor OCR.
Tesseract es suficiente para texto impreso limpio
No corras al OCR cloud hasta que Tesseract / EasyOCR haya realmente fallado en tu contenido. Son gratis, rápidos y sorprendentemente buenos.