Extraer texto¶
Saca el texto de las imágenes — recibos, capturas de pantalla,
documentos fotografiados, páginas escaneadas, cualquier cosa. Salida
a .txt (plano) o .docx (párrafos formateados).
Esta página no traduce — sólo extrae. Pasa la salida a Traducir documento si también quieres traducir.
Dos métodos de extracción¶
| Método | Mejor para |
|---|---|
| OCR | Alto volumen / lote / sensible al coste (gratis o casi gratis por imagen) |
| LLM vision | Preservación de layout, scripts mixtos, imágenes de baja calidad, escritura a mano |
Elige el predeterminado en Configuración → Extraer texto → Método de extracción.
Motores OCR (método OCR)¶
| Motor | Coste | Offline | Idiomas | Notas |
|---|---|---|---|---|
| Tesseract | Gratis | Sí | 100+ | Predeterminado. Necesita instalación del sistema. |
| EasyOCR | Gratis | Sí (tras descarga del modelo) | 80+ | Mejor para scripts no latinos. ~1 GB de modelos. |
| Google Cloud Vision | De pago (1.000 gratis / mes) | No | 60+ | Mayor precisión. |
Configura en Configuración → OCR.
Paso a paso¶
- Haz clic en Extraer texto en la barra lateral.
- Suelta uno o varios archivos de imagen (
.png,.jpg,.jpeg,.bmp,.webp,.tiff,.tif). - Elige el Idioma de origen (ayuda al OCR a elegir el modelo correcto).
- Elige el Formato de salida —
.txto.docx. - Haz clic en Extraer (o
Ctrl+Enter). - Abre la fila cuando termine.
Cuándo usar qué¶
- Recibo / factura denso en texto → Tesseract es rápido y preciso.
- Notas manuscritas fotografiadas → la visión LLM gana de lejos.
- Paneles de manga / cómic → EasyOCR (maneja bien texto CJK vertical).
- Formulario con muchos campos pequeños → Google Cloud Vision tiende a preservar los límites de campos mejor que los demás.
Trucos¶
OCR o LLM, no ambos
La página elige un método y lo ejecuta. Para comparar salidas, ejecuta la misma imagen dos veces con métodos diferentes.
Diálogo de configuración requerida
Si eliges OCR pero no hay motor OCR configurado (o LLM pero no hay clave LLM configurada), la página muestra un único diálogo "Configuración requerida" que enlaza directamente con la pestaña de Configuración relevante.
Atajos¶
| Atajo | Acción |
|---|---|
Ctrl+Enter |
Extraer |
Ctrl+O |
Navegar |
Ctrl+F |
Foco en búsqueda de historial |