เอนจิน OCR¶

OCR ใช้เพื่ออ่านข้อความจากภาพ — ทั้งบนหน้า Extract Text และเป็น fallback ภายในการแปล Document เมื่อหน้าถูกสแกน (ไม่มี เลเยอร์ข้อความ) หรือเมื่อคุณเปิด Translate embedded images

คุณสามารถเลือกจากเอนจิน OCR สามตัว

Tesseract (ค่าเริ่มต้นที่แนะนำ)¶

ฟรี, รวดเร็ว, ออฟไลน์ ต้องการการติดตั้งระบบ

macOSUbuntu / DebianFedora / RHELWindows

brew install tesseract tesseract-lang

sudo apt install tesseract-ocr tesseract-ocr-all

tesseract-ocr-all นำทุกภาษาที่รองรับมา หากต้องการประหยัดดิสก์ ติดตั้งเฉพาะที่ต้องการ (เช่น tesseract-ocr-fra สำหรับฝรั่งเศส)

sudo dnf install tesseract tesseract-langpack-eng tesseract-langpack-fra

ดาวน์โหลด installer จาก Tesseract releases ของ UB Mannheim เรียกใช้ ยอมรับค่าเริ่มต้น — แพ็คภาษามาพร้อม

ตรวจสอบ:

tesseract --version
tesseract --list-langs

ในแอปเดสก์ท็อป: Settings → OCR → OCR method = Tesseract เสร็จ

EasyOCR¶

ฟรี, ออฟไลน์ ดีมากสำหรับสคริปต์ที่ไม่ใช่ละติน (จีน, เกาหลี, ญี่ปุ่น, ไทย) โมเดลดาวน์โหลดในการใช้ครั้งแรก (~1 GB ทั้งหมด)

uv sync --extra easyocr

ในแอปเดสก์ท็อป: Settings → OCR → OCR method = EasyOCR

ครั้งแรกที่คุณใช้สำหรับภาษาหนึ่ง โมเดลที่เกี่ยวข้องดาวน์โหลดไปยัง ~/.EasyOCR/ การรันถัดไปทันที

Google Cloud Vision¶

คลาวด์, เสียเงิน (1,000 คำขอฟรี / เดือน) ความแม่นยำสูงสุด โดยเฉพาะ บนเนื้อหาที่มีเสียงรบกวน / ลายมือ / สคริปต์ผสม

สร้างโครงการ Google Cloud
เปิดใช้งาน Vision API
สร้างคีย์ API
ในแอปเดสก์ท็อป: Settings → Service → Google Cloud API key → วาง
Settings → OCR → OCR method = Google Cloud OCR

คีย์ Google Cloud API เดียวกันขับเคลื่อน Vision OCR, Speech-to-Text และ Text-to-Speech ถ้าคุณเปิดใช้งาน APIs เหล่านั้นด้วย

เปรียบเทียบความแม่นยำ¶

แท็บ Settings → OCR มีตารางเปรียบเทียบเล็กๆ ในตัว — ความครอบ คลุมภาษา, ออนไลน์/ออฟไลน์, ราคา, ความแม่นยำ อ่านซ้ำเมื่อใดก็ตามที่ คุณรู้สึกอยากเปลี่ยน

เมื่อใดใช้ OCR¶

ที่	พฤติกรรม
หน้า Extract Text (เมื่อ method = OCR)	OCR โดยตรงบนภาพที่ drop
Translate Document → PDF	OCR fallback ในหน้าที่สแกนเท่านั้น (ไม่มีเลเยอร์ข้อความ)
Translate Document → Office ด้วย Translate embedded images เปิด	OCR + LLM vision บนทุกภาพที่ฝัง

เคล็ดลับ¶

เลือกภาษาต้นทาง

เอนจิน OCR ส่วนใหญ่แม่นยำมากขึ้นเมื่อคุณบอกว่าคาดหวังภาษาใด หน้า Subtitle / Document / Extract Text ทั้งหมดส่งตัวเลือก Source language ของคุณไปยังเอนจิน OCR

Tesseract เพียงพอสำหรับข้อความพิมพ์สะอาด

อย่าเอื้อมไป OCR คลาวด์จนกว่า Tesseract / EasyOCR จะล้มเหลว บนเนื้อหาของคุณจริงๆ พวกมันฟรี รวดเร็ว และดีอย่างน่าประหลาดใจ