ข้ามไปที่เนื้อหา

เอนจิน OCR

OCR ใช้เพื่ออ่านข้อความจากภาพ — ทั้งบนหน้า Extract Text และเป็น fallback ภายในการแปล Document เมื่อหน้าถูกสแกน (ไม่มี เลเยอร์ข้อความ) หรือเมื่อคุณเปิด Translate embedded images

คุณสามารถเลือกจากเอนจิน OCR สามตัว

Tesseract (ค่าเริ่มต้นที่แนะนำ)

ฟรี, รวดเร็ว, ออฟไลน์ ต้องการการติดตั้งระบบ

brew install tesseract tesseract-lang
sudo apt install tesseract-ocr tesseract-ocr-all

tesseract-ocr-all นำทุกภาษาที่รองรับมา หากต้องการประหยัดดิสก์ ติดตั้งเฉพาะที่ต้องการ (เช่น tesseract-ocr-fra สำหรับฝรั่งเศส)

sudo dnf install tesseract tesseract-langpack-eng tesseract-langpack-fra

ดาวน์โหลด installer จาก Tesseract releases ของ UB Mannheim เรียกใช้ ยอมรับค่าเริ่มต้น — แพ็คภาษามาพร้อม

ตรวจสอบ:

tesseract --version
tesseract --list-langs

ในแอปเดสก์ท็อป: Settings → OCR → OCR method = Tesseract เสร็จ

EasyOCR

ฟรี, ออฟไลน์ ดีมากสำหรับสคริปต์ที่ไม่ใช่ละติน (จีน, เกาหลี, ญี่ปุ่น, ไทย) โมเดลดาวน์โหลดในการใช้ครั้งแรก (~1 GB ทั้งหมด)

uv sync --extra easyocr

ในแอปเดสก์ท็อป: Settings → OCR → OCR method = EasyOCR

ครั้งแรกที่คุณใช้สำหรับภาษาหนึ่ง โมเดลที่เกี่ยวข้องดาวน์โหลดไปยัง ~/.EasyOCR/ การรันถัดไปทันที

Google Cloud Vision

คลาวด์, เสียเงิน (1,000 คำขอฟรี / เดือน) ความแม่นยำสูงสุด โดยเฉพาะ บนเนื้อหาที่มีเสียงรบกวน / ลายมือ / สคริปต์ผสม

  1. สร้างโครงการ Google Cloud
  2. เปิดใช้งาน Vision API
  3. สร้างคีย์ API
  4. ในแอปเดสก์ท็อป: Settings → Service → Google Cloud API key → วาง
  5. Settings → OCR → OCR method = Google Cloud OCR

คีย์ Google Cloud API เดียวกันขับเคลื่อน Vision OCR, Speech-to-Text และ Text-to-Speech ถ้าคุณเปิดใช้งาน APIs เหล่านั้นด้วย

เปรียบเทียบความแม่นยำ

แท็บ Settings → OCR มีตารางเปรียบเทียบเล็กๆ ในตัว — ความครอบ คลุมภาษา, ออนไลน์/ออฟไลน์, ราคา, ความแม่นยำ อ่านซ้ำเมื่อใดก็ตามที่ คุณรู้สึกอยากเปลี่ยน

เมื่อใดใช้ OCR

ที่ พฤติกรรม
หน้า Extract Text (เมื่อ method = OCR) OCR โดยตรงบนภาพที่ drop
Translate Document → PDF OCR fallback ในหน้าที่สแกนเท่านั้น (ไม่มีเลเยอร์ข้อความ)
Translate Document → Office ด้วย Translate embedded images เปิด OCR + LLM vision บนทุกภาพที่ฝัง

เคล็ดลับ

เลือกภาษาต้นทาง

เอนจิน OCR ส่วนใหญ่แม่นยำมากขึ้นเมื่อคุณบอกว่าคาดหวังภาษาใด หน้า Subtitle / Document / Extract Text ทั้งหมดส่งตัวเลือก Source language ของคุณไปยังเอนจิน OCR

Tesseract เพียงพอสำหรับข้อความพิมพ์สะอาด

อย่าเอื้อมไป OCR คลาวด์จนกว่า Tesseract / EasyOCR จะล้มเหลว บนเนื้อหาของคุณจริงๆ พวกมันฟรี รวดเร็ว และดีอย่างน่าประหลาดใจ