ดึงข้อความ¶
รับข้อความจากภาพ — ใบเสร็จ, ภาพหน้าจอ, เอกสารที่ถ่าย, หน้าที่สแกน,
อะไรก็ได้ เอาต์พุต .txt (ธรรมดา) หรือ .docx (ย่อหน้าที่จัดรูปแบบ)
หน้านี้ ไม่แปล — แค่ดึง ส่งเอาต์พุตไปยัง Translate Document ถ้าคุณต้องการการแปลด้วย
สองวิธีการดึง¶
| วิธี | ดีที่สุดสำหรับ |
|---|---|
| OCR | ปริมาณสูง / batch / ไวต่อต้นทุน (ฟรีหรือเกือบฟรีต่อภาพ) |
| LLM vision | การรักษาเลย์เอาต์, สคริปต์ผสม, ภาพคุณภาพต่ำ, ลายมือ |
เลือกค่าเริ่มต้นใน Settings → Extract Text → Extraction method
เอนจิน OCR (วิธี OCR)¶
| เอนจิน | ราคา | ออฟไลน์ | ภาษา | หมายเหตุ |
|---|---|---|---|---|
| Tesseract | ฟรี | ใช่ | 100+ | ค่าเริ่มต้น ต้องการการติดตั้งระบบ |
| EasyOCR | ฟรี | ใช่ (หลังดาวน์โหลดโมเดล) | 80+ | ดีที่สุดสำหรับสคริปต์ที่ไม่ใช่ละติน โมเดล ~1 GB |
| Google Cloud Vision | เสียเงิน (ฟรี 1,000 / เดือน) | ไม่ | 60+ | ความแม่นยำสูงสุด |
กำหนดค่าใน Settings → OCR
ทีละขั้นตอน¶
- คลิก ดึงข้อความ ในแถบด้านข้าง
- drop ไฟล์ภาพหนึ่งไฟล์ขึ้นไป (
.png,.jpg,.jpeg,.bmp,.webp,.tiff,.tif) - เลือก ภาษาต้นทาง (ช่วย OCR เลือกโมเดลที่ถูกต้อง)
- เลือก รูปแบบเอาต์พุต —
.txtหรือ.docx - คลิก ดึง (หรือ
Ctrl+Enter) - คลิก เปิด ในแถวเมื่อเสร็จ
เมื่อใดใช้แบบใด¶
- ใบเสร็จ / ใบแจ้งหนี้ที่มีข้อความหนาแน่น → Tesseract เร็วและ แม่นยำ
- บันทึกเขียนด้วยมือที่ถ่าย → LLM vision ชนะมาก
- แผงมังงะ / การ์ตูน → EasyOCR (จัดการข้อความ CJK แนวตั้งได้ดี)
- แบบฟอร์มที่มีฟิลด์เล็กๆ จำนวนมาก → Google Cloud Vision รักษา ขอบเขตของฟิลด์ได้ดีกว่าตัวอื่น
เคล็ดลับ¶
OCR หรือ LLM ไม่ใช่ทั้งสอง
หน้าเลือกหนึ่งวิธีและรันมัน เพื่อเปรียบเทียบเอาต์พุต ให้รัน ภาพเดียวกันสองครั้งด้วยวิธีต่างกัน
Setup-required dialog
หากคุณเลือก OCR แต่ไม่ได้กำหนดค่าเอนจิน OCR ใดๆ (หรือ LLM แต่ ไม่ได้กำหนดค่าคีย์ LLM) หน้าจะแสดง dialog "Setup Required" เดียวที่ลิงก์ตรงไปยังแท็บ Settings ที่เกี่ยวข้อง
ทางลัด¶
| ทางลัด | การกระทำ |
|---|---|
Ctrl+Enter |
ดึง |
Ctrl+O |
เรียกดู |
Ctrl+F |
โฟกัสค้นหาประวัติ |