ข้ามไปที่เนื้อหา

ดึงข้อความ

รับข้อความจากภาพ — ใบเสร็จ, ภาพหน้าจอ, เอกสารที่ถ่าย, หน้าที่สแกน, อะไรก็ได้ เอาต์พุต .txt (ธรรมดา) หรือ .docx (ย่อหน้าที่จัดรูปแบบ)

หน้านี้ ไม่แปล — แค่ดึง ส่งเอาต์พุตไปยัง Translate Document ถ้าคุณต้องการการแปลด้วย

สองวิธีการดึง

วิธี ดีที่สุดสำหรับ
OCR ปริมาณสูง / batch / ไวต่อต้นทุน (ฟรีหรือเกือบฟรีต่อภาพ)
LLM vision การรักษาเลย์เอาต์, สคริปต์ผสม, ภาพคุณภาพต่ำ, ลายมือ

เลือกค่าเริ่มต้นใน Settings → Extract Text → Extraction method

เอนจิน OCR (วิธี OCR)

เอนจิน ราคา ออฟไลน์ ภาษา หมายเหตุ
Tesseract ฟรี ใช่ 100+ ค่าเริ่มต้น ต้องการการติดตั้งระบบ
EasyOCR ฟรี ใช่ (หลังดาวน์โหลดโมเดล) 80+ ดีที่สุดสำหรับสคริปต์ที่ไม่ใช่ละติน โมเดล ~1 GB
Google Cloud Vision เสียเงิน (ฟรี 1,000 / เดือน) ไม่ 60+ ความแม่นยำสูงสุด

กำหนดค่าใน Settings → OCR

ทีละขั้นตอน

  1. คลิก ดึงข้อความ ในแถบด้านข้าง
  2. drop ไฟล์ภาพหนึ่งไฟล์ขึ้นไป (.png, .jpg, .jpeg, .bmp, .webp, .tiff, .tif)
  3. เลือก ภาษาต้นทาง (ช่วย OCR เลือกโมเดลที่ถูกต้อง)
  4. เลือก รูปแบบเอาต์พุต.txt หรือ .docx
  5. คลิก ดึง (หรือ Ctrl+Enter)
  6. คลิก เปิด ในแถวเมื่อเสร็จ

เมื่อใดใช้แบบใด

  • ใบเสร็จ / ใบแจ้งหนี้ที่มีข้อความหนาแน่น → Tesseract เร็วและ แม่นยำ
  • บันทึกเขียนด้วยมือที่ถ่าย → LLM vision ชนะมาก
  • แผงมังงะ / การ์ตูน → EasyOCR (จัดการข้อความ CJK แนวตั้งได้ดี)
  • แบบฟอร์มที่มีฟิลด์เล็กๆ จำนวนมาก → Google Cloud Vision รักษา ขอบเขตของฟิลด์ได้ดีกว่าตัวอื่น

เคล็ดลับ

OCR หรือ LLM ไม่ใช่ทั้งสอง

หน้าเลือกหนึ่งวิธีและรันมัน เพื่อเปรียบเทียบเอาต์พุต ให้รัน ภาพเดียวกันสองครั้งด้วยวิธีต่างกัน

Setup-required dialog

หากคุณเลือก OCR แต่ไม่ได้กำหนดค่าเอนจิน OCR ใดๆ (หรือ LLM แต่ ไม่ได้กำหนดค่าคีย์ LLM) หน้าจะแสดง dialog "Setup Required" เดียวที่ลิงก์ตรงไปยังแท็บ Settings ที่เกี่ยวข้อง

ทางลัด

ทางลัด การกระทำ
Ctrl+Enter ดึง
Ctrl+O เรียกดู
Ctrl+F โฟกัสค้นหาประวัติ