محركات OCR¶
يستخدم OCR لقراءة النص من الصور — على صفحة Extract Text وكذلك كاحتياطي داخل ترجمة Document عندما تكون الصفحة ممسوحة (لا توجد طبقة نص) أو عندما تقوم بتشغيل Translate embedded images.
يمكنك الاختيار من بين ثلاثة محركات OCR.
Tesseract (الافتراضي الموصى به)¶
مجاني، سريع، دون اتصال. يحتاج إلى تثبيت نظام.
tesseract-ocr-all يجلب كل لغة مدعومة. لتوفير القرص، قم
بتثبيت ما تحتاجه فقط (مثل tesseract-ocr-fra للفرنسية).
قم بتنزيل المثبت من إصدارات Tesseract لـ UB Mannheim. قم بتشغيله، اقبل الإعدادات الافتراضية — حزم اللغة مدمجة.
تحقق:
في تطبيق سطح المكتب: Settings → OCR → OCR method = Tesseract. تم.
EasyOCR¶
مجاني، دون اتصال. رائع للنصوص غير اللاتينية (الصينية، الكورية، اليابانية، التايلاندية). تنزل النماذج عند الاستخدام الأول (~1 GB إجمالي).
في تطبيق سطح المكتب: Settings → OCR → OCR method = EasyOCR.
في المرة الأولى التي تستخدم فيها لغة، يتم تنزيل النموذج ذي الصلة
إلى ~/.EasyOCR/. التشغيلات اللاحقة فورية.
Google Cloud Vision¶
سحابي، مدفوع (1,000 طلب مجاني / شهر). أعلى دقة، خاصة على المحتوى الصاخب / المكتوب بخط اليد / متعدد النصوص.
- أنشئ مشروع Google Cloud
- قم بتمكين Vision API
- أنشئ مفتاح API
- في تطبيق سطح المكتب: Settings → Service → Google Cloud API key → الصق
- Settings → OCR → OCR method = Google Cloud OCR
نفس مفتاح Google Cloud API يدعم Vision OCR وSpeech-to-Text وText-to-Speech إذا قمت بتمكين هذه APIs أيضًا.
مقارنة الدقة¶
علامة تبويب Settings → OCR بها جدول مقارنة صغير مدمج — تغطية اللغة، متصل/دون اتصال، التكلفة، الدقة. أعد قراءته في أي وقت تشعر فيه بإغراء التبديل.
متى يستخدم OCR¶
| المكان | السلوك |
|---|---|
| صفحة Extract Text (عندما method = OCR) | OCR مباشر على الصور المسقطة |
| Translate Document → PDF | OCR fallback على الصفحات الممسوحة فقط (لا توجد طبقة نص) |
| Translate Document → Office مع تشغيل Translate embedded images | OCR + LLM vision على كل صورة مضمنة |
نصائح¶
اختر لغة المصدر
معظم محركات OCR أكثر دقة بكثير عندما تخبرها أي لغة تتوقع. صفحات Subtitle / Document / Extract Text كلها تحول منتقي Source language الخاص بك إلى محرك OCR.
Tesseract كافٍ للنص المطبوع النظيف
لا تمد يدك إلى OCR السحابي حتى يفشل Tesseract / EasyOCR فعليًا على المحتوى الخاص بك. إنها مجانية، سريعة، وجيدة بشكل مذهل.