OCR Engines¶
OCR images से text पढ़ने के लिए उपयोग होता है — दोनों Extract Text पेज पर और Document translation के अंदर एक fallback के रूप में जब एक page scanned हो (कोई text layer नहीं) या जब आप Translate embedded images turn on करते हैं।
आप तीन OCR engines में से चुन सकते हैं।
Tesseract (recommended default)¶
Free, fast, offline। एक system install की आवश्यकता है।
tesseract-ocr-all हर supported language लाता है। Disk बचाने
के लिए, केवल वही install करें जिसकी आपको आवश्यकता है (जैसे
French के लिए tesseract-ocr-fra)।
UB Mannheim's Tesseract releases से installer download करें। इसे run करें, defaults accept करें — language packs bundled हैं।
Verify:
Desktop ऐप में: Settings → OCR → OCR method = Tesseract। Done।
EasyOCR¶
Free, offline। Non-Latin scripts (Chinese, Korean, Japanese, Thai) के लिए बढ़िया। Models पहले उपयोग पर download होते हैं (~1 GB total)।
Desktop ऐप में: Settings → OCR → OCR method = EasyOCR।
जब आप किसी language के लिए इसे पहली बार उपयोग करते हैं, relevant
model ~/.EasyOCR/ पर download होता है। बाद के runs instant होते
हैं।
Google Cloud Vision¶
Cloud, paid (1,000 free requests / month)। Highest accuracy, विशेष रूप से noisy / handwritten / mixed-script content पर।
- एक Google Cloud project बनाएँ
- Vision API enable करें
- एक API key बनाएँ
- Desktop ऐप में: Settings → Service → Google Cloud API key → paste
- Settings → OCR → OCR method = Google Cloud OCR
यदि आप उन APIs को भी enable करते हैं, तो वही Google Cloud API key Vision OCR, Speech-to-Text, और Text-to-Speech को powers देती है।
Accuracy compare करना¶
Settings → OCR tab में एक small comparison table built in है — language coverage, online/offline, cost, accuracy। जब भी आप switch करने के लिए tempted हों इसे फिर से पढ़ें।
OCR कब उपयोग होता है¶
| जगह | व्यवहार |
|---|---|
| Extract Text page (जब method = OCR) | Dropped images पर direct OCR |
| Translate Document → PDF | Scan-only pages पर OCR fallback (कोई text layer नहीं) |
| Translate Document → Office Translate embedded images on के साथ | हर embedded image पर OCR + LLM vision |
Tips¶
Source language चुनें
अधिकांश OCR engines बहुत अधिक accurate होते हैं जब आप उन्हें बताते हैं कि कौन सी language expect करनी है। Subtitle / Document / Extract Text पेज सभी आपके Source language picker को OCR engine पर forward करते हैं।
Clean printed text के लिए Tesseract पर्याप्त है
Cloud OCR तक तब तक न पहुँचें जब तक Tesseract / EasyOCR वास्तव में आपके content पर fail न हो जाए। वे free, fast, और surprisingly अच्छे हैं।