انتقل إلى المحتوى

الأسئلة الشائعة

عام

هل يعمل دون اتصال؟

في الغالب نعم. تحديدًا:

  • الترجمة تحتاج إلى LLM. واجهة Gemini المجانية متصلة؛ Ollama / LM Studio محلي عبر إعدادات Custom Provider غير متصل تمامًا.
  • OCR مع Tesseract أو EasyOCR غير متصل.
  • STT مع Whisper (الافتراضي) غير متصل.
  • TTS مع Edge TTS (الافتراضي) متصل؛ ElevenLabs / Google Cloud TTS / Gemini TTS متصلة (مجانية أو مدفوعة)؛ Piper TTS هو TTS عصبي غير متصل تمامًا — لا مفتاح، لا مكالمات شبكة بمجرد تنزيل الصوت لكل لغة (~25–60 MB ONNX file) عبر Settings → Voice → Piper TTS → Download voices now.

للإعداد المعزول تمامًا: Custom Provider → LLM محلي، Tesseract أو EasyOCR لـ OCR، Whisper لـ STT، وPiper TTS لمخرجات الصوت.

أين تُحفظ ملفاتي المترجمة؟

بجانب الأصلي افتراضيًا، مع لاحقة _translated_<src>_<tgt> (مثل report_translated_en_fr.docx). تجاوز لكل ميزة في Settings → General → Translation storage path.

أين تُخزَّن إعداداتي؟

ملف INI في:

OS Path
Linux ~/.config/ai-translate/settings.ini
macOS ~/Library/Preferences/ai-translate/settings.ini
Windows %APPDATA%\ai-translate\settings.ini

تعيش مفاتيح API في keychain نظام التشغيل (وليس في INI). يعيش سجل الترجمة في قاعدة بيانات SQLite في دليل البيانات.

كيف يتم التعامل مع بياناتي؟

  • Local-first — لا يغادر النص جهازك إلا إذا كنت تتصل بخدمة LLM / OCR / STT / TTS سحابية.
  • بدون قياس عن بُعد — لا يقوم التطبيق بالاتصال بالمنزل. الطلب الصادر الوحيد الذي يقوم به التطبيق نفسه هو فحص تحديث GitHub Releases الاختياري (تبديل في Settings → General)؛ تستدعي الواجهات الخلفية السحابية فقط البائعين المعنيين بها.
  • مفاتيح API — مخزنة في keychain نظام التشغيل الخاص بك. الرجوع لنظام keychain لتطبيق سطح المكتب هو INI نص عادي عند عدم توفر daemon keychain.

هل يمكنني ترجمة Google Doc / صفحة Notion؟

ليس مباشرة. صدّر إلى .docx أولاً، ترجم، ثم أعد استيراد الملف المترجم. نفس الأمر لـ Notion (تصدير كـ Markdown / HTML)، Confluence (تصدير كـ .docx)، إلخ.

اختيار النماذج / المحركات

أي نموذج LLM يجب أن أستخدم؟

لمعظم المستخدمين:

  • أي متغير Gemini Flash — مستوى مجاني، سريع، جيد بشكل مدهش. استخدمه للترجمات اليومية. تبدو الأسماء مثل gemini-2.5-flash، gemini-3-flash-preview، إلخ، اعتمادًا على ما هو متاح حاليًا.
  • أي متغير Gemini Pro — دفع لكل token، جودة أعلى. استخدمه للمستندات المهمة (قانونية، تقنية، تواجه العملاء).
  • Ollama محلي بنموذج 7B-13B — عندما تحتاج إلى عدم الاتصال / الخصوصية.

يعني منتقي النموذج لكل ميزة أنه يمكنك استخدام نموذج سريع للترجمة بأسلوب الدردشة وحجز النموذج المكلف للمستندات.

أي محرك OCR يجب أن أستخدم؟

  • Tesseract للنص المطبوع النظيف في النصوص الرئيسية. مجاني، غير متصل، سريع.
  • EasyOCR للنصوص غير اللاتينية (CJK خاصة) والصور الأكثر ضوضاء.
  • Google Cloud Vision للكتابة اليدوية، النصوص المختلطة، وأعلى دقة عندما يمكنك الدفع.

أي طريقة STT يجب أن أستخدم؟

  • Whisper المحلي للعمل دون اتصال / الخصوصية.
  • Soniox للتسجيلات متعددة المتحدثين — تذهب علامات المتحدث ذهابًا وإيابًا إلى SRT الخاص بك.
  • Google Cloud STT للصوت الهاتفي / الطبي (نماذج المجال الخاصة بهم جيدة).
  • Gemini Live لترجمة الكلام إلى الكلام في الوقت الفعلي.

أي backend TTS؟

  • Edge TTS للأصوات المجانية عالية الجودة.
  • ElevenLabs للأصوات المتميزة / ذات العلامة التجارية / المستنسخة.
  • Google Cloud TTS لأصوات WaveNet في اللغات طويلة الذيل حيث تكون تغطية Edge ضعيفة.
  • Gemini TTS للأصوات المسبقة الإعداد الطبيعية المجانية بإعادة استخدام مفتاح Gemini API الحالي الخاص بك.
  • Piper TTS عندما تحتاج إلى مخرجات صوت غير متصلة / معزولة. المقايضة: تحتاج كل لغة إلى تنزيل صوت لمرة واحدة بحجم ~25–60 MB عبر Settings → Voice → Piper TTS → Download voices now، و13 من بين 45 لغة في التطبيق ليس لديها صوت Piper (تلك تعود بصمت إلى Edge TTS).

سير العمل

كيف أترجم مجلدًا كاملاً؟

أفلت المجلد في منطقة الإفلات Translate Document. تُدخل الملفات المدعومة بداخله (تكراريًا) في قائمة الانتظار؛ يتم تخطي كل شيء آخر بصمت. هناك حد أقصى يبلغ 100 ملف؛ الدفعات الأكبر → قسم إلى عدة إفلاتات.

هل يمكنني إيقاف الترجمات مؤقتًا واستئنافها؟

نعم. اخرج من التطبيق في أي وقت — تستأنف مهام Pending / Translating في الإطلاق التالي. نقاط التحقق لكل مهمة تعني أن صفحة PDF رقم 47 من 100 لا يتم إعادتها عند الاستئناف.

هل يمكنني تحرير ترجمة باليد؟

لـ Translate Text — نعم، انقر على الجزء الأيمن واكتب. يتم حفظ التعديل تلقائيًا في سجل تاريخ الإدخال.

لـ Translate Document — افتح الملف المترجم في محررك المعتاد (Word، LibreOffice، إلخ) وحرر هناك. لا يقوم التطبيق بإرجاع التعديلات إلى السجل.

هل يمكنني ترجمة قائمة من السلاسل بشكل جماعي؟

استخدم CLI:

ait *.txt --target French

أو للسلاسل في العملية (مثل سلاسل واجهة المستخدم المستخرجة من الكود)، استدعِ أداة translate_text MCP بقائمة، أو استخدم واجهة برمجة Python مباشرة:

from src.core.llm_engine import translate_text
out = translate_text(texts=["Hello", "World"], target_lang="French")

المسرد

لماذا لا يستخدم LLM المسرد الخاص بي؟

ثلاثة أشياء للتحقق منها:

  1. المجموعة نشطة (مربع الاختيار محدد).
  2. يظهر مصطلح المصدر في المسرد فعلاً في النص المصدر (الضغط لكل استدعاء يرسل فقط لـ LLM الإدخالات التي تطابق نص الدفعة — يوفر tokens، لكنه يعني أن مصطلح مصدر مكتوب بشكل خاطئ غير مرئي).
  3. النموذج قوي بما يكفي — يتجاهل flash-lite أحيانًا التلميحات التي يحترمها flash وpro.

هل تتم مطابقة مصطلحات المسرد بطريقة لا تأخذ علامات التشكيل في الاعتبار؟

نعم. يستخدم كل من البحث في المسرد ومربع البحث في صفحة المسرد دالة تطبيع تجرد العلامات والحالة. لذا فإن cafe وCafé وCAFE كلها تطابق إدخالاً مصدره Café.

الخصوصية

هل تجمعون أي بيانات استخدام؟

لا. ليس لدى التطبيق SDK تحليلات. يستطلع فحص التحديث الاختياري نقطة نهاية إصدارات GitHub واحدة عند بدء التشغيل؛ يمكن تبديله في Settings → General.

هل مفاتيح API الخاصة بي آمنة؟

تُخزَّن في keychain نظام التشغيل الخاص بك (Keychain على macOS، Credential Manager على Windows، Secret Service على Linux). لا تستطيع العمليات الأخرى قراءتها دون إذنك الصريح. الرجوع (عند عدم توفر daemon keychain — عادةً خوادم Linux بدون رأس) هو INI نص عادي تحت دليل تكوين المستخدم؛ في هذا الوضع، تكون المفاتيح محمية بأذونات الملف ولكنها غير مشفرة بطريقة تشفير.