انتقل إلى المحتوى

الترجمة الفورية

ترجمات وتسميات في الوقت الفعلي من الميكروفون أو صوت النظام أو كليهما — مع نافذة overlay اختيارية دائمة في الأعلى بحيث تجلس التسميات فوق أي شيء تشاهده.

ما يمكنك فعله

  • تسميات اجتماعات حية — ضع تسميات على مكالمة Zoom / Meet / Teams بلغة أخرى دون الانضمام كروبوت ترجمة.
  • تعلم اللغة في الوقت الفعلي — ضع تسميات على محتوى بلغة أجنبية (أفلام، بودكاست، محاضرات) مع لغتك الأم كمسار ترجمة.
  • ترجمات على مستوى النظام — التقط صوت النظام حتى يمكنك ترجمة YouTube / Netflix / أي شيء يُشغَّل على مكبرات الصوت.

ما تحتاجه

  • FFmpeg على PATH — راجع إعداد FFmpeg.
  • خلفية STT، واحدة من:

    • faster-whisper — محلي، دون اتصال، مجاني، افتراضي
    • Soniox — سحابي، مدفوع، تمييز المتحدثين الفوري. راجع إعداد Soniox.
  • لـ التقاط صوت النظام، يتم اختيار الخلفية الصحيحة لكل OS تلقائيًا: Linux يستخدم parec (PulseAudio / PipeWire)، Windows يستخدم WASAPI loopback الأصلي (لا يوجد برنامج إضافي في معظم الحالات)، macOS يستخدم ffmpeg -f avfoundation ضد جهاز loopback افتراضي (BlackHole / Loopback / إلخ). يظهر شريط تحذير مضمن مع روابط تثبيت قابلة للنقر إذا كان شيء مفقودًا. راجع Setup → System audio لتعليمات تثبيت كاملة لكل OS.

خطوة بخطوة

  1. انقر الترجمة الفورية في الشريط الجانبي.
  2. قم بالتكوين مرة واحدة في Settings → Live:

    • لغة المصدر (اللغة المنطوقة)
    • لغة الهدف (أو اتركها فارغة للنسخ فقط)
    • مصدر الصوت: ميكروفون / صوت النظام / كلاهما
    • طريقة STT: Whisper / Soniox
  3. مرة أخرى في صفحة Live، انقر بدء (Ctrl+Enter).

  4. يملأ النص الجزء الرئيسي بطاقة بطاقة. تعرض نافذة Overlay العائمة أيضًا التسميات (اسحبها أينما تريد).
  5. انقر إيقاف لإنهاء الجلسة.

عرض النص

اختر تخطيطًا في شريط الأدوات:

  • كلاهما مكدس — الأصل + الترجمة، أحدهما فوق الآخر
  • كلاهما جنبًا إلى جنب — الأصل على اليسار، الترجمة على اليمين
  • الأصل فقط / الترجمة فقط

تستخدم أزرار شريط الأدوات لاحقات ON / OFF للحالة في لمحة — مثل TTS ON، TTS OFF، Timestamps ON، Overlay OFF.

قم بتبديل timestamps بأيقونة الساعة. قم بتبديل تشغيل TTS للأسطر المترجمة بأيقونة مكبر الصوت. يحترم اختيارك في Settings → Voice → TTS method — Edge TTS (افتراضي)، ElevenLabs، Google Cloud TTS، Gemini TTS، أو Piper TTS (دون اتصال بالكامل). مع تحديد Piper، تعود الأصوات المفقودة لكل لغة بصمت إلى Edge TTS في منتصف الدفق — لا يوجد فحص قبل التشغيل modal على هذه الصفحة، نظرًا لأن حظر التدفق المباشر بحوار تنزيل سيكون أسوأ من العودة.

نافذة Overlay

نافذة أداة قابلة للسحب وقابلة لتغيير الحجم ودائمًا في الأعلى. الاختصارات:

الاختصار الإجراء
Ctrl+[ / Ctrl+] تقليل / زيادة الشفافية
Ctrl+Arrow نقل overlay
Ctrl+0 / Ctrl+9 تكبير / تصغير

تستمر الموقع والحجم والشفافية وحجم الخط بين الجلسات.

المزامنة المباشرة مع الإعدادات

يعمل حجم الخط والشفافية في الاتجاهين: سحب شريط حجم الخط أو الشفافية في الإعدادات → الترجمة المباشرة → إعدادات التراكب يحدّث التراكب المفتوح فوريًا، والعكس بالعكس — الضغط على + / - / Ctrl+[ / Ctrl+] داخل التراكب يحدّث شرائط الإعدادات. لا حاجة لإعادة فتح التراكب.

العنصر النائب للحالة الفارغة

قبل التقاط أي صوت يعرض التراكب عنصرًا نائبًا ("اضغط ابدأ..." في وضع الخمول / "جارٍ الاستماع..." بعد الضغط على ابدأ) يعكس الحالة الفارغة للنافذة الرئيسية — يتبدّل بالتزامن مع شارة الحالة الجارية. يتكيّف العنصر النائب مع عرض × ارتفاع التراكب الحالي ليبقى مقروءًا في أي حجم نافذة.

وضع التسميات التوضيحية المبسّطة

خانة الاختيار عرض تسميات توضيحية مبسطة في الإعدادات → الترجمة المباشرة → إعدادات التراكب تُخفي شرائح الطابع الزمني والمتحدث على التراكب مع إبقائها مرئية على النافذة الرئيسية. مفيد عند مشاركة التراكب مع جمهور (وضع المقدّم / مشاركة الشاشة) مع رغبتك في الاحتفاظ بالبيانات الوصفية الكاملة في عرض العمل لديك. هذا التبديل خاص بالتراكب فقط — لا يغيّر تفضيل "تسميات المتحدث" للنافذة الرئيسية.

احفظ النص

انقر حفظ النص لتصدير الجلسة إلى ملف .txt مع الطوابع الزمنية والمتحدثين والأسطر الأصلية والأسطر المترجمة.

اختيار خلفية STT

Backend الأفضل التكلفة الكمون
Whisper (محلي) دون اتصال، حساس للخصوصية مجاني متوسط (~1 ثانية بعد نهاية الجملة)
Soniox اجتماعات متعددة المتحدثين مدفوع (~$0.005 / دقيقة) منخفض (في الوقت الفعلي)

محاذير

اختيار الميكروفون

يستخدم إدخال الميكروفون دائمًا جهاز OS الافتراضي — لا يوجد منتقي داخل التطبيق (sounddevice يعرض الكثير من ملحقات ALSA الافتراضية ليكون مفيدًا، ويمتلك OS بالفعل واجهة المستخدم للميكروفون الافتراضي). قم بتعيين الميكروفون المفضل لديك في إعدادات صوت OS قبل البدء.

ضغط TTS

قائمة انتظار TTS محدودة بأحدث 3 جمل — يتم إسقاط الصوت الأقدم في قائمة الانتظار إذا تأخر التركيب. هذا يبقي التشغيل المنطوق قريبًا من التسميات على الشاشة.

ElevenLabs بدون مفتاح

إذا قمت بتعيين طريقة TTS إلى ElevenLabs لكن لم يتم تكوين أي مفتاح API، فإن صفحة Live تعود تلقائيًا إلى Edge TTS وتعلن عن العودة في تسمية الحالة.

الاختصارات

الاختصار الإجراء
Ctrl+Enter بدء / إيقاف
Ctrl+K مسح السجل (مع التأكيد)
Ctrl+[ / Ctrl+] ضبط شفافية overlay