การติดตั้ง¶
สิ่งที่คุณต้องมี¶
- Python 3.12 หรือใหม่กว่า (ดาวน์โหลด)
-
uv — ตัวจัดการแพ็คเกจ Python ที่รวดเร็ว ติดตั้งด้วย:
-
คีย์ LLM API — สิ่งใดสิ่งหนึ่งจาก:
- Google Gemini (มี tier ฟรี — แนะนำสำหรับการเริ่มต้น)
- endpoint ที่เข้ากันได้กับ OpenAI ใดๆ (OpenAI, Anthropic ผ่าน proxy, Ollama / LM Studio ในเครื่อง ฯลฯ)
ทางเลือก แต่ปลดล็อกฟีเจอร์เพิ่มเติม¶
| เครื่องมือ | ใช้โดย | เมื่อใดที่คุณต้องการ |
|---|---|---|
| FFmpeg (ดาวน์โหลด) | คำบรรยาย, เสียง, พากย์, Live | เวิร์กโฟลว์ audio/video ใดๆ |
| LibreOffice (ดาวน์โหลด) | รูปแบบ Office บน Linux/macOS | การแปล .doc / .xls / .ppt รุ่นเก่า หรือไฟล์ Office ใดๆ เมื่อไม่ได้ติดตั้ง MS Office |
| Tesseract (คู่มือการติดตั้ง) | เอนจิน OCR (ค่าเริ่มต้น) | หน้าดึงข้อความ, การแปล PDF ที่สแกน, การแปลภาพที่ฝัง |
| MS Office + pywin32 | Office บน Windows | การแปล Office ความเที่ยงตรงสูงสุดบน Windows |
คุณสามารถติดตั้ง AI Translate ได้โดยไม่มีสิ่งเหล่านี้ — ฟีเจอร์ที่ ต้องการสิ่งเหล่านี้จะแจ้งคุณก่อนที่จะล้มเหลว
ตั้งค่า¶
การกระทำนี้ติดตั้งทุกสิ่งที่จำเป็นในการรันแอปเดสก์ท็อป, CLI และ เซิร์ฟเวอร์ MCP
รัน¶
เพิ่มคีย์ API ของคุณ¶
ครั้งแรกที่คุณเปิดแอปเดสก์ท็อป:
- คลิก การตั้งค่า ในแถบด้านข้าง
- เปิดแท็บ LLM
- วาง คีย์ Google Gemini API ของคุณ (หรือกำหนดค่าผู้ให้บริการที่ เข้ากันได้กับ OpenAI แบบกำหนดเอง) ผู้ใช้ระดับองค์กรสามารถสลับ Gemini เป็น โหมด Vertex AI แทน — ชี้ไปที่โครงการ GCP และ ภูมิภาค เลือกใส่ JSON path บัญชีบริการเป็นทางเลือก ดู ผู้ให้บริการ LLM สำหรับรายละเอียด
- เลือกโมเดลเริ่มต้น — Flash variant ปัจจุบันใดๆ (เช่น
gemini-2.5-flash) เป็นจุดเริ่มต้นฟรีที่ดี Pro variants ให้ คุณภาพที่ดีกว่าด้วยค่าใช้จ่ายที่สูงกว่า - ปิดการตั้งค่า — เสร็จแล้ว
คีย์ถูกจัดเก็บใน OS keychain ของคุณ (macOS Keychain, Windows Credential Manager, GNOME / KDE Secret Service บน Linux) ไม่ใช่ใน ข้อความธรรมดาบนดิสก์
ติดตั้งแบบ headless / เซิร์ฟเวอร์
หากคุณไม่สามารถรันแอปเดสก์ท็อปเพื่อตั้งค่าคีย์ ดู ผู้ให้บริการ LLM สำหรับคำสั่ง CLI ของ keychain