Cài đặt¶
Cần chuẩn bị¶
- Python 3.12 trở lên (tải về)
-
uv — trình quản lý gói Python tốc độ cao. Cài bằng:
-
Một API key LLM — chọn một trong:
- Google Gemini (có gói miễn phí — khuyến nghị cho người mới bắt đầu)
- Bất kỳ endpoint tương thích OpenAI nào (OpenAI, Anthropic qua proxy, Ollama / LM Studio chạy local, v.v.)
Tuỳ chọn, mở khoá thêm tính năng¶
| Công cụ | Dùng cho | Khi nào cần |
|---|---|---|
| FFmpeg (tải) | Phụ đề, Giọng nói, Lồng tiếng, Trực tiếp | Bất kỳ tác vụ âm thanh / video nào |
| LibreOffice (tải) | Định dạng Office trên Linux/macOS | Dịch định dạng cũ .doc / .xls / .ppt, hoặc bất kỳ tệp Office nào khi không có MS Office |
| Tesseract (hướng dẫn) | Engine OCR (mặc định) | Trang Trích xuất Văn bản, dịch PDF scan, dịch ảnh nhúng |
| MS Office + pywin32 | Office trên Windows | Chất lượng cao nhất khi dịch Office trên Windows |
Bạn có thể cài AI Translate mà không có cái nào ở trên — các tính năng cần chúng sẽ thông báo trước khi gặp lỗi.
Cài đặt¶
Lệnh trên cài mọi thứ cần để chạy ứng dụng desktop, CLI, và máy chủ MCP.
Chạy thử¶
Thêm API key¶
Khi mở ứng dụng desktop lần đầu:
- Bấm Settings trên thanh bên
- Mở tab LLM
- Dán Google Gemini API key (hoặc cấu hình một custom OpenAI-compatible provider). Người dùng doanh nghiệp có thể chuyển Gemini sang chế độ Vertex AI — trỏ đến project và region GCP, tuỳ chọn thêm đường dẫn JSON của service account; xem Nhà cung cấp LLM để biết chi tiết.
- Chọn model mặc định — bất kỳ biến thể Flash hiện hành nào (ví dụ
gemini-2.5-flash) là điểm khởi đầu miễn phí ổn. Biến thể Pro cho chất lượng cao hơn với chi phí cao hơn. - Đóng Settings — xong
Key được lưu trong OS keychain (macOS Keychain, Windows Credential Manager, GNOME / KDE Secret Service trên Linux), không phải dạng plaintext trên ổ.
Cài đặt headless / server
Nếu bạn không thể chạy desktop app để cấu hình key, xem LLM Providers cho các lệnh keychain CLI.