テキスト抽出¶
画像からテキストを取り出します — レシート、スクリーンショット、撮影した
ドキュメント、スキャンしたページ、何でも。出力は .txt(プレーン)
または .docx(書式付き段落)。
このページは翻訳しません — 抽出するだけです。翻訳もしたい場合は 出力をドキュメント翻訳に流します。
2 つの抽出方法¶
| 方法 | 最適 |
|---|---|
| OCR | 大量 / バッチ / コスト重視(画像あたり無料またはほぼ無料) |
| LLM ビジョン | レイアウト保持、混合スクリプト、低品質画像、手書き |
デフォルトを 設定 → テキスト抽出 → 抽出方法 で選択。
OCR エンジン(OCR 方法)¶
| エンジン | コスト | オフライン | 言語 | 備考 |
|---|---|---|---|---|
| Tesseract | 無料 | はい | 100+ | デフォルト。システムインストールが必要。 |
| EasyOCR | 無料 | はい(モデルダウンロード後) | 80+ | 非ラテンスクリプトに最適。~1 GB のモデル。 |
| Google Cloud Vision | 有料(月 1,000 枚無料) | いいえ | 60+ | 最高精度。 |
設定 → OCR で構成。
ステップ¶
- サイドバーの テキスト抽出 をクリック。
- 画像ファイルを 1 つ以上ドロップ(
.png、.jpg、.jpeg、.bmp、.webp、.tiff、.tif)。 - ソース言語 を選択(OCR が正しいモデルを選ぶのに役立ちます)。
- 出力形式 を選択 —
.txtまたは.docx。 - 抽出 をクリック(または
Ctrl+Enter)。 - 完了したら行で 開く をクリック。
どちらをいつ使うか¶
- テキストが多いレシート / 請求書 → Tesseract は高速で正確。
- 撮影された手書きのメモ → LLM ビジョンが大きな差で勝ち。
- マンガ / コミックのコマ → EasyOCR(縦書き CJK テキストを上手く扱う)。
- 多くの小さなフィールドを持つフォーム → Google Cloud Vision は 他より良くフィールド境界を保持する傾向。
ヒント¶
OCR または LLM、両方ではない
ページは 1 つの方法を選んで実行します。出力を比較するには、 同じ画像を異なる方法で 2 回実行してください。
セットアップが必要なダイアログ
OCR を選んだが OCR エンジンが構成されていない(または LLM だが LLM キーが構成されていない)場合、ページは関連する設定タブに 直接リンクする「セットアップが必要」ダイアログを 1 つ表示します。
ショートカット¶
| ショートカット | アクション |
|---|---|
Ctrl+Enter |
抽出 |
Ctrl+O |
参照 |
Ctrl+F |
履歴検索にフォーカス |