コンテンツにスキップ

テキスト抽出

画像からテキストを取り出します — レシート、スクリーンショット、撮影した ドキュメント、スキャンしたページ、何でも。出力は .txt(プレーン) または .docx(書式付き段落)。

このページは翻訳しません — 抽出するだけです。翻訳もしたい場合は 出力をドキュメント翻訳に流します。

2 つの抽出方法

方法 最適
OCR 大量 / バッチ / コスト重視(画像あたり無料またはほぼ無料)
LLM ビジョン レイアウト保持、混合スクリプト、低品質画像、手書き

デフォルトを 設定 → テキスト抽出 → 抽出方法 で選択。

OCR エンジン(OCR 方法)

エンジン コスト オフライン 言語 備考
Tesseract 無料 はい 100+ デフォルト。システムインストールが必要。
EasyOCR 無料 はい(モデルダウンロード後) 80+ 非ラテンスクリプトに最適。~1 GB のモデル。
Google Cloud Vision 有料(月 1,000 枚無料) いいえ 60+ 最高精度。

設定 → OCR で構成。

ステップ

  1. サイドバーの テキスト抽出 をクリック。
  2. 画像ファイルを 1 つ以上ドロップ(.png.jpg.jpeg.bmp.webp.tiff.tif)。
  3. ソース言語 を選択(OCR が正しいモデルを選ぶのに役立ちます)。
  4. 出力形式 を選択 — .txt または .docx
  5. 抽出 をクリック(または Ctrl+Enter)。
  6. 完了したら行で 開く をクリック。

どちらをいつ使うか

  • テキストが多いレシート / 請求書 → Tesseract は高速で正確。
  • 撮影された手書きのメモ → LLM ビジョンが大きな差で勝ち。
  • マンガ / コミックのコマ → EasyOCR(縦書き CJK テキストを上手く扱う)。
  • 多くの小さなフィールドを持つフォーム → Google Cloud Vision は 他より良くフィールド境界を保持する傾向。

ヒント

OCR または LLM、両方ではない

ページは 1 つの方法を選んで実行します。出力を比較するには、 同じ画像を異なる方法で 2 回実行してください。

セットアップが必要なダイアログ

OCR を選んだが OCR エンジンが構成されていない(または LLM だが LLM キーが構成されていない)場合、ページは関連する設定タブに 直接リンクする「セットアップが必要」ダイアログを 1 つ表示します。

ショートカット

ショートカット アクション
Ctrl+Enter 抽出
Ctrl+O 参照
Ctrl+F 履歴検索にフォーカス