テキスト抽出¶

画像からテキストを取り出します — レシート、スクリーンショット、撮影したドキュメント、スキャンしたページ、何でも。出力は .txt(プレーン) または .docx(書式付き段落)。

このページは翻訳しません — 抽出するだけです。翻訳もしたい場合は出力をドキュメント翻訳に流します。

2 つの抽出方法¶

方法	最適
OCR	大量 / バッチ / コスト重視(画像あたり無料またはほぼ無料)
LLM ビジョン	レイアウト保持、混合スクリプト、低品質画像、手書き

デフォルトを 設定 → テキスト抽出 → 抽出方法 で選択。

エンジン	コスト	オフライン	言語	備考
Tesseract	無料	はい	100+	デフォルト。システムインストールが必要。
EasyOCR	無料	はい(モデルダウンロード後)	80+	非ラテンスクリプトに最適。~1 GB のモデル。
Google Cloud Vision	有料(月 1,000 枚無料)	いいえ	60+	最高精度。

設定 → OCR で構成。

OCR または LLM、両方ではない

ページは 1 つの方法を選んで実行します。出力を比較するには、同じ画像を異なる方法で 2 回実行してください。

セットアップが必要なダイアログ

OCR を選んだが OCR エンジンが構成されていない(または LLM だが LLM キーが構成されていない)場合、ページは関連する設定タブに直接リンクする「セットアップが必要」ダイアログを 1 つ表示します。