オンラインOCR
オンラインで利用できる無料のOCRテキスト認識ツール。画像からテキストを抽出できます。
オンライン OCR について
ブラウザ内で完全に動作する Tesseract.js を使用して、画像からテキストを抽出します。アップロード、ドラッグ&ドロップ、クリップボードからの貼り付け(Ctrl+V)で任意の画像を受け付け、10 種類の認識言語(英語、簡体字中国語、繁体字中国語、日本語、韓国語、フランス語、ドイツ語、スペイン語、ロシア語、アラビア語)に対応しています。
使い方
1. ドロップゾーンをクリックするか、画像をドラッグする、またはクリップボードから貼り付けます。 2. ドロップダウンから認識言語を選択します。 3. Recognize をクリックし、プログレスバーを確認します。 4. 抽出されたテキストと信頼度スコアを確認し、Copy をクリックします。
言語と信頼度
言語パックは Tesseract.js がオンデマンドで取得するため、ある言語の初回実行時にはその学習データがダウンロードされ、時間がかかる場合があります。結果カードにはテキストと共にエンジンの信頼度パーセンテージが表示されます。信頼度が低い場合は、通常、ソース画像がぼやけている、コントラストが低い、または装飾的なフォントであることを意味します。
▶初回の認識が遅いのはなぜですか?
Tesseract.js は初回使用時に言語モデル(例:eng.traineddata)をダウンロードし、その後キャッシュします。同じ言語での後続の実行はより高速になります。
▶認識精度が低いのはなぜですか?
一般的な原因:ソースがぼやけているまたは低解像度、背景が複雑、通常とは異なるフォント、手書き文字。シャープで明るく、コントラストの高い画像を使用し、正しい言語を選択してください。
▶1 枚の画像で複数言語を認識できますか?
いいえ。ドロップダウンでは一度に 1 つの言語のみ選択できます。多言語が混在するテキストの場合は、言語ごとに 1 回ずつ認識を実行してください。
▶画像はサーバーにアップロードされますか?
いいえ。OCR はブラウザ内の Tesseract.js によりローカルで実行されます。ネットワーク経由で取得されるのは言語モデルのみで、画像がデバイスから離れることはありません。
このツールがあなたに役立ったなら、私にコーヒーをご馳走することをお勧めします。
私にコーヒーを買ってください。