ドキュメントがスキャンされたPDFや画像ベースのJPEG/PNGの場合、コンピュータはその内容を点やピクセルとして読み取ります。内容をコンピュータが文字として認識できるようにするには、OCRツールで機械可読ファイルに変換する必要があります。
1. ファイルをアップロード
ファイルは暗号化された接続で安全にアップロードされるためご安心ください。処理後、ファイルは完全に削除されます。
- コンピュータからファイルをアップロードするには、「PDFファイルをアップロード」をクリックして編集したいファイルを選択するか、ファイルをページにドラッグ&ドロップしてください。
- Dropbox、Google Drive、またはファイルが保存されているウェブサイトからアップロードするには、ドロップダウンリストを展開してファイルを選択してください。
- 無料アカウントでは一度に1ファイルをアップロードできますが、アップグレードアカウントでは一度に10ファイルまでアップロードできます。
2. PDF文書の言語選択
OCR変換は言語を指定した方が最適に動作します。言語に応じて不明な語句も解決しやすくなります。
3. 出力形式を選択して保存
文書を変換するオプションが表示されます - 検索可能なPDF またはプレーンなテキストファイルとしてデータを .txt ファイルに抽出します。 検索可能なPDFは、文字として認識できるコンテンツを含むPDFファイルです。
希望するオプションを選択し、処理を開始するには 「すべてのページでテキストを認識」 をクリックしてください。
処理が完了したら、「ダウンロード」をクリックして変換されたファイルを保存するか、Google Drive または Dropbox アカウントに書類をアップロードすることもできます。
OCR処理の精度
OCR処理を実行する前にドキュメントを圧縮しないことをお勧めします。解像度の高いドキュメントは通常、より良い結果をもたらします。
残念ながら、認識されたテキストが100%正確になることは保証できませんが、これが最良の方法です。
注:ブラウザのキャッシュをクリアするとツールが最適に動作します