2014.02.10

OCR機能の活用方法と効果的な使い方

目次

豊富な複合機の機能の中には、「OCR」というものがあります。
手書き文字や印刷された文字をスキャナなどで読み取った後、コンピュータが利用できるデジタルの文字コードに変換する技術のことで、スキャンした文書を本体の内部でOCR処理をすることができる機能がある複合機の機種もあります。
今回は、このOCR機能の使い方について見てみましょう。

OCRって何?

OCR(オーシーアール)とは、「Optical Character Recognition/Reader」のことで、光学的文字認識と訳されるものです。

スキャナやデジタルカメラなどで読み取った手書き文字や印刷された文字が、文字コードに変換されて、コンピュータで文字認識できるのです。

その仕組みとしては、新聞をOCR化するのを例に挙げてみましょう。

新聞をスキャナ機能で画像として取り込んだら、まずレイアウト解析が行われます。

画像と文字領域を分離して、文字のかたまりがどのように配置されているかを解析して、文字認識する順番を決める処理をします。

具体的には、一行一行に分離する行の切り出し、さらに切り出された行から1文字ずつに分解する処理、そして、分解された文字が何の文字かを認識する処理です。

この文字認識の過程では、文字を一定の大きさに拡大・縮小する、特徴を抽出する、合致する文字を探してマッチングさせるという作業が行われます。

また、最後に前後の文字列の候補と、日本語の単語情報とが照合されることで、最終的に文字認識が達成されます。

複合機でもOCRが可能!

複合機でも、このOCR機能を使用できる機種があります。

例えば、複合機と連携させて使うことのできるOCRソフトです。複合機でスキャンした紙文書が内部で画像ファイル化して、指定したパソコンへ送信してくれます。

また、ソフトウェアと連携させることによって、WordやExcel、PowerPointのファイルや、PDFファイル、一太郎ファイルなど実用性の高いファイル形式に変化することができます。

全文検索をしたい紙文書をドキュメント化、PDF化して検索をかけることも可能です。

通常、複合機でOCRを行うためには、このような専用のソフトが必要になることがありますが、専用のOCRソフトがない場合でも、スキャンデータを直接OCR処理することができる機種も出てきています。

ぜひ業務効率化のためにOCR機能を使ってみましょう。