2023.03.08

OCRの仕組みを理解して文書をデータ化してみよう!

目次

会社を経営している場合、契約書や見積書などを紙で保管しているケースは少なくありません。

紙保存の場合、セキュリティ面はリスクが少なくなりますが、保管した場所を見つけるのに時間と手間がかかり、
情報化社会と言われる現代では会社の損失になりかねません。

OCRを取り入れれば、そのような悩みは解決します。

ここでは、OCRとは何か、メリット・デメリットを踏まえ、実際の使用方法などを詳しくご紹介します。

OCRとは何なのか

OCRとは光文字認識という意味で、「Optical Character Recognition/Reader」の略です。

手書きの文字や印字文字などを書類の中からスキャンし、デジタルの文字コードに変換してコンピューターで利用できるようにします。

例えば、たくさんの書類を運ばなければいけないとき、OCRを利用すればデータとしてパソコンやスマートフォンに写すことができます。

文字の読み込みはOCRの基本的な機能で、「Word」や「Excel」、「PDF」、「PowerPoint」へ、紙の文書をスキャンして出力することができます。

もう少し詳しく説明すると、OCRは透明なテキストを文字の上に埋め込みが可能で、OCRで処理したファイルを画面で見ても何の違いもありませんが、透明ファイルがあることで文字の検索が可能になっているのです。

つまり、OCRとは、文字をパソコンで読み取れるようにする技術で、
書類を探す際にパソコンに文字を打ち込むことで、検索して見つけられるようになります。

OCRはどのようにして文字コードを抽出するのか

書類の中には、さまざまな言語や図・表などが入り交じっています。

OCRは、書類の文字をどのようにして文字コードに変換しているのでしょうか?そのプロセスを追ってみましょう。

まず、スキャナー(複合機)が書類を画像として読み込みます。

これは、一般的にスキャナーで写真などを読み込むのと同じです。

次に、レイアウトの分析をします。

文書は単純に同じ並び方で文字が並んでいるとは限りません。

段や図・表などが混在したり、コラムや表題があることもあります。
文字と画像を分け、文字のかたまりがどんな並び方をしているかを調べ、自動的に文字のレイアウト処理を行います。

さらに、レイアウト解析が行われた文字のかたまりは、1行1行に分解されます(行の切り出し)。

そして、1行に分けられたものを、1文字まで細かく分けていきます(文字の切り出し)。

分解された1つの文字は、処理がしやすいように拡大や縮小をして一定のサイズに修正されます。

文字がどのような線の構成(たて・よこ・ななめ)になっているかを調べます。

日本語の単語と1文字ずつ照らし合わせ、その特徴とマッチングする文字を探します。
最後に、元の文書と同じ形のフォーマットに変換し、ExcelやWordなどで再利用できるようにします。

OCRのデメリットとメリット

OCRは上述のようにとても便利な機能を持っていますが、メリットだけでなくデメリットもあります。

ここでは、OCRのメリット・デメリットについて詳しくまとめてみました。
デメリット対策をして、より効率良くOCRを活用していきましょう。

OCRのデメリット

OCRは、上述のように文字一つ一つを文字コードに変換し、透明テキストの中に埋め込んでいます。

一般的な画像を保存する場合とは異なり、ファイルのサイズが重くなることがデメリットとして挙げられます。

解決策として、すべての文書をOCRで処理するのではなく、検索頻度が高い重要な書類を優先するなど、できるだけファイルのサイズが小さくなるようにすることが大切です。

OCRメリット

OCRのメリットは、以下のようになります。

まず1つ目は、収納スペースを劇的に小さくすることができることです。

紙で保存していた書類をテキストデータ化することで、オフィスの書類の保管場所という物理的なスペースをなくせます。

さらに、A4一枚(400dpi)の画像データ約2MBがA4一枚(日本語1000字)のテキストデータ約0.003MBになり、
メモリー上の保管スペースもテキストデータ化することで約700分の1に縮小されます。

2つ目は、欲しい情報を素早く取り出せることです。

必要な情報を必要なときに簡単に取り出せることは、仕事の効率化という点でとても重要です。
データファイルとしてテキスト化した書類の情報は、欲しい情報を検索機能を使ってスピーディーに取り出せます。

3つ目は、OCRで書類をデータ化すると、自分がデザインしたいように編集できます。

WordやExcelを使って抽出した文章から表やグラフを作ることも可能ですし、PowerPointでプレゼン資料にすることもできます。

さらに、文書内の表も、最初から表計算ソフトで打ち直さなくてよいので便利です。
文書の情報をデータ化した後に、表計算ソフトを利用できます。

実際にOCRを使って文書をデータ化しよう

OCRを実際に使用するための必要な知識と流れについてご紹介します。

ソフトをダウンロード

OCRを複合機で使用するにはどのようにすればよいのかを以下に説明します。

まず必要なものはソフトで、複合機と連携して使えるものをダウンロードすると、OCRが利用できるようになります。
複合機の中には、直接OCRでスキャンしたデータを処理できるものもあります。

書類をスキャンしてファイル化する流れ

OCRソフトのダウンロードが完了したら、実際にスキャンして文章を自分でファイル化してみましょう。

操作は簡単です。画像をスキャンするときと同じように、紙の文章を複合機でスキャンします。

文章は複合機でデータ化されるので、送信先を決めます。

WordやExcelだけでなく、PDFやPowerPoint・一太郎ファイルなど、OCRソフトと複合機を連携させることで、
実用的なファイル形式に変換することが可能になります。

キヤノンの複合機の場合

キヤノンの複合機を使用する場合、操作方法は以下のようになります。

例えば、キヤノンのOCR「ScanToOffice Pro」に対応している複合機・ ADVANCE C5560の操作手順を見てみましょう。

複合機のフィーダーを開け、原稿台に原稿をセットします。
その際、読み込む画面を下にします。

フィーダーをゆっくりと閉じ、メニューの「スキャンして送信」のボタンを押します。

送信先の指定がスキャンの基本画面に出てくるので、宛先を指定します。

ファイル形式を選ぶ・解像度を選ぶ・原稿の読み取りサイズを設定する・カラースキャン/白黒スキャンを選ぶ・原稿の両面を読み込む・拡大/縮小するなどの設定ができるので、必要に応じて設定します。

スタートボタンを押すと原稿がスキャンされ、送信先に保存されます。

これはキャノンの複合機の場合です。

違うメーカーの複合機はやり方が異なるので、各メーカーサイトで確認して操作をするようにしましょう。

OCRで文字を正しく認識させるには?

OCRは文字をデータ化できますが、中には認識しづらいものもあります。
どのような文字が認識しにくいのかを知り、工夫して認識率が上がるように気を付けましょう。

認識しづらい文字に注意

具体的に、OCRが認識しづらい文字には以下のようなものがあります。

かすれている文字やカラーの文字、ななめになっている原稿の文字、いろいろな言語が混ざっている文章、文字と文字の間が狭い、背景と文字のコントラストが低かったり網掛けされている文字、横書きや縦書きが混在している文字、手書きされた文字などです。

認識率を上げる方法

このように、原稿の条件によって、OCRの文字認識率は低くなります。

認識しやすくするためには、以下のような方法があります。

ファインからスーパーファイン(200~300dpi)の高い解像度でスキャンをすると、低い解像度のときよりも認識しやすくなります。

かすれている文字やカラーの文字(例えば、背景が白で文字が黄色など)は背景との明度差が低いので、
白黒でスキャンして背景との明度差をつけます。傾きを補正したり、コントラストをつけることも有効です。

その他に、雑誌や新聞紙などは裏移りがしやすいので、これをなくすことで認識されやすくなります。

OCRで仕事の効率化をしよう

OCRの概要などについての説明でした。

会社で複合機にOCRを取り入れてペーパーレス化を進めると、書類の収納スペースを省くことができます。

それだけでなく、欲しい情報をいつでもスピーディーに取り出すことができ、仕事の効率化を図れるなどたくさんのメリットが生まれます。

便利なOCRを複合機に導入してみてはいかがでしょうか。