OCRの取り込みのポイント :: 事例紹介

今日は市内某所へ行く。

天候がよく、海岸の砂浜は白波と海のコントラストが美しかった。

何もなければ、のんびりするのだが・・・そんな余裕もなく、現地へ向かう。

スキャンがうまくいかないというお客さんの相談で

設定を確認すると、解像度が300と低く、認識率が悪い事が判明。

その後、最大解像度である1200まであげて再度行ったところ、無事に読み込めた。

この解像度って何か?

数字が高い方がよく、低いのは駄目と思いがちですが

実は、用途によって使い方が違うのです。

解像度の単位はDPI(Dot per Inch:ドットパーインチ)と呼び、1インチ×1インチ(約2.5センチ)あたりに、ドット(点)を何発打ち込むかという事です。

解像度というのは、点の密度がどの程度か?ということです。

そのため、ドットが増えれば、情報量が増大し詳細なデータとなります。パソコンの性能が低いと処理不能となるため、安易に増やす事もできません。

一方で、ドットを減らすと、情報量は減少しますが、取り込むデータは粗くなるため、これもおすすめできません。

OCR(手書き文字をPCで認識する手法:Optical Character Readerの略)の場合は、解像度をめいっぱい上げなければ、詳細な情報を取り込む事ができないため、低解像度しか対応していない機器の場合は精度が下がってしまう事になります。

普段はCPUやメモリといったものは、「動く程度なら別によい」と常々申し上げてます。

しかし、このような特殊作業を行うときは、CPUとメモリの性能で大きく左右される事も確かです。

幸い、基本性能がよかったこともあり、大事に至りませんでした。

うまく取り込めないときは、解像度が正しく設定されているか確認してみるといいと思います。

ちなみに、ファクスは 平均200dpiです。

OCRで使う解像度は最低600dpiは必要です。