※LinX Express は、日頃お付き合い頂いているお客様、展示会やセミナー等でお名刺を戴いた方、また、雑誌やホームページから引合を戴いた事のあるお客様へ配信させて戴いております。

 
 
自作フォントによる文字認識

画像上の文字を読み取るOCRの機能は、チップ上の印字検査やロット番号読み取りなど様々な分野で活用されています。この様々なニーズにこたえるためHALCONでは200万もの実サンプルを用いたフォントデータを標準で提供し、文字認識アプリケーションのスムーズな開発に貢献してきました。一方、特殊な形状の文字を読んだり、読み取る文字の種類を限定したいといった要求から、フォントデータを自作したいという声もあります。

HALCON 11では、この柔軟なOCR開発をスムーズに行うトレーニングファイルブラウザ機能が実装されました。LinX Expressでは今後2号にわたって、この機能を紹介します。

  今号:OCRトレーニングファイルブラウザを用いた文字データの登録
  次号:OCRアシスタントによるOCRトレーニングフォント作成(予定)

 
 
OCRトレーニングファイルブラウザ

HALCON 11では、HDevelop上でOCR用のフォントデータを管理するツールとして、OCRトレーニングファイルブラウザが用意されました。従来のOCRでは、標準でインストールされるトレーニング済みのフォントセットを利用するか、プログラムによりフォントセットを自作する必要がありました。本機能を利用することで、簡単なマウス操作のみで文字データの登録・管理の高尚な機能を視覚的に行うことが可能です。

 

図1. OCRトレーニングファイルブラウザ

OCRトレーニングファイルブラウザでは次のようなメリットが得られます。

1.システムフォントを利用
使用PC内の任意のシステムフォントをマウス操作で簡単に利用することが可能です。アプリケーションのフォントデータがあれば、容易にOCR用のトレーニングフォントを自作することが可能です。

2. 文字の選択
トレーニングファイルブラウザでは、フォントセットに含める文字を任意に選択することが可能です。HALCONが標準で提供しているトレーニング済みのフォントセットでは、読み取り可能な文字がフォントセットごとに決まっています。実際のアプリケーションでは、読み取る文字を限定したいケースや、読み取りたい文字が標準フォントセットに含まれていないケースも考えられます。例えば前者のケースでは、読み取りが必要な文字のみを選択しトレーニングフォントを作成することで、認識率を飛躍的に高めることが可能です。

3. 文字の自動変形
認識精度の高いトレーニングファイルを作成するには、1つの文字に対して大量のサンプルが必要になります。本機能では"局所変形"、"文字線幅"といった変形の種類を指定するだけで、1サンプルから自動で大量のサンプルを生成することが可能です。これにより、作業工数を大幅に削減しつつ認識精度の高いトレーニングフォントが作成可能です。


下図はOCRトレーニングファイルブラウザを用いたシステムフォントからの文字データの登録の流れを示しています。従来では下記機能を実現するためには膨大なコーディングが必要でしたが、わずか1分足らずで文字データの登録をグラフィカルに行うことが可能です。

OCRトレーニングファイルブラウザアイコン

 

図2. OCRトレーニングファイルブラウザを用いた文字登録の流れ

次号では、上記の文字セットから文字識別に必要なトレーニングファイルを作成する手順について紹介します。

※LinX Express 配信の中止・アドレスの変更をご希望の方は、お手数ですが右の「ご登録内容変更」よりお問い合わせください。