NikkeiBP: JavaScriptで自動文字認識! Microsoftの無料OCRライブラリーを使おう

NikkeiBP: JavaScriptで自動文字認識! Microsoftの無料OCRライブラリーを使おう

JavaScriptからMSの昨日を呼び出せるとは知りませんでした。

 今回は、画像の中に書かれている文字(テキスト)を抽出するプログラムを作ってみましょう。スマートフォンやデジカメで手軽に写真を撮れるようになった昨今では、撮影・スキャンした手書きメモや文字データなどをテキストに変換したい場面が多いのではないでしょうか。

画像の文字認識をするプログラム自体を一から作るのは大変です。Microsoftが提供する「MODI」のOCR機能を利用すれば、JavaScriptから手軽に文字認識を実行できます。今回は、MODIのセットアップと簡単なプログラムを紹介します。

まず、ローカルにOCRのシステムMODIをダウンロードするらしい。(ここが面倒かも)

MODIを利用するために、無料でダウンロード可能な「SharePoint Designer 2007」をインストールする方法があります。

インストールできたら

では、簡単なプログラムを作ってみましょう。サンプルプログラムはここからダウンロード(117-program.zip)できます。以下は、プログラムと同じフォルダに配置した「test.tif」という画像を読み取る例です。

ということでサンプルプログラムの骨格部分だけを抜き出すと、

var doc = new ActiveXObject(“MODI.Document");
doc.Create(filename);
doc.OCR(17); // OCRするとき言語に日本語を指定
var img = doc.Images(0);
var layout = img.Layout;
WScript.Echo(layout.Text);

といった感じらしい。(あくまで記事の内容を写しただけで、まだ試していない!)

結構、面白いかも。