フリーの高機能画像認識 SmartOCR Lite

| | トラックバック(0)

・SmartOCR Lite
http://www.smartread.biz/index.htm
SmartOCRLite104.jpg

フリーソフトでは珍しい高機能な画像認識ソフト(OCR)。スキャナで読み取った文書データや、デジカメの画像、Web上の画像ファイルなどから、文字列を自動検出し、テキストデータとして抽出することができる。ルビや表組など複雑な背景も解析するのが特徴。
機能を強化した商用版もあるのだが、フリーのLite版でも一般的な利用者にとって必要十分な仕様になっている。読み取ったデータは、画像と一緒もしくはテキストのみのデータとして、PDF、ワード、エクセル、HTML、CSV、テキスト形式でのファイル保存が可能だ。
装飾が多い新聞の折込みチラシの画像を読み込ませてみたら、想像以上にうまくテキストを拾い上げることができた。ニューラルネットワーク、遺伝的アルゴリズムを使った高精度な認識が特徴。誤認識した場合にも、レイアウトを調整するなどして、読み取り精度を調整する機能がたくさん搭載されている。

ふだん、あまりOCRは使わないのだけれども、ブログで活用するとしたら、どんなものがあるだろうと考えてみた。

・プロジェクター投影された講演スライドの写真からデータを抽出する
・製品の紙の説明書からテキストを抽出してデジタルで再利用する
・マンガの吹き出しからテキストを抽出してブログネタにする

画像認識、音声認識、自動翻訳など、従来精度が問題とされたソフトウェアも、近年、精度が高くなってきたようで、動向を常にチェックしている。特にアナログ→デジタル変換を行うツールをうまく使いこなせれば、相当のPC作業の効率化、差をつけること、につながりそうである。

トラックバック(0)

このブログ記事を参照しているブログ一覧: フリーの高機能画像認識 SmartOCR Lite

このブログ記事に対するトラックバックURL: http://www.ringolab.com/mt/mt-tb.cgi/1883

このブログ記事について

このページは、daiyaが2005年12月29日 23:59に書いたブログ記事です。

ひとつ前のブログ記事は「このブログがすごい! 2006」です。

次のブログ記事は「ƒfƒBƒAƒXƒ|ƒ‰」です。

最近のコンテンツはインデックスページで見られます。過去に書かれたものはアーカイブのページで見られます。

Powered by Movable Type 4.1