2013年6月15日土曜日

OCRサービスを比べてみた

オンラインの日本語OCRサービスを探してWebをさまよった。
結論からいうと、まだ厳しい。

けど、オンラインで使えるとめちゃ便利。笑えるほど便利。
iPhoneのSiriみたいな未来感、コンピュータすごい!感がある。
ぜひ早く実用レベルのものが登場してほしいと願う。

サンプルはこれ。紙をスキャンしたものをスクリーンショットしたもの。
背景に色があるし、厳しめの条件かもしれない。



上2つがオンラインのOCRサービスによる出力。
下2つはオフラインのOCRソフトによる出力。

Google Docs

使い勝手は夢のようにすばらしい。信じがたいほど速い。縦書きも対応。

これで結果がよければ…
日本語入力を作成したチームが本気出して作ってくれれば…
日本語圏でOCRが日常になるにちがいない。今後に期待。

韓Lヵ`らイ伯っアこべコリ一ノチ一ス`
P離。nn。も島の特産アご。 このチーズ
ーま料王蹄として、 まアこ` テ一フ‾丿レチ
一ズ'と して食される。 本土でーま牛享L
カ丶らつくられることカゞ多しゝ、 リコッ
夕チ一ズもこの地でーま罫園。 云骨ら
カ丶でクリーミーな{憂しし丶囗当アこりーま
絶品。 イ竿りアこてのリコッ夕チ一ス‾

i2OCR

多言語OCR Webサービス。
http://www.i2ocr.com/

エンジンはGoogleとおなじか。

韓Lヵ`らイ伯っアこべコリ一ノチ一ス`
P離。nn。も島の特産アご。 このチーズ
ーま料王蹄として、 まアこ` テ一フ‾丿レチ
一ズ'と して食される。 本土でーま牛享L
カ丶らつくられることカゞ多しゝ、 リコッ
夕チ一ズもこの地でーま罫園。 云骨ら
カ丶でクリーミーな{憂しし丶囗当アこりーま
絶品。 イ竿りアこてのリコッ夕チ一ス‾

Adobe Acrobat (Ver. 9)

おそらく最もよく使われている日本語OCRであろうAcrobat。

羊乳かう作ったベコリーノチーズ
Pecorinoも島の特産だ。このチーズ
は料理用として、また、テーブルチ
ーズとして食される。本土では牛乳
か5っくうれることが多い、リコッ
タチーズもこの地では羊手l製。滑ら
かでクリーミーな優しい口当たりは
絶品。作りたてのリコッタチーズ

RealReader (Lite)

http://data-digital.sakura.ne.jp/RealReaderLiteTop.html
Windows用OCRソフト。お値段も良心的。2週間お試し無料。
羊乳から作ったペコリーノチーズ
Peconnoも島の特産だ。このチーズ
は料理用として、また、テーブルチ
ーズとして食される。本土では牛乳
からつくられることが多い、リコッ
タチーズもこの地では羊乳製。滑ら
かでクリーミーな僅しい口当たりは
絶品。作りたてのリコッタチーズ

OCRの精度が上がるのはいいけど、高精度なテキストの中に
「僅しい」→「優しい」みたいな微妙な間違いがあると、
人間が直すのは大変。
このへんを、Google先生が、日本語入力の技術で、
どうにかしてくれたらなぁと願う。

2014/5 追記:より精度の高いMoshaがサービス開始。レビューはこちら