2014年5月14日水曜日

数式OKのオンラインOCR「Mosha」は日本語力もすごい

オンラインOCRサービスMoshaというのができたそうです。
JPEG・PNGなどの画像を読み取って、テキスト・Word・TeXで出力。
日本語・英語に加えて、数式にも対応。しかも無料。

さっそく試してみました。まずは数式。これが元画像。
ドラッグ&ドロップで認識開始。

結果。おお、完璧。
自分で書いてたのとほとんど同じTeXコマンドが出力されるのが面白い。


Word(doc形式)のファイルとしてダウンロードできる。

もうちょっと複雑だとどうかな。
結果はこんな感じ。


積分範囲の文字のアンダースコアなど、細かい部分も再現されている。
全般に、細部の再現には強い印象。

いっぽう、日本語と記号の混在には弱いかもしれない( U(ん)←U(h) )。
あと、ときどき、数式番号が数式に混ざってしまう。
でもこれは、スクリーンショットを撮るときの工夫で回避できそうではある。

自炊したPDFはどうだろう。(出典:『ファインマン物理学1』岩波書店)

いきなりWordになるのは快感。

数式のOCRは、使いどころが難しいかもしれない。文章とちがって、大雑把では意味が無いことが多いし、ざっくり読み取っておいてあとで検索するという使い方もあまりしないから。そもそも、PDFをまるごと読み込むことは現状できないので、そういう使い方は想定していないのかもしれない。TeX→Word あるいは PDF → TeX / Word 変換のファーストステップとしては使えそう。

あと、数式をOCRで読んでTeXにできるということは、数式の構造を把握できるということだから、たとえば携帯電話で数式撮ってアップロードしたら答えが返ってくるとか、Google Glassで数式見たら答えが見えるとか、似たような構造の式を過去の論文や『公式集』から自動抽出してヒラメキ支援とか、いろいろスゴイことにつながるのかもしれない。

いくつか試すうちに、これ、数式もいいけど、単に日本語OCRとして使える子なのでは、と気がついた。そこで、以前の記事で使ったサンプルを認識させてみた。

認識結果はこんなかんじ。
羊乳から作ったペコリーノチーズ
Peconnoも島の特産だ。 このチーズ
は料理用として、 また、 テーブルチ
--7"として食される。本土では牛乳
からつくられることが多い、 リコッ
タチーズもこの地では羊乳製。滑ら
かでクリーミーな優しい口当たりは
絶品。作りたてのリコッタチーズ

オンラインの日本語OCRサービスを試した中では圧倒的に優秀。
オフラインのOCRソフトの最強レベルにも負けてない。

ということで、Mosha、数式を使わない文章にもおすすめです。

0 件のコメント:

コメントを投稿