2015年7月17日金曜日

Macのプレビューで透明テキストが扱えるようになったかも

以前書いた「MacのプレビューでPDFの透明テキストが失われる」記事を、意外にも多くの方が読んでくださったようでうれしい。細かいことでも同じ問題で困る人はいるものなのだなあと。

この問題、何度かアップデートしても直っていなかったのだけど、今回 OS 10.10.4 (Yosemite) で試してみたら、直ってるかもとおもったのでメモ。

自炊した本に、OCRをかけて、透明テキストをつける。

すると、「プレビュー」で、ハイライトが引けるようになる。

ハイライトをつけたところだけ一覧することもできる。(出典:山田祥寛『JavaScript本格入門~モダンスタイルによる基礎からAjax・jQueryまで』




そして、保存して終了して、改めて開いても、ちゃんとテキストを選択できる…と思う。以前は、保存して終了したが最後、透明テキストが失われてしまうという不具合があったのが、解消されてる…かも。まだ確信はありませんが、よろしければお試しください。縦書は試してないけど、きっとダメだろうなぁ…

新しい MacBook にして、うれしいのは、本を読みやすくなったこと。Kindleしかり、自炊PDFしかり。Retina になるとこんなにも読む気がするのだなと。あと本体が軽くなったせいもあるかもしれない。

気になったところに線が簡単に引けて、あとで見返せるのは超便利。これがはじめから自分の読書のデフォルトになっていたら何かが変わっていたのではないかと感じる。50年ぐらい遅く生まれて、たいていの本が電子化完了している時代から本を読み始めていたならばと悔やまれてならない。

2015年6月4日木曜日

iPhoneで非破壊自炊

本をばらしてスキャンしてPDFにする「破壊的自炊」をよくする。
それに対して、本をばらさない「非破壊自炊」というのがある。
今回は、iPhone(とMac)だけで非破壊自炊に挑戦したメモ。

必要なもの

なるべく特別なものを使わない方向で。
  • iPhone(他のスマートフォンでも可)
  • 机と椅子(なんでもいい)
  • 何冊かの本(高さ調整のため)
その他、あるといいもの。
  • コンピュータ(MacでもWindowsでも可。なくても可。)
  • 位置の調整ができる照明(デスクライトなど)
きれいにスキャンするなら、スキャナを使うのがいちばん。
フラットヘッドスキャナもいまや超安いけど、
場所ふさぎだし、モノ持ちたくないし。
数枚ならコンビニのコピー機でいいけど、数十枚になると高くつくし。
もっとどうでもいいものをカジュアルにスキャンしたい。

そして、カメラを使うほうがスキャナより速い。
スキャナは、モーターが動くのを待たないといけない。
カメラなら、シャッター一発。

置き方

机(高さ約70cm)の上に、iPhoneを置く。
椅子(座面高約40cm)の上に、本を置く。
iPhoneのふちに本をおいて、重石にする。
すると、だいたい、A4サイズが撮影できる。

机が低い場合は、机の上に少し本を置いて、その上にiPhoneを置く。
机が高い場合は、椅子の上に少し本を置いて、その上に本を重ねる。
机と椅子の高さは人間工学的にほぼ一定なので、
どこでも同じようにできる。世の中よくできてる。

A5の本で、iPhone 6 Plusのカメラで、
左右見開きで撮影しても普通に読める。
左右が同じページでいいならこれで十分。

A5サイズを左右片面ずつ撮りたいなら、椅子の上に少し本を置く。
この場合、あとの作業の都合上、別々に撮ると便利。

左→右→左→右→… と撮影すると位置がずれるので、
左→左→左→… と撮影したあと、本をひっくり返して、
右→右→右→… と撮影する。

ページめくりの手間は増えるが、位置合わせの手間がなくなるので
差し引きではラク。できあがりも綺麗になる。
また、左右別々に位置を調整できるので、
影になる部分や、光の反射の白飛びが発生しにくくなるのもいい。

iPhoneで撮影

スキャナアプリは、いくつか試した結果 CamScanner+ に決定した。
無料版で試してみて、大丈夫そうなら有料版にするといい。

設定はまだよくわからないけど、ひとまず、こうしてみた。
  • [スキャン]→[強化モード設定]
  • [自動処理]自動トリムモード「トリミングをしない」
    自動トリミングはあまりあてにならない。
  • [手動処理]色を鮮明化:「鮮明化」
  • [自動処理]色を鮮明化:「鮮明化」
    鮮明化すると、ScanSnapで白黒モードにしたようなペッタリ感。
    文字だけの本なら「増強」にするのもいい。

連続撮影モードを使う(※)。手でページをめくっては、撮影ボタンを押す。

※自動インターバル撮影アプリで撮影した写真を、カメラロールからインポートすればいい、とはじめ思ったのだけど、CamScannerのバグ?で写真の読込がうまくいかない(2014年11月現在)。ただ、自動撮影だと焦るし、自分には、ぽちぽち押して撮影するのが向いてる気がした。また、CamScannerのカメラで撮るとカメラロールに写真が溜まらないというメリットがある。

撮影後は、メールで送ったり、クラウドに保存したり、なんでもしたい放題。
さすが神アプリ。
GoodReader と同じように、PCから直接 WiFi で接続することもできる。
ファイルサイズが大きい場合はこれが便利。

PDFを加工

PDFを編集。Macならプレビュー。
まず、画像を回転。全ページ選択して、[Command]+[L]/[R]。
次に、トリミング。全ページ選択して、トリミング範囲を選択して、[Command]+[K]。
見開きスキャンの場合はこれで完了。

左右を別ページにしたい場合、左・右を別々にトリミングする。
(「2枚に分けて印刷」すれば一発でできるが、中心位置がずれる場合が多いと思う)
そうしてできた、左右片面ずつのPDFを、右→左→右→左→右→……と交互に並べる。

この作業は、Macのプレビューでも、WindowsならAcrobatでもできるが、
数十ページになるとかったるい。
自動でやってくれる PDF Split and Merge というアプリがある。
Mac版のインストールがうまくいかない……とおもいきや、
Webサービスにしてくれてた。神。"PDF Alternate Mix" がその機能。

これにて完成。あとはご自由に。
私は、まず GoodReader にいれたあと、
ページめくりの快感を得るために、 i文庫 で開いて読みます。

まとめ

まあ、手間といえば手間で、
こんなめんどいことやっとれるか、という人がほとんどだろうけど。
本をばらして自炊をする忍耐力のある人なら、
非破壊自炊も数十ページなら可能な範囲だと思う。
慣れればわりと簡単にできそうだし、
手を抜いて速くするも、手をかけて綺麗にすることもできそう。

他に試したのは Jucie (現在非公開?)。
ページめくりの動作を認識して自動でシャッターを切ってくる。
これは素晴らしいアイデアだとおもうけれど、
自分の環境では動作認識がうまく動かなかった。