My book-scan points

昨今、書籍の電子化とかが流行ってきてブックスキャンとかのサービスがあるようで、自分も以前からしばしば書籍の電子化を自炊していたので、せっかくなのでこれから電子化を考えている方の参考になればと思い、自分なりの方法というかポイントをまとめてみました。

ちなみにこれからスキャン環境などを揃えたい方はこちらのサイトおまえは今までスキャンした本の冊数をおぼえているのか?)のこちらの記事が非常に参考になりますので一度読んでおくことをオススメします。

というのを踏まえた上で。

・Curl DC-210N

・キヤノン DR-150

という組み合わせで裁断&スキャンというのが僕の環境なのですがちょっとしたポイントみたいなものを。まあ数冊やれば気がつく程度のものかもしれませんが。

まずこれから道具などを揃えようと思っている方に。

一般に技術書っていうのは読み物系の本に比べて分厚いです。なので場所と予算が許すのであれば圧倒的にプラスのデカイ裁断機をオススメします。また分厚いというのはつまりページ数が多いということなので、スキャナにもページの重複送りチェック機能が欲しいところ。僕が知っている個人向けのスキャナではScansnap1500くらいしかこの機能ありません。他にもあるのかな。あと、書籍の電子化というのを主目的にする場合は、絶対両面スキャン可能な機種を選ぶべきです。

また、読み物系と技術書の違いとして「読み物は(大抵は)1回読んで終わりだけど、技術書は必要な時に広げることが多い」です。なのでそれを考えてスキャンする必要があります。

ということで個人が揃えられる環境として場所と予算が許すのであれば、プラスの裁断機&ScanSnap1500が最強です。ガチです。

というのを踏まえた上で、以下は僕と似たような環境で(DR-150の代わりにScanSnap1300とか)技術書のスキャンを考えている方のお役にたてば。

【スキャンの設定を自分好みに】

設定は一度自分で模索してみるのがベストですが、下記の「グレースケール&300dpi」というのはそれほど変な設定ではないと思うので、これをベースにいろいろやってみるのをオススメ。

・大抵グレースケールで

元がカラーの場合当然カラーの方がいいですが、当然ファイルサイズが大きくなります。また、逆にモノクロ(2階調)は階調が失われすぎて見づらいです。なのでグレースケールがベスト。当然ですがカラーじゃないと判別できない様な本の場合は除きます。

・OCRをかける

検索するためです。一度読むだけの本ならOCRは不要だと思いますが大抵技術書の場合「あれは確かあの本に書いてあったな」と思って広げる事が多いです。OCRかけない場合に比べて時間は多少かかりますが、使うときの利便性は圧倒的にあがります。ただしソースコードのコピペなどは期待しないほうがいいです。フォントの関係かうまくコピペできないことが多いです。

・300dpiくらいで

これもキレイな方がいいに越したことはありませんが、自分の場合電子化したものをiPhoneやiPadに入れておくことも多いのでファイルサイズはできるだけ小さくしたいです。また解像度上げればスキャンにも時間がかかります。300dpiは自分がスキャンする時間&読む時のことを考えてちょうどいいと思った数字です。

【スキャンをする時のコツ】

電子化の工程で一番面倒&やりたくないのは「スキャンのやり直し」です。「スキャンのやり直し」する場合は大抵ページ抜けとかが起こった時です。なのでそれを防ぐためのポイント。

・裁断前に余計なハガキとかしおりとか挟まっていないことを確認

スキャン中に余計なページの混入をさけるためです。技術書に限ったことではありませんが、結構忘れがち。

・重複送りされないようにするために

これも技術書に限ったことではないですが、多い原因としては「綴じ代が完全に切れていない」「ページがまとめて折れている」「付箋などの糊が残っている」とかです。なので逆に言うとここらへんを気をつけておけば劇的に重複送りは減ります。裁断するときは必要以上に切ってしまわないように綴じ代の部分はできるだけ少なく裁断しがちですが、けっこう余裕があるので気持ち多めに切っても大丈夫です(もちろん先に中身を見てどこまで切っていいか確認した上で)。

あと、たまに裁断の時の圧力で切れ目がくっついちゃってることがあるので、お札やトランプを数える時見たく50Pくらいずつグニグニってして扇状に広げてバラバラにしておくといいです。

・ページ番号=スキャンしたページ数となるようにしておく

重複送りチェクのないスキャナだと放っておくとなかなかページの抜けとかに気が付きません。なのでページ番号がそのままスキャンしたページ数になるようにしておくとページ抜けが無いか簡単に判断できます。目次とかでページ番号がずれる場合は、目次だけ別に分けてスキャンすればOK。分けてスキャンしてもMacの場合プレビュー.appとかで結合できますので問題無し。

・ページ数が多いものは100Pくらいづつに分けてスキャンする

例えば1000Pくらい頑張ってスキャンしてて、最後の方で重複とかでページ数あわなくなったー!確認するの面倒くせー!というのを回避するためです。50PづつくらいでもOK。自分は面倒くさがりなので一度スキャンしたもののチェックとかやりたくない。なので重複送りされないように糊とか折れとか確認しなおしても一回まとめて最後の100Pとか50Pをもう一回全部スキャンします。先のページ番号の方法と合わせてスキャンすればスキャンしたあとにページ抜けの確認とかしなくていいので非常に楽でいいです。先述の通り分けてスキャンしてもプレビュー.appとかで結合できるので問題無し。

====

と、まあこれくらい気をつけておけば。結構いい感じでスキャンできるのではないでしょうか。

なにかのお役にたてば。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

次のHTML タグと属性が使えます: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>