2010/04/21

紙の書籍を電子化して保存する: 書籍のスキャン

機材導入も済みスキャン試験も完了したので、当初の目的である書籍の取り込みを試してみます。

取り込む実験に利用する書籍は『機動戦士ガンダムUC 1 ユニコーンの日(上)』。一般的なマンガ単行本サイズで、約250ページの書籍です(実は表紙とサイズだけ見て、マンガだと勘違いして購入しました)。


サイズ、ページ数的に実験には手頃であり、最悪取り込みに失敗しても、書店で新規購入することが可能かなと...。

まず取り込むためには書籍を裁断しなければなりませんが、裁断機であるPK-513Lは1.5cm程度までの書類しか裁断出来ない仕様になっています。生憎この書籍は1.8cm程あるので、このままでは裁断できません。


そのため、書籍を事前に2分割する必要があります(裁断するために分割する、というのは中々不思議な感覚です)。

分割するには、例えば背表紙上部からカッターを差し込み、下へ向かってゆっくり切ってゆく、という方法があると思いますが、なかなか綺麗に切るのは難しいものであり、また結構な力が必要となります。特に最終目的であるコンピュータ関連の書籍の場合、厚みのあるものも多く、分割作業を何度も繰返さなければなりません。

そこで今回は、各種Blog上でおすすめされている「背表紙に熱をあてノリを溶かすことで書籍を分割する」方法を試してみることにしました。必要な道具は熱風を当てるためのヒーティングガンで、同じくお薦めである白光の「HAKKO883B」を使用します。

プロ用だけあって、大変しっかりした作りです。


ScanSnapと比較するとほとんどサイズに差のないことが分かります。予想以上に大きいです。


これを使って書籍の背表紙糊面に熱をあてます。


焙ること約5分。熱が回ったところで、背表紙をそっと剥がし始めます。呆気無いほど、ヌルリと剥がれてきます。


なお熱を当てる際には、HAKKOサイトの「使い方」にも書いてある通り、対象物から10cm以上離して熱をあてましょう。近くからあてすぎると、こんな感じに焦がしてしまうことに...。


背表紙を剥がした後は、PK-513Lに入る大きさへ分けて裁断します。週刊ダイヤモンドなどよりも厚みがありますが、全く違和感なく、あっさりと裁断できます。

裁断面はこんな感じ。大変綺麗で、もともと裁断されていた側と、全く区別がつきません。


裁断された残りはこんな感じ。画像奥が元々の糊面です。


裁断後は、ScanSnap へ原稿をセットして読み込ませます。一度に25枚(50ページ)程度をセットし、「両面、スーパーファイン、カラー、文字くっきり」の設定で読み込ませました。重送が生じることもなく、25枚(50ページ)を50秒程度で読み込みました。非常に快適です。

読み込ませたあとは念のため、PDFのページ数と、本文のページ数が正しいことを確認しておくと良いでしょう。

最後に、分割生成されたPDFを1つのファイルに纏めます。MacOS X 10.6を利用している場合には、/System/Library/Automator/Combine PDF Pages.action/Contents/Resources/join.pyコマンドなどを使うと簡単です。


% /System/Library/Automator/Combine\ PDF\ Pages.action/Contents/Resources/join.py --output foo.pdf 2010041823*.pdf 

これで電子化することが出来ました。ファイルサイズは約66MBです。後はPCやiPhone、Kindleなど、お気に入りのデバイスで自由に読むことが出来ます。

なお、イメージデータとして生成されたPDFをKindleで閲覧する場合、PDFのサイズを適切に合わせると、より快適に読むことが出来ます。サイズ合わせには、拙作のkdconvを利用すると簡単です。

いろいろな方が、Blog上で情報を公開してくださっているおかげで、書籍の電子化は大変簡単な作業となりました。皆様に感謝しつつ、居住空間確保のためにも、せっせと書籍群の電子化に励みたいと思います。



0 件のコメント:

コメントを投稿