「ゆき」のスキャニング完了し、初の電子化書籍が完成

深夜、昨日半分まで進んでいた「ゆき」のスキャニング作業が完了した。 昨日からのスキャンで、傷んでいた本の糊の部分が壊れて、スキャン作業が却って書籍の寿命を短くしてしまったのは皮肉なことだが、まあ、そもそも見つけて購入した本がぼろぼろの古本だったのだから仕方ないかも知れない。

最終的には、表紙だけがカラー400dpiで、他は全部白黒400dpiでスキャンした。 全部で121ページとなり、サイズは78MB程。 そのうち2MB程度がどうやらOCR分のテキストデータらしい。 完了してからテキストデータ作成のOCRを走らせたら、それだけで30分程もかかってしまったので、今後はOCRは別のマシンでやるようにした方が良さそうだ。 ノートPCの非力なCPUでは、時間がかかってたまらない。