自炊するのに ScanSnap1500M を買ってしまった私は負け組。

残念ながら自分はまったくの情弱だったようだorz 理由は、

  1. ScanSnap Manager の OCR は認識がよくない(特にアルファベット、カタカナ混在の技術書)
  2. 同梱の Adobe Acrobat の ClearScan による OCR 認識を使った方が断然いい(らしい)
  3. Acrobat の ClearScan 搭載はバージョン 9 以降
  4. SnanSnap1500M 同梱の Acrobat は、なぜかバージョン 8

下位モデルの購入者ですら2年も前に無償アップグレードキャンペーン実施しているというのに。こんなことならS1500買ってBootCampから自炊した方がずっとマシだった...なんか急速に自炊熱醒めてきたなー。とりあえず未だにバンドルが8とか、ありえない話だと思うのでPFUに問い合わせしといた。HHKだってLite2とPro2合わせて三台持ってるんだし、お得意様なめんなコラ。なんか地震以来クレーマーだな私...エンドユーザのが伝染ってきたんだろうか。

本を自炊スキャンするとき、溶けた糊の匂いを吸うと喉によくないみたい

先週書籍の自炊作業をやったあとに喉風邪をひいた。その時は寒い日に冷える格好で寝たからだと思っていたが、ほぼ治ってから今日また自炊作業するとまた喉がいがらっぽい。
多分アイロンで溶かした糊の匂いを吸いまくったからだろう。今後はマスクしなければ。

ScanSnapで厚めの技術書を自炊するコツがつかめてきた(裁断器不使用)

ゴールデンウィークの終わりに ScanSnap1500M を買って、いきなり数冊の技術書を自炊してみた。最初のうちは失敗したものもあるが、それなりに骨がつかめてきたのでメモ。骨といってもスキャンしたPDFの品質を上げるものであって、作業時間を短縮するものではないのだけど。

分厚い本が中心なら裁断器は不要

前もって職場にある事務用の手動裁断器で薄めの冊子をテスト裁断してみて判断したことだが、職場の裁断器は使い込まれていて刃が摩耗しているとはいえ、言うほど切れ味はよくない。10枚程度ならそりゃ綺麗には切れるが、スキャンしたいのは数百ページの技術書なので、役に立つとは思えない。文庫とか漫画も沢山あって部屋の場所をとっているけど、それらまでスキャンしようとはまだ思っていない。
あとこれは自分の性格だけど、裁断の作業って意外と楽しいので、まだあまり苦にならないんだよね。モノを分解するのが好きなので。

背表紙をバラすのは普通にアイロンで

アイロンで背表紙の糊を溶かす。背表紙の接着と裏表紙のちょっといい紙の接着に使ってあるのは別種の糊のようだ。前者は熱でムニュッてチーズフォンデュみたいに溶けるまでアイロンをあてる。直接当てると背表紙が焦げて変色するからキッチンペーパを挟む。後者は溶けないので背表紙外してからそーっと手でびりびりするのが現状では一番いい。ビール瓶のラベルを綺麗に剥がす時みたいな。

内側の余白の削りを最小限にするため綴じ単位でバラす

背表紙と具が分かれたけど、ロータリィカッタで切れるくらいの厚みに細かくしないといけない。綴じ単位でバラすと破れるリスクを下げられる。邪魔な糊を除去すると同時に手でバラす。

  1. 糊の固まりがくっついている具の背にキッチンペーパをのせる
  2. キッチンペーパの上からアイロンを当てる
  3. 糊が再び溶けてキッチンペーパに染みてくるけど気にしない
  4. 糊がペーパに染みてきたらキッチンペーパをベロンてはがす
  5. 背の側に少しキッチンペーパがくっついて残ってしまうが気にしない
  6. アイロンを離した瞬間から糊がまた冷えて固まりはじめるので、液体状のうちに本全体をグニグニって曲げる
  7. これで一気に綴じ単位がはっきりわかって、ボロボロと外れてくる
  8. 3綴じか4綴じくらいずつに分かれると理想。細かい分には別にいいけど
  9. アイロン使うのここまで。アイロンに糊がくっついた場合、余熱のあるうちにキッチンペーパをアイロンがけすれば綺麗にとれる

カット

  1. 後はロータリィカッタで綴じの部分をカット
  2. あまりギリギリで切りすぎてもくっつきが残り、後で SnanSnap が重なり検出しまくる羽目に
  3. 余白カットが全体で一律になるように注意

スキャン設定

画質の選択

ノーマル。カラーなら 150dpi で十分キレイさだし、サイズがでかくなるとiPadでは読み込みが遅くて読めたもんじゃない。

カラーモードの選択

カラー。自動にすると、ところどころ白黒になったりカラーになったりして画質が不揃いになる。白黒だとノーマル画質では文字にジャギィが出すぎるのでカラー+ノーマル画質がベスト。

読み取り面の選択

当然、両面読み取り。両面でないページも勿論あるが、ちょこちょこ変更すると設定ミスるので変えない。

継続読み取り

有効。

ファイル形式

PDFで、 "検索可能なPDFにします" にチェックし "全ページ" を選択。

原稿サイズの選択

オライリー & ピアソン判型ならB5。下に余白ができるけど、GoodReader使ってるので閲覧時に余白調整すれば気にならない。連続でスキャンするなら同じ判型の本から順にやった方がいい。設定変え忘れてテキスト認識後に気付き、やり直しになってかなり鬱だった。

マルチフィード検出

重なりで検出(超音波)。

圧縮率

3(これは試行錯誤してないので、そのまま)。

スキャン

50枚まで同時にいけるので100ページずつに分ける。目次はたいてい別カウントなので、ギリシャ数字のとこだけ最初に別にやっておき、1ページから数えた方が混乱しない。

テキスト認識〜完成

テキスト認識には時間かかるので放置して次の本の裁断にかかるなり、お好きに。スキャン後の本は一冊ずつポリ袋に入れて保管。出せる場所に置かなくていいだけで部屋は広くなるので、現状捨てる理由はない。
現状スキャン完了した本のサイズは下記。括弧内のページ数は書籍ではなくPDFとしての総ページ数。

重いわ開きづらいわ厚すぎて書見台も使えないわ、で読めてなかった本も通勤中に touch や iPad で読めるようになった。読んでる最中に残量を重量で実感しないで済むのもいいかも...次は目次付けだな。Acrobatで頑張るか、ほかに良い方法があるか模索してみるとしよう。

追記: 作業に使った道具

オルファ(OLFA) ロータリーカッターL型 41B

オルファ(OLFA) ロータリーカッターL型 41B

オルファ(OLFA) カッターマットA3 (320x450x2mm) 135B

オルファ(OLFA) カッターマットA3 (320x450x2mm) 135B

リード ヘルシークッキングペーパーダブル 80枚

リード ヘルシークッキングペーパーダブル 80枚

FUJITSU ScanSnap S1500M FI-S1500M (Macモデル)

FUJITSU ScanSnap S1500M FI-S1500M (Macモデル)

シンワ測定 アル助ゴム付 300mm 65331

シンワ測定 アル助ゴム付 300mm 65331

O'Reilly の電子書籍(Ebook)でひとつだけ我慢できない点

前からわかっていた事なんだけど、震災のセールの時にも大量に買ってしまったし、客としてやっぱり我慢ならないので下記メールを O'Reilly Japan に送った。価格とかもまあ海外版の電子書籍に比べて明らかに高いと思うけれど、日本語である事自体に代えがたい価値があるので別にいいと思っている。
けどアウトラインがないとなると電子書籍として半ば用をなさないし、紙の書籍で買ってバラして自炊した方がずっと良いんじゃないかと思う。自分がまだブックスキャンサービスの利用や自炊には踏み切っていないので利用するけれど、自炊やりはじめたら高確率でそうするんじゃないだろうか。

メールした内容

昨年からEbook Storeを利用しているのですが、震災の半額セールの時にも安いのと寄付になるのもあり、今まで計20冊くらいは買っていると思います。以前から我慢できなかった事が一つあるので、今後も利用するにあたり何としても考慮して頂きたい事があります。
なぜPDFにアウトライン情報がついていないのでしょう?
iPad (iBooks, GoodReader等)で利用していて、目次に戻るにもページを探すにも何も情報がなく手探りで、通読する際には自分で章や節をブックマークするなどしており(クックブック等も通読しなければならない、自力なので開いたアプリでしか有効にならず、本来の意味でのブックマークの邪魔にもなる)、電子媒体としては正直ひどい使い勝手です。技術が売りのO'Reilly/オーム社なのでそのうち改善されるかと思いましたが、一向にその気配もないのでクレームを入れさせて頂きます。
なお各書籍の内容にはどれも非常に満足しています。

MakBook Air 11インチを購入

なぜ新年セールで買わなかったかね本当に...。13インチとか迷った挙句に購入を後回しにする私みたいなのがどれだけいるかわからないが、セールス面でマイナスなんじゃないだろうか。買って最初に思ったのはやっぱり軽さだけど、MagSafeな電源コードだけひっぱると本体がずるずるついてくる。これってMagSafeの意味がないのでは...。
メモリ4G+高速プロセッサ+英語キー配列版で、32GをBootCampに割り振ってWindows7を入れるという、おそらくド定番の構成。ディスクボリュームが足りないので音楽をこっちに移すわけにはいかず残念。Win7側は特にシビアなので膨らんできたDropboxもSelective Syncでやりくり。Mac/Winの両方で、こまかい初期設定を延々とやった。どっちにしてもメインで使うアプリはほとんど同じ:

操作感が違う所はそれぞれ別アプリ導入して、できるだけ似た感じになるように埋めることになる:

設定やデータも可能な限りクラウド連携するから、もはやOS切り替える意味が...。.NETとCocoaIEとOfficeくらいか。

地震による東京の最適化

東京についてだけ雑感。被災地の方々は現在も大変な状態にあると思うが、実感として知ることはできないので、それについては書かない。
今回の災害で東日本は大変な騒ぎになっていると世界中が思っているんだろうし、東京もかなり混乱している、まあ確かにそうなんだけど、逆に最適化された一面もあるのではないか? 実際に今日出勤してみて、本日時点の東京は "とても普通だな" と思える。

郊外の電車の本数は少ない上に各駅停車しかなくなり、通常通りに出勤しようとすると地獄絵図になってしまうので人々は時差出勤を始め、会社もそれを認めた。定時を過ぎると3月後半にも関わらず早く帰るようにと指示があった。当初こそ大挙して並ばなければ帰れなかったものの今日にはたいしたことはなく、通勤時間も意外とかからなかった。各駅停車って意外と早いんだな、と認識したくらい。
いつ電力がいつ途絶えるかわからないので各自が節電の方法を考え、ヤシマ作戦など広範に呼び掛けが行われた。煌々と電気を灯すパチンコ屋は糾弾され、3連休の間に使われない社内サーバはすべてシャットダウンされた。一部の人が買い占めに走ってコンビニから物がなくなったので、家で弁当を作ってきて昼食にする人が増えた。夜は暗い。
何が問題?
確かにこの状況がいつまで続くのかは示されないままだし、すべてに対して遅延やキャンセルのリスクを意識しながら生活するので集中力や体力を薄く削られている。けどそれって慣れればどうってことないというか、単にまだ最適化すべき領域が残っているだけのような。

ただ報道についてはひどいままで、いかにも深刻めいた連日の放射線量についての報道は昭和天皇の下血量についてのそれを思い出させる。官房長官の一言一句に皆が注目して人気が鰻登りだが、その発言内容と真逆の情報や行動ばかり煽っている。FUDなのかな?
犯罪についても報道されなくなったので見かけの犯罪量は激減して、模倣犯は減るかも。

MacBook Air 11インチ欲しい!

2つめの ipod touch を買って古い方を母に渡したら、けっこう面白がって使っている。携帯メールの時も親戚間でいちばん使いこなすのが早かったし、わりと新しいガジェット好きなのかもしれない。けど所謂パソコンは全然触れたことがないし、私もいつも壊れるまで使って買い替え、なのでお古がない。新しい MacBook Air を買って今使ってる MacBook をお下がりにしようかと思ってるのだけど、1/2のセールをうっかり逃してしまった...。
というわけで、 「MacBook Air 11インチ欲しい!