2011年5月28日土曜日

インターネットアーカイブ

「インターネットアーカイブ」。いまや極普通の名詞を二つ並べた感じのものだが、じつは一つの固有名称だ。去年の秋に一度オンラインの講演録画について記したが、そこで語られたプロジェクトの結果なのだ。短い期間ですでにここまでの規模をもつものになったものだと、感心した。

サイトには、一つのサブタイトルが添えられている。「Universal access to all knowledge」、人類のすべての知識を手に入れる、とでも訳すべきものだろうか。さすがに人類すべてと名乗るだけあって、日本語によるものもかなりの数が入っている。サイトの運営者については、サンフランシスコにあると、関係者全員の顔ぶれを写真つきで紹介されているが、細かな説明を丁寧に読んでいても、はたしてどのような方針で資料を選び、敏感な著作権の対処にどのような方針を取っているのかは、ついに見出せない。それぞれの国々には違う事情があり、簡単に線引きが出来ない、というのがその一番の理由ではなかろうかと推測する。ただし、参加機構の規模には、圧倒される。カナダだけで36の機関がリストされ、しかもたとえばトロント大学だけで25の図書館が協力している。これらの機関が所蔵している資料を電子化した、ということだ。

収録されている資料は、動画、音声などメディアの形態により大きく分類されるが、一番関心をもつのはやはり文字資料だ。収録の規模もさることながら、アクセスの方法は、これまで見てきたさまざまな電子テキストの出版や電子図書館の中で、一番質が高い。オンラインで読む場合は、最小限のツールバーとともに、ページの解像度は画面のサイズにより変わり、しかもアクセススピードは不思議なぐらい速い。PDFファイルも用意され、ダウンロードを支持するどころか、それを推奨するとまで説明にある。およそ400頁の本なら40メガ程度のファイルだから、いまの環境だと、さまざまなリーダーで対応できて、使いやすい。

さっそく飛びついたのは、「続群書類従」や「古事類苑」だった。日本にいれば、ほとんどの大学図書館に備えられていて、書庫の一角に押し入れられているものだが、外国にいると、手元で調べることが適わなくて、ときに苛立たしい思いに苛まれるものだ。ただし、ダウンロードしたファイルを開いて見たら、かなりの部数のものはページ順が逆になっている。洋書とともにスキャンにかけられたもので、文字など一つも識別できないまま作業されたもののではなかろうか。しかも作業が終わったら、トータルな見直しもほとんど施さないで公開しているのかもしれない。あとは、書籍タイトルの掲載や検索には、アラビア語などが原語なのに、日本語の文字は一つも出てこない。なんとも言えない気持ちだった。

Internet Archive

0 件のコメント: