ホーム > 読んだ >

日本語全文検索システムの構築と活用

書誌

tagPerl
author馬場肇
publisherソフトバンク
year1998
price2,800+tax
isbn7973-0691-2

目次

1感想

履歴

editor唯野
1998.11.0x読了
1998.11.7公開
2002.11.28修正
2012.1.17タグ追加

既に巷間では(出版されたばかりなのであるが)「なまず本」として崇拝されている本である。とにかくフリーの日本語全文検索システムの構築に関しては、本書にとどめをさすといってしまってもいいだろう。関心を持たれた方であれば、買って損はしない。

全文検索システムの最も身近な姿とは例えばサーチエンジンのことであるが、これを個人レベルでも使える時代がとうとうやってきた。Namazu はこの日本語全文検索システムのソフトウェア(実体はPerlスクリプト)の名前である。詳しくは本家のページにでもいっていただくとして、このことのすごさはもっともっと喧伝されるべきであると私は思っている。

むろん、私自身のサイトは全文検索システムを持たなければならないほどのコンテンツがないので、Web 上でそれを実装するつもりは今のところない。しかし、ローカル環境では Web のコンテンツを含めた検索システムを導入した。現実にこういう姿を見て思うことは次のようなことである。それは、もはや情報は整理さえされる必要はないのかもしれないということだ。膨大の情報は当座に必要なものを除いては、とにかくストックしてキーとなりそうな言葉を書き並べ、だいたいの整理だけをやっておくだけにすべきだといえる。そして、後はサーチする。関連のないものから関連を見つけ出し、必要な情報の一覧を得る。人間は情報の取捨選択とそれに伴う収集と再利用のことだけを考えればよいのであって、情報量に比例する整理に時間を取られるというのは、もはやすべきことではない。なぜなら、現実に我々を取り巻く情報の量はとっくに個人の処理能力の限界を超えたものが流されているからだ。とにかく、こういうものが我々自身の手の届くところにまでやってきたというのは画期的だと私は思う。導入をするつもりがなくても(Mac OS 8.5 ではシャーロックという似たような機能が追加されたようであるが)本書はおすすめである。

Up