CiNii著者検索とコップの中の小さな革命

2010年4月1日にCiNiiがバージョンアップしました。昨年4月のリニューアル以来、1年ぶりの機能強化です。といっても、CiNiiの基本的な機能や見た目にはほとんど変化はなく、新たに「著者検索」という機能がついたのが今回の目玉です。検索ボックスの赤いタブがそれです。

あっさりとした公式説明 - http://ci.nii.ac.jp/info/ja/index.html#20100401

もう少し詳しい説明 - http://cinii.jp/post/486298233/cinii-author-search

CiNiiのデータベースに入っている著者名にIDを振って、その著者IDで検索できるようになった、ということなのですが、言うは易く行うは難しで、やろうと思ってから実現するまで1年がかりの大仕事でした。

中身の説明については上記リンクに任せるとして、ここではCiNii著者検索をなぜやろうと思ったのか、どういう意義があるのかという話を個人的な観点から書いてみようと思います。それは、端的に言えば「学術情報サービスの根幹であるデータの作成に機械処理とユーザ参加の仕組みを入れること」です。

CiNiiにせよその他の学術情報サービスにせよ、データは学会・出版社・図書館・大学など、ある種のオーソライズされた組織によって「人手で」作られてきました。この作業がどれほど大変で、誰がその役割を担ってきたのかについては適切に評価されなければなりませんし、いつか書きたいと思うのですが、その話は置いておいて、そうして作られた何百万、何千万というデータに対し、IDを振る作業を再び人手で行うことは現実的に不可能です。

そこで、今回の著者検索では、コンピュータによる自動処理と、ユーザからのフィードバックによって、できるだけ精度が高く、かつコストパフォーマンスのよいシステムの実現を目指しました。

とはいえ、すべて人手で作るのが当たり前の世界において、機械処理やユーザ参加は本質的に「いい加減」なものであり、どれだけ工夫をこらしても同等の信頼性を得ることはできないでしょう。現状の著者検索の精度を含め、さまざまな面でご批判を受けることになるだろうと覚悟しています。

それでもこのようなシステムを作るのは、遅かれ早かれ学術情報サービスのデータは組織による入力・機械処理・ユーザ参加の組み合わせによって作られることになるだろうという見通しと、情報にせよ人物にせよ網羅性の高いIDを持つことが死活的に重要になるだろうという読みに基づいています。とくにIDは、外部のサービスと密に連携するためになくてはならない存在であることは間違いありません。

また、これはいささか内向きな理由に見えてしまうかもしれませんが、国立情報学研究所が(あるいはぼくが)なぜCiNiiを運営しなければならないのか、という問への回答でもあります。研究機関であると同時にサービス提供者であるNIIでしか実現できないことが可能になってはじめて存在意義が生まれます。もちろん自己満足になってはいけませんが、今回は著者IDという明確な目標を立てることで、研究成果とサービスを一体化できたのではないかと考えています。

まだ新機能のリリースから3日目です。今後どういった評価を受けることになるかはわかりません。幸いなことに、フィードバックを300件近くいただいております。まずはこれらのフィードバックを速やかに反映し、よりよいサービスの実現に邁進していく所存です。