2012年のごあいさつ

あけましておめでとうございます。

まずは昨年の振り返りから。2011年もいろいろなことがありました。

3月11日の東日本大震災。その時ぼくは研究所の居室にいて、幸い身のまわりに被害はなかったのですが、翌週からの計画停電のためにCiNiiをはじめとする各種サービスを一時的に休止することになり、多くのユーザにご迷惑をおかけしてしまいました。正直なところ、こういった事態をあらかじめ想定できていたとはいえません。サービスの性質上、NIIだけでなく学術情報を扱うコミュニティ全体の課題として取り組む必要があるので、今後はステークホルダーとのコミュニケーションを深めながらこの問題に対応していこうと思います。

11月にリリースしたCiNii Booksは、ある意味でそういったメッセージを込めて設計したものです。15年目を迎えるWebcatの後継として、NIIと大学図書館、そしてユーザをつなぐメディアになれるよう、関係者とのコミュニケーションを密にして進化させていきたいと思っています。また懸案だった電子リソース管理の問題も調査を進めており、今年から具体的な動きができるように準備しています。

研究面では、2010年にスタートしたLinked Open Dataに関するプロジェクトLODACが育ってきました。メンバーも増え、美術館・博物館情報だけでなく地域情報、生物多様性などさまざまな分野のLOD化を進め、知見を積み上げています。講演や発表も順調に増え、LODといえばLODACと認識してもらえるようにさらに活動していきます。

グルコース社はとても忙しい1年でした。スマホ・タブレット向けアプリの実績が増え、もともとの強みであったウェブサービスとの連携など、多様なニーズに応えられるようになりました。一方、自分たちのブランドで製品を出すための時間が取れなかったのが反省点で、これは今年の課題です。

個人的には、学術情報とLODに軸足を置きながら、各分野とのコラボレーションを進めていくというスタイルが確立した1年だったように思います。とはいえ、クリアな成果が出ているわけではないので、ほんとうに使えるサービス、ほんとうに使えるデータを作り出すことが2012年の第一の目標です。そのために、自分の中で分断気味のコミュニティをまとめ直し、強いチームを作っていくことも重要だと思います。

また、ここしばらくTwitterだけしか使っていないような状態でしたが、まとまった言葉を発信していくことを再開したいと思います。あと論文や解説記事など過去に書いたものをアーカイブとして公開しはじめましたので、本ブログとあわせて見ていただけるとうれしいです。

それでは、課題だらけの1年になりそうですが、今年もよろしくお願いします!

はてなブログに引っ越し中(仮)

あけましておめでとうございます。今年もよろしくお願いします。

新年ということで、心機一転ブログの引っ越しをしてみました。移転先ははてなブログで、とりあえずしばらくこちらで更新してみます。そのうち戻ってくるかもしれませんが…。

それでは今後ともよろしくお願いします!

@i2kのブログ

2011年のごあいさつ

遅ればせながら、あけましておめでとうございます。今年もよろしくお願いします。

まずは昨年の振り返りから。2010年もいろいろなことがありました。

これまでと同様、仕事の中心はCiNiiでした。4月に著者検索をリリースし、11月にはヤフーとの共同研究の成果である「Yahoo!検索 論文検索」を出すことができました。6月に応募をスタートし、11月に発表会を開催した第2回APIコンテストもありました。個人的にはこれらを大きなトラブルなく乗り切ることができたのが大きな収穫で、これをもってCiNiiはシステムの土台作りの段階を終えたと思っています。

研究面では4月からセマンティックウェブの中でもLinked Dataに照準を絞ったLODACプロジェクトが立ち上がり、新しいメンバーとともに研究を進めています。6月には監訳書「セマンティックWebプログラミング」も出て、多少なりともこの分野への貢献ができたのではないかと思っています。また、4年間担当してきたインタラクションのローカルアレンジメント委員長の役割を無事終えることができました。

年初には想像していなかったのが行政との関わりでした。電子書籍の関連で三省懇の末席に顔を出したり、他にもいくつかの仕事をしたり、とくに役に立てているとは思いませんが、これまで自分には関係がないと思っていた世界に足を踏み入れた感があります。これも政権交代から事業仕分けに連なる大きな流れの影響なのかなと思ったりします。

グルコース社は珍しくまじめに(?)仕事した1年でした。iPhoneアプリiPadアプリ・Androidアプリ・ソーシャルゲームといろんな世界が一斉に花開いて技術者の需要が急速に高まり、それに応えていくことでたくさんの経験をさせていただきました。実のところ忙しければ忙しいほどぼくの出番はなく、会社も新しい段階に入ったかなと思っています。

そんなこんなで、予想通りのこともあれば予想外のこともあった1年ですが、一貫して「自分にとって公共とは何ぞや」ということを問われ続けた年だったような気がします。なぜ論文検索を提供するのか、なぜデータをオープンにするのか、なぜ電子書籍に関わっているのか…などなど、自分の中で確たる回答が出ていないのが現状です。また、図書館をはじめとして、ちょっと前までは自身がアウトサイダーだと思っていた世界がどんどんインサイダー化していく中で、新たな責任を負っていかなければならないのはもちろん、居心地のよさに安住してはいけないという思いもあります。これについては、常に外からの視線を意識するとともに、アウトサイダーになれるような分野を探し続けることも忘れないようにしていきたいと思います。

新年早々いろんな仕事が同時に動き出しててんてこ舞いなのですが、成果をお知らせできる日を楽しみにしながらひとつひとつ取り組んでいきます。それでは今年もどうぞよろしくお願い申し上げます。

CiNiiの論文データが「Yahoo!検索 論文検索」で検索できるようになりました

きのう、「Yahoo!検索」の新機能「論文検索」がリリースされ、国立情報学研究所(NII)が運営するCiNii(サイニィ)の論文データ約400万件が検索対象となりました。まずは関係者のみなさま、お疲れさまでした!

突然現れたように見えるこのサービスですが、NIIのプレスリリースにも書かれているように、昨年度からNIIとヤフーとで共同研究を行い、サービスのあり方を検討してきたものです。最終的には、検索機能をヤフーが提供し、論文の詳細情報はCiNiiが受け持つという極めてシンプルな形になりました。単純ですが、これがお互いの強みを一番生かせるだろうという判断です。

NIIはデータを出しているだけ?と思われるかもしれませんが、実はそのデータ作りがぼくたちの生命線です。複数の異なるデータベース(それぞれが数百万件オーダー)から個々のレコードを名寄せし、1つのきれいなデータベースを作るのは、とてつもなく困難で、終わりのない作業です。NIIではそれを機械学習などの自動処理や人手を含めたワークフローを構築することで日々対応しています。表からはほとんど見えないこのプロセスについては、いずれ何か書きたいと思いますが、こうして作ったいわば「虎の子」のデータをオープンにしていくのは、ひとえに論文という情報を多くの人々に届けたいがためです。

以前から、CiNiiの情報はグーグルやヤフーなどの検索エンジンからのクローリングを許可し、検索の対象となっていますし、Google Scholarとは密な連携をしています(現在はわけあって検索できない状態になっていますが、近日中には復活します)。今回の連携もその一環で、CiNiiへのアクセス経路が増えることでより多くの方々に論文情報を見てもらえればと考えています。

いずれにせよ、公共的なサービスとして、また図書館のサービスとしてかなり思い切った連携の形だと思います。いろいろなご意見があるかとは思いますが、あたたかく見守っていただければ幸いです。

「セマンティックWebプログラミング」の監訳を担当しました

発売からすでに1ヶ月ぐらい過ぎてしまいましたが、オライリーから出版されている「セマンティックWebプログラミング」の監訳を担当したので、そのご報告を。

セマンティックWeb プログラミング

セマンティックWeb プログラミング

セマンティックWebプログラミングは、同じくオライリーから出ている「集合知プログラミング」の著者であるToby Segaranらによる「Programming the Semantic Web」の邦訳です。集合知にせよセマンティックWebにせよ、理屈はわかるけど実装のイメージがつかないというエンジニア向けに、プログラムできちんと説明するという良書です。ぼくも学部生の実習用に集合知プログラミングを使っていて、Programming the Semantic Webも早く日本語版が出たらいいのになあと思っていたのですが、ひょんなことから自分が関わることになりました。このような出会いを提供していただいたオライリーの伊藤さん、はてなの伊藤さんには心から感謝しています。

それで、ぼくの役割はというと、実際に翻訳したわけではなく、訳者の玉川さんが翻訳された原稿を読んで、間違いがないか、表現が適切かをチェックするというものでした。また、ぼくひとりでは心許ないので、適任だろうと思われる加藤さんにお声がけし、そうすると加藤さんが中尾さんを誘い、中尾さんが山本さんを誘い…という感じで訳者1名、監訳者4名という妙な体制ができあがりました。最終的に、監訳者4人で分担してチェックを行うとともに、ぼくが代表して「監訳者まえがき」という短い原稿を書きました。

監訳という仕事ははじめてで、またセマンティックWebの用語は難しいものが多いのであまり自信はなかったのですが、元の翻訳がよいのでスムーズに進めることができました。あと、技術書の翻訳だと掲載されているプログラムが動かないということがよくあるのですが、今回は監訳チーム(ぼく以外…)のがんばりで、ちゃんと動くように修正しています。

そんなわけで、もし書店で見かけたらお手に取ってご覧ください。教科書や演習資料にしていただければもっとうれしいです。そういえば、監訳者の4名はそれぞれ「情報・システム研究機構」という組織の傘下である国立情報学研究所・新領域融合研究センター・ライフサイエンス統合データベースセンターに所属しているので、ここしばらくはセマンティックWebといえば情報・システム研究機構ということでひとつよろしくお願いします。

おまけ

7月16日に、この本の著者が所属しているMetaweb社がGoogleに買収されたというニュースがありました。これでGoogleは本格的にセマンティックWebに取り組んでいくことになりそうです。
Freebaseを運営するセマンティック・ウェブの会社MetawebをGoogleが買収 - モジログ

集合知プログラミング

集合知プログラミング

CiNii著者検索とコップの中の小さな革命

2010年4月1日にCiNiiがバージョンアップしました。昨年4月のリニューアル以来、1年ぶりの機能強化です。といっても、CiNiiの基本的な機能や見た目にはほとんど変化はなく、新たに「著者検索」という機能がついたのが今回の目玉です。検索ボックスの赤いタブがそれです。

あっさりとした公式説明 - http://ci.nii.ac.jp/info/ja/index.html#20100401

もう少し詳しい説明 - http://cinii.jp/post/486298233/cinii-author-search

CiNiiのデータベースに入っている著者名にIDを振って、その著者IDで検索できるようになった、ということなのですが、言うは易く行うは難しで、やろうと思ってから実現するまで1年がかりの大仕事でした。

中身の説明については上記リンクに任せるとして、ここではCiNii著者検索をなぜやろうと思ったのか、どういう意義があるのかという話を個人的な観点から書いてみようと思います。それは、端的に言えば「学術情報サービスの根幹であるデータの作成に機械処理とユーザ参加の仕組みを入れること」です。

CiNiiにせよその他の学術情報サービスにせよ、データは学会・出版社・図書館・大学など、ある種のオーソライズされた組織によって「人手で」作られてきました。この作業がどれほど大変で、誰がその役割を担ってきたのかについては適切に評価されなければなりませんし、いつか書きたいと思うのですが、その話は置いておいて、そうして作られた何百万、何千万というデータに対し、IDを振る作業を再び人手で行うことは現実的に不可能です。

そこで、今回の著者検索では、コンピュータによる自動処理と、ユーザからのフィードバックによって、できるだけ精度が高く、かつコストパフォーマンスのよいシステムの実現を目指しました。

とはいえ、すべて人手で作るのが当たり前の世界において、機械処理やユーザ参加は本質的に「いい加減」なものであり、どれだけ工夫をこらしても同等の信頼性を得ることはできないでしょう。現状の著者検索の精度を含め、さまざまな面でご批判を受けることになるだろうと覚悟しています。

それでもこのようなシステムを作るのは、遅かれ早かれ学術情報サービスのデータは組織による入力・機械処理・ユーザ参加の組み合わせによって作られることになるだろうという見通しと、情報にせよ人物にせよ網羅性の高いIDを持つことが死活的に重要になるだろうという読みに基づいています。とくにIDは、外部のサービスと密に連携するためになくてはならない存在であることは間違いありません。

また、これはいささか内向きな理由に見えてしまうかもしれませんが、国立情報学研究所が(あるいはぼくが)なぜCiNiiを運営しなければならないのか、という問への回答でもあります。研究機関であると同時にサービス提供者であるNIIでしか実現できないことが可能になってはじめて存在意義が生まれます。もちろん自己満足になってはいけませんが、今回は著者IDという明確な目標を立てることで、研究成果とサービスを一体化できたのではないかと考えています。

まだ新機能のリリースから3日目です。今後どういった評価を受けることになるかはわかりません。幸いなことに、フィードバックを300件近くいただいております。まずはこれらのフィードバックを速やかに反映し、よりよいサービスの実現に邁進していく所存です。

2010年のごあいさつ・2009年のまとめ

あけましておめでとうございます。今年もよろしくお願いします。

2009年は、CiNiiを中心にして、周囲の状況も自分自身の状況も大きく変わりました。

まずは何といっても4月のリニューアル。仕様書作りから考えれば約2年、ここまでたどり着くことができたのは、多くの関係者の力があってのことです。それこそリリース直前にはシステムが動かない夢を見たこともありますが、振り返ればいろんな人に守られたプロジェクトだったなあと思います。そして、リニューアル後にいただいたポジティブな反応は、関係者を勇気づけるとともに、学術情報分野ひいては図書館分野全体に「やればできる、うまくいく」というメッセージとなって伝わったのではないかと自負しています。11月には、ウェブAPIコンテストの発表会を催すこともできました。広大なウェブの世界から見れば小さな出来事ですが、公共サービスを「ウェブ化」していくことの意義を示すことができているとすれば幸いです。

11月からは、国立情報学研究所の准教授兼専門員という肩書きを得て、正式に学術情報サービスの担い手となることになりました。仕事の内容がいますぐ変わるわけではありませんが、1サービスにとどまらず、より大きな絵を描くのが任務だと思っています。劇的に変化している学術情報分野でどんな貢献ができるのか、まだわかりませんが、世界に誇れるサービスのあり方を模索していきたいと思います。

12月には第1回ウェブ学会シンポジウムを開催しました。ウェブを主語にしたコミュニティを作りたい、という想いから1年がかりで作り上げたイベントです。TwitterUstreamなど、ウェブの力を最大限に使って、数千人が参加し、議論するプラットフォームのひな形ができたのかなと思っています。

株式会社グルコースでの活動も継続しており、今年もいくつかのソフトウェアを提供することができました。iPhoneiPod touchTwitterクライアントとして2月にリリースしたFastweet無料版・有料版に続いて、12月にはリアルタイム検索に特化したFastweet Liveを出しました(まだ正式にプレスリリースを出していませんが)。また8月の衆院選を前に、みんなの政治というサービスを作りました。

さて、これらを踏まえて、2010年をどういう年にしていきたいか、抱負らしきものを書いておこうと思います。

ここ数年、毎日毎日何らかのソフトウェア・サービスの設計・開発・運用に関わっています。いわゆるプロダクト・マネージャの仕事に近いのだと思いますが、この仕事を内外に認知してもらうこと、そしてこの仕事に必要な知識・経験を得ることが第一の目標です。また、研究者として取り組むからには、体系的な「学」につなげていくことも必須です。

上記とも関連しますが、いま自分がいる研究コミュニティから少しずつ軸足をずらしていくことも必要だと思っています。ウェブ学会もそうですし、CiNiiを通じて図書館分野の人々と交流が増えてきたこともありますが、自分のアプローチがAI(のみ)に立脚していることの利点と欠点を同時に感じます。ことさら学際を標榜するつもりはありませんが、さまざまな分野の方法論を知り、時には合わせていくことのできる柔軟性を身につけたいと思います。

これらは今日から急に始めるものでもありませんが、いま取り掛かっているいくつかの仕事を通じて少しずつ実現していきたい目標です。2010年もいろんなお知らせができるようにがんばりますので、ご期待ください。

それでは、改めて、今年もよろしくお願いします。

追伸:毎年、今年こそちゃんとブログ書きますと宣言してましたが、そろそろあきらめます…。Twitterのつぶやきは増えると思うので、ぜひフォローを!