ウェブ未来論：第3回 - @i2kのブログ

「ウェブ未来論」はNTT出版Webマガジンに掲載されています。最新の記事はこちらから。

前回は、インターネットのアーキテクチャーそのものの特性として、分散性とエンド・ツー・エンド原則を取り上げた。これらは、全世界的なコミュニケーション基盤を構築し、その基盤の上でさまざまなコミュニケーションの形態を実現するために必要不可欠なものであった。

実際に、インターネットではさまざまなコミュニケーションサービスが考案され、運用された。代表的なサービスとしてはEメールやファイル転送（FTP）、ネットニュースなどがある。ウェブも、インターネットを利用するサービスのひとつとして提案された。それぞれのサービスには異なった目的があり、異なったアーキテクチャがある。ここでは、ウェブが目指すもの、そしてそのアーキテクチャについて見ていく。

ハイパーテキストの歴史

ウェブ（World Wide Web）は、「ハイパーテキスト」という概念をインターネットの上で実現したものである。ハイパーテキストとは、複数の文書をリンク（ハイパーリンクと呼ばれる）によって連結し、管理する文書システムである。

ハイパーテキストの歴史は、1945年のヴァネヴァー・ブッシュの論文「As We May Think」から始まる。「私たちが考えるように」と題したこの論文では、人間の思考がさまざまな連想から成り立っていることを指摘した上で、それを書き留めるための文書システムは書物のように一直線に並べられるものではなく、文書同士をネットワークのようにつなぎ、自由に行き来することができるようなものでなければならないとした。そして、このコンセプトを実現するためのシステムを「Memex（メメックス）」と名付けた。Memexはマイクロフィルムに記録された文書の集合を、レバー操作によって自由に取り出せるような設計になっている。当時の技術水準ではMemexを完成させることはできなかったが、「文書のネットワーク」というアイデアはその後も生き続けることになった。

1965年には、デッド・ネルソンが「文書のネットワーク」に「ハイパーテキスト」「ハイパーメディア」という造語を与えた。テッド・ネルソンは自身が進める「Xanadu（ザナドゥ）」プロジェクトにおいて、ハイパーテキストをコンピュータ上で実現することを目指したが、普及には至っていない。しかしながら、プロジェクトの過程でハイパーテキストの基本的な概念や機能が確立されていった。

その後の進展としては、1987年にアップルのマッキントッシュ向けにハイパーテキスト作成ツール「ハイパーカード」が提供され、インタラクティブな教材やゲームの開発環境として人気を博した。

1989年、欧州原子核研究機構（CERN）に所属していたティム・バーナーズ＝リーは、研究者の情報管理や共有の方法として、インターネット上で利用可能なハイパーテキスト型の文書システムを提案した。翌年にはこのシステムにWorld Wide Webという名前を付し、必要なソフトフェアの開発を始めた。

初期のウェブはテキスト情報のみを扱うシステムであり、同様の目的を持った「Gopher（ゴーファー）」などのサービスと争っていたが、1992年にマーク・アンドリーセンらがWorld Wide Web向けに画像を扱うことができるブラウザ「Mosaic（モザイク）」を提供したことをきっかけに、爆発的に普及することになった。以後の進展はご存じの通りである。

ハイパーテキストのアーキテクチャ

ハイパーテキストは人々に何をもたらしたのだろうか。ヴァネヴァー・ブッシュが指摘するとおり、人間の思考は一直線ではなく、いくつもの思考の流れが絡み合い、ときにはあらぬ方向へと流されることもある。書物は、その著者に対して思考を一直線にまとめあげるように強いる容器のようなものだと考えることもできる。この容器があることで、他者に対して明確なメッセージを伝えることができるようになった反面、著者の頭の中にあるような複数の話題を同時並行的に扱うことは難しい。ハイパーテキストは、一直線であるというテキストの「制約」を外し、著者の思考空間をより生に近い形で書き下すことを可能にしたといえる。

また、知識が階層化・細分化された科学の世界では、個々の読者の興味の範囲やレベルがまったく異なり、そのすべてを満足させるような文献を提供することはほぼ不可能である。ハイパーテキストによって、読者の状況に応じて、より基礎的な文献や他分野の文献を参照させることで、著者は自身の主張を展開することに注力することができるようになった。

一方で、ハイパーテキストは読者という存在をより際だたせることにつながる。ハイパーテキストでは、ある文書から次にどの文書に移動するかを決定するのは読者である。ここでは、書物のように著者が期待するような順番で読まれることが期待できない。著者にとっては、表現の自由度が上がった代わりに、読者に対するコントロール力が低下することになる。

ウェブ：世界規模ハイパーテキスト

こういったハイパーテキストの特性は、インターネットと結びつくことで質的に大きく変化することになった。前回で触れたように、インターネットでは、情報は世界中のコンピュータに格納されている。それらの情報へのアクセスは中央集権的なコントロールの下にはなく、情報の持ち主さえ同意すれば、どこからでも瞬時に取り出すことができる。

このような世界規模の情報源に対して、ハイパーテキストの概念を適用することができるようになったのがウェブの本質的な機能である。ウェブでは、インターネット上に存在するあらゆる文書の間を、その作者が誰であるかを問わず自由に行き来することが可能である。これによって、ハイパーテキストは個人の思考を表現する手段から、世界中の知識を連結させる情報システムに変貌した。

自身の知識と他者の知識が容易に連結できるようになると、そこには2つの利点が生まれる。1つは分業効果である。先に述べたように、専門分化が進む科学の世界では、ある分野における知見を1人の科学者が網羅的に記述することはあまり現実的ではない。また、各分野間の関係は複雑に絡み合っているために、1つの体系にまとめることも難しい。そこで、ウェブを利用して複数人の科学者が分担執筆し、おのおのの文書をハイパーテキスト化することで分野全体の情報を提供するといった活動が進められた。

2つめの利点は知識のシナジー効果である。ある事象に対して、複数の執筆者が異なった意見を表明することは珍しくない。それぞれの意見が文書化されており、ハイパーテキストとして連結されていれば、読者は複数の意見に目を通すことができる。そして、それによって到達した結論は、個別の文書から得られる知見よりもより豊かなものであることが期待できる。

分業とシナジーは、科学のあり方そのものであり、古くから論文や雑誌といった媒体がこれを実現してきた。ウェブは、インターネットとハイパーテキストによって、一般の人々にも同じ方法論を活用できるような環境を提供したのである。

ウェブのアーキテクチャ

ハイパーテキストの歴史におけるウェブの位置づけは以上のようなものであるが、次にウェブはハイパーテキストの概念をどのように実装しているかを見ていく。

ウェブにおいては、すべての文書はHTML（Hypertext Markup Language）で記述する。HTMLは、通常のテキスト文書にHTMLタグと呼ばれる特殊な記号で装飾したものである。また、ウェブ上のHTML文書には、「http://」ではじまるアドレスが付加される。ある文書から別の文書へのハイパーリンク（以後リンクと称す）を表現するためには、HTMLタグを利用して相手先の文書のアドレスを記述する。

HTML文書は、そのままでは単純に特殊記号が付加されたテキスト文書にすぎない。この文書をハイパーテキストとして扱うには、ウェブブラウザというソフトウェアが必要である。ウェブブラウザは、インターネットを通じてHTML文書を取得し、HTMLタグを解釈することで文書のレイアウトやリンクの表示を行う機能を持つ。

このように、ウェブではHTML文書のみによってハイパーテキストが実現されているのではなく、HTML文書を解釈するソフトウェアが必要不可欠である。そして、そのソフトウェアのアーキテクチャが、ウェブの性格を規定している。

ウェブを利用する際には、ユーザはウェブブラウザでアドレスを入力したり、ブックマーク（お気に入り）を選択してはじめて情報を得ることができる。すなわち、情報の受け手が情報配信のタイミングをコントロールしている。このように、受け手主導のシステムを「Pull型」と呼ぶ。一方、インターネットのもうひとつの代表的なサービスであるEメールのように、情報の送り手が主導権を持っているシステムは「Push型」と呼ばれる。

Pull型のシステムでは、情報の送り手は、その情報を誰に送るかを指定せず、受け手がいつでもアクセスできるような場所に情報を置くだけの役割に留まる。そして、その情報がいつ、誰に読まれるかについては関与することができない。一般的なコミュニケーションの文脈では、受け手が誰かということと情報の内容は一体化しており、Pull型のウェブがコミュニケーションのためのメディアと呼べるのかについては議論の余地がある。どちらかと言えば、ウェブのアーキテクチャはテレビやラジオ、あるいは新聞などのマスメディアに似ている。マスメディア型の情報伝達においては、情報の内容は受け手による制約を受けない。ウェブの普及の一因は、個人に情報の内容を問わないマスメディア型の情報伝達手段を与え、その結果として多様性のあるコンテンツが入手可能になったからであると考えられる。

ウェブ・アーキテクチャの設計論

なぜウェブがこれほどまでに普及したのかについては、さまざまなレベルで検証がなされるべきであろう。上で述べたように、ウェブが個人にとって新しい情報伝達手段であったという点は重要であると思われるが、その役割を担うにあたって、Gopherのように、かなり近い時期に提案され、同様の目的を持ったシステムとの差はどこにあったのだろうか。

1つには、HTMLをベースとしたアーキテクチャの設計が秀逸であったことが挙げられる。現在のウェブはテキスト情報のみならず、画像や音声、映像といった多様な表現（メディア）を扱うことができるという意味で、ハイパーテキストではなくハイパーメディアと呼ぶべきだという議論がある。しかしながら、ウェブでは基本となるウェブページがテキストベースのHTML文書で記述されていることから、やはりハイパーテキストと呼ぶことが適当であると思われる。HTML文書を作成する作業（マークアップ）は、HTMLタグを習得し、一定のルールでタグの修飾を行わねばならないなど、一般の人々にとってはやや敷居が高い。しかしながら、HTML文書がテキストであることによって、ウェブブラウザは解釈処理前のHTMLタグつき文書（ソースと呼ばれる）を表示することができる。そして、あらゆるウェブページのソースが閲覧可能になっていることで、初心者は容易にHTMLを理解することができる。テキストベースであるゆえに多くの機能を提供することはできないが、ソースを通じたノウハウの共有は、ウェブの初期段階において大きな力になったことは想像に難くない。一方、グラフィカルなハイパーテキスト作成環境を提供していたハイパーカードでは、完成した作品がどのようなメカニズムに基づいているかを理解できない仕様になっていたため、作者の数は大きく増えることはなかった。

ハイパーテキストの提唱者であるテッド・ネルソンは、ウェブがハイパーテキストの諸要件を満たしていない不完全なシステムであると批判している。オリジナルのハイパーテキストでは、文書間をリンクする際に、1）リンクが双方向であること、2）リンクに意味づけがなされていること、3）著作権者を明示した引用がなされること、の3つが必要であるとされている。

1）リンクの双方向性については、現状のウェブの仕組みでは、文書Aから文書Bへのリンクが定義された場合、AからBには移動できるが、BからAには移動できない。言い方を変えれば、文書Bは文書Aからのリンクが存在することを感知できない。2）次に、リンクの意味づけとは、AからBへのリンクが何を意味しているのかを明示するという機構であるが、ウェブのリンクにはそのような記述をすることができない。3）引用に関しては、文書Bが文書Aの記述を引用する際に、文書Aに含まれる文章をコピー・ペーストさせるのではなく、文書Aの該当部分を閲覧できるような「窓」を文書Bに埋め込むことで、文書Aの著作権を守るという機能である。また、文書Bが文書Aに拠って立つものであることを示すことができる。

テッド・ネルソンの批判は、ウェブに関する本質的な問題提起であったが、ティム・バーナーズ＝リーの設計が正しくなかったと結論づけることはできない。なぜなら、世界規模のシステムを実現する上で、上記の機能を導入することは、計算量などの面で現実的には難しく、仮に導入されたとしてもユーザに多くの負担がかかることが予想されたからである。実際に、当初のティム・バーナーズ＝リーの提案書には意味つきリンクの必要性が議論されていたが、最終的にこの機能は実装から外された。

HTML文法の規約とHTML文書へのアクセス方法規約（Hypertext Transfer Protocol：HTTP）という、極めてシンプルなウェブのアーキテクチャは、そのシンプルさ故に認められ、現在の姿に成長した。その一方で、当初の議論で抜け落ちたリンクや著作者に関する問題はいまだ解決していないものの、新たな取り組みが始まっている。こういった活動についても今後の連載で触れる予定である。

次回は、時間を早送りしてブログの登場とそのアーキテクチャについて述べる。

「ウェブ未来論」はNTT出版Webマガジンに掲載されています。最新の記事はこちらから。