2.6 国際全文データベースサービス 学術文献情報に関するデータベースサービスは長くこれまではいわゆる二次情報を 提供するサービスであった。利用者が指定したキーワードを基にデータベースを検索 し,論文名やその書誌的事項,あるいはその抄録を提供するというものである。デー タベースの構築者は,学術文献のたゆまぬ収集と蓄積に務め,それに基づく利用者へ のサービス提供をビジネスとして維持してきている。 最近になって,学術文献の一次情報,すなわち論文の本文そのものを提供する全文 データベースシステム構築の国際的な実験プロジェクトが欧米を中心に開始されてい る。このシステムの特徴は次のようである。 (1)論文・記事の本文を提供 (2)国際学術ネットワークを介し,多くサイトが自由に参入して相互にデータ ベースを提供 (3)全文検索,ハイパーテキストなどの新検索手法の導入 (4)記述の国際標準化 (5)文字情報のみならず画像,音響情報を提供 (6)国際学術ネットワークを介し,どの国の誰でも利用可能 これらのプロジェクトの例として,WAISとWWWの二つをあげる。これらはい ずれも国際学術ネットワークであるインターネットの上に構築されていて,インター ネットに接続したワークステーションから誰でも利用できる。 WAIS(Wide Area Information Servers) は米国の Dow Jonesなど数社による共 同プロジェクトで,実験的運用の成果を基に最近ではその商用化が検討されている。 このシステムは(a)Directory of serversと呼ばれる一つの所在情報提供者,(b) サーバと呼ばれる複数のデータベース提供者,(c)クライアントと呼ばれる任意数 の利用者からなる。 サーバは各記事の本文を一つの文字情報ファイルとして格納し,それら記事の本文 を全文検索(フルテキストサーチ)できるように用語索引を用意している。利用者が 任意の用語を指定しサーバを検索すると,その用語を含む記事がその用語の本文中の 出現頻度順に示される。それを参考に利用者がいずれかの記事を指定すると,記事の 本文がディスプレイ上に表示され本文中でその用語がハイライトされる。画像につい ては,各画像は一つの画像ファイルとして格納されるので,アクセスのさいにはその ファイル名を直接指定する。 Directory of serversにはどのような情報がどのサーバにあるかの所在情報が格納 されている。サーバがシステムに参入する際に自分自身を案内する情報を Directory of servers に登録する。クライアントは先ずインターネットを介し Directory of servers にアクセスし,それによってアクセスすべきサーバを知る。次にクライアン トはインターネットを介しそのサーバにアクセスする。 WWW(World-Wide Web)はヨーロッパのCERN(European Laboratory for particle physics : Geneva, Switzerland)で開発されたシステムで,インターネッ トを介し,自由参入できるサーバとそれらにネットワークのどこからでも任意にアク セスできるクライアントからなる。 サーバにいくつもの記事が格納されていて,各記事の本文中のある言葉から,別の サーバの記事へ,あるいはその本文中の指定した箇所へリンクがはられている。ある 記事をディスプレイで読んでいる際にそのリンクを指示すれば,即時にリンク先の記 事の該当する部分が取り寄せられ表示される。利用者はそれらの記事がどこの国のな んというサーバにあるかということをまったく意識せずにリンクをたどることができ る。いわゆるハイパーテキストが国際的に散在しているサーバ中の記事の本文相互の 間に実現されている。 サーバとしてこのシステムに参入する際,一つのファイルとして格納される各記事 の本文中の言葉に必要に応じて任意の他サーバ中の記事へのリンクを設定する。記事 はSGML(Standard Generalized Markup Language)の一つのドキュメント型定義で あるHTML(Hyper Text Markup Language)で記述する。画像や音声はそれぞれ一つ のファイルとして格納され,それらに対してある記事の本文中からリンクをはかるこ とができる。 われわれの身近なワークステーションからこれら二つのプロジェクトのシステムに 実際にアクセスしてみると,十分実用的な性能を有していることがわかる。これらの システムへのサーバとして日本からの参入の試みも行われている。日本語による記事 の取扱についても検討されている。