目次   はじめに ---------------------------------------------------- 尾関雅則 1.情報学の概要 ------------------------------------------------ 藤原 譲 2.情報学研究の現状と展望 2.1 言語情報 ---------------------------------------------- 長尾 真 2.2 情報標準化 ------------------------------------------ 仲本秀四朗 2.3 全文データベース -------------------------------------- 根岸正光 2.4 マルチメディア ---------------------------------------- 杉田繁治 2.5 情報の自己組織化 -------------------------------------- 藤原 譲 2.6 国際全文データベースサービス -------------------------- 田畑孝一 3.専門領域における情報学の現状と展望 3.1 医学情報 ---------------------------------------------- 開原成允 3.2 判例データベース -------------------------------------- 早川武夫 3.3 農業情報 ---------------------------------------------- 大塚擁雄 3.4 博物館情報 -------------------------------------------- 杉田繁治 4.情報化社会の規範 4.1 情報経済 ---------------------------------------------- 根岸正光 4.2 知的財産権 ------------------------------------------ 名和小太郎 4.3 情報倫理綱領 ------------------------------------------ 早川武夫 4.4 情報倫理綱領をめぐるIFIPの活動 -------------------- 黒川恒雄 5.わが国における情報学の課題 5.1 情報資源の整備 ---------------------------------------- 神田利彦 5.2 日本語情報の収集と提供 -------------------------------- 根岸正光 はじめに 人間は太古より言語,文字を所有し,更に中世に至って紙と活字を発明した。これ らによって,人間は時空の隔たりを越えて,相互に意志や感情を伝達することを可能 にし,原始社会は次第に文明社会へと変貌を遂げてきた。現代に及んで物質とエネル ギー利用の進歩と共に,情報の伝達,保存,変換などの手段は,通信とコンピュータ 技術の出現によって,画期的な発展を遂げつつある。 殊に,現在まさに進行であるパーソコナルコンピューティングと,パソコン相互の 自由な通信は,物質とエネルギー技術を中心に発達してきた産業社会を,次の脱産業 社会へと変化させる原動力であると考えられるにいたった。 コンピュータと通信は,まさに来るべき,情報化社会の基礎をなす技術である。情 報の保存,変換及び伝送を取り扱う通信・情報工学が言わば情報の入れ物を対象とす る学問であるのに対し,中身である情報そのものの性格や構成を究明する情報学の進 歩に対する期待は,今後,複雑化の一途をたどるであろう情報化社会の正しい理解と 方向づけのためにも極めて大きいと言わなければならない。ここに,情報学の確立と 発展が望まれる基本的な意義が存在すると言わなければならない。 本報告書では,未だ十分に確立されるに至っていない情報学の内容と領域を考究し, 少なくとも,現在のところ情報学の中心的な課題と考えられているものの内容を示し, 更に将来の情報化社会において,大きな力を持つようになると考えられる情報技術及 び,それに携わるプロフェッショナルの在りかたなど,新しい社会規範の必要性とそ の中心命題についても論究した。 この報告書が情報学の内容と,その社会とのかかわれについて正しい理解のために 少しでも役立つことを願って,前書きとする次第である。 1.情報学概要 (1)序 情報学とは,「情報の本質に関する理論や知識を体型かすること,さらにそれらの 応用として思考活動の質と向上を図ること」つまり,「情報とは何か」,「情報をど う使うか」を追求することであるとする。 先ず人間の脳における活動について考える。優れた思考機能を持つ頭脳の表現とし て博識という言葉がある。これは物理的に言えば情報の量が多いということに相当す る。また頭脳明晰であるとか頭の回転が速いということも重要な機能であり,これは 応答の速度が早く,しかもその結果の精度が高いということになる。これらは一応定 量化ができる機能であるが,これだけでは高度な知的活動に対応しているという感じ がしない。発想,創造などというレベルになると本当の意味で価値を生じる機能とい える。 それにはどのような処理が対応しているかというと,情報を収集し,解析し,検索, 数値計算,演繹推論のみならず,帰納推論,類推,仮説推論,連想や評価をすること, さらにその延長上に問題解決,意志決定,創造,評価などがある。 歴史的にみて「思考支援の方式」としてこれまでどのような手段をもっていたのか ということを考えると,簡単なそろばんや計算の手助けになる道具は人間の歴史と同 じくらい長い歴史があり,基本は加算であるけれども,四則演算ができる道具として 各種の形のものがある。そのことを計算機ではスイッチングの機能で行わせる。四則 演算が基本であることは同じであるが,高速大量の処理ができることで,論理演算も 可能となっている。最近コネクションマシン,ニューロ計算機といったようなもので 分類や学習が有る程度できるようになった。 さらに高度な数値や符号の処理だけでは済まなくなる。もしこういうことがてきれ ば機能として人工頭脳ができることになる。ところが意味の理解や処理は,現在まで の理論や技術では極めて限定された範囲を除けば未解決の問題であり,とくに情報の 記述,表現を含め情報の諸性質を把握することが必要とされている。 つまり情報を有効に活用するためには,情報や知識がどういうものであるかを知る 必要がある。それが情報の学問であるから,情報学の目的は情報の特性と理論の体型 か,情報に関する技術,手法の開発及びそれを具体的に各分野の情報,思考活動への 応用することになる。 情報学でまず問題になるのは,情報,知識,データなどの定義である。情報とは最 も広義では「認知とか思考の対象となる実態についての認識内容」であり,普通の意 味で言われる情報は全てこれに入る。次に知識とは一般的には情報と同じに使われる こともあるし,情報処理,特に人工知能の分野では一定の形式化された知識を指すの で,具体的にはプロダクションルールとか1階述語論理で表現されたもの,またはそ の延長上にあるものということになる。ここでは最広義と最狭義との中間になる, 「体型かされた情報」という意味で使うことにする。次に情報はいろいろな形で記述 され,表現されるがそれの「最少単位」をデータという。またその「集合」もデータ という。以下はこれらの定義に従うことにする。 情報が持っている特徴と,それらに関連する課題の例を次に示す。情報は数えられ るものとして扱われることが多いが,本来可算数集合ではないということが第一の特 徴であり,識別子の設定や管理上の問題となる。次に計算機では2値論理が処理し易 いが,計算機から見ても論理的に見ても厄介な多値論理が情報の本質である。つまり 多数の同意語のあるのが用語の基本的な特徴である。また表現されたものに多義牲が あつて曖昧性を生ずる。例えば英和辞書を引くと,一つの英語に対して日本語が一つ だけ対応しているという言葉は殆ど無い。通常非常に沢山の種類の訳語が書いてある。 さらに意味の表現の他に表現の意味解釈の問題があり,それは計算機では情報そのも のを扱っているのではなく,媒体上に記述表現されているものを対象としているとい うことから生じている。これを情報の媒体依存性という。 このような情報の特徴と課題についてこれまで多くの研究がなされているが,未解 決の問題も山積みしていて,学問としてはまだ緒についたばかりである。 (2)情報学の専門領域 情報学は全体としてどのような専門分野から構成されているかを自然学科の側から 整理してみると,理論的,実験的な側面および応用用の3つの領域に分けられる。 (2.1)理論情報学の構成 理論的な分野は上で述べたことから,まず情報の解析時に構造の解析方式であり, 次に情報の表現や構造の意味対応などのために必要な理論的骨核としてモデルがある。 また歴史のある分類の可能性と分類の手法,それから媒体に関連して記述表現の多様 性,その取扱い方,情報の時間的,空間的,意味的変化,管理の可能性,限界な情報 操作の手法などが情報学の基本対象である。 (2.2)実験情報学の構成 実験的な分野としては,実際の情報を対象として情報の特性,情報の量,情報の質, 情報のキャラクタリゼーション,情報の資源化,管理および典型的な情報媒体の要素 であるターミノロジやソーラス,辞書,日本語,マルチメディア,それらの構築,特 性,操作処理などが実験的な情報学の領域である。 (2.3)応用情報学の構成 理論や実験が進めば応用も具体的に展開できるわけであり,典型的な情報検索の手 法は確立されており,数多くのシステムが開発,提供されている。もう少し情報を高 度に加工して付加価値を図ること,情報の伝達法として従来からの印刷物とオンライ ンデータベース,バッチ型データベースや知識ベースなどの位置づけと展開,さらに 学習,類推,発想などを実現し,最終の目的である問題解決,意志決定,評価,人工 頭脳までも一応応用情報学の対象に含まれる。 以上まとめると情報学は下のようになる。 情報学 1.序 :領域−大量情報の特性,資源化,操作に関する理論と基本課題, 背景,歴史,概要,基本概念の定義 2.情報解析 :特性解析−属性,媒体,動態 意味解析−物理関係,概念関係,論理関係,従属関係など 3.情報構造 :グラフ,ハイパーグラフ,木構造−分類,網構造 拡張ハイパーグラフ,双体,入れ子,部分共有,動的構造など 情報空間モデル化 4.完全性制約:空値問題,実在制約,識別,同定 5.媒体 :物理媒体,論理媒体,表現媒体,記録媒体,表示媒体,通信媒体 など媒体変換 6.情報記述 :属性空間,記述項目,差分記述,様相性 情報表現 :媒体依存性,多様性,多義性,lattice 情報表示 :多元媒体 7.情報構造化:意味関係構造化,自己組織化,学習 概念構造:シソーラス,構文解析辞書,定義辞書 論理構造:述語論理,様相論理,ファジー論理 物理構造:アドレス,索引,所在,ファイル 8.構造操作 :記憶構造,直接アクセス,構造経由アクセス,同型性,準同型性, 拡張関係型操作−関係グラフ,抽象化(汎化,集約化) 9.意味処理 :内容検索,演繹推論 類似性処理:共有概念,類似度−帰納,類推,仮説推論,連想,発想など 10.応用システムおよび展望:自己組織型情報ベースシステム,人工頭脳など (2.4)情報の特性と課題の例 まず情報の基本的特性を挙げると次に示すようなものがある。 a.媒体依存性 b.記述,表現の多様性 c.様相性(Modality) d.非加算性 e.階層性(入れ子構造) f.相対性,双対 などがあり以下に簡単に説明する。 (a)媒体依存性 情報はそれ自身で実在することは少なく通常なんらかの媒体上に記述,表現されるの で必然的に記述および表現の形式が媒体に依存することになる。例えば風景を表現す るのに写真を用いるか文章を用いるかを比較してみれば違いは説明するまでもない。 媒体として見ると文字に比し画像や音声や抽象化の水準が低いが,情報量が多く理解 も容易である。これが先に述べたマルチメディアへの期待につながっている。 (b)記述,表現の多様性 情報の媒体が多用であるので記述,表現の多様性があるのは,避けられないことであ るが,同じ媒体であつても想像以上に様々な形態をとり得る。典型的な例は言葉でい えば同意語である。一般的に情報の記述,表現の多様性の説明のため,単純な場合で 包含関係だけがあったとして次に図解する。 4つの特性で記述されるべき対象があったとして,その世界はこの4つの属性の 全てを正確に記述するレベルとそれより少ない3つ,2つ,または1つの属性で記述 する,4段階がある。実際にはさらにそれらの中間もあるが複雑になり過ぎるのでそ の議論はここでは省略する。先ずA1という概念で記述し,その次にA2で記述し, 更にA3,A4で記述する仕方がある。図1の上から下への別のルートがそれぞれの 別の記述法に対応している。このように属性が4つあるだけ 図1 概念階層の束構造 図2 属性附加による概念階層の束構造の変化 でも記述の仕方は16通りになる。さらに属性が一つ増えると図2に示すように階層 も深くなり,かくレベルのノードも増加するだけでなく全体の構造も変化し記述法も 32通りとなる。なおぶんるの多様性も同じ構造で説明出来て,それぞれ24通り, 120通りとなる。一般にnヶの属性に対して記述法は2のn乗通り,分類法はn! 通りとなる。 (c)様相性 検索やAIで符号照合のとき, A=A と A≠(〜A) は対隅であるから同じことを意味するとしたり,一階述語論理で,「PならばQであ る」ということは,「PでないかまたはQである」ということに等しいし,又そのこ とは「(PであってかつQでないということ)はない」ということになるわけだが, これらが成立するのは先ほどの対隅が成立したのと同じであり,2値論理が前提であ る。ところが使われる情報は2値論理型とは限らない。一般に多値論理つまり「そう である」か「そうでないか」のどちらかに割り切れる場合だけでなく,「そうかもし れない」し「そうでないかもしれない」というような場合も含めた論理である。そう いう情報に対しては2値論理の手法は使えない,つまり演繹推論であるとき数値計算 であるとか符号の照合というのは計算機むきの良い方法ではあるが,それが使えない 情報も多いということである。 (d)非加算性 意味の関わる問題の一つは個別実体(Distinct Entities)の集合を通常仮定すること である。順序関係の成立する外延(Extension)として概念を取り扱うことは対象を著 しく制限することになる。 (e) 情報,概念の間には抽象化や総称表現に基づく包含関係のため階層関係があり,とく に技術の進歩や生活様式の変化による新しい概念の生まれることが多く,入れ子型の 構造になる。 (f)相対性(双対) 実体と実体の間にある関係はそれぞれ固定されているのではなく,関係自体を実体と しても扱いたいときはまたはその逆に実体を関係として扱いたいときがあり,これを 相対(dual)ちう。また実体と属性,階層関係における上下関係なども状況で応じて 変化するので相対的である。これも従来型のシステムでは扱えない問題である。 (2.5)情報の資源化 最近マルチメディアが注目されているが,ハイパメディアはマルチメディアの有力 な利用形態のひとつである。ゼロックスが提供していたハイパーメディアシステム NoteCards の経験から,次世代のハイパーメディアに展開するために,解決すべき問 題としてHalazsが87年と91年に改訂しCACMに発表した問題の一つは大規模な情報 を入力し,構造化し,使える段階に資源化し,適切に管理することが困難であるとい うことである。この問題を解決しない限り大型ハイパーメディアは実用的なものにな らない。このことは,柔軟性があり何でもできそうなハイパーメディアも構造化と管 理ということが大きな課題になっていることを示している。 少し個別な問題でアクセスの問題を考えてみると,キーによって情報を識別するこ とに基づいてアクセスをすること,及びキーワードの牽引が今までの代表的なもので あつたが,マルチメディア情報は上で述べたように本質的な問題点を持っており,簡 単に解決できることでは無い。それから新しい方法の全文データベース用シグネチャー ファイル方式やマルチメディア用の変換コート,それから従来のネットワーク型デー タベース管理システムのように情報の構造を直接利用する方法も考えられる。 こういう問題に対しては,先ほど述べたような制約を考えると,現在では最も柔軟 なシステムとかんかているハイパーメディアとオブジェクト指向的DBSも基本的に は満足できるものではないことになる。一般的に従来型のデータベースには沢山の情 報が入り,知識ベースでも入れられることにはなっているけれども,前者は管理,と くに識別,同定からの制約のため,後者では知識の表現の制約から知識の獲得が困難 であり,いずれにしても入力できるものが限られる。つまり全体から見ると現在の技 術で扱える情報に比べて積み残した情報の方が圧倒的に多い。それは管理システムの 基礎となるモデル実現方式の柔軟性と管理機能が不足していることに起因する。 結局,基本的には利用者向きで情報媒体の面からも望ましい大量のマルチメディア 情報の利用のために情報の特性に即した新しいモデルに基づくシステムの開発が必要 である。 (2.6)利用機能 今までの課題をもし解決したとして,最後に利用機能の問題がある。現在の計算機 では四則演算や符号照合の処理,即ち数値解析,検索,演繹推論などは高速かつ高精 度で処理される。より高度な予測や推定も,完全ではないが種々の手法があり,実際 に使われている。 更に高度な機能として,類推,機能推論,仮説推論,発想,連想などと,それらを 複合して問題解決,設計,意志決定,評価などが要求されている。 このような高度な機能実現のためには意味とくに類似性,関連性の処理が重要であ るが,情報が媒体経由の関節表現のため困難な問題である。しかし意味の関係を概念 間の関係として構造の形で組織化ができれば,意味処理に道が開けることになる。大 量の情報の構造化は人手で行うことは極めて湖南なことであるから,システム的に, 即ち自己組織的に行わなければならないし,そのような試みがなされているので以下 に一つの例を示す。 (2.7)新しい情報システムの展望 (a)意味関係の構造化 実体や概念の間の様々な関係は主として用語の関係としてあつかうことができる。 専門用語のデータベースを作って,用語間の関係,例えば同意語,多義語,階層関係, 部分全体関係などをC-TRAN(Constrained Transitive Closure)および SS-KWIC(Semantically Structured Key Word Element in Terminological Context) などを用いて抽出して用語の間の関係を扱えるようにしてシソーラスを自動的に作る ことができる。 情報構造の実現方法を簡単に述べると,例えば日本語と英語の対訳用語集には英語 に対して日本語の対応関係が示してある。基本的には用語の訳は同値関係になるが, 実際には用語の使われかたとして同値関係の場合に上下関係も入ることが多い。それ を全てが同値関係だけだとすれば,推移則が成立するので推移閉包をとり,全部の同 値な用語を結んだ同意語集合が得られる。例えばこれはJISの用語集だが難燃性と 同じ民法の表現が“燃える”という表現に対して“炎”と“火”もあって,“難”に は“耐”があって,性質を表すのに“性”と“度”がある。このように考えられる組 み合わせがほとんど全て使われている。JISは勿論標準化の為に作るので用語も標 準化されているが,それは専門分野別に行われるので全体としては標準化にはほど遠 いということであり,これが先ほどから述べている言葉というものの多様性の典型的 な例である。 これは学術用語でも同じであり,学術分野毎に用語も標準化されているが,標準化 されたものが全分野に共通になっているのではなく,広く使われる概念であればある ほど多用な表現が使われている。 いろいろな用語について各種の抽出の仕方があるが,先ほどの上下関係や入れ子構 造になる再帰関係がある場合には多義性によるノイズが拡大されるので,上位概念を 抽出して推移閉包を求め,その結果を上位概念に結合することによる同意語集合の精 度を上げることと,抽出された上位概念はそれを利用して階層関係も構造化できると いうことで割合簡単な方式でシソーラスができる。それから他の論理関係などについ ても類似の方法で構造化ができる。 自動作成されシソーラスは概念構造を表し,情報の構造化による意味処理のみなら ず内容検索にも有効である。 SS−KWICは専門用語が主として複合語であり,構成要素間に造語規則が存在 することを利用して階層関係や関連関係を抽出する方法である。 同じような積み上げ方式によって論理関係とくに因果関係も自動的に収集,構造化 することができる。これには SS-SANS (Semantically Specified Syntactic Analysis of Sentences)および SANS (Sematic Analysis of Sentences)を用いる。 前者は先ず特定用語中心とする一定の構文を利用して,概念間の関係を抽出する。次 のその結果を用いて新しい特定用語と構文を得る。これを再帰的に繰り返す方法であ る。この方法は構文の不明確な文章や,構文のない用語の集合例えばキーワード集合 の間の関係も抽出できる方法である。概念間の論理関係として,因果関係にも各種の ものがあるが,自然科学で重要なのは直接結果に結びつく原因結果関係と,いくつか の要因があって結果に結びつく要因結果の関係及び,必然性が充分でないけれども何 らかの理由結果につながる理由結果などの種類がある。これらを構造化すれば演繹推 論は単なるナビゲーションとして実現でき,概念構造を表すシソーラスと併用して類 推も実現できる。 これらの関係情報を抽出すると,ソシーラスとして概念間の構造が組織化されるの で,それには先ほどの各種の関係が含まれるわけであるが,例えば類似関係というよ うなことが直接扱えるようになり,情報の利用に関して非常に重要になる。また論理 関係はタキソノミーとして構造化される。更に元の情報が持っている書誌的な情報と 索引など,物理的構造は基礎的構造である。 つまり情報が持ついろいろな意味を構造化することによって,今までに述べた範囲 内ではあるけれども計算機で意味が扱えるということである。 (b)自己組織型情報ベース 上で述べたような情報の構造化を行って実際の研究開発に役に立つような応用シス テムの構築の例を示す。そのシステムはInformation-Base Systems with Self Organizing Receptor Interconnections, IBS:SORITESと名付けられている。 要点のみを述べると,情報の持つ階層性,相対性および部分重複などの基本特性は 従来のグラフ構造型のモデルでは扱えないので,多項関係を扱えるハイパーグラフに 内部構造や意味関係表現のラベル付け,および役割を示す方向などを導入して拡張し た新しいモデルSSR(Structured Semantic Relationship) を構築し,それに基づ いてシステム開発を行っている。 IBSのモデルはハイパーグラフを階層化,ラベル付け,および方向付けの点で拡 張した新規のものである。それに基づき検索や演繹推論のみでなく類推や帰納推論が 使えるシステムが実現できる。 全体構成として図3に示すように,まず一次情報をCD−ROMに入れておく,理 由はCD−ROMの記憶容量が大きく,540メガあるので専門家に必要な情報がほ ぼ網羅的にこの中に入ることと,読み取り専用記憶装置で書換ができないので管理が 非常に簡単になることなどである。次に一次情報から概念構造をソシーラスとして, 論理構造をタキソノミーの形で抽出し,それを用いて一次情報を構造化して意味処理 に使うという方式である。このシステムは種々の研究用マルチメディア型情報に応用 され高分子,NMR,有機合成,半導体,超伝導,非線形光学材料,常温核融合等が 対象となっている。 図3 IBS:SORITESのシステム構成 2.情報学研究の現状と展望 2.1 言語情報 (1)言語技術の情報学における位置づけ 情報を担っているものは言語だけでなく,図面,写真,映像,その他種々のものが ある。それらは表現しようとする情報内容によって使い分けられる。情報はまたいか に客観的相手に伝えられるかという立場からその媒体を考えることもできる。機械の 設計図面などは世界中で共通的に理解されうるものである。それでは言語はどのよう な情報の表現に適しているのだろうか。あるいは情報学における言語の位置付けはど うであろうか。それは次のように考えられる。 (i)言葉は思想を表現するための最適の媒体である。 (ii)言葉は誰にでも理解でき,人による理解の相違を最も小さくし,正確な情 報を伝達することのできる媒体である。 (iii)歴史的に見て,人類の知的財産が言語によって最も多く表現され,また蓄 積され今日に伝えられている。 (iv)今日の情報技術においては,言語が最も安価に,最も容易に扱える媒体で ある。 このような理由から,言語技術は情報学の中で重要な位置を占めていることが分か るだろう。 (2)言語技術の現状 (i)字づら処理 言語を扱う場合には,それを構成する基本である文字,単語が明確である必要があ る。文字としては欧米諸国言語のアルファベットのように 100文字以下の場合と,日 本語,中国語のように数千〜数万文字の場合がある。数千あるとされる世界の言語の うち文字が確定している言語はそれほど多くないとしても,やはり膨大で,これを計 算機でユニフォームに扱うために,1文字を何バイトでどのように表現するのがよい かが現在真剣に検討されている。文を構成する単語を確定する形態素解析は言葉の持 つ多義性の問題からユニークには決定できない。現在日本語では単語単位で99.9%程 度まであげる努力をする必要があろう。 (ii)文解析 文中の各単語の文法的役割を明確にすることであり,奥の場合各単語のもつ意味に まで踏み込んで扱わねば正確な解析は出来ない。文解析の中心的役割を占めるものは 文法であり,過去30年の間に種々の文法形式が提案され,それらのいくつかは計算機 による文の自動解析に用いられた。しかし,いまだに種々の複雑な文を90%以上の正 確さで解析することの出来る十分精密な文法は作られていない。最近は従来の文法の 概念でなくニューロネットワークや部分的な文の類似性などを発見する方法など,種々 のヒューリスティック手法が試みられている。一般的には非常に困難であった長い文 の解析もかなりできるようになり,照応の問題,省略語句の推定,文脈関係の把握と いった問題が研究されている。 (iii)文生成 最近になってようやく研究が盛んになって来たが,何から出発して文を作るかが明 確でなく,研究方向が定まっていない。質問に対する応答や定まったパターンの文を 作り出す程度のことは出来るが,話者の聴者との関係,聴者に対する心的態度,話す べき内容をどのような方略でどのような文形式でどのような順序に従って読みやすい 文脈的表現にしながらまとまった1つの文章として作り出すかは未だに全くといって よいほど未解決である。 (iv)翻訳 言語の機械翻訳は不完全ながら実用されている。欧米では英語,フランス語,ドイ ツ語などを中心として使用されているが,日本においてはほとんど日本語と英語との 間の翻訳である。1文ごとの翻訳しかできないこともあって,人手による後修正が必 要となる。ただどのような内容の文章であったかを把握するためであれば後修正なし に使うこともできる。ほとんど後修正を必要としない質の高い翻訳システムは21世紀 の初頭まで待たねばならないだろう。 (v)テキスト情報の圧縮と分類 与えられたテキストからキーワードを自動抽出したり,自動要約をしたり,またそ のテキストがどのような分野のものであるかを自動判定したりする研究が盛んになっ て来た。現在まだ実用になるようなしっかりした方法は確立されていないが,社会的 な要求も強く,研究も進んでいるので近い将来実用となる方法が出てくるものと考え られる。 (3)これからの課題 (i)言語技術基盤の確立 言語技術を発展させるためには研究開発のための環境整備が必要である。それは, 膨大なテキストデータの蓄積(特に多言語翻訳対で),これらのテキストデータに出 来るだけ豊富な言語情報を付与したテキストデータベースの整備,膨大な多言語の単 語・フレーズ辞書の整備,形態素解析,構文解析,その他のソフトウェアの整備,こ れらの全ての研究者への公開ないし低価格による配布,などであり,誰もが自分の目 的とする言語処理をすぐ行えるような環境整備が重要である。米国を中心としてこの ような環境整備の動きがあり,日本でも早急に検討しなければならない。 (ii)言語理解のための知識辞書の作成 我々人間が言葉を理解できるのは,文法を知っていたり,単語の意味を知っている というだけでなく,言葉によって語られている外界・対象に関して種々の知識を持っ ているからである。機械に人間と同じように言葉を理解させ,適切に応答させるため には人間の持つ世界に関する知識を機械が取り扱える形に整備しなければならない。 これがこれから挑戦すべき最大の問題である。 (iii)電子図書館システム 今後ほとんどの出版が電子的に行われるようになり,またワープロによって文書が 作成され,電子メールシステムで流される時代になるが,その時の図書館はこれらの 活動にマッチした形の電子図書館となるだろう。そして世界中の電子図書館がネット ワーク接続され,多用なユーザの要求に対応しなければならなくなってくると,以上 に述べられたあらゆる言語技術が必須のものとなる。すなわち情報学における言語技 術は,十分な意味における電子図書館の実現と言いかえてもよいのである。 2.2 情報標準化 二つの流れ 情報に関する標準化には,科学技術会議が総理大臣に答申した「科学技術情報流通 に関する基本政策」に従った情報流通技術の標準化(SIST)と,従来展開されて きた日本工業規格(JIS)での情報処理技術の標準化の二つの流れがある。いずれ にもそれぞれの目的に沿って,情報の流通・処理における技術の整合性を高めること に主眼を於いている。この経緯には,科学技術振興における支援活動として早くから 進められてきた前者と,機器の進展に比して産業化の遅れた情報活動に対する後者の 認識の差が認められる。経緯はともあれ,両者とも国際基準への整合を掲げており, その点で共通の基盤をもっているということができる。強いていえば,後者が工業技 術の延長上で「情報」を眺めているのに対し,前者は科学技術が内包する「情報」に 視点を置いているところに相違がある。また,前者が20年の実績をもっているのに対 し,後者は国際標準化機構への国家対応の公式規格であることに,それぞれの特徴を 有している。制度的には,前者が科学技術庁科学技術振興局の発行文書であるに対し, 後者は工業標準化法にもとづく法律の認知を受けている。それだけに憲法が保証する 表現の自由の限界の内にあることの認識が重要である。内容的には前者が書誌情報お よび情報生産を対象としているのに対し,後者は用語・略語・記号・符号などが法律 にその対象として例示されている。両者の境界については微妙なところがないでもな いが,SISTの一部 JIS化も実現しており,この面の発展のため今後の協力が 期待されている。 SIST 現在までに制定されたSIST(科学技術情報流通技術基準)は13にのぼり,大 別すると,抄録作成・参照文献記述・レコードフォーマット形式など書誌情報に関す るものと,学術雑誌構成・学術論文構成・科学技術レポート様式・予稿集様式などの 情報生産に関するものの2種となる。作業部会が作成する基準案を,学協会・大学・ 研究機関・関係省庁からの研究者・情報専門家からなる諮問機関(科学技術情報流通 技術基準検討会)が審議する手順をとっており,適用者が情報作業を実施する際の高 質化,効率化への寄与を図っている。「基準」のそれぞれの特性や適用者の事情が勘 案されて,適用および記述のレベルにバラツキのあるのは発展期においてやむをえな いのであろう。普及については,ハンドブックの発行や説明会の開催などの実績を積 んでいるが,全般的な利用に一層の努力が必要である。 内容では,電算機利用が大きな主眼になって,多くは機械可読情報を対象としてい るが,電算機の使用を前提においているのだから,印刷形式の基準文献を発行するば かりでなく,基準の電子形式の発行,さらに一歩進んで,適用例のパッケージを作成 提供することによって,適用者の便宜を図るなどの基準開発が課題であろう。 JIS ISO/TC 46(情報ドキュメンテーション)の制定した国際規格の中には,日本国内の 規格として必要とみなされていたものが散見されていた。その内のいくつかが,1988 年,jis として制定された。それが, JIS X 0304-1988 国名コード JIS X 0305-1988 ISBN JIX X 0306-1988 ISSN である。その後,これらの規格に加え,用語規格として JIS X 0701 ,0702,0705, 0706のドキュメンテーション用語が出版された。現在は,電子出版やオフィス・ドキュ メンテーション分野で注目されている。 SGML(Standard Generalized Markup Language)のDTD(Document Type Definition),各種情報検索サービス間のコマンドの差異を乗り越えようとするコモ ン・コマンド言語等の新たなJIS原案の作成作業や,JIS 国名コードの改正原案の 作成作業など,情報の標準化に関して,広範囲な活動が継続されている。 ISO(国際標準化情報)への対応 標準化の国際専門活動として,ISO(国際標準化機構)があり,情報学分野に関 連の深い下部組織として,TC 37(ターミノロジー技術委員会)と TC 46(情報ドキュ メンテーション技術委員会)がある。ISOへの日本の対応は工業技術院が窓口であ り,活動全般に対しては日本工業標準調査会(JISC)が事務局を担当し,国際規 格の原案作成から制定までの各段階で,内容の審議を各国内対策委員会を行っている。 ISO・IEC指針が示すように,ISOの各TC(技術委員会)は TC 37が制定 した用語原則に従うよう示唆されており,TC 37 の活動は全標準化作業の基本になる ものであるが,日本では国際活動への寄与へ踏み出したところであり,また,国内で の標準整備が現在の課題となっている。一方,TC 46 分野では,対応のための国内体 制はほぼ整っており,積極的な提案にいたるまでの活発な活動を目指している。 2.3 全文データベース 全文データベースの発達 −− いわゆるデータベース・サービスは,文献の書誌 的データと要旨を収録した二次文献データベースを中心に発達してきた。これには, 従来の抄録誌の編集作業が電算化され,それで得られる電子化ファイルが,当初は副 産物的位置付けにあったが,次第に主製品としてのデータベースに転化してきたとい う背景がある。一方,数値情報系のデータベースは,株価の即時配信システムという, データベース的ではないオンラインシステムからはじまったが,その後,データの蓄 積機能を取り入れてデータベースを構築するようになった。また統計情報関係では, 統計データのデータベースが早期に事業化されている。全文データベースは,上述の 二次文献データベースの進化の延長上にあるものである。 全文データベースの発達は,図書・雑誌・新聞等,一般の出版物の原稿作成や編集 におけるコンピュータ利用の浸透,また電算写植機による印刷の普及を背景にしたも ので,この点,抄録誌のデータベース化と同様の経過をたどっている。こうして,現 今ではオンラインでサービスされるデータベースの半数以上が全文データベースになっ ている。また,パッケージ型データベースと称される半数以上が全文データベースに なっている。また,パッケージ型データベースと称されるCD−ROMによるデータ ベース出版物は,近年わが国でも普及が進んでいるが,これらの多くが内容的には全 文データベースであると考えられる。 オンライン系全文データベースでは,通信量と通信料金の制約,また標準化の問題 から,図表の類を除外した,本文だけの全文データベースがほとんどであるのに対し て,こうした制約の小さいCD−ROM版データベースでは,むしろ画像・音声に主 力をおいたマルチメディアデータベースが盛んになっている。もっとも,高速・大容 量・低価格のインターネットの普及に伴って,オンライン系でも,画像・音声を含む ハイパーテキスト仕立ての全文データベースの構成方式WWWが普及のきざしをみせ ている。また,既存出版物の各頁を画像として蓄積・配信することも,インターネッ トの普及により現実的になっており,このような全文データベースの集積と配信を統 合したシステムを「電子図書館」と称して,その実用化にむけた開発計画が米国では いくつ試みられている。 文字・文章・文書情報の基礎的研究 −− こうした状況をうけて,情報技術の研 究開発では,マルチメディア,端的には画像・音声に関係したものが多くとり上げら れるようになっている。これに比べて,テキストデータ自体に関する研究は地味な印 象を与え,またビジネス機会の観点からも興味薄とみられるせいか,報道されること も少ない。しかし,オックスフォード大のテキストアーカイブスのように,全文デー タベースを広範に蓄積するという試みも着実に進捗している。こうした全文データの 蓄積は,単に検索・参照の用に供するのみならず,むしろこれを実験試料として利用 した様々の研究が広い学問分野にわたって可能になるという点で,情報資源というに ふさわしいものであると考えられる。 人間活動の多くが言語に依存し,またその記録や伝達の多くが,これを文字で表わ した文書に依存していることは明らかである。このことは,画像・音声を別にした, せまい意味での全文データベースについて,その構築,蓄積,検索,表示などの基本 的機能に関わる研究が,すべての学問分野の発展に寄与する基盤的な研究であること を示唆している。 ワープロの普及に象徴されるように,文書の電子化は社会のすみずみまで浸透しつ つある。こうしたOA機器・システムの普及は,文書の作成を効率化させるから,文 字情報の絶対量も増大させるであろう。これを,文字情報の氾濫というような混沌事 態に陥らせないために,文字情報の処理に関する基礎的・統合的な研究が必要である。 例えば平文ファイルに対する高速走査検索手法は,全文データベース向きのシステム ではすでに実用されているが,この種の研究もさらに推進されるべきである。また, テキストデータに多用な切口を与えるSGMLはすでに国際規格として成立しており, 上記のテキストアーカイブズでも,この方式に依拠した全文データベースの蓄積が推 進されている。SGMLは,文字情報の氾濫に対する,文書の作成段階での対応法の ひとつとみなされる。しかし,わが国では大方の支援を欠くためか,この方面での動 きは鈍い。 上記のような視点に立つとき,現在,全文データベースに関連して展開されている 様々な研究は,本来,文字・文章・文書情報に関する研究として,組織化・統合化さ れるべきものと考えられる。そのためには,これまで例えばデータベース,テキスト 処理,機械翻訳,電子図書館など,個別の応用を目的に進められてきた諸研究を,適 切に位置付けて統合化するような学問体型の構築が必要である。そして,この役割は まさに情報学が担うべきものであると考えられる。 2.4 マルチメディア 我々の日常はマルチメディアの世界である。文字,画像,音響,などさまざまな情 報メディアに囲まれて生活してる。しかしメディアの多様性ということをほとんど意 識していなかった。ところが1980年代に入ってマルチメディアという言葉が新聞や雑 誌広告などにしばしば見られるようになった。これはコンピュータや通信の世界にお いて単に文字や数値だけではなく,静止画のみならず,動画や音響も扱える様になり つつあることを反映して特に強調されて出てきた表現である。 画像や音響データはそれをデジタル化すると膨大なデータ量になる。一枚の写真も 文庫本10冊分ぐらいの量になる。それを数千枚数万枚を扱うとなると大変な量であ る。従来のコンピュータではシステムが大きくなり杉田。ましてやパーソナルコンピュー タでは不可能であった。ところが大量のデータを蓄積することが出来る媒体,光ディ スクの出現によって事情が一変した。数百メガバイトのデータを蓄積することができ る光磁気ディスクやCD−ROMをコンピュータに接続することによって従来の計算 機のメディアの世界が飛躍的に広がって,我々の日常的なメディアの世界に近づいて きたのである。 また写真や書類をコピーするような感覚でスキャナーから入力することが出来るよ うになった。更に動画を高速にデジタル化するICの開発,画像データを品質を落と さずに圧縮する技術(JPEG,MPEG)の開発,高品質の画像表示装置,などの 出現が大きな役割を演じている。コンピュータのディスプレイ上でビデオや音も出す ことが出来るようになった。異なる媒体の情報をすべてデジタルにしてコンピュータ・ システムだけで多様なメディアを扱うことが出来るのである。また大量のデータも光 ケーブルや衛星通信を介して高速に伝送することが出来るようになって,コンピュー タとネットワークの接続で利用方法が広がった。 画像や音などがコンピュータで扱える様になると,その応用範囲は急激に広がる。 従来の知的生産の技術ではカードに文字を書いて情報を整理し活用する工夫がなされ ており,それのコンピュータ化はかなり進んでいるが,写真や音はまた別の媒体とし て扱わねばならなかった。それが文字も画像も音も同じレベルで扱うことが出来るよ うになって知的生産の技術が一段と向上したことになる。これは人文学の分野にとっ ても有効な方法を提供することにになる。 このマルチメディア・システムがゲームや家庭内の情報機器として利用され出すと 新しい応用が広がるというので話題になっている。 マルチメディアを扱うシステムの問題点はいかにしてデータの間に関係をつけるか ということである。異なる情報媒体をどのような情報によって結び合わせるかという ことが最も重要である。単純なやり方は関係する対象をあらかじめ指定し,それをリ ンクする情報をデータとして持つ方法である。しかしこれは拡張性がない。新規に追 加した場合またリンクをつけ治すというのでは大変である。それぞれが独立していて しかも関係をつける工夫がいる。 それにはそれぞれのメディア情報に対して自然言語による記述データをつけておき, その自然言語を介してリンクをつけるという方法がある。この時問題になることは自 然言語の持つ表現の多様性である。同じような事柄に対しても異なった表現をする場 合がある。そこで類語集(シソーラス)を用意し,単語の表現を変換して一致を取る ことにすれば柔軟なシステムになる。 2.5 情報自己組織化 現在の計算機では四則演算や符号処理,即ち数値解析,検索,演繹推論などは高速 かつ高制度で処理される。更に高度な機能になると,学習,類推,帰納,仮説推論や それらを複合して問題解決,発想,意志決定,評価などをすることになる。これらが 実現されれば本当に思考支援であり,人工頭脳的機能が実現できることになる。 このような高度な思考機能に対応する情報処理をするには情報の意味処理をする必 要がある。ところが意味の関わる問題の多くは未解決である。例えばデータベースや 知識ベースでは個別実体(Distinct Entities)の集合としてデータや知識を対象とし ていることである。つまり考えている対象領域では,ある概念の表現と別の概念の表 現との間に重なりがなく,別々のものであるというのが基本的な考えである。実際に 使われる情報では特許や法律でも化合物でも,概念には非常に多くの重なりがあり, それを考慮しないで処理することは無理であり,例えば総称表現が適切に処理できな い。また類似性というのも重なりがある概念の関係であるから同様である。あるべき 情報が欠落している空値問題はさらに意味処理が困難である。 実体と実体の間にある関係は意味の表現に直結するものであるが,システムによっ てはこのような関係についての表現を持たないものがあり,その典型的なものは関係 型データベースモデルで,PCやワークステーションから大型用のデータベース管理 システムとしても普及しているが,実体間および関係間の関係を扱う機能がない。一 方実体一関係型(E−R)のように関係を直接扱えるものもある。ただしE−Rモデ ルでは実体と関係それぞれが固定されているので,関係自体を実体としても扱いたい ときまたはその逆に実体を関係として扱いたいときにそれができないという問題など が残っている。これは意味ネット,ハイパーメディアやオブジェクト指向システムに も共通する問題点である。 また意味の相互重なりに対する記述表現としては再帰的または差分的な表現の問題 がある。次に概念には相対性があり,上位と下位が絶対的ではなく,下位の概念の下 にさらに下位の概念があり得るので,上位と下位は,状況により変化する相対的なも のである。相対性としては上位,下位以外にも実体と属性,例えば女性とき男性とき は人間の属性になるけれども,見方によってはそれ自身で実体になるというような相 対背,それから関係と実体も固定的ではない。例えばある人が車を持っている。人と 車の関係は所有されるという関係であるが,所有という概念は関係としてだけではな く実体にもなり得るので双対関係である。それから先ほどの類似性のような部分的重 複も記述表現が難しい。一般に意味の記述表現の問題は外延(extension) に基づく既 存の情報技術では適切に扱えなく,情報の管理や,知識の獲得の困難さの原因となっ ている。 実際の例でいうと,図4に示すように,化合物の部分構造に関する包含関係のごく 一部を取り出したものであるが,各種の包含関係があり,構造表現に多様性があるこ とを示している。これは一般の概念の場合も同じで,たとえば製品の情報でも製造場 所,製造日時,原料材料とその特性,加工法,装置,条件などの多くの概念が多重の 入れ子関係を含み複雑な関係になる。 表現の多様性も情報の記述,目的,内容に応じて大きく変化する。分類や表現の多 様性は情報の表現の本質的な性質であるので意味の処理が困難になるのである。この 様な問題の解決策として脳における機能と同じように情報の意味的関係を自動的に構 造化する自己組織化の研究が注目されている。 自己組織化方式 多様,複雑,かつ大量の情報を収録,管理し,それらの高度利用のため学習,類推, 仮説生成,発想などが可能なシステムを実現するための基礎研究とプロトタイプシス テムの例として「自己組織化機能を持つ情報ベースシステム」についてのべる。 脳における学習に対応して,概念や情報間の意味的関係を抽出して情報の組織化を 行う。概念に内在する関係は概念構造としてシソーラスを構築する。論理関係は,原 因−結果,理由−結果,要因−結果な主としてタキソノミーの形で論理構造を組織化 する。メディア変換,意味関係抽出等によりマルチメディア型原情報の概念構造,論 理構造,物理構造などの自己組織化を行ない演繹推論,帰納推論,類推などの可能な 人工頭脳型システムを設計する。研究に必要な情報の動的構造の記述操作のためには 新しい型の情報構造を持つモデルSSR(Structured Semantic Relationship)の開発 がなされている。そのためデータベース,知識ベースおよびハイパーメディアなどの 要素技術を大幅に拡張し,新しいモデルで統合的に記述表現,操作し,思考支援でき る機能を持つ情報ベースシステムの設計と基礎となる理論の研究が行なわれている。 自己組織化は,自動生成されるシソーラスおよびタキソノミーなどを用いる概念構 造化により実現する。 概念構造及び論理構造にもとづく自己組織化には次に示すような方法がある。表現 の多様性のために存在する同意語は,原情報に内在する概念の同値関係や,対訳用語 集における対訳関係の推移閉包を求めるC−TRAN(Constrained Transitive Closure)で同値関係を求めるのがSS−KWIC(Semantically Structured Key Word Element in Terminological Context)である。また意味解析のためSS−SA NS(Semantically Specified Syntactic Analysis of Sentences)およびSANS (Semantic Analysis of Sentences)などを用いて,動的概念関係シソーラスや論理関 係タキソノミー構築できる。これらに基づき類推,帰納や仮説生成による学習,問題 解決,発想支援を実現する。 これに関して現在のハイパーメディアは小規模情報には有効であるが,リンクの生 成,管理の限界およびグラフ構造の制約から大規模化が困難であり,柔軟性にも欠け る。また類推,帰納推論などの研究も人工知能分野で広く行なわれているが,方法と して確立されていない。 以上の方式は具体的対象として機能性材料,および有機合成などの研究用情報を取 り上げプロトタイプシステムの構築と,そのテスト評価を行なわれている。 原情報の収集,入力提供には光学材料,および有機合成それぞれの専門家多数の協 力によっている。 図4 化合物の概念構造 2.6 国際全文データベースサービス 学術文献情報に関するデータベースサービスは長くこれまではいわゆる二次情報を 提供するサービスであった。利用者が指定したキーワードを基にデータベースを検索 し,論文名やその書誌的事項,あるいはその抄録を提供するというものである。デー タベースの構築者は,学術文献のたゆまぬ収集と蓄積に務め,それに基づく利用者へ のサービス提供をビジネスとして維持してきている。 最近になって,学術文献の一次情報,すなわち論文の本文そのものを提供する全文 データベースシステム構築の国際的な実験プロジェクトが欧米を中心に開始されてい る。このシステムの特徴は次のようである。 (1)論文・記事の本文を提供 (2)国際学術ネットワークを介し,多くサイトが自由に参入して相互にデータ ベースを提供 (3)全文検索,ハイパーテキストなどの新検索手法の導入 (4)記述の国際標準化 (5)文字情報のみならず画像,音響情報を提供 (6)国際学術ネットワークを介し,どの国の誰でも利用可能 これらのプロジェクトの例として,WAISとWWWの二つをあげる。これらはい ずれも国際学術ネットワークであるインターネットの上に構築されていて,インター ネットに接続したワークステーションから誰でも利用できる。 WAIS(Wide Area Information Servers) は米国の Dow Jonesなど数社による共 同プロジェクトで,実験的運用の成果を基に最近ではその商用化が検討されている。 このシステムは(a)Directory of serversと呼ばれる一つの所在情報提供者,(b) サーバと呼ばれる複数のデータベース提供者,(c)クライアントと呼ばれる任意数 の利用者からなる。 サーバは各記事の本文を一つの文字情報ファイルとして格納し,それら記事の本文 を全文検索(フルテキストサーチ)できるように用語索引を用意している。利用者が 任意の用語を指定しサーバを検索すると,その用語を含む記事がその用語の本文中の 出現頻度順に示される。それを参考に利用者がいずれかの記事を指定すると,記事の 本文がディスプレイ上に表示され本文中でその用語がハイライトされる。画像につい ては,各画像は一つの画像ファイルとして格納されるので,アクセスのさいにはその ファイル名を直接指定する。 Directory of serversにはどのような情報がどのサーバにあるかの所在情報が格納 されている。サーバがシステムに参入する際に自分自身を案内する情報を Directory of servers に登録する。クライアントは先ずインターネットを介し Directory of servers にアクセスし,それによってアクセスすべきサーバを知る。次にクライアン トはインターネットを介しそのサーバにアクセスする。 WWW(World-Wide Web)はヨーロッパのCERN(European Laboratory for particle physics : Geneva, Switzerland)で開発されたシステムで,インターネッ トを介し,自由参入できるサーバとそれらにネットワークのどこからでも任意にアク セスできるクライアントからなる。 サーバにいくつもの記事が格納されていて,各記事の本文中のある言葉から,別の サーバの記事へ,あるいはその本文中の指定した箇所へリンクがはられている。ある 記事をディスプレイで読んでいる際にそのリンクを指示すれば,即時にリンク先の記 事の該当する部分が取り寄せられ表示される。利用者はそれらの記事がどこの国のな んというサーバにあるかということをまったく意識せずにリンクをたどることができ る。いわゆるハイパーテキストが国際的に散在しているサーバ中の記事の本文相互の 間に実現されている。 サーバとしてこのシステムに参入する際,一つのファイルとして格納される各記事 の本文中の言葉に必要に応じて任意の他サーバ中の記事へのリンクを設定する。記事 はSGML(Standard Generalized Markup Language)の一つのドキュメント型定義で あるHTML(Hyper Text Markup Language)で記述する。画像や音声はそれぞれ一つ のファイルとして格納され,それらに対してある記事の本文中からリンクをはかるこ とができる。 われわれの身近なワークステーションからこれら二つのプロジェクトのシステムに 実際にアクセスしてみると,十分実用的な性能を有していることがわかる。これらの システムへのサーバとして日本からの参入の試みも行われている。日本語による記事 の取扱についても検討されている。 3.専門領域における情報学の現状と展望 3.1 医療情報 (1)医療情報学の現状 (1−1)全体として見た時の現状 日本の医療情報の分野は,実用面では一部で高い水準の保健医療情報システムが稼 働しているが,全体的なポリシーが欠けているために,システムが相互に連携しない 形で作られ,多くの無駄や非効率な点が見られる。また,データに基づき客観的な意 思決定をする習慣がないため,情報システムが医療機関の運用効率の追及に使われ, 情報を収集・分析して意思決定に使うという認識が少ない。 一方,研究面では,日本で生まれたイノベイティブな医療情報関連技術は少ない。 医療関連の新しい情報は,ソフトウェアの形で生まれることが多いが,日本ではソフ トウェアの価値に対する認識が少ないことも上記の理由の一つであろう。 (1−2)それぞれの情報システムの現状 医療機関では,病院情報システム及び診療所のシステムの普及が目ざましい。特に, 大病院では医師や看護婦が直接端末機を使ってコンピュータと対話するシステムへ向 かっている。診療所では,保険請求のコンピュータ化から利用がはじまったが,最近 では,これらをネットワーク化して医療に必要な情報を得る方向へ向かっている。特 に,保険請求業務を医療機関から支払基金まで磁気化した形で連携させる巨大なシス テムを作る計画が進んでおり,このシステムが稼働すればその影響は大きいであろう。 また,一部の地域では,ICカードや光カードを使った患者情報の管理が実験されて いる。医療機関のね,救急医療,臓器移植などの専門化された領域では実用化されて 使われている。 このように全体的にコンピュータ利用は進んでいるが,いわゆる病歴を全てコンピュー タ化して紙の病歴をなくすことについては,まだ可能となっていない。それは,法制 的な問題もあるが,画像の入出力がまだ実用的レベルに達してないためである。 コンピュータとは,やや異なった問題であるが,映像通信を医療に利用して遠隔地 の患者や在宅の患者を診療しようというシステムが興味をもたれており,「遠隔医療」 という名称で呼ばれている。これは,離島や脳外科領域など専門化された場面では実 用化されているものもあり,またハイビジョンの応用など興味ある実験も多く行われ ている。 (1−3)医療情報学研究の現状 上記のような情報システムを支えるために多くの研究が行われているが,その方向 は,次の6つの方向に大別されよう。即ち第一は「情報化時代の患者情報のあり方」 であり,「紙」の病歴が既に時代に合わないため,より効率的で正確な記録方式を求 めて多くの研究が行われている。第二は「情報化時代の医学知識のあり方」であり, 激しく移り変っていく知識を迅速にまた適切な形で医師に届けることは重要な研究課 題である。多くのエキスパートシステムなどが研究されたが,今は論理よりは知識ベー スの形成と伝達の重要性がより強く認識され,この意味から病院と医学図書館を連携 させることなどが研究課題となっている。また,最も基礎的な問題として,医学用語 やシソーラスを作っていくことも重要な研究課題であると認識されている。第三は 「情報化時代のマネージメントのあり方」であり,これまで情報に基づいた意思決定 が十分行われていなかったという反省にたって,情報システムを最大限に利用したマ ネージメントのあり方が研究されている。第四は「医療情報ネットワーク」であり, これはコンピュータネットワークの研究の中で生まれた技術をどう実際面に生かすか の研究である。特に画像関連の情報ネットワークに興味が持たれている。第五は「医 療画像技術の研究」であり,今はアナコログ映像の利用が研究されているが,これが 将来はディジタル画像としてコンピュータネットワークに統合されるという展望の下 に研究が行われている。第六は「医療情報のデータ保護」であり,これは上記のすべ てを含む最も重要な医学上の研究課題である。 以上は,医療の中での情報学の課題を述べたが,医学に関連しては,基礎医学にお ける情報学の重要性も高まっており,Bioinformaticsという言葉も生まれている。最 近の遺伝子や蛋白質の研究,薬剤の開発などには情報学は欠かせないものになってい る。 (2)医療情報学の展望 研究における展望は,既に現状の項に含めて述べたので,ここでは政策的な意味で の展望を述べたい。医療における情報学は応用されてこそ意味があるが,医療は社会 システムであるために,その応用は学問の発達のみでは不可能で,社会にそれを受け 入れる基盤を作っていかなければならない。その意味で政策が重要であるが,ここで いう政策とは,政府の政策のみをいうのではなく,医学界,医師会などの医療関係者, 産業界,行政などを含むすべての人々の認識をいう。 今後重要な政策的課題として,ここでは次の7つをあげておきたい。紙面の関係で これらを詳細に論じることはできないので,興味のある方は末尾の文献を参照された い。 (1)医療情報政策を討議する場の創設,(2)ソフトウェアの価値の認識, (3)医療情報関連技術の標準化の促進,(4)情報を利用することに対する経済基 盤の確立,(5)情報技術応用の障害となる法令の見直し,(6)一般人への医療情 報の提供の原則の確立,(7)情報技術を用いた国際医療協力 参考文献 開原成允,桜井恒太郎,大江和彦,長瀬淑子: 日本の医療情報学・今後5年の課題 医療情報学(印刷中)1944 3.2 判例データベース (1)判例検索は乾草の山の中から1本の針を探すのにも似た大変な作業である。判 例法を主要法源とするアメリカの判例集には,今世紀半ばすでに 225万件が登載され ていた。年々連邦や諸州その他の法域の最高裁以下の諸裁判所からおびただしい数の 判例が流出し,それが今でも加速されて続いている。 大きな訴訟となると,弁護士団が組織されるが,legal research関東のチームが決 まる。それは法の本質を問う抽象的思弁ではなく,具体的な関連判例や法条を捜し出 すことだが,もとは手作業で,しかも期限との闘いだった。チームは3班に分けられ, 3交代で24時間働いた。彼らは判例集,法規集,判例要録,引用手引き書 (citations),目次,索引,文献目録,法律辞典,法律百科,論著と格闘する。商業 出版者は競ってこの労を省く工夫をし,それを出版物の特徴とする。法規集には各条 ごとに立法経過,参照条文,関連判例を豊富に盛った注を加える。判例集には冒頭に 要約をつけて無関係なしかも冗長な判例を読む手間を省き,さらに法律点(point of law) を拾い出してその要旨を頭注として列記する。おかげで,本文や関係部分だけ を読めばよい。West Pub'g Co.は,法律点にそれぞれ番号をつけ同社の他の出版物に もその番号を共通に用いるから,交互参照と芋蔓式発掘を可能にする。これが同社の 誇る Key Number Systemである。引用手引書の中で特に有名なのが Shepard's Citationsである。それはすべての判例について,それを引用したその後の判例を残 らず掲載して,それらが原判例をどう扱ったかを ★P30★ 入力の面での競争は,まず判例や制定法の coverage のサイズと内容に見られる。 最近ではことに国際化で争っている。LEXISが,ECはじめ英仏,カナダ,オー ストラリア,ニュー・ジーランド,中国等の資料をある程度収めるや,WESTLA WもEC,中国を少し加えた上,EUROLEXと提携してそれとの相互乗り入れで 対抗した。 LEXISはNEXISを別に開発し,非法律情報たる主要新聞や雑誌の全文デー タベースを加えると(別料金の関連システムとして),WESTLAWはDIALO Gと提携した。 このほか,両者が鍋を削っているものに,特殊ライブラリー,個人ライブラリー, 特殊サービスなどがある。特殊ライブラリーとは,例えば,WESTLAWの専門家 証人(鑑定人)の名簿のようなものである。 なお,詳しくは両システムの比較表参照(高石 47-8,松浦 42-293 参照)。 (3)次に出力の方だが,バッチ方式は敗退してランダム・アクセスのオンライン方 式が普通になった。 出力に関する最大の問題は検索方法である。LEXISもWESTLAWもKWIC (Key Words in Combination)方式を採用する。これはピッツバーグ大学 Health Law Center の John F. Horty教授が医事法規の全文データベースからの検出用に創 案したものである。key words といっても,データにそれを指定して入力するのでは なく,全文の中の前置詞,接続詞,冠詞,人称代名詞などを除いたすべての key words である。検索方法は若干の訓練を要するものの,容易である。もっとも,当初は1つ の語に変化語尾や接尾語のついた形は別語扱いだったから面倒だった。しかし何と言っ ても,まだ見たこともない判例の中の語を正確に当てなければ絶対出て来ないのであ る。そのため思いつく限りの様々の同義語,類語,上位語,下位語,関連語で試みる ことになる。その一助として thesaurusを用いて自動的に各 key word を拡張して検 索して検索することになる。それでも 100%まで完全に検索し尽くせるとは断言でき ないだろう。 LEXISもWESTLAWも法律辞典を内蔵しているから,検索の途中いつでも 必要な箇所をスクリーンに映し出せる。また引用手引書をも具えているから,検出さ れた判例が現在でもそのまま有効かどうかをすぐチェックできる。中でも Shepard's Citations, Inc.はそのデータをコンピュータ化しているから,両システムともそれ と提携して,検索しながらの Shepardizing を可能にしている。 3.3 農業情報 (1)農業情報の特徴 (1.1)研究分野の多様性 農業研究の分野は,生物の改良・機能の解明,生産の場としての物理的・生物的環 境の解明・制御,環境に人為的に投入される資材の開発・改良・管理,農業基盤整備, 機械化,施設化・農作業の効率化,農業・農村計画,農家経営の改善,農業生産同行 の解析・予測,食品の安全性・高品質化など多様であり,研究手法も自然科学から人 文科学まで広範囲でしかも扱われる情報も多種・多様である。さらに,最近では農業 農村の活性化,環境保全,国土保全機能農業の持つ多面的機能の向上が重要な研究課 題となっている。 (1.2)情報の特徴 これら研究を推進するにあたって扱われる情報の特徴の第1は,時・空間的広がり をもつとともにその構造が複雑である場合が多いことである。例えば,過去の品質育 成の記録は次の育種戦略の策定にあたって重要な情報源であるが,世代を追って様々 な文雑と選抜の繰り返しによって得られたデータは,容易にモデル構造を定式化でき ない複雑さをもっている。第2に画像でしか把握できない特性が多いことである。例 えば,作物の草姿や群集落の特性などは農業上重要な情報であるが,これを数値化す ることは容易ではなく画像情報として扱わなくてはならない。第3にデータ量が巨大 化しつつあることである。近年多様なセンサーと通信技術の発達により農業環境や植 物成長のモニタリングの進歩は著しく,収集・蓄積されるデータは極めて増大してい る。また,広域的農業情報を把握するために衛星等リモートセンシングデータの活用 が必要であるがその量も巨大である。 情報利用の特徴としては,様々なデータの総合的利用が必要なことである。例えば, 農業資源の効率的利用,農業生態系の保全等の研究のためには,人工衛星データ,地 理データ,気象データ,土壌や植生の調査データ等々,様々なデータの総合利用が必 要である。また,データの多くは,制御が難しい生物・環境の複雑な交互作用を含ん でいる。さらに,環境条件の変化に対応して適切な技術対応を行うために,データの リアルタイム利用の問題などがある。 (2)情報研究の課題 農業情報の特徴と関連して農業分野における情報研究の課題をいくつか挙げる。 (a)巨大情報の管理・処理方法 農業で扱われるデータの多様化と巨大化に対応して,新たな情報処理手法の開発が 必要である。例えば,データのもつあいまいさを適切にモデル化し迅速に情報の抽出 を可能にする情報システムの開発,圃場データや環境データの自動計測における誤差 やノイズの制御等,計測に関連した新しい応用数学的手法の開発などがある。 (b)システム科学的手法 作物とそれをとりまく環境の複雑な現象を把握し,その変動を適切に予測するため に,主要な手段としてシステム科学的手法の開発・適用が必要である。農業における システム研究においては,システム全体の時間的・空間的挙動を決定する要素を抽出 し,そのモデル化を行うことが主要な課題である。 (c)データベースの開発 大量でしかも多岐にわたるデータの総合的利用はデータベースの整備と利用を前提 にしてはじめて可能になるものであり,データベースの必要性は極めて大きい。しか もこれらを商用データベースに依存することはできないので,農業に必要なデータベー スおよびその利用システムは農業分野で主体的に開発しなければならない。 (d)農業農村の高度技術化,高度情報化 農業農村の活性化のための諸方策,農業の持つ多面的機能の解明と維持増進,地球 的規模の農業問題などに情報研究の関わりは大きい。その1つとして地域農業情報シ ステムの確立の問題がある。これらは他分野へ依存できるものではなく,農業分野独 自の問題として対応しなければならない課題である。 (3)情報研究の展望 現在,農業における情報研究は情報の計測・収集手法,管理・蓄積手法,情報シス テム化手法など広範囲に実施されているが,必ずしもうまく進んでいるとは言えない。 それは情報学専門の研究者がいなかったこと,組織的な研究体制がなかったこと及び 情報研究の成果を正当に評価する認識に欠けていたことによるものと考えられる。し かし,最近は農業分野にも情報工学,電子工学専攻の研究者がわずかではあるが加わ るようになり,また,研究体制も整備されつつある。 今後,情報学の発展が農業情報研究に大きなインパクトを与えてくれることを期待 する一方,農業情報の特徴的な研究が,かって例えば近代統計学が生物学や農業試験 の情報処理から発祥したように,他の分野へ貢献できる可能性があることを期待した い。 3.4 博物館情報 普通博物館という名称は考古資料や生活資料を陳列している場所として狭い意味に 使われている。しかし美術館,水族館,動物園,植物園,科学館,なども博物館の範 疇である。そこでは対象の違いはあっても,さまざまなモノを集め,それをある種の 体系にしたがって展示をし,そのモノの世界をより良く理解させるようにする施設で ある。 したがって博物館ではまずモノを集めることが重要である。しかし単にモノがあっ てそれが適当に並べられているだけでは不十分である。各々のモノについて更に詳し い知識,情報が必要である。それは,名称(学名),収集地,分布状況,年代,など 基本的なものもあるが,対象とする分野によって必要な項目は異なっている。 普通どこの博物館でもその館がたしようにしているモノに対して情報カード,ある いは資料カードが用意されている。そこにはいろいろな項目がかかれている。名称ど の基本情報はカードに記入されているが,そのほかの情報となるとほとんど記入され ていないのが現状である。ましてやコンピュータ化がなされている場合は少ない。 情報カードの作成ができていない原因のひとつは,分類ということにこだわってい るからである。図書の場合にはUDCやNDCなど分類体系ができている。ところが 考古学資料や民族学資料などは,分類体系は研究がある程度進んでからでき上がるも のである。しかし分類項目が定まらないとデータ化が行えないとしてデッドロックに 陥っている場合が多い。カードだけで検索をしようとすれば分類がしっかりしていな いと捜しにくいということになる。しかしコンピュータを使って検索する場合には, その情報カードに含まれている文字列すべてが検索の対象になるから,断片的なデー タであっても活用可能なのである。そこがカードのみのシステムとコンピュータ・シ ステムとの大きな違いの一つである。 それと関係して大小さまざまな博物館で情報化が進んでいない要因として標準化と いうことにこだわっているところがある。図書の分類体系と同様の標準的な項目をす べての博物館で共通に利用できるのをまっているというケースがある。標準化はそれ ができるに越したことはない。なかなか足並みが揃うものではない。それをまつてい たのでは資料がどんどんたまる一方である。 もちろんコンピュータを使ってのデータベースのことを全く無視したデータ作成は 困るが,各博物館でデータフォーマットが異なっていても構わないのである。とにか くそれぞれの博物館でコンピュータにデータを入れて検索できる体制にあれば,他の 博物館とのネットワークによって相互利用ができるようにできるのである。 記述データだけではなく博物館では画像データが重要になる。対象物の姿が表示さ れるような情報化が望まれる。それは平面的な画像であったり,立体的な画像であっ たりする。普通どの博物館でも展示されているモノの数は収蔵品のごく一部である。 そこでコンピュータやハイビジョンによって展示場にないものの情報を提供すること が考えられている。また展示場や収蔵庫に距離を置いて存在しているものを相互に比 較したいということがある。現在の物理的な空間ではそれは容易ではないが,コンピュー タによる画像であれば隣接して並べることができる。 4.情報化社会の規範 4.1 情報経済 ミクロ情報経済学 −− 「情報経済学」なる用語は,1961年のスティグラーの論 文をその嚆矢とするとされる。その以前においても,経済活動における情報の役割の 重要性は意識されてはいたが,これを正面から扱うことはなかった。古典的経済分析 における情報とは,すなわち価格だけであり,しかも市場参加者はこの価格をすべて 知っているという完全情報の世界を想定した議論がなされていた。ここでは,価格情 報は費用をかけることなく,しかも即座に入手可能なものとされている。 しかし実際には,株式市場のような例外を除けば,価格の調査にかなりの費用と時 間を要するのは常識である。もっとも,そうした手間をかければ,財をより安く販売 しようとする者を発見できるはずである。このとき,こうした調査によって得られる 購入費用の節約分を,その価格情報の価値と評価でき,その節約分と調査コストとの 差が最大になるまで価格調査を継続する意味があることになる。 つぎに,投資を決定する場合を考えると,投資から将来実現される収益は一般に不 確実であるが,この不確実性をいくらかでも減じるような情報が入手できたとすれば, それだけ有利な投資決定を行うことができる。そうした情報は,投資を有利にした分 だけの価値があることになる。このような,不確実性とその低減をもたらす情報の役 割を導入した経済取引モデルの分析を行う分野が形成されている。 この場合,情報とは価格情報とは限らずに,例えば財の品質,特性に関する情報な ども対象になる。そして,取引主体間で情報が非対称であることから,逆選抜(例え ば,個々の中古車の真の品質は現所有者のみが知るところであり,中古車市場では, 購入者は平均的品質を前提にして購買決定せざるを得ない。したがって高品質の中古 車所有者は不満であるから市場から退出してゆき,これが平均品質をさらに引き下げ て,結局最低品質の車ばかりが残る)や,モラル・ハザード(例えば,保険をかけた 人は,これをあてにして危険回避に対する努力が低下する可能性がある。しかし,保 険会社は,このような個々人の行動情報を把握して,査定することはできず,したがっ て保険事故が増大して,保険料は次第に高騰してゆく)などの問題が検討される。 上記はミクロ経済学における経済取引のモデルを,より現実の経済行動に近づけよ うという方向での展開であり,その過程で情報の役割が必然的に導入されたものとい える。一方,情報を経済財の一種として,その特殊性を分析して,情報財の価格,需 要と供給,市場,情報産業などについて解明しようとする情報経済論が,マクロ経済 の一分野になっている。 マクロ情報経済学 −− 情報経済論は,1962年のマハルップの「知識産業」端緒 とするもので,情報化社会と並行して議論が行われた。これは,経済のサービス化, すなわち物財に代わってサービスが優越するという現代のソフト化経済について,こ れを経済学的に正当に把握しようとする試みのひとつである。これは,従来の経済学 が基本的に物財の生産・消費を前提に構成されていたとに対する反省でもある。 経済財としての情報は,その特質として,排除不能性(情報は安価に複写でき,こ うした利用を不正として排除するのが困難である),協同消費性(もうひとりが情報 を得るについて,追加的費用を要しない,情報は見ても減らない)がある。これはま さしく公共財の特性である。しかし,これをもって情報はすべて公共財とされるべき であるといえないのは明らかであろう。たしかに,通常の物財の取引に比べて厄介な 点は多々あるが,情報商品の売買は現に活発に行われ,ますます盛んになっている。 そこで,こうした情報財取引の不正化や,情報産業の振興を図るべき経済政策などに ついて,例えば,複製防止装置や複写料徴収制度の経済効果を検討し,また産業関連 表を情報活動に着目して組み替えるといった試みがなされている。 情報学の役割 −− 上述のような,情報の機能を組み入れた経済分析や情報財に 関する経済学は,これをみる限り経済学の自然な発展,あるいは時代への対応という 路線上のものである。この意味でこれらは経済学そのものといえる。このことを前提 として,以下,情報学との関連を検討する。 経済学の分析用具やモデルは古典力学や数字に多くを負っている。情報学は,情報 の経済学や情報財の経済学にとって,あたかも古典力学や数学と同様の位置にあるも のと考えられる。上述のような経済分析において,その出発点で仮定される情報の機 能や特性は,経済学者がいわば常識的に認識できる範囲のことであって,科学的な吟 味,すなわち情報学的な吟味を経たものではない。これまでの段階では,こうした常 識的な情報規定で間に合う範囲での議論であったし,また一方,情報学の側でも,こ の点に関して組織だった検討がなされていなかったという事業もある。 しかし,今後情報経済研究のより一層の深化を図るに当たっては,情報学の立場か らの,情報の本質に関わる本格的な分析の成果矢踏まえてゆく必要があると思われる。 このことは,情報経済学に対する要請ではなく,むしろ情報各におけるこの方向での 研究の推進を示唆するものである。現代社会における情報の役割はますます増大し, その経済学的な検討はますます重要になっている。こうした状況のもとで,より有効・ 適切な情報の規定,モデル,分析用具等を情報経済学に提供してゆくことは,情報学 の重大な使命のひとつであるといえよう。 4.2 知的財産権 地域財産権制度は,情報化社会において新しい対応を迫られつつある。ここでは著 作権制度に焦点を当てて問題点を列挙する。 (1)オリジナルとコピーの区別の無意味化 在来制度どは,情報製品に対して「オリジナル」(著作物)と「コピー」(複製) というコンセプトを用意し,この区別のもとにシステムを構成し運用してきた。だが, 電子技術の発展によって,複数のオリジナル(または複数のコピー)が同時に存在す る,という状況が出現した(例,DAT)。 (2)複製概念の変質 在来の制度は,著作権を情報製品の「表現」に対する「複製」を管理するための道 具として扱ってきた。だがコンピュータ・ソフトウェアにおいては,「非表現」(例, アルゴリズム)に対する「複製」や「表現」に対する「非複製」(使用)が問題になっ てきた。このために現場においては,「表現」や「複製」に関するコンセプトが曖昧 になりつつある。 なお,「非表現」に対する「非複製」については,ソフトウェアの「特許」化とい う形で,問題の解決が図られつつある。 (3)人格権の形骸化 在来の制度は,オリジナルの生産者に「著作権人格権」という権利上の優先性を与 えてきた。この内容は,たとえばコピーがオリジナルと同一であることを強制するも のである(同一性保持権)。しかし,電子技術の発達とその産業化によって,同一性 保持権を逸脱する情報製品が出現してきた(例,コンピュータ・グラフィクス,デジ タル・サンプリング)。 とくに情報製品におけるインタラクティブ性の増大は,オリジナル優先主義の在来 制度を大きく変質させつつある(例,ゲーム,ザッピング・テレビ) (4)オリジナルの価値の低下 従来の制度は,オリジナルの生産者に「複製権」をはじめとする各種の権利を付与 し,かれらを二次的著作物,編集著作物,データベースの著作物の生産者よりも優位 に置いている。だが情報過多の時代においては,オリジナルよりも二次的著作物など のほうが,情報的価値つまり産業的価値がはるかに大きいという場合も多くなってい る(例,データベース)。 (5)公的情報の権利化 80年代を通じ,知的財産権意識の高まりとともに,かつて公的分野にあるとされて きた情報の権利化が,産業界を中心にすすめられている。これは,とくにコンピュー タ・ソフトウェアをめぐって行われている。具体的には,ソフトウェア互換のための インタフェース,ディスプレイ上のユーザー・インタフェース,通信プロトコルなど が権利化されている。 (6)私的使用の増大 従来の制度は,著作物の「私的使用」に対して著作物の権利を制限してきた。だが コピー技術の発達とコピー機器の低廉化によって,エンド・ユーザーは高性能コピー 機器を私有化できるようになった。このような環境下では,「私的使用」のルールは 著作者の得べかりし利益を大幅に失わせることになる。現に,「私的使用のルールは しだいに見直されつつある(例,DAT)。 (7)情報の自由流通 在来の制度は,著作物は著作権者側で管理しうる,という前提にあった。だが電子 機器の普及と通信ネットワークの発達は,著作物をより自由に流通できるような環境 を作ってしまった(例,レンタルCD,パソコン通信によるフリー・ソフトウェア)。 このような環境は,著作者および使用者の意識を大幅に変質させつつある。 (8)権利の集中管理システムの立ち遅れ 権利集中管理機関としては,現在,若干の機関が活動している。だが現実に,この 種のシステムを構築し運用している機関は一部にとどまり(例,音楽),他の多くの 分野ではこの種のシステムは未整備の状況である。このために権利関係が錯綜する分 野では,権利の処理について,権利者間または権利者〜使用者間において,紛争の発 生する確率が高い(例,放送,マルチメディア)。 (9)著作物の越境流通 人や物の移動とは無関係に,自由に国境を越えてしまう著作物が出現した(例,衛 星放送)。このために越境著作物について国境の両側で調和のとれた権利処理をする 必要がでてきた。(なお,在来型の地上波放送の到達範囲は国境内に閉ざされたもの であった。) 4.3 情報倫理綱領 (1)医聖ヒポクラテースの宣誓は,おそらく史上最古の倫理綱領であるが,現在で もアメリカの医学生は卒業の際その宣誓を行う。日本では,つとに緒方洪庵がドイツ 人 C. W. Hufeland の医の倫理を抄訳して,「扶氏医戒之略」と題し,門人らに与え て戒めた。法曹も高等職業人(professionals,以下単に職業人)の典型として,早く より倫理要項をもつ。アメリカ法曹協会の弁護士倫理綱領と裁判官倫理綱領は模範的 だが,日本にも日本弁護士連合会「弁護士倫理」がある。 およそ職業人には高度な専門知識・技能の修得と,これを用するに当たっての高い 行動規範の遵守とが要求される。この点で専ら利を追求る手職人(handicraftsmen) や商売人(tradesmen)と区別される。専門知識・技能は高等専門教育や資格試験の問 題であり,行動規範は倫理綱領の問題である。 コンピュータ時代に入って登場した新しい型の情報関係者のうち,情報技術者は上 記の両資格要件を満たすべき職業人と考えられる。かれらのための倫理綱領の作成は 現下の急務である。以下既成の諸しょぎょう倫理綱領より具体例をとってその問題点 を検討しよう。 (2)アメリカ法曹協会の職業倫理綱領(Code of Professional Ethics)は個人の具 体的な職業倫理規範(canons/rules of professional ethics)の集成である。その具 体的内容は,日本弁護士連合会の「弁護士倫理」について見ると,一般規律(規範), 法定内,対官庁,対依頼者,対相手方その他の規律に分かれている。その一部は法規 範でもある。法は万人の守るべき行動規範だから,当然職業人も拘束される。 このうち日米の対依頼者規範が参考になるであろう。弁護士と依頼者,医師と患者 との関係は,商人と顧客との関係と大いに異なり,信頼関係(confidential relation) と呼ばれ,前者は後者に対し忠実義務(duty of loyality) を負い,その最善の利益 を図らなければならない。専門家としての優越的地位を濫用して,依頼者や患者の利 益に反するような合意をすれば,倫理違反として懲戒(後述)の理由となり,法にも 触れ,その合意を裁判上強行出来ないばかりか,罰せられる恐れもある。過大な報酬 もその一つで,対等の商人間なら問題にならないだろうが,職業人には許されない。 その守るべき行動規範は一段高いのである。 もっとも,弁護士報酬に関しては最近大きな変化が生じた。報酬はもともと honorarium で,依頼者が任意に払う礼金,寸志である。イギリスのバリスタの法服 の背中のポケットはそれを受けるものだった。今でも支払わない依頼者を訴えること は出来ない。しかし英米とも消費者保護の時代に入って,法律サービスの消費者たる 依頼者の利益のため,報酬の自由競争と広告とが解禁になった。これは,特価サービ スのTV広告をして懲戒されたある簡易法律事務所(legal clinics)のチェーンが, 連邦最高裁判所まで争って勝ちとった戦果である。 弁護士には,利害相反(conflict of interest) の禁といって,原告と被告との双 方代理は許されない。依頼者に対する忠実義務の当然の帰結である。(なお,アメリ カの広告代理業者はこの原則によって,同一業者一社しか代理しない。) 弁護士や医師は最善の処置をするため依頼者や患者から十分な情報を聞き出す必要 がある。秘密も含まれる。その代わり厳重な守秘義務を負い,外部者に対しては秘匿 特許といって,たとえ法定の証人となっても開示を拒否できる(本人の同意がない限 り)。 さて情報技術者について見よう。以上3つの義務のうち一番問題になるのは守秘義 務であろう。データ処理業者は,大学の入試データを処理しあるいは諸会社の経理事 務を代行し,会計記録を負うことは当然である。重大な個人情報を含むから勝手な開 示は倫理違反であり,法律違反でもある。 アメリカの大手データ処理業者には,経理データを用いて一定額以上の高額利得者 の address lables を作って direct mail用に売ったり,俸給や賃金の趨勢に関する 統計データを作成して経済雑誌などに売る。これはどうか,個人情報自体ではないか ら,法が介入しないとしても,情報技術者にふさわしくない行為であれば,顧客の明 示の同意なく行ってはならない,という倫理規範を定めることもできよう。 このように,(1)綱領は理想や目標の宣言にとどまらず,具体的で実践的な行為 規範を盛り,(2)それらの行為規範は裁判を伴い,一部は法規範と重複する,(3) 具体的で詳細だから,情報倫理綱領はぶもごとに異なることになる(アメリカの法曹 倫理綱領には,前述のように,弁護士のと裁判官の二通りがある)。 (3)法曹倫理綱領はアメリカの law schoolsの教科の一つとなっており,さらに臨 床法学教育(clinical legal education),すなわち実習コースにおいて具体的事件で 実践的に教えられる。弁護士資格を得るには,弁護士試験(bar examination)のほか に,弁護士倫理の試験にも合格しなければならない。それは単なる抽象的作文問題で はなく,具体的仮説問題でテストする。 (4)職業倫理綱領の実効の確保と,違反者,欠落者の処分はどうしているか。法規 範を重複している場合には,それが容易である。刑事法規違反なら刑事責任(刑罰) が,民事法規違反なら民事責任(損害賠償など)が裁判所によって課せられ,行政法 規違反なら行政処分が加えられ,その上に倫理規範により懲戒(後述)ができるから である。 法は服従の意志の有無を問わず実力で強制するが,倫理は元来良心の問題として自 発的服従を予定するから,実効の確保には世人の批判・非難による以外はない。 職業団体がある場合,違反者に注意・警告の上除名する。その団体に権威があれば, 除名は本人の社会的な信用の失墜として制裁になる。アメリカの一部の州法曹団体の ように,法律で加入が強制されていると,除名は資格剥奪という強い制裁になる。ま た権威ある団体が公表する評価も威力をもつ。アメリカの医師会はかつて medical schoolsの実態調査をして,合否の判定を発表した。その結果半分の不良校が潰れた。 法曹倫理綱領のうち理想や目標の宣言いがいついに法と同一の効力を有するに至っ た。日米ともそれに準拠して懲戒処分(譴責,停職,資格剥奪)が行われる。通常弁 護士会が行い,不服の者は裁判所へ上訴できる。第一次懲戒機関の構成員が弁護士だ けのためか,とかく処分が寛に失することなど,さまざまな問題がある。 4.4 情報倫理綱領をめぐるIFIPの活動 IFIP(International Federation for Information Processing)TC−9 (Computer & Society Relationship)では1980年初からEC諮問委員会の報告書 H. Maisl. Legal Problems Connected with the Ethics of Data Processing[Concil of Europe. Strasbourg, CJ-PD(79)8, August 29, 1979]の検討を契機に情報理論 (Information Ethics) をその第2作業部会(WG9.2)の研究課題としてきた。 1988年 Prof. Dr. Sackman(前TC−9議長)はPreliminary IFIP Code of Ethics を起草した。 しかし,TC−9内部では文化,伝統,法制の異なる世界で,普遍的な倫理綱領な どの成文化には疑念を抱く者や,IFIPのような国際機関はいかなる Code もその メンバーである各国学・協会に強制出来ないと主張する者もあり,1992年9月開 催の第12回世界コンピュータ会議(マドリッド)において“Ethics of Computing : Information Technology and Responsibility"をテーマにパネル討論が開催される ことになった。 このパネル討論および今後のIFIP加盟各国学・協会内でのCode of Ethics : Discussion Paper を編集,提出した。 この Discussion Paper は 1.序論(Introduction) を含め全体で9項目から構成されている。 2.「倫理,倫理学説」では Jeremy Bentham, J. S. Mill の Consequentialism (Teleological Theory) や,E. KANTOの説く Deontological (Principle) theory を紹介。 3.「倫理規範の機能」(Functions of Ethical Norms) では(a)情報技術の成果とその導入による影響に対する責任機能 (Responsibilities) (例えばDNA−Mapping のような革命的技術開 発と利用に対する責任),(b)立法,行政ではカバーしきれないこと を柔軟に補強する補完機能(Flexible instrument supplemented to legal and political meaures),(c)科学・技術の集約的影響に対す る公衆への注意喚起機能(Awareness of People),(d)同じ考えたを もつ職業グループに帰属しているという社会的職能機能(Status of Profession),(e)国によって異なる諸施設の相違を調和させる調整機 能(Harmonizing differences between diverse countries)等である。 4.「倫理規範の表現形式」(Options for Ethical Norms)では,考えられる 次の5つの形式,(a)守るべき原則(Principles),(b)公序良俗に そった行動基準(Public Polices),(c)守るべき原則に則った行動規 範(Codes of Conducts),(d)指針(guidelines)および(e)法制 文書(Legal Instrument) を挙げ,倫理に関してはある階層や同業会社 を支配する行動規範の集大成ということで Code of Conduct(または Code of Ethics) の型をとるのが実際には最も一般的な取扱いであろう としている。 5.「情報倫理要領の必要性」(The Need for Information Technology Ethics) においては,今日情報技術は日常生活の Macro (Societies as a shole),Meso (Organizations),そして Micho (Individual and family life) の全階層にわたって影響を与えているとしている。すなわち, (a)情報技術は強力で不断に発展する Toolsであり,(b)あらゆる 生活局面に浸透しており,(c)情報技術への依存努力は生活全体に大 規模な脆弱性(Vulnerability)を創出し,(d)このような情報技術の 進展と利用に法制文書化等の対応整備が追い付かない現状にある,とし て Code of Ethics の必要性を強調している。 6.「情報倫理要領」(Code of Ethics) ではすでに Code of Ethics を作成 している次の学・協会の Codesの骨子を紹介している。 (a)Association for Computing Machinery(ADM)の A. C. M. Code of Ethics and ProfessionalConduct,(b)Computer Professionals for Social Responsibility and Privacy International(CPSR/PI) の Code of Fair Information Practices. IFIPの Code of Ethics は前述のごとく前TC−9議長 Sackmanに より起草され,IFIP Newsletter(1989年12月号)に公表された。 4重の倫理領域(a four-fold ethical domain) すなわち,(a)個人の 職業倫理領域(Individual Professional Ethics) (b)国際機関の倫理 領域(International Organization Ethics)(c)国際法制情報倫理領域 (Ethics for International Legal Information) と(d)国際公共倫理 領域(International Public Policy Ethics) から構成されている。 7.「既存 Codesに対する反対意見」(Objections to the Presented Codes) では前項で紹介した Codesに対して(a)Codes の内容が詳細過ぎること。 特にIFIP−Codeは4重の倫理領域に重複のあること。(b)あまりに 詳細かつ強力な Code は情報技術のような Very dynamic な科学(science) に対し static かつ inflexible になりがちであること。(c)先進国の 技術的思考の所産であり文化・社会的価値の相違を軽視していること。 (d)一部 Codes には懲戒的な規範が欠落しているなどの反論をとなえ ている。 なかでも,Draft IFIP Code of Ethics については作成される Code に最終的に署名する会員資格者,すなわち加盟各国の学・協会 (national scientific of technical society) の意見を不問のままに起 草してきたことも批判された。 最後の8.「反論の解釈」と9.「検討」においては,IFIPのような国際機関 が全加盟学・協会が受け入れられる Code を作成することは不可能である。しかし, 加盟各国の学・協会がそれぞれの国情にあった守るべき原則(general principles) を義務として書き込んだ(deontological statements) 倫理要領を作成すること,そ の際ACM,BCSの Code はモデルとなろうと提案している。 Discussion paperに盛られた内容をふまえた世界コンピュータ会議でのパネル討議 はIFIPのセンドフ会長が自らモデレータとなり,アメリカ,EC主要国の専門家 がパネリストとして参加し,活発な討議が行われ,情報倫理の問題に世界中が大きな 関心を寄せていることが強く感じられた。 世界コンピュータ会議後開催されたIFIP Technical Assembly(TA)において, mission として Development of “ IFIP Guidelines for Codes of Ethics and Professional Conduct" に関するドキュメントを準備する Task Group を設置し,こ の Task Group はTC−9で運営し,18か月以内に Codes ofEthicsに関するIF IPの考えをまとめ起草することになった。 5.わが国における情報学の課題 5.1 情報資源の整備 (1)情報資源の基本的認識 情報は,社会経済活動を支える基本的要素の一つである。近年,コンピュータと情 報通信技術の飛躍的な発展は,従来の数値や文字情報のみならず,音声や画像情報を 含む大量かつ高度な情報処理や情報流通ネットワークを実現した。 このような情報技術の高度化は,「情報」を体系的に収集し,加工し,処理し易い ように整備・蓄積することを容易とし,利用価値の高い“資源”と呼ぶにふさわしい 状態にすることができるようになった。 「情報」資源は,「物質」,「エネルギー」などの天然資源と異なり,研究開発の 進展や技術進歩,社会システムの高度化・多様化などにより,その拡大再生産と新た な蓄積を図ることができることに大きな特徴がある。 (2)わが国における情報資源整備の現状 情報技術の進歩により,現在様々な情報が様々なメディアにより容易に資源化でき る環境にある。このような情報資源は,科学技術分野は勿論のこと,産業・経済,文 化・芸術,教育,観光・レジャー,生活関連分野で形成されつつある。 これら情報資源の充実・整備が人間や社会に及ぼすインパクトは,(a)人間の知 識や研究開発・技術開発に及ぼす影響,(b)社会システムの情報資源への依存性の 増加,などに代表される。 研究・技術開発の成果である科学技術情報資源は,新たな研究開発の糧であると同 時に人類共通の知的財産でもある。一方,医療・福祉,防災,環境,行政,教育など の各種社会システムの有効性は,その投入する予算規模や人材と同様,システムの保 有する情報資源の質と量にも依存すると言われ,今後この比重はますます大きくなる と予想される。 わが国の科学技術分野のデータベース化は,米国より約10年遅れ1970年代後半より 本格化し,現在,科学技術以外の分野のデータベースの整備も急速に進んでいる。わ が国で利用可能な国産データベースは,平成3年度のデータベース台帳総覧によると, 文献データベース152(科学技術分野56,その他の分野96),全文データベース342(科 学技術分野33,その他の分野309),ファクトデータベース345(科学技術分野27,その 他の分野318)となっている。しかし,国内で利用できる海外製を含めた全利用可能デー タベースのうち,国際製は,文献で21%(科学技術分野15%),全文で25%(科学技 術分野12%)にすぎない。ファクトデータベースについては,総数では国産製が多い が,科学技術分野では24%となっている。 全文データベースでは,新聞編集工程での副産物としての各種新聞情報が,ファク トデータベースでは,市況,投資,財務などビジネス系を中心に民間企業でコストリ カバリーベースで整備されつつあるが,採算性の悪い基盤的情報資源としての科学技 術情報の整備はまだまだ不十分と言わざるをえない。 (3)わが国における情報資源整備の課題 個々に存在するだけでは利用価値の低い情報を,利用価値を高め,利用に便ならし めるように体系的に収集,加工,整理・蓄積するためには,長年にわたる多くの知的 労働と資金が必要となる。 オリジナルな情報が,ほぼそのままの形で資源化される数値情報や事実情報,一部 の全文データベースはあるものの,情報そのものを圧縮化したり,利用し易い形態に 加工する場合が多く,オリジナルな情報を資源化するための新たな,ある意味では非 生産的な,作業が必要となる。こうした作業は,人的・知的作業が多く,合理化・機 械化が困難あるいは部分的にしか適用できない。 データベース構築上の問題点として,データベース白書 '93版のアンケート結果に よると,(a)のデータの収集,入力などの構築作業にコストがかかる(87.5%), (b)構築後のメンテナンスコストが負担(61.3%),(c)初期投資が大きく回収 困難(45.0%),(d)構築に関しての国の助成がない(22.5%),(e)DBMS など効率的ソフトの不足(22.5%),(f)標準化の検討が不足(17.5%),(g) インデクサ等のデータ作成者の不足(13.8%)・・などとなつており,データベース 構築面での最大の課題が,初期及び運用コストであることを示している。 わが国における今後の情報資源整備の課題として,(a)研究者や研究機関など情 報発信者への,あるいは防災,環境,医療機関など各種情報収集機関への情報資源化 のための財政的,人的,技術的な支援の強化(b)大学や国公立試験研究機関などが 積極的に研究情報を公開できる環境の整備,(c)情報資源化のための情報表現形式 の標準化の推進,(d)わが国の主体性の確保と国際的役割を果たすために基盤とな る情報を整備する公共的な情報資源化専門機関に対する助成の充実,などが考えられ る。また,技術的な課題として,情報そのもの自己組織化による更に高度な情報の創 出メカニズムの研究なども検討に値しよう。 5.2 日本語情報の収集と提供 公的機関(あるいは,それに準ずる機関)における日本語情報の収集と提供活動の 現状を概観する。また,今後どういるべきかについても簡単にふれることにする。現 状は,満足すべき状態とはいいがたく,今後の努力に期待することが大きいからであ る。ここでいう日本語情報とは日本語の言語情報(2章,言語情報の項参照)のこと である。 (1)日本語情報への需要 日本語情報への需要の源は,大きくは日本語教育,言語学教育,コンピュータによ る日本語処理の三つである。従来は,日本語教育も国内の言語教育,言語学研究も国 語学研究という観点からの需要であり,コンピュータに関してもごく限られたもので あった。しかし,ここ十年程で大きく状況が変わってきている。国際化と情報化がそ の要因である。日本経済の国際化の中で外国人に対する日本語教育の大きな需要が生 じた。しかも,ビジネスの現場や日常生活に役立つ実用日本語に対する需要である。 コンピュータによる日本語処理は日本語ワープロの普及によって大きく加速された。 機械翻訳をはじめとする日本語処理ソフトウェアの本格的な取組みが始まり大規模で 高品質の日本語データが求められるようになった。日本語教育と日本語処理という現 場のニーズに刺激され,また,学問自体も大きく進展する中で言語学研究の現場も大 きく様変わりをしつつある。理論研究がある種の成熟に達しつつあるなかで,日本語 学という観点を踏まえた実データに基づく研究が注目を集めるようになっている。 (2)日本語情報の供給 需要サイドの変化に十分に対応しきれているとはいえないが,供給サイド,すなわ ち,日本語情報の収集と提供の活動も新たな様相を見せつつある。ここでは,最近の 同行の特徴的なところにしぼりその活動を概観する。 外国人の日本語教育に関しては,日本語情報は教材,教授法などやそれらの裏付け データの形をとる。教育課程の研究を含め体系的な整備の役割をになうところとして 国立国語研究所がある。例えば,外国人の日本語語彙教育のための基本語用例データ ベースの作成等が行われている。一般的な教材に関しては外国人に対する日本語教育 の中心機関である国際交流基金が供給源である。また,教育現場の具体的なデータは 外国人留学生の日本語教育のセンター機能を持つ各地の大学からも提供されている。 コンピュータの言語処理に関しては,日本語情報はコンピュータ処理可能になった 辞書,コーパス,テキストデータ,そして処理ソフトウェア等の形をとる。日本語電 子化辞書研究所では日本語と英語を対象に次世代自然言語処理技術のための大規模な 電子化辞書の開発が行われている。現在,50ケ所程の国内外の大学,研究機関等に 評価研究用として供給されている。また,小規模ながら特色のある辞書作りが各所で 行われている。情報処理振興事業協会技術センターが代表例である。また,京都大学 をはじめとする大学の研究グループがデータやソフトウェアを公開し,協同利用の環 境を整えつつある。テキストデータに関しては各種の機関がデータの蓄積をし,一般 利用に向け供給を始めている。さらに,音声言語に関しては,国際電気通信基礎技術 研究所,電子技術総合研究所,日本音響学会,東北大学等で音声データの収集と提供 がなされている。 言語学研究所に関する日本語情報の供給は国立国語研究所や大学等における研究成 果の従来からの蓄積活動の延長線にある。むしろ,これに関しては出版社における大 型辞書等の刊行事業に負うところが大きい。 (3)これからの活動 日本経済の不調から外国人の日本語教育の過熱状態は納まったが,その重要性はむ しろこれからであろう。分野や外国語ごとの対応での辞書や教材,教授法等の開発, 整備を着実に進めねばならない。情報化もこれから本格化する。日本の国家情報基盤 のその基礎となるのが日本語情報である。日本語処理用言語データの開発,整備にも 一層の努力が求められる。これには言語学研究との密な連帯が重要になる。言語学に とっても言語データの分析に基礎を置く実験科学への展開が今後の課題である。しか も,どの方面からも海外からの日本語情報への需要が生まれてきている。これには, 日本として無条件に応えるべきであろう。 5.3 情報流通の整備 流通すべき情報として,灰色文献(Grey Literature)と呼ばれるカテゴリの文献が クローズアップされつつある。灰色文献とは通常の出版・流通の経路で扱われていな く,またそれについての検索手段が整備されていないので,入手が困難な文献を指す。 これにはテクニカルレポート,会議資料,学位論文,大学出版物,官公庁資料などが 含まれる。正規の流通経路にある学術雑誌は研究成果が得られてから出版するまでに 時間がかかり,現場の研究者にとってはテクニカルレポート,会議資料などがより重 要となる。また官公庁資料は民間の企業活動にとって貴重であるがなかなか入手でき ない。灰色文献の収集と蓄積,検索,配布については,従来,英国のBL(British Library),欧州のEAGLE(European Association for Grey Literature Exploitaion),米国のNTIS(National Technical Information Service),わが国 のJICST(日本科学技術情報センター)などがその事業の一貫としてそれに努め ている。灰色文献の二次情報をオンライン情報検索システムやCD−ROMで提供し, ものによってはその一次資料のコピーを郵送あるいはFAXで配布している。しかし ながら,対象とする文献は限られたもので,またその事業の採算性に難点があり,こ のままでの体制では問題の解決にほど遠い。 最近になって,問題の解決を求めた動きが活発になってきた。1993年9月には 米国NASAの主催によるワークショップ「外国灰色文献へのアクセスの改善」が開 催され,また同年12月にはEAGL主催(JICST,NTIS共催)による「第 1回灰色文献国際会議」が開催されている。いずれの会議においても,国際学術情報 ネットワークを介した全文データベース(一次資料)の相互共有,所在情報サービス, 一般利用者への文献本文(一次資料)の提供の必要性が強調されている。つまり,2. 6で述べたWAISやWWWなどの形態が門だの直接的な解決の糸口となるというの である。「第1回灰色文献国際会議」では,INGLA(International Network for Grey Literature Association)の設立を目指して,会議参加者にアンケート調査 を行っている。 あるべき一つの姿として,国際学術情報ネットワークを設置し,灰色文献の生産者 となる組織が加入する。各組織は自身が生産する文献を格納する全文データベースを 維持し,ネットワークからのアクセスに応じる。望むらくは,各国の産官学のすべて がそのような組織として加入する。このネットワークにはもちろん一般の利用者がア クセスでき,文献本文が電子的に入手できる。 この方式を進めるにあたって解決すべき点がいくつかある。 (1)文献データの国際標準化 (2)マルチメディア情報 (3)所在情報,検索手法の開発と整備 (4)著作権使用料 (5)一般利用者からの料金徴収方法 (6)データベース提供者への利益還元方法 (7)ネットワーク運営・財政の管理 特に,わが国としては日本語の問題をかかえているので,欧米に対し積極的に働き すける必要がある。 5.4 著作権の権利処理,標準化および流通 情報化とは,情報を技術的・経済的に処理可能な客体に化することであり,これは 情報の電子化によって具現された事態であると解される。情報学は,このような現代 的状況の要請に応えるべく構成され,またその振興が図られるべきものである。とこ ろで,情報の発展のためには,情報学研究の素材あるいは対象となるべき電子化情報 が,情報学研究者に豊富に提供される必要がある。一方,情報学研究には,基礎科学 的研究だけでなく,社会の具体的な要請に直接に応える応用科学的領域も大きいと目 される。このような応用科学的研究の成果が社会的にひろく実地に応用されることに より,わが国における情報化が適切に助長されるものと期待される。したがって,情 報学関連の制度,機構を検討にあたっては,情報学の研究促進を目的とするものと, 情報学の成果を社会に還元,定着させることをめざすものという両側面からの検討が 必要である。 情報学研究と著作権処理機構 −− 情報の電子化に伴って,情報の処理・提供方 法は飛躍的に多様化し,この傾向は,昨今多用されているマルチメディアという用語 に象徴されるように,現在ますます強まっている。そして,この種の応用を研究的に また事業的に推進しようとする立場から,著作権の問題に直接関係しなかったような 企業,研究者の参入,すなわち,彼らにおける著作権処理に関する無知,誤解に由来 する部分が大きいようである。一方,著作権者の側においても,マルチメディアなど の新しい公刊形態に対する誤解・不安という要因がある。これらは当局の啓発活動に よって逐次解消されるべきであり,各般の措置がすでに講じられているところであろ う。しかし,啓発のみによつては解決し難い部分もあり,法的あるいは制度的な方策 も検討されつつある。 情報各の研究においては,研究の素材あるいは実験試料として,各種の著作物を多 種・大量に利用することが不可欠である。現状では,何分新しい事態であるため,研 究者側と著作権利用側の双方に上記のような無知や誤解があり,個別的な利用交渉は 一般にかんばしくないようである。情報を保護する制度によって,情報学の進展が阻 害されるとすれば,これは重大な矛盾であろう。 元来,著作権法には,例えば図書の売買契約に際して,これに並行して,その内容 の利用方法を個別に著作権者と契約交渉するというよう煩瑣な過程を省略するための, 著作権利用約款の役割があると考えられる。このような著作権処理の定型化,簡素化 によって,従来型の著作物の流通は良好に維持されている。この点に鑑みると,新し い情報技術に対応した新しい形態の著作物に対しても,その利用契約に関する手順の 明確化,標準化,簡素化が望まれる。著作権審議会マルチメディア小委員会の第一次 報告(平成5年11月)にもこうした指摘があり,その初段階として,著作権の所在 をデータベース化した「著作権権利情報集中機構」の試案が提示されている。 著作物は著作権利用者の私的財産であると同時に,社会的な地位的資産でもある。 したがって,これが新しい情報技術により一層有効に活用されることは,著作権者に とつても社会全体にとっても望ましいところであり,著作権保護の意義もここにある と考えられる。この際,情報学研究を助長するような著作権処理制度,体制の整備が 望まれる。 情報資料の蓄積交換機構 −− 前項にのべた著作権処理機構を,情報学研究振興 の立場からさらに発展させると,これは,情報研究者間で共通に利用されるような情 報資料を集中したセンターの設置という構想にいたるであろう。全文データに関して, オックスフォード大学のテキスト・アーカイブズのような事例がすでに外国にあるこ とからみても,このような機構は情報学研究の振興に有効であると考えられる。 この種の機構では,研究者相互間での情報試料の交換を簡便に行いうるような機能 がまずそうていされる。しかし,より重要であるのは,研究者社会の外部,具体的に は企業などから多用な情報試料の寄託を受け,これを研究者間の共用に付するという 機能であろう。前記のように,研究者と企業等著作権者間の研究的データ利用契約交 渉は難航することが多い。大学研究者は,もとより営利的利用を目的とするわけでも ないが,権利者側では前例のないこととて理解に至らず,商業的利用のために設定さ れるような高額の使用料を提示することもあろう。このような価格は研究者からすれ ばほとんど禁止的なものであり,結局利用を断念するというような例が聞かれる。情 報試料の公的な蓄積交換機構の整備は,このような事態を打開するために有効に機能 すると期待される。 標準化の研究と標準化機構 −− 情報の良好な流通を確保するためには,適切な 標準の制定と普及が不可欠である。従って情報に関連する標準化は,情報学における 重要な研究テーマとなる。これまで,標準化は当該技術の実用化,普及段階での事項 とされ,標準化それ自体は研究の対象になっていない。産業論,技術論の一端として 事後的,歴史的な議論がなされることはあるが,現在および将来の標準化は扱われな い。情報化の進行に伴って,情報関連の標準化は社会的に重大な意味をもつようになっ ているから,これを情報学の研究領域に正当に位置づけて,科学的基礎に立脚した検 討を行うことは大いに有意義であろう。 ところで,近年情報関係では,公的な立案・審議過程を介さない,デファクト・ス タンダードが重要な地位を占めるようになっている。これには,技術進歩の高速化に 対して,審議の時間のかかる公的な制定機構が対応できないということが要因である と考えられる。また,ファイル形式やプログラム・インターフェースのようなソフト ウェア的に簡単に実現される規約の類については,研究者の任意団体による規約が次 第に普及し,企業的製品化がこれに追従するというような,新たな現象も現れている。 このような情報分野における「標準のソフト化」ともいうべき状況に対して,標準化 機構はどのようにあるべきか,さらに検討する必要があろう。