2.5 情報自己組織化 現在の計算機では四則演算や符号処理,即ち数値解析,検索,演繹推論などは高速 かつ高制度で処理される。更に高度な機能になると,学習,類推,帰納,仮説推論や それらを複合して問題解決,発想,意志決定,評価などをすることになる。これらが 実現されれば本当に思考支援であり,人工頭脳的機能が実現できることになる。 このような高度な思考機能に対応する情報処理をするには情報の意味処理をする必 要がある。ところが意味の関わる問題の多くは未解決である。例えばデータベースや 知識ベースでは個別実体(Distinct Entities)の集合としてデータや知識を対象とし ていることである。つまり考えている対象領域では,ある概念の表現と別の概念の表 現との間に重なりがなく,別々のものであるというのが基本的な考えである。実際に 使われる情報では特許や法律でも化合物でも,概念には非常に多くの重なりがあり, それを考慮しないで処理することは無理であり,例えば総称表現が適切に処理できな い。また類似性というのも重なりがある概念の関係であるから同様である。あるべき 情報が欠落している空値問題はさらに意味処理が困難である。 実体と実体の間にある関係は意味の表現に直結するものであるが,システムによっ てはこのような関係についての表現を持たないものがあり,その典型的なものは関係 型データベースモデルで,PCやワークステーションから大型用のデータベース管理 システムとしても普及しているが,実体間および関係間の関係を扱う機能がない。一 方実体一関係型(E−R)のように関係を直接扱えるものもある。ただしE−Rモデ ルでは実体と関係それぞれが固定されているので,関係自体を実体としても扱いたい ときまたはその逆に実体を関係として扱いたいときにそれができないという問題など が残っている。これは意味ネット,ハイパーメディアやオブジェクト指向システムに も共通する問題点である。 また意味の相互重なりに対する記述表現としては再帰的または差分的な表現の問題 がある。次に概念には相対性があり,上位と下位が絶対的ではなく,下位の概念の下 にさらに下位の概念があり得るので,上位と下位は,状況により変化する相対的なも のである。相対性としては上位,下位以外にも実体と属性,例えば女性とき男性とき は人間の属性になるけれども,見方によってはそれ自身で実体になるというような相 対背,それから関係と実体も固定的ではない。例えばある人が車を持っている。人と 車の関係は所有されるという関係であるが,所有という概念は関係としてだけではな く実体にもなり得るので双対関係である。それから先ほどの類似性のような部分的重 複も記述表現が難しい。一般に意味の記述表現の問題は外延(extension) に基づく既 存の情報技術では適切に扱えなく,情報の管理や,知識の獲得の困難さの原因となっ ている。 実際の例でいうと,図4に示すように,化合物の部分構造に関する包含関係のごく 一部を取り出したものであるが,各種の包含関係があり,構造表現に多様性があるこ とを示している。これは一般の概念の場合も同じで,たとえば製品の情報でも製造場 所,製造日時,原料材料とその特性,加工法,装置,条件などの多くの概念が多重の 入れ子関係を含み複雑な関係になる。 表現の多様性も情報の記述,目的,内容に応じて大きく変化する。分類や表現の多 様性は情報の表現の本質的な性質であるので意味の処理が困難になるのである。この 様な問題の解決策として脳における機能と同じように情報の意味的関係を自動的に構 造化する自己組織化の研究が注目されている。 自己組織化方式 多様,複雑,かつ大量の情報を収録,管理し,それらの高度利用のため学習,類推, 仮説生成,発想などが可能なシステムを実現するための基礎研究とプロトタイプシス テムの例として「自己組織化機能を持つ情報ベースシステム」についてのべる。 脳における学習に対応して,概念や情報間の意味的関係を抽出して情報の組織化を 行う。概念に内在する関係は概念構造としてシソーラスを構築する。論理関係は,原 因−結果,理由−結果,要因−結果な主としてタキソノミーの形で論理構造を組織化 する。メディア変換,意味関係抽出等によりマルチメディア型原情報の概念構造,論 理構造,物理構造などの自己組織化を行ない演繹推論,帰納推論,類推などの可能な 人工頭脳型システムを設計する。研究に必要な情報の動的構造の記述操作のためには 新しい型の情報構造を持つモデルSSR(Structured Semantic Relationship)の開発 がなされている。そのためデータベース,知識ベースおよびハイパーメディアなどの 要素技術を大幅に拡張し,新しいモデルで統合的に記述表現,操作し,思考支援でき る機能を持つ情報ベースシステムの設計と基礎となる理論の研究が行なわれている。 自己組織化は,自動生成されるシソーラスおよびタキソノミーなどを用いる概念構 造化により実現する。 概念構造及び論理構造にもとづく自己組織化には次に示すような方法がある。表現 の多様性のために存在する同意語は,原情報に内在する概念の同値関係や,対訳用語 集における対訳関係の推移閉包を求めるC−TRAN(Constrained Transitive Closure)で同値関係を求めるのがSS−KWIC(Semantically Structured Key Word Element in Terminological Context)である。また意味解析のためSS−SA NS(Semantically Specified Syntactic Analysis of Sentences)およびSANS (Semantic Analysis of Sentences)などを用いて,動的概念関係シソーラスや論理関 係タキソノミー構築できる。これらに基づき類推,帰納や仮説生成による学習,問題 解決,発想支援を実現する。 これに関して現在のハイパーメディアは小規模情報には有効であるが,リンクの生 成,管理の限界およびグラフ構造の制約から大規模化が困難であり,柔軟性にも欠け る。また類推,帰納推論などの研究も人工知能分野で広く行なわれているが,方法と して確立されていない。 以上の方式は具体的対象として機能性材料,および有機合成などの研究用情報を取 り上げプロトタイプシステムの構築と,そのテスト評価を行なわれている。 原情報の収集,入力提供には光学材料,および有機合成それぞれの専門家多数の協 力によっている。 図4 化合物の概念構造