5.2 日本語情報の収集と提供 公的機関(あるいは,それに準ずる機関)における日本語情報の収集と提供活動の 現状を概観する。また,今後どういるべきかについても簡単にふれることにする。現 状は,満足すべき状態とはいいがたく,今後の努力に期待することが大きいからであ る。ここでいう日本語情報とは日本語の言語情報(2章,言語情報の項参照)のこと である。 (1)日本語情報への需要 日本語情報への需要の源は,大きくは日本語教育,言語学教育,コンピュータによ る日本語処理の三つである。従来は,日本語教育も国内の言語教育,言語学研究も国 語学研究という観点からの需要であり,コンピュータに関してもごく限られたもので あった。しかし,ここ十年程で大きく状況が変わってきている。国際化と情報化がそ の要因である。日本経済の国際化の中で外国人に対する日本語教育の大きな需要が生 じた。しかも,ビジネスの現場や日常生活に役立つ実用日本語に対する需要である。 コンピュータによる日本語処理は日本語ワープロの普及によって大きく加速された。 機械翻訳をはじめとする日本語処理ソフトウェアの本格的な取組みが始まり大規模で 高品質の日本語データが求められるようになった。日本語教育と日本語処理という現 場のニーズに刺激され,また,学問自体も大きく進展する中で言語学研究の現場も大 きく様変わりをしつつある。理論研究がある種の成熟に達しつつあるなかで,日本語 学という観点を踏まえた実データに基づく研究が注目を集めるようになっている。 (2)日本語情報の供給 需要サイドの変化に十分に対応しきれているとはいえないが,供給サイド,すなわ ち,日本語情報の収集と提供の活動も新たな様相を見せつつある。ここでは,最近の 同行の特徴的なところにしぼりその活動を概観する。 外国人の日本語教育に関しては,日本語情報は教材,教授法などやそれらの裏付け データの形をとる。教育課程の研究を含め体系的な整備の役割をになうところとして 国立国語研究所がある。例えば,外国人の日本語語彙教育のための基本語用例データ ベースの作成等が行われている。一般的な教材に関しては外国人に対する日本語教育 の中心機関である国際交流基金が供給源である。また,教育現場の具体的なデータは 外国人留学生の日本語教育のセンター機能を持つ各地の大学からも提供されている。 コンピュータの言語処理に関しては,日本語情報はコンピュータ処理可能になった 辞書,コーパス,テキストデータ,そして処理ソフトウェア等の形をとる。日本語電 子化辞書研究所では日本語と英語を対象に次世代自然言語処理技術のための大規模な 電子化辞書の開発が行われている。現在,50ケ所程の国内外の大学,研究機関等に 評価研究用として供給されている。また,小規模ながら特色のある辞書作りが各所で 行われている。情報処理振興事業協会技術センターが代表例である。また,京都大学 をはじめとする大学の研究グループがデータやソフトウェアを公開し,協同利用の環 境を整えつつある。テキストデータに関しては各種の機関がデータの蓄積をし,一般 利用に向け供給を始めている。さらに,音声言語に関しては,国際電気通信基礎技術 研究所,電子技術総合研究所,日本音響学会,東北大学等で音声データの収集と提供 がなされている。 言語学研究所に関する日本語情報の供給は国立国語研究所や大学等における研究成 果の従来からの蓄積活動の延長線にある。むしろ,これに関しては出版社における大 型辞書等の刊行事業に負うところが大きい。 (3)これからの活動 日本経済の不調から外国人の日本語教育の過熱状態は納まったが,その重要性はむ しろこれからであろう。分野や外国語ごとの対応での辞書や教材,教授法等の開発, 整備を着実に進めねばならない。情報化もこれから本格化する。日本の国家情報基盤 のその基礎となるのが日本語情報である。日本語処理用言語データの開発,整備にも 一層の努力が求められる。これには言語学研究との密な連帯が重要になる。言語学に とっても言語データの分析に基礎を置く実験科学への展開が今後の課題である。しか も,どの方面からも海外からの日本語情報への需要が生まれてきている。これには, 日本として無条件に応えるべきであろう。