2011年7月10日日曜日

コーパス・体

しばらくは、研究所の中で暮らすという、まるで非現実的な生活を送っている。その中で、時間の使い方の一つの大きな内容は、多国籍、他分野の学者との会話である。真剣なやりとり、あるいはなにげない雑談の中からは、時々かなりの閃きに巡り逢い、まさに会話の醍醐味だ。今週のハイライトの一つは、「コーパス」。ある意味では、これまで漠然として考えていたことを、分かるように伝える方途を手に入れた思いだった。

「コーパス」という言葉、一つの学術用語としてもちろん知っていた。ただ、それはつねに敬畏をもって接する言語学が独占するものだとばかり考えていた。もともとその言語学を業とする人間に言わせれば、かなり違う内容や意味合い、対象や作業に転用され、生成流転をさせられているものだった。中でも、感覚的に理解ができるものには、翻訳を念頭に置いた違う言語のコーパスがあげられる。翻訳され出版された文学作品、あるいは他言語で出版している新聞、雑誌などの文章を対照に並べ、検索やデータの並べ替えの使用に提供する。そのようなデータは、規模が圧倒的に大きく、さまざまな可能性を感じさせてくれる。さらに言えば、在来の辞書やら用語集やらと違って、技術処理の手段が紙からデジタルに変わったことにしたがって自然に生まれてきた、技術によって先導された一つのアプローチだと印象だった。その分、有効な利用がむしろつぎのステップに属するものであり、作成者が想定していた使い方以外の発見や活用が現れて、はじめてシステムの成功が実証されるものだ、という側面を最初から持ち合わせていたとも言えよう。

110709ところで、「コーパス」とは、体だ。しかもオランダには「コーパス博物館」と名乗るものが存在していると聞く。もともとこちらのほうは、子供たちのための遊園地、ということがコンセプトで、中身は人間の体を巨大に作って、生身の人間をその中を回遊させるという知的なファンタジーランドだ。これに照らして言えば、言語学などにみる「コーパス」とは、体というよりも、体のパーツといったところだろう。体を分解させておいて、それをもって得体の知れない体に対する新たな発見を、というのがそもそもの希望だったかもしれない。

0 件のコメント: