チョムスキーと構文解析

2019年9月4日

人間が扱う全ての言語には共通する普遍的な特性があるというのがチョムスキーの提唱する生成文法理論だ。最初にこの話を聞いた時は「ほんまかいな」と思っていたのだが、現在でも私自身の状況は変わらない。人間は生得的に言葉を扱えるような能力を持っていたというのがチョムスキーの言い分だが、私にはわからない。ソシュールだったか、言葉は適当に作られるような事を言っていたような気がするが、適当に作られるものにも普遍的な構造があるのかもしれないし、ないのかもしれない。

さて、チョムスキーを持ち出したのは、生成文法の本には、文の構造を示す次のような木構造のグラフがよく出てくるからである。

チョムスキーは、文を構成する要素について、それらの関係を句構造規則として明示した。こういった文を構成する要素の関係を分析することを一般に構文解析と呼ぶ。ジョセフ・ワイゼンバウムが開発した初代のELIZAには構文解析の機能は含まれていなかったようだけど、コンピュータが文を扱うための第一歩が構文解析となる。

構文解析がどういうものかを次のサイトで実際に試してみることができる。上図はこのサイトで生成したものである。

Enju 2.4 online demo

チョムスキーの考え方からすれば、全ての言語には普遍的な特性があるわけだから、それぞれの言語の句構造規則を明示し、それぞれの言語間の句構造規則の変換ができれば、コンピュータによる翻訳も可能なような気がしてくる。おそらく最初の機械翻訳の発想はこのあたりにあったのではないかと思う。Wikipediaにも次のように記載されている。

構文木に基づく翻訳は、機械翻訳開発のかなり初期からあったアイディアである。1960年代~1980年代の(今から見れば古いタイプの)AI研究者は、しばしばこうしたアイディアを過大評価し、それに酔った。

しかし、うまくいかなかったようだ。

この構文木に頼る翻訳システムは、多くの研究者による長年に渡る試行錯誤にもかかわらず、結局、翻訳文の質が実用翻訳、実用通訳のレベルまでは向上せず、行き詰まりを見せた。

ということで、次回は新しい翻訳の方法について見ていきたい。

翻訳

Posted by 管理者