ここに、二者による電話会話が2パターンある。どちらも会話の内容は同じ。さて、どちらがよりスムーズな会話といえるだろうか。
 一見すると1)タイプはやや回りくどく、2)タイプの方が効率的な会話に感じられる。しかし、現実において2)タイプの会話が交わされることはほとんどない。なぜならば、1)タイプのほうがよりスムーズに会話を進めることができるからである。
「2)タイプはどちらかというと、ドラマの中で使われる台詞(セリフ)のような、つまり書き言葉による言い回しです。日常で使われる電話会話ではないですね」と自然言語処理講座を担当する島津教授は言う。
 自然言語処理講座では、このような人同士のさまざまな対話構造のあり方を研究テーマの一つとしている。それが具体的に何のために貢献しうるのか──。同講座はその先に“人とコンピュータが自在に対話できるシステム”への応用を見据えている。

 

 人とコンピュータの対話システムは、欧米諸国を中心に1950年代頃から研究開発が行われてきた。SF映画のように人間とマシンが自在に会話を交わすことを多くの研究者が夢見て、そして研究に没頭してきた。
 だが21世紀を迎えた今、その技術の進化は遅々として進んでいない現実がある。人とコンピュータの対話システムなるものといえば、天気予報や航空チケット販売など非常に限定されたシチュエーションで実現されているにすぎず、また、決まりきった数パターンの対話のやりとりしかできないレベルである。それらでさえ、“機械が聞き間違えたり、言い直しを要求されることが多い”“定型文でしか会話のやりとりができない”など利用者の不満は多い。 「これには多くの要因があります。機械の音声認識精度が優れないということ、現在のコンピュータのCPUでは認識可能な単語や会話パターンがまだまだ限られているということ・・・。それらの中でも私が注目し、そして研究しているのは対話形態や発話文の構造です」
 現状の対話システムは、あまりに対話進行が一方的であったり、発語の間、つまりタイミングが悪い故に、非常に使いづらい現状がある。そして、それはまさしく2)タイプに当てはまるのだという。では、その対話形態の何が問題なのか──。島津教授は次のような分析と対策を示唆している。

〈1〉多数の単語からなる文構造は、 誤認識を招きやすい。
まず指摘するのは、現状の対話システムの多くが完結した一文ごとで情報をやりとりしている点。
「一見、効率の良いやりとりに思えますが、コンピュータの音声認識はまだまだ完全ではありません。仮に2)タイプの会話をコンピュータに対して行うとすれば、コンピュータは[僕の][机の上に][本が][4冊][ありますか?]というように5つの発語を一括して正確に認識する必要がある。

となれば、このうちのどれか一語でもうまく認識できなければ、もう一度全文を言い直さなければなりません。そうではなく、1)タイプのように『僕の机の上にですね』という具合になるべく分割しながら発語すれば、コンピュータが誤まって認識する確率は減り、仮に言い直しになったとしてもその手間はそれほどでもなくなるはずです」

〈2〉相互の理解度を推測することで 対話の幅が広がる。
 また対話が進行する上では相互の理解度を確認し、さらに対話のタイミングをうまく図る仕組みが必要である。
「人同士の対話の場合、相互の復唱や問い返し、あいづちによって相手の理解度や次の反応を常に予測しながら会話をコントロールしています。例えば1)タイプで言えば、発語文の語尾に「ね」という確認の意味の終助詞をつけたり、「それをですね」と確認の意味で発語したり。しかし現状の対話システムにはこうした要素があまりありません。非常に限定された対話やYES/NOレベルの対話であるなら問題はないのでしょうが、もっと話題の広がりがある高度な対話を行っていくには、相手の反応次第で次の発語をいろいろ可変できる仕組みが必要である。そのためには対話が進行するたびに相互理解を確認できる対話パターンでなければならないと思います。」 従来の対話システムは見かけ上スムーズな、つまり2)タイプのような会話体系を追求した。それこそが対話システムが普及しきれない要因ではないかと、島津教授は推察している。
 もちろん、人と機械の対話構造が人同士の対話構造と同じであるべきかどうかという議論もある。ただ「人の使いやすい、そして気持ちの良いコミュニケーションが可能なマシンを実現するためには無視できない要素」と島津教授は考えている。

 

 こうした考察をもとに、島津研究室では交通 案内や予約システムなどコンピュータとの対話に置き換わることが可能なさまざまな対話サンプルを収集・分析し、あらゆる角度から理想的な対話のあり方を追求している。
 具体的には、多数の対話サンプルを発話単位ごとに区切り、“発話の主導権はどちらにあるのか”、“その後に応答がどう続くのか”、“その発話は陳述・依頼・疑問・確認のうちの何なのか”、“発話は完了しているのか”・・・などのデータを細かに積み重ね、対話パターンの体系化を試みた。NTT基礎研究所との研究協力で例えば次のような交通 案内対話のモデル化(※1)が実現している。

 上記の対話パターンではまるで人同士が対話しているように、相手が聞き直してきたり(3)、マシンの発話語を質問者が確認の意味で繰り返して発語した場合にも対処が可能となっている。(4)
 用途はまだまだ限られるものの、対話の進み具合によってさまざまな発語や応答が可能になる。
「こうした研究は、身近な家電操作にも応用することができることでしょう。テレビなどの家電製品に話しかければ、それに応じてテレビが自らを操作する。そんな家電製品がこれからの時代にはもっと増えるのではないでしょうか」と島津教授は語る。

 

 自然処理言語講座ではもう一つの研究の機軸として、人が発したテキスト情報をよりスムーズに他人に伝えるための要約技術を追求する研究も行われている。
 「書籍はもちろん、新聞、ニュース字幕、近年ではインターネットによる情報・・・テキスト情報は時代を追うに連れ増え続けています。特に90年代、コンピュータやインターネットの普及は、私たちの暮らしに膨大な量 の情報をもたらしています。その影響で要約に対する社会的ニーズはかなり高まっているといえるでしょう」
 膨大な情報のなかから必要な情報を要約するということの重要性を、島津教授は強調する。ただ現在、市場に流通 している要約システムは、まだまだ表層的なものだという。
「一般に流通している要約ソフトがどのような方法で行われているかというと、表題に出てくる言葉や頻繁に使用される言葉は重要だろうと判断し、それらを集約する。ほとんどのソフトはこうしたレベルから抜け出してないんですね」
 同講座では、そこから脱却し、より使い勝手の良いシステムのあり方を示すためさまざまな研究を行っている。
「長いテキストにはさまざまな話題が含まれており、テキストによっては、ユーザーにとって重要な単語でもそれほど重要ではないと判断されてしまう場合があります。そこで、キーワードと関連性のある語が連続している部分を重点的にピックアップして要約する仕組みを提案しています。また、テキスト全体から重要な文を抽出して並べただけでは読みやすさに欠けるという課題もあります。
そこを解消するために要約文の読みやすさ、読みにくさの心理実験をおこない、その結果 にもとづいて要約文を読みやすく修正するシステムを部分的に実装することなども試みています」
 より具体的なアプリケーションを想定した研究も盛んだ。例えば、大学や研究機関等で用いられることを想定した学術論文を要約するシステム。膨大なデータベースから関連する論文を自動的に収集し、人が特定分野の概要の論文を作成する作業を支援するものでありる。他にも、法律条文をよりスムーズに読解するため関連条文をハイパーテキスト化する手法(※2)も考案されている。
 この要約の研究は、私たちの日常生活にも深く関わっていると、島津教授は言う。 「街頭や電車の中の電光板ニュース、映画の翻訳字幕。これらの要約作業は現時点では人間が行っていますが、要約の技術が高まれば機械によって行われることも夢ではありません。近年においては携帯電話やPHS、PDA端末で Eメールをやりとりする機会が増加していますが、それらは文字数が制限され、必要な情報を充分に伝達することにはやや難があるといえます。そこで、長文のメールを要約して表示することが可能になれば、非常に効率の良い効果 的なコミュニケーションの方法が確立されることになります」
 島津教授によれば、さらに技術が高度化すれば、要約文を音声で発語することもありうるという。そうなれば、コンピュータとの対話システムとの関連で「誰からのメールなのか」、「どんな内容なのか要約してほしい」と人間がマシンに要求すれば、マシンがそれに音声で応えてくれるということも実現可能であろう。

 

 他にも同講座では、手話の語彙の貧弱さを日本語辞書で補完しながら相手に伝えるシステム、家庭医学事典等の代わりに受け手に応じて臨床検査データを説明するシステム(※3)、テキスト形式の料理レシピを理解しやすいビジュアルの動画像へと変換するシステムなど、多彩 な研究が行われている。そのどれもが独創的な研究でありながらも、確かに身近なシーンで利便性を向上させる可能性に満ちあふれている。
 自然言語処理学は、コンピュータが人と接する際の有効なインターフェイスになるための重要な技術だといえないだろうか。
「人とコンピュータが人同士のようにコミュニケーションするようになるのはまだまだ遠い先のことですが、少しずついろんな場面 でコンピュータは温もりあるインターフェイスとして機能し始めています」と島津教授は言う。その進化のスピードがこれからいかにアップしていくのか。同講座の研究のさらなる進展に期待したい。

 

──先生ご自身が自然言語処理の研究に携わるようになったのは、いつ頃からですか?
大学卒業後、電電公社(現NTT)武蔵野研究所に入所したのですが、配属決定時、ちょうど同研究所で言語処理の研究が開始されるところだったのです。決して得意な分野だったというわけではなく、巡り合わせから自然言語処理の研究に携わってきたわけです。当時は自然言語処理の教科書もありませんので大変でしたが、「構文解析」、「意味解析」という基礎的な研究から対話システム、機械翻訳まで自然言語処理に関する一通 りのことに携わることができたのは良い経験でした。
──こちらの講座の二つの研究室では、どのような体制で研究を進められていますか?
私と奥村学助教授('00年4月より東京工業大学精密工学研究所に異動、JAISTは併任)がそれぞれ独自に研究を進めながらも、協力すべきところはプロジェクトとしてやっていこうという趣旨で進めています。方向性を一致されられるところでは一致させ、一つでも多くの成果 をあげることを目指しています。

  ──医療や法律に関するテーマなど多彩な研究が行われていますね。
法学部出身の学生がいたこともありますし、現役の医師の方も学生として所属していますので、そうした分野の研究が行われています。情報科学科のなかでも言語を扱っている性格上、文系出身の学生などさまざまな分野から集まっていますから、多彩 なテーマ設定で研究を進められます。
──学生の方にはどのような指導をなさってますか?
学生の興味を持っていることは、可能な限り尊重したいと考えています。ただそれが難しい場合には、こういう方向性もあるということを示す場合もあります。文系出身の人はコンピュータに不慣れなことが多く苦労することも多いのですが、皆、頑張って習得しているようです。
──研究の指針は?
言葉というのは依然としてその本質が分かっていません。自然言語処理の分野はまだまだこれからの研究分野といえるでしょう。。いろいろな視点から研究を進めて少しでも人と機械、そして人同士のコミュニケーションを向上させたいですね。