井之上直也 准教授
2008年 武蔵大学 経済学部卒業、2010年 奈良先端科学技術⼤学院⼤学 情報科学研究科 博士前期課程修了、2013年 東北⼤学⼤学院 情報科学研究科 博⼠課程後期修了。
(株)デンソー基礎研究所 研究員を経て、東北⼤学⼤学院 情報科学研究科 助教、米国Stony Brook University ポスドク研究員。2022年4月よりJAISTに着任。理化学研究所 ⾃然⾔語理解チーム 客員研究員、同 言語情報アクセス技術チーム 客員研究員も務める。
研究分野は自然言語処理、自然言語理解、常識推論。
自然言語処理は、私たちが書いたり話したりする言葉をコンピュータで処理する技術で、人工知能(AI)の研究分野の要素技術のひとつです。ChatGPTなどの大規模言語モデルが目覚ましい進化を遂げたことで、自然言語処理分野の研究はパラダイムシフトを迎えています。2022年4月にJAISTに創設された言語推論研究室を主宰する井之上准教授は、自然言語処理の推論過程に焦点を当て、より高度な問題に果敢に取り組んでいます。
なぜ人間はできるのか なぜ機械には難しいのか
言語推論研究室は2022年4月に誕生した新しい研究室で、人間が日常的に使っている自然言語を計算機処理するための方法を研究しています。私たちがめざすのは「人のように推論し、考えることができ、説明できるAI」です。言い換えれば、行間を読む力をAIに持たせるということです。
自然言語処理では、人間が当たり前にできることが、機械にはとても難しい、ということがあります。何が難しいかといえば、まず構文解析の問題があります。たとえば、「私は友達とごはんを食べた」という文章は、文法上は「友達と一緒にごはんを食べた」とも「私が友達を食べた」とも解析できます。同じように、「私はりんごとみかんを買った」という文章は、「2つの品物を買った」とも「りんごがみかんを買った」とも解析できます。
意味の解析の問題もあります。いくつもの表現で同じ内容を示すことができるのは自然言語の特徴のひとつですが、「私は石川生まれだ」「私は石川県の出身だ」「私の人生は石川から始まった」という3つの文章が同じ内容を示す同義表現だと認識するのは、AIにとって容易ではありません。また私たちは「私は昼食を食べたばかりだ」と聞くと、「お腹がいっぱいだ」「眠い」と常識的に推測しますが、常識を身につけていないAIは思いつきません。
人間がごく当たり前にできることが、なぜAIには難しいのか―。自然言語処理にはさまざまなアプローチがありますが、私自身はそんなわくわくするような問いをモチベーションとして研究に取り組んできました。
自然言語処理では、AIが質問に対してきちんと答えを返すだけでなく、その答えにたどり着く過程を説明できることも重要です。これまでの研究の中で、AIが出した答えがなぜ答えといえるのか、その説明を生成するためのデータセットを構築しました。これはAIの推論がどれくらい正しいかを評価するベンチマークとなるもので、 自然言語処理の最大の国際会議であるACL2020で論文が採択されました。さらに次のステップとして、推論の過程を簡潔に説明できるモデルをつくり、同じく自然言語処理のトップ会議であるEMNLP2021で採択されました。
「行間を読む力」を計算機に持たせる
自然言語処理の研究が進む中で、前述の構文解析問題は2010年までに、同義表現問題は2018年に、大部分が解消されました。残された大きな問題は「常識をどう持たせ、使いこなせるようにするか」という常識問題ですが、2020年以降、ChatGPTなどの大規模言語モデルが目覚ましい進化を遂げたことにより、以前に比べると大きく解消されてきています。
こうした中、私たちの研究室は、より高度な課題にチャレンジしています。
【自己認識的に推論・説明できるAI】というテーマは、AIに「無知の知」を持たせる、すなわち知らないということを自覚させる研究です。質問に対し、学習したデータに答えがないなら、AIは「分かりません」と言えるか。AIの知識の確信度を推定する、非常にチャレンジングな研究です。
【画像に対する帰納推論的な説明生成】の研究は、AIに画像と言語を交えた推論をさせるという方針で進めています。たとえば以下のように複数の画像を与え、「共通する規則は何か?」とAIに聞いたときに、「最も右側にある立方体はオレンジ色」「最も奥にある物体は立方体」というような推論ができるか、ということです。これは現在の最先端の大規模言語モデルでも難しい問題です。
【コンピュータの自動操縦】は、比較的応用に近い研究テーマであり、人間が与えた指示に対して、指示には明確に書かれていない行動計画を推論して立案し、実行するAIをめざすものです。たとえば「35歳以上の従業員に定期健康診断のメールを送る」という指示を与えたときに、自動的に社員データベースから対象者を抽出し、メールを書き、送信できるようなしくみを検討しています。
他大学との共同研究として進めているのが、【論理構造の解析・誤謬の検出】【ディベートの壁打ち相手】というテーマです。前者は、たとえば人間が書いた小論文の論理構造の欠陥をAIが発見し、フィードバックするというものです。後者はAIに立論、反論、アドバイスをさせて、ディベートの練習相手にすることをねらっています。いずれも教育への応用が期待できます。
自然言語処理の基礎的な面でもまだまだ問題はあります。現在の大規模言語モデルも複雑な推論をさせようとすると失敗します。また、学習したコーパスにないようなことも平気で言ってしまうことがあります。たとえばChatGPT(GPT-3.5)は「北陸先端科学技術大学院大学はどこにありますか」という質問に対し、下記のような回答をします(2023.10.17時点)。
AIが学習データにない情報を生成してしまう現象をハルシネーションといいますが、もっともらしい回答なので、生成された回答が事実と異なる情報だとしても、知らない人は信じてしまいます。私たちの研究室では、こうした問題を解消し、高精度で、信頼性の高いAIを実現するためのさまざまな課題に徹底的に取り組んでいきます。
ChatGPTの登場以降、世の中ではAIに対する期待と懸念の両方が高まっていますが、使い方次第でプラスに働くことが多いということも強調したいところです。
当事者意識を持つことで人は大きく成長する
研究室は人が育つところでもあります。当研究室では、そのためのさまざまな“しかけ”を用意しています。
全体のラボミーティング、研究トピックごとに行うユニットミーティング、私と学生が一対一で行う1on1ミーティングといったミーティングは、すべて学生主体で行っています。同じく自然言語処理分野の白井研、グェン研の学生とチームを組んで議論を深めることもありますし、自発的な勉強会の立ち上げも歓迎しています。
メンバー間の情報共有にはSlackで、リアルなコミュニケーションの場としては、メンバーシップトレーニングとして、いろいろな機会に懇親会を行っています。
JAISTは、学部も国籍もさまざまな人が集まる、多様な環境が魅力です。私たちの研究室は日本人学生と留学生が半々の環境で、プレゼンや議論、連絡などは基本英語で行っています。将来海外で活躍したいと考える日本人学生にとっては、留学しているような環境で学ぶことができ、身につくことが多いと思います。
人が成長する上で何より大切なのは、当事者意識を持つことです。私は、心から面白いと思える研究テーマに主体的に取り組んだときに、人は大きく成長すると信じています。こうした信念のベースには、経済学部から人工知能の研究の世界に飛び込み、心からやりたいと思ったことを仕事にしている自分自身の経験があります。
令和5年11月掲載