ニュース・イベント

受賞

人間情報学研究領域の鵜木教授が電子情報通信学会のEMM研究会優秀研究賞を受賞

人間情報学研究領域の鵜木祐史教授が一般社団法人電子情報通信学会のEMM研究会優秀研究賞を受賞しました。

 電子情報通信学会では、各ソサイエティ・グループに所属する84の研究専門委員会が学会の基幹分野における研究成果の発表・討論を行い、担当分野の学問・技術の発展・普及を図ることを目的とする第一種研究会及び討論中心のワークショップなど比較的自由な形式の第二種研究会を開催しています。
 EMM(マルチメディア情報ハイディング・エンリッチメント)研究専門委員会は、メディアを流通するコンテンツの『価値』を守る・高める・創るための技術および制度設計について、コンテンツ種別の垣根を掃って、幅広い議論や意見交換を行う場として設立されました。
 同研究会では、毎年度一年間の研究発表のうち、特に優れたものに対して、「EMM研究会優秀研究賞」、および「EMM研究会学生研究賞」を授与し、表彰しています。受賞者は選奨規程に基づいて賞選定委員会による審議を経て決定されます。

※参考:EMM研究専門委員会
    KDDI財団インタビュー(ディープフェイク音声の自動判別法)

■受賞年月日
 令和6年3月3日

■研究題目、論文タイトル等
 Study on Analysis of Amplitude and Frequency Perturbation in the Voice for Fake Audio Detection

■研究者、著者
 Kai Li、Yao Wang、Minh Le Nguyen、Masato Akagi、Masashi Unoki

■受賞対象となった研究の内容
 本研究では、AI音声合成技術の悪用を防ぐために、入力した音声がディープフェイク音声であるかどうかを自動的に識別する仕組みを提案しました。まず、メルスペクトルや聴覚的スペクトルのケプストラムの特徴、様々な音響特徴について包括的に調査し、機械学習ベースで合成されたなりすまし音声(ディープフェイク音声)の検出がどの程度可能であるか検討しました。その結果、音声の基本周波数成分の振幅と周波数の時間変動の特徴であるシマーとジッターがフェイク音声の検出で利用すべき最良な音響特徴であることを明らかにしました。また、メルスペクトルとLCNN-BLSTMを組み合わせたディープフェイク音声の判別法にシマー・ジッターの特徴を組み込んだ検出法を構築しました。ADD2022(Audio Deep synthesis Detection, http://addchallenge.cn/add2022)チャレンジに準拠して提案法を評価した結果、シマーの情報を利用する優位性が確認され、高い検出性能を得ることができました。

■受賞にあたって一言
 今回、優秀研究賞を受賞することになり、大変うれしく思います。本研究は、鵜木研究室で最初に取り組んだディープフェイク音声検出の課題になります。ディープフェイクといえば、大きな社会問題となりつつあり、いまでは多くの方々がご存知のキーワードになっているのではないでしょうか。高々2年でこの研究情勢も大きく変わってきました。本研究課題は、2021年から2022年にかけて実施されたもので、当時、博士後期課程学生(LI Kaiくん)の主テーマならびに博士前期課程学生(WANG Yaoくん)の副テーマとして取り組んだ課題になります。協働教育として赤木正人名誉教授ならびにNGUYEN, Minh Le教授からも協力を得られました。また、本研究は2021年に採択になったKDDI財団・調査研究の支援によって得られた研究成果でもあります。鵜木研究室では、この後、この方法を超えるいくつかのディープフェイク音声検出法を提案してきました。今後、いわゆる生成AIとして、なりすまし音声(ディープフェイク音声)は、もっと巧妙で複雑に発展し、我々にも検知できないようなものがでてくるものかと予想します。また、なりすまし音声を使った詐欺事件など大きな社会問題に発展するものと予想します。喫緊の課題としてこれからもこの課題解決に向けてチャレンジしていきたいと思います。

award20240628.jpg

令和6年7月2日

PAGETOP