GAKUSHIN Research Theme.
研究の特色・独創的な点
聴覚の計算理論を構築するための基礎的研究として、聴覚の情景解析に基づいた信号分離に関する計算モデルを構築する試みがある。
これらの計算モデルは、Bregmanによって提唱された四つの発見的規則のいくつかを利用することで、聴覚がもつ優れた信号抽出(雑音除去)能力を模擬できている。
しかし、計算理論を構築するために必要な音響信号に対する情報表現と制約条件に関する議論がほとんどされていないため、聴覚の計算理論を構築するには至っていない。
本研究では、聴覚が雑音中から望みの信号を分離・抽出できるという優れた機能に着目し、音の分離・抽出に関する聴覚の計算理論の構築を試みている。
この計算理論を構築するためには、音の情報表現と分離に必要な制約条件を明らかにし、その必要性を検証しなければならない。そこで本研究では、
- 物理量として振幅スペクトルだけでなく位相も考慮し、二つの信号波形を厳密に分離できるように定式化する。
- 各発見的規則の働きを調べるために、分離対象となる音響信号を自然界に存在する単純な音からより複雑な音へと拡張した信号分離問題に取り組む。
- 信号分離問題の制約として、発見的規則を定量的な制約条件にとらえ直す。
- この制約条件を検証し、必要十分条件を導出する。
ということに重点をおき、音声信号の分離・抽出に関する聴覚の計算理論の構築を試みている。
この方法で聴覚の計算理論を構築することで、聴覚がどのような処理過程で音を分離・抽出しているか明らかになるだけでなく、共変調マスキング解除といった様々な聴覚心理現象のモデル化や、工学的に頑健な音声認識システムにも応用できる。
Masashi Unoki(unoki@jaist.ac.jp) Apr 14, 1995