[修士研究]
複数の最適化した構造要素を用いたパターンスペクトル による階層的画像識別

Abstract


画像の周波数と位相に関する特徴量である フーリエスペクトルによる画像識別はポピュラーなものであるが、 フーリエスペクトルの概念に通じるものとして、 モルフォロジーによるパターンスペクトルがある。 フーリエスペクトルは周波数の異なる正弦波で画像を分解したときの 重ね合わせとして定義され、一方パターンスペクトルは サイズの異なる構造要素と呼ばれる基本形状で画像を分解したときの 重ね合わせとして定義される。 これら2つは画像の振幅に関する特徴を良く示し、位相的な変化に対して 不変性があるという特徴を持つ。 特にパターンスペクトルは、フーリエスペクトルを抽出する正弦波の 方向性や振幅の情報を全て構造要素と呼ばれる画像に圧縮して いるため、より厳密な画像のモデル化が行え、 多くの画像識別の研究で利用されている。
パターンスペクトルによる画像識別特性は構造要素に大きく依存する。 従来、構造要素は適用に応じて経験的に与えている為、 その画像識別に対して最適である保証はなく、 パターンスペクトルによる画像識別に最適な構造要素を設計 することができれば、識別精度の向上が期待できる。 画像識別に最適な構造要素の設計法として、山本(本学98年修了)は 辞書画像のパターンスペクトル間の距離を最大とする構造要素を 遺伝的アルゴリズムやシミュレーテッドアニーリングにより設計する手法 を検討した。 しかし、この手法では1個の構造要素で全ての画像の識別を行っており、 識別するカテゴリ数の増加に伴い広げられる辞書間の距離に限界があった。
本研究では、パターンスペクトルによる高精度な画像識別を目的とし、 画像の識別を複数の構造要素を用いて階層的に行う手法、 及びそれら複数の構造要素の設計法を検討する。 この手法は全ての辞書画像の パターンスペクトル間の距離を最大にする 構造要素を設計するのではなく、辞書を2つのグループに分割し、 そのグループ間の距離が最大となるよう構造要素を設計する。 そして、分割した各グループに属する辞書画像も同様の処理を 繰り返すことにより、階層的に辞書画像のパターンスペクトル間の距離を 広げる手法である。 本手法をテクスチャ画像識別及び鼻形状による個人識別に適用した結果、 複数の最適化した構造要素による画像識別率が、従来の1個の 最適化した構造要素による画像識別率より大幅に向上し、 本手法の有効性が確認できた。


研究成果

竹内伸也, 剣持雪子, 小谷一孔,
"パターンスペクトルを用いた テクスチャ画像の判別に最適な構造要素の設計法, "
映像メディアシンポジウム(IMPS99)予稿集, pp.77-78, 1999.
Abstract|| 予稿(ps.gz)
竹内伸也, 剣持雪子, 小谷一孔,
"パターンスペクトルによる画像の階層的な識別に最適な 構造要素の設計法, "
電子情報通信学会技術報告, Vol.PRMU 99-216, pp.89-96, 2000.
Abstract|| OHP(html)|| 予稿(ps.gz)


竹内伸也のプロフィール

小谷研究室
北陸先端科学技術大学院大学