ディープラーニングを活用して物質の特徴に関する定理発見を支援する技術を開発
ディープラーニングを活用して物質の特徴に関する
定理発見を支援する技術を開発
ポイント
- 物質が「どのような元素をどのような比率で含んでいるか」といった「物質の指紋」となる実験データとして、X線ピークパターンが利用されている。
- ディープラーニング技術を用いれば、ピークパターンの特徴を定量化して捉えることができる。
- ディープラーニングの過程においてニューラルネット内部の数値パラメタを調整するなど工夫を凝らすことで、「どのピークが特徴づけに最も効いているのか」を特定する技術を開発した。
- このような特定は人間の目には難しく、今後、データ科学的な定理発見を促進する技術となりうる。
【背景と経緯】
物質がどのような元素をどのような比率で含んでいるかを調べる方法の一つとして、X線を物質に照射して元素を特定するX線回折法があります。物質に角度を変えながらエックス線を照射して反射されるエックス線の強度を観測すると、特定の照射角度で反射強度が非常に強くなる様子が観察されます(ブラッグ反射)。そのため、照射角度を横軸、反射強度を縦軸にしたグラフはピークパターンを描きます(XRDピークパターン。図)。ピークは物質を構成する元素に固有の値をとるため、得られたピークパターンは「物質の指紋」のようなもので、このパターン形状から物質が「どのような元素をどのような比率で含んでいるか」を推察することができます。これは、いわゆる「毒物カレー事件」で混入していた毒物をヒ素と特定するのにも使われた技術です。
近年、物質に別元素を添加して、例えば、磁石の強度や電池の特性を向上させるといった材料チューニングの研究が進められています。添加した元素が、どこにどれくらい導入されたのかを特定するのにX線ピークパターンである「物質の指紋」の変化から読み取る努力が続けられてきましたが、その変化はしばしば僅少で、また多数あるピークのうち、どのピークが大きく変化しているのかを人間の目で読み取ることは容易ではありません。
【研究の内容】
北陸先端科学技術大学院大学サスティナブルイノベーション研究領域の前園 涼教授、本郷 研太准教授、中野 晃佑助教らのグループは、人工知能分野でも使われているオートエンコーダ[用語解説]と呼ばれるディープラーニング技術を応用して、多数のピークの中でどのピークが意味を持った変化を示しているかを識別する技術を開発しました。
オートエンコーダ技術を用いると、画像などの識別対象データの特徴が平面上の点に表現されます(特徴量空間中の点)。その点の位置の違いから「特徴の違い」を識別することができます。これは特に、ディープラーニングによる犬猫の顔識別が有名な例です。
本研究グループでは、X線ピークパターンを識別できるようニューラルネット内部の数値パラメタを調整することでオートエンコーダを訓練しました。その結果、元素の添加比率で変化を示すピークとそうでないピークを自動的に識別したり、そのピーク強度変化高から添加比率を割り出したりすることが可能となりました。
ピークの変化は僅少で、これらの識別は人間の目には容易ではありませんが、ピークパターンを特徴量空間中の点に射影することで、このような自動識別が可能となりました。
本研究成果は、2022年12月22日(米国東部標準時間)にWiley社発行の科学雑誌「Advanced Theory and Simulations」のオンライン版に掲載されました。
図 X線ピークパターンの識別。特定の照射角度に対して反射光の強度が著しく高まる様子がピークとして捕捉され、そのパターンを「物質の指紋・特徴」として利用することができる(XRD(赤色)の曲線)。多数のピークからなるピークパターン1枚が、1つの物質サンプルに対応する。「数多くのピークのうち物質の特徴づけに決定的役割を果たしているピークはどれなのか」という問いに対し、ディープラーニングで割り出したピークの重要度がDev(青色)の曲線で重ね書きされている。
例えば、(a)で示されたピークは重要度が小さく、「強度は大きいが特徴づけには役割を果たしていないピーク」ということがわかる。このような識別を人間が行うことは容易ではない。
【今後の展開】
本研究の成果は、対象をX線ピークパターンに限定するものではなく、物質の科学的データをディープラーニングの入力とし、その特徴を抽出する場合の全般に利活用できる技法を提供したという点で大きな意義があります。人間の目では見出しづらい法則性を抽出できる枠組みで、データ科学による定理発見を支援する有力なツールとして活用されることが期待されます。
【論文情報】
掲載誌 | Advanced Theory and Simulations |
論文題目 | Feature Space of XRD Patterns Constructed by an Autoencorder (オートエンコーダによって構成されたXRDパターンの特徴量空間) |
著者 | Keishu Utimula, Masao Yano, Hiroyuki Kimoto, Kenta Hongo, Kosuke Nakano, Ryo Maezono |
掲載日 | 2022年12月22日(米国東部標準時間) |
DOI | 10.1002/adts.202200613 |
【用語解説】
機械学習において、ニューラルネットワーク(人間の脳のおおまかな仕組みを模したモデル)を使用した次元圧縮のためのアルゴリズム。入力層/隠れ層/出力層で構成され、隠れ層の次元数を入力層の次元数より小さくすることで入力データに含まれる重要な特徴を抽出できる。
【リンク】
研究室 (日/英)
[https://www.jaist.ac.jp/is/labs/maezono-lab]
令和4年12月22日