データ駆動科学は、ベイズ推定やスパースモデリング等の機械学習の手法を計測・解析に組み込み、従来の知見を超える情報を抽出する取り組みである。これまで科学計測は、現象の原因から因果律に従って結果が決まる一方、誤差論では、計測値がノイズによって確率分布すると考えてきた。データ駆動科学で用いるベイズ推定ではその考え方を逆転させ、計測データを「起点」として原因が確率分布すると考える。

 データ駆動科学の基本的思想は、計測データを最善の方法(機械学習)で骨の髄まで解析して虚心坦懐にデータに対峙することである。その結果、一切の作為的な先入観を排除するとともに、例え初心者であっても経験豊富な研究者と対等に戦うことが可能となる。特にベイズ推定では物性パラメータの統計的分布の評価が可能で、新しく発見した現象や物性の、誰もが納得できる統計的証拠を示すことができる。更に、一切の先入観を排除してデータだけから現象を説明する物理モデルの選択も可能である。

 このデータ駆動科学を、放射光を用いた材料科学研究に展開する内容の研究プロジェクト「データ駆動科学による高次元X線吸収計測の革新」(下図)が、JSTの情報計測CREST「計測技術と高度情報処理の融合によるインテリジェント計測・解析手法の開発と応用」に採択され、現在研究を進めている。