1つのニューラルネットワークで複数の材料科学データを学習
ヒトの脳神経回路を模したという今のニューラルネットワーク、すなわちAIはしかし、"知能"とはほど遠い。材料科学で使われるAIの予測モデルは原則として単一のデータベース(DB)や概念しか学習できず、ヒトは、多彩な分野(言語、数学、化学、物理、人文、社会科学など)を知識として取り入れ、それらを統合した上で総合的な判断を下せる。AIに異なる概念を学習させるのは容易ではない。
例えば、化合物の融点と沸点の間に正の相関があることは良く知られていて、ヒトは「高融点の化合物は沸点も高いはずだ」との予測を立てられるが、これまでのAIは融点または沸点のみを学習するケースがほとんどで、複数の物性を同時学習させることが大変困難だったという。早稲田大学理工学術院の研究グループは、多彩な形式の材料科学のデータを単一AIに学習させる手法を開発した。
グラフ構造と呼ばれるフォーマットに着眼し、種々のDBを共通書式に変換する手法を開発。従来の材料DBはスプレッドシートのような表形式で記述されるケースが大半であり、通常の学習モデルは単一構造の表形式データしか受け付けないため、異種DBの学習が困難であった。そこで同研究グループは、全データを共通書式のグラフ構造に変換し、専用の学習モデルに入力することで、原理的にあらゆるDBを学習可能にした。
新規手法の導入により、単一のAIで40種類以上の物性、数千以上の化合物、数百以上のプロセス情報を学習・予測させられた。特筆すべき例は、透明ディスプレイ等への応用も期待されるPEDOT-PSSと呼ばれる導電性ポリマーの性能予測だ。ポリマーフィルムの製法の微妙な違いにより導電性が1万倍以上も増減してしまう材料において、同手法によるAIはフィルムの製法をもとに導電性を化学実験の熟練者並の精度で予測できた。
材料科学に関する広範な知識をAIに付与することができた。今後、材料科学に限らず創薬など広範な分野に応用可能な「万能AI」を導く一つの道筋となる可能性がある。オープンアクセス論文や特許などの材料科学に関する膨大な公開データを自動収集し、学習させるとどのような景色が見えてくるのか、最近注目されている逆問題を解くためのより洗練された方法論などもこれから明らかにしていくという。
JSPS科学研究費助成(複数種目)ならびに早稲田大学データ科学センター電通国際情報サービス(ISID)研究助成を受けて行われた上記研究の成果は、英科学誌ネイチャー系「Communications Materials」電子版で公開された。