AIは社会構造に変革をもたらす革新的技術だといわれていて、ディープラーニング(DL)の潜在能力は生物学や化学などの分野でも注目されている。がまだ本格的に利活用されていないという。理化学研究所の研究チームは、メタボロミクス――細胞に含まれる全ての代謝産物、代謝中間体などの小分子全体を網羅的に測定・解析する――研究に最適化した「DLアルゴリズム」を開発。魚類の核磁気共鳴(NMR)データを解析し高精度な産地判別が可能なことを示し、この判別に寄与する重要代謝物探索法も確立したことをきょう公表した。
DLにおける基幹的な計算アルゴリズムであるディープニューラルネットワーク(DNN)に着目したという。同チームは、学習過程においてその内部構造が複雑なため、構築された分類/回帰モデルに寄与する重要な変数を直接的に見いだすことができないDLの欠点を、パーミュテーション法(変数の列のみがランダムに並べ替えられた新たな行列を生成する)をアルゴリズムに組み込むことによって克服。メタボロミクス研究における解析で、モデルに対して重要な因子となる代謝物を特定できるようにした。
このDLアルゴリズムの性能を評価するため、日本各地の河川で採集した魚類の筋肉抽出物に由来するNMRデータを用意。1,000サンプルを超えるデータセットに対して、従来の分析手法や種々の機械学習も用いて採集地域の違いに関する判別性能を比較したところ、DLアルゴリズムが最も高精度な産地判別能を持つことが分かった。
高精度な産地判別モデルに寄与する重要な変数(代謝物)を特定できる重要代謝物検索法としても有用であった。DLアルゴリズムの研究で用いたデータセットでは、判別モデルを構築するための学習サンプル数が200を超えると、90%以上の判別精度が得られた。これらの結果は、DLアルゴリズムが、NMR法のようなビッグデータの取得に効果的な分析機器と相性がよく、メタボロミクスに限らず、メタゲノミクスやフェノミクスなど、生物系の多様なビッグデータ解析に有用な解析技術であることを示しているという。
研究チームの成果は、米国の科学雑誌「Analytical Chemistry」電子版に掲載されていて、将来、簡易分析装置とDLアルゴリズムによる農産物や水産物の品質管理が普及することで、重要因子を代謝マーカーとした「旬」や「産地」に応じたおいしい食品開発や、廃棄物を飼料などへ再利用し1次産業の価値向上を図る「環境持続的コネクティッド・インダストリ化」などへの応用が期待できるとのことだ。