超スマート社会に向け、ゲノム医療研究用スパコンを全国利用へ

親から子へ生物的な特徴を伝えるDNA。それは染色体の重要成分であり、遺伝子のもととして伝達情報の保存や複製に関わっている。生命現象を研究するライフサイエンスにて、DNAの全遺伝情報を指し、遺伝子と染色体を掛け合わせた概念を「ゲノム」と呼ぶ。

ヒトゲノムの解読作業はおよそ10年かけて2003年に完了した。以降も推定値の修正作業が続いている。いま、人間の遺伝子の数は、イネ科の植物より遙かに少なかったり、ウニとほぼ同等であったり、遺伝子そのものが他の生物と相当数共通していることが判明して、「人間は万物の霊長」という自信は崩れつつある――。一方、民族多様性など未解明な部分も多く、個人のゲノム解析は医療・医学においていっそう重要となっている。

近年、解析技術の急速な進展等により、ライフサイエンスに関わるデータ量は膨大となり、研究にはスーパーコンピュータを用いたビッグデータ解析が必須となりつつある。が、それを所有できる研究組織は限られ、多くの研究者が計算資源の確保に苦慮しているという。AMEDはゲノム医療研究の推進加速のため、医科学用共用スパコンを更新し、全国の研究者が利用できるようにした。

スパコンは東北メディカル・メガバンク機構(ToMMo)に運用委託していて、今回、AIによる解析・ディープラーニング(深層学習)に適した汎用GPUノードを強化し、ビッグデータ解析に向けて――外部記憶域も拡張し保存データ量を増大――世界有数の複合バイオバンクの基盤を整備。その3分の2を公開・分譲区画(外部からアクセス可)となるようにした。

データ及び計算・解析機能の共有により様々な機関による医療、医学の研究が効率的になる、スパコンシステムによって、第5期科学技術基本計画に基づく「Society5.0」時代に、ToMMoが目指してきた個別化医療をはじめとする次世代医療の開発が近づくという。