GPUコンピューティングによるヒトゲノム解析をさらに高速に

各生物種で固有のDNAやRNAにある全遺伝情報を「ゲノム」という。正常な生命活動に必要最小限の遺伝子群を含む一対の染色体である。ヒトゲノム(核ゲノム+ミトコンドリアゲノム)は全遺伝情報の1セットが約30億塩基対×2で構成されていて、近ごろ個別化医療でも注目されている。

一人ひとりの体質や病態に適した医療を提供するためには、パーソナルゲノム情報に基づいた予防・診断・治療法の検討が必要となる。そこで厚労省は国家戦略として「全ゲノム解析等実行計画」を策定。がんと難病の患者計約92,000人分の検体を対象に最大3年間かけて解析するとした。

全ゲノムシークエンス(塩基配列)は情報の網羅性が高く、研究面での有用性が広く認識されている。近年、従来の5倍以上のシークエンス深度(配列読取り回数)で、がん全ゲノムを解析する研究も発表された。感染症等の研究領域でもそのニーズが高まっている。かつてない規模の全ゲノム解析を行うには大型計算機でも膨大な時間を要する。ゲノム医療を多くの患者に提供するためには、超高速データ解析基盤の構築が喫緊の課題だという。

NVIDIAは2月25日、東大医科研ヒトゲノム解析センターが最新型のヒトゲノム解析用スパコンシステム「SHIROKANE」の解析基盤の強化に向け、同社のプラットフォームを新たに導入したことを公表。従来の約40倍の高速化を可能とするゲノムデータ解析ソフトウェア、NVIDIA Clara™ Parabricksが全面的に実装され、それを実行するGPU環境の強化としてNVIDIA® DGX™ A100サーバが選択されたという。

新基盤は3月1日に稼働し、4月1日よりユーザ向けに提供される。ライフサイエンス分野で国内最大の計算基盤SHIROKANEは、がん研究に貢献するヒトゲノム情報の効率的な解析と個別化医療の実現を目的に運用されていて、民間利用の道も開かれている。