医用画像AI、少ない学習量で早期胃がんを熟練医の如く発見

高齢化が進む日本では、機械学習/人工知能(AI)の活用が、産業および医療分野で広がっている。理由はその一つ、ディープラーニング(深層学習)が画像識別を得意としていることにある。検査・診断において、通常あるいは正常との違いを瞬時に見抜く――

ディープラーニングでも、高い精度で機能するためには大量の教師データを使った予習を必要とする。一般に画像識別のための機械学習では数十~数百万枚の学習用データが必要とされている。近ごろ、消化管の内視鏡画像診断に機械学習を導入し、熟練医師に迫る消化管腫瘍の診断、自動検出に成功した例がいくつか報告されている。

日本において、胃がんの罹患者は男女あわせておよそ13万人(がん情報サービスサイト参照)。早期の患者には自覚症状があまりなく、症状が現れても胃炎や胃潰瘍の症状に似ていることから、がんだと分かったときにはかなり進行しているケースがある。そのため、内視鏡検査での早期発見が望まれている。が、早期胃がんの画像診断の正確さは医師の経験に大きく依存し、専門医であっても発見が難しい場合がある。

早期胃がんでは精度の高い自動検出の成功例はほとんどない。その理由として、機械学習に適用可能な早期胃がんに関するデータが十分に整備されていないこと、早期胃がんの多くは進行性胃がんや大腸がん、大腸ポリープなどと比べて形態的特徴や色の特徴が多彩で、正常粘膜における炎症との判別が難しいことなどが挙げられるという。

理化学研究所の光量子工学研究センター画像情報処理研究チームと、国立がん研究センター東病院消化管内視鏡科との共同研究チームは、ディープラーニングの一種である「畳み込みニューラルネットワーク(CNN)」をベースにして、少数の正解データにより構築されたAIによる、早期胃がんの高精度な自動検出法を確立した。

早期胃がんの正解画像約100枚と正常画像約100枚から、「がんの部分」と「正常の部分」を確実に含む領域をランダムにそれぞれ約1万枚切り出し、合わせて約2万枚の画像を取得。これらにデータ拡張――早期胃がんの特徴である胃粘膜表面の血管模様などを保ちながら、元画像を加工することで新たな学習用データを作成する――技術を適用して、画像を約36万枚まで増やし、さらに学習済みCNNを用いた「転移学習」を施した。

のちに、学習に用いていない約1万枚の画像を使って、それぞれの画像について正しい判断ができるか検証した。結果、感度80.0%、特異度94.8%、陽性的中率93.4%、陰性的中率83.6%――胃炎や胃潰瘍と特徴が似ているために判断が難しい例についても、高い確率で判断できることが分かったという。

画像1枚の処理時間は実質4ミリ秒で、臨床現場での活用に十分な速度を実現した。早期発見、早期治療につながると期待される今回の研究成果は、ハワイで開催のEMBC'18にて本日発表される。