画像数が少なくても皮膚腫瘍を識別する、AI診断補助システム登場

世界トップ水準のプロ棋士を打ち負かしたことですっかり有名になった――。AI(人工知能)の一技術、ディープラーニング(深層学習)は、これを用いた脳機能モデルが'12年の画像認識コンペティションで従来技術を凌駕して以来、産業および医療分野での活用が進んでいる。

ディープラーニングはしかし、高い精度で機能するためには大量の教師データを使った事前学習を必要とする。――画像の識別には1つのカテゴリごとに最低1,000枚の画像を用いた学習を要するため、希少な疾患が多い皮膚疾患の診断システムの構築には不向きである。ゆえに実際、昨年1月に公表されたスタンフォード大学の論文では、皮膚がんの識別精度を皮膚科医と同様とするために、ダーモスコープ(皮膚の状態を診察する特殊ルーペ)を用いて撮影されたものを含む129,450枚もの画像が使われているという。

筑波大学とKCCSの共同研究グループは、同大学が所蔵している約6,000枚の臨床写真を用いて、90%以上の非常に高い診断精度を有する皮膚腫瘍人工知能診断補助システムを開発した。

14種類の皮膚腫瘍を識別には14,000枚以上の画像が必要となるところで、同研究グループは、その半分に満たない数の臨床写真を用いたAI学習でも、皮膚腫瘍の良悪性を判断できる割合(識別率)が90%超となるシステムの構築を可能にした。要因には、教師画像として使用した臨床写真の大半が、病理組織診断で診断が確定している質の高いデータであるという点と、一般画像を事前学習済みのGoogLeNet(Google AI)をベースにして、診断画像を学習データとする段階でKCCSの画像解析ノウハウを活かし、さまざまな工夫を加えた点が挙げられるという。

今回開発したシステムを評価するために、同じ画像セットを用いて、日本皮膚科学会認定皮膚科専門医13名が診断を行った――結果、皮膚科専門医による皮膚腫瘍の良悪性の識別率が85.3%±3.7%であったのに対して、AI診断補助システムの良悪性の識別率は92.4%±2.1%と有意に高いことが明らかとなった(P<0.0001, Welch's t-test)。良悪性の識別より難しい14種類の詳細な診断の正答率でも、皮膚科専門医が59.7%±7.1%であったのに対して、同システムの正答率は74.5%±4.6%であり、こちらも有意に優れていた(P<0.0001, Welch's t-test)。

皮膚腫瘍の良悪性が写真判定できるようになれば、皮膚科専門医が不足している地域でも皮膚がんの早期発見が可能となり、必要な治療が手遅れになる前に受けられるようになる。今後は診断精度の向上だけでなく、皮膚がん以外の皮膚疾患も診断出来るよう、さらに研究を進めていくという。研究成果は、「British Journal of Dermatology」でオンライン公開された。