写真や動画を撮影すると、本来の情景を覆うように画像全体にざらざらとした粒状のノイズが生じる。このようなノイズは、画質を悪くするだけでなく、例えば監視カメラでは被写体の視認性を低下させ、ロボットの目などの物体認識カメラでは認識精度を低下させる。そのたため、多くの場合、撮影後にデジタル処理を用いて除去する。この画像ノイズ除去においては、ノイズだけを取り除き、本来の情景をぼかさずに正確に復元することが求められる。
東芝によると、ノイズ除去の方式としてはこれまで、開発者がアルゴリズムを細かく設計するハンドクラフト方式が多く開発されてきた。しかし、近年、AIの開発が盛んとなり、ノイズ除去にも深層学習を用いることで高い復元精度が得られることが分かったという。
従来の深層学習方式では、学習データに含まれるノイズ量に最適化された固定のニューラルネットワークが構築されるため、あらかじめ学習したノイズ量の画像に対しては高画質な画像が得られる。ノイズ量は周囲の明るさやカメラの露光時間によって変化することから、学習時と異なるノイズ量の画像に対しては調整ができず、十分なノイズ除去効果が得られていなかった。
そこで同社は、あらかじめ学習していないノイズ量であっても対応できる「深層学習型ノイズ除去技術」を開発した。ニューラルネットワークでは、脳の神経細胞を模した活性化関数でデータを変換。これまでは、活性化関数として、負のデータを全てゼロにして、正のデータはそのままとする「ReLU(rectified linear unit)関数」が多く用いられてきたが、今回新たに、絶対値がしきい値以下のデータをノイズとみなしてゼロにするSoft-shrinkage関数を採用した。
さらに、しきい値をノイズ量に比例して切替え、入力される画像のノイズ量に応じてノイズ除去の対応範囲を変更可能にすることで、学習範囲を超えたノイズ量にも対応できるようにした。
同社は、この技術により、深層学習方式においてノイズ除去の強さが調整可能となり、想定外のノイズ量の画像に対して復元誤差が従来の深層学習型ノイズ除去技術に比べ3分の1以下に改善し、十分な画質が得られるようになったと説明する。