世界人口の増加に伴い、タンパク質の需要が倍増している。いま、植物性タンパク質の主要供給源である大豆の収量向上が求められているが、多大な手間と時間のかかる収量調査は、大規模化が難しく、育種のボトルネックになっている。数え上げ等従来手法による子実の分布調査には限界がある。
――初期の研究で使用された深層学習は物体の計数と位置決めに問題があり、例えば、画像内の目的の物体の特徴点やそれが含まれる領域を教え込むための労力とコスト、特徴点が密集している場合に特徴点を含む領域が重なり合うことを抑制する必要があることなどが課題だったという。
東京大学大学院農学生命科学研究科と農研機構作物研究部門の研究グループは、育種圃場の静止画像や動画からダイズ子実を自動検出・計測する新しい深層学習モデル「MSANet」を開発した。多様な大豆が含まれるベンチマークデータセットの子実数と位置の計測で、昨年提案したP2PNet-Soyの性能を大きく上回った。同モデルにより、ダイズ個体内の子実の空間分布に関する情報が容易に得られるようになった。
ヒートマップ生成による座標回帰からセグメンテーションへの変換、マルチスケールアテンションによる背景ノイズの軽減、他の方法との比較/異なるデータセットでの識別能力を特徴とし、子実分布解析による新たな育種選抜の可能性を有する。同モデルは新しい収量予測技術などにつながる強力なツールになるだろう。
今後は多収性に関する特徴を捉えるための大きな一歩を踏み出す。予測精度アップに向け、子実が含まれない莢の検出や節あたりの種子数の計測アルゴリズムの開発に焦点を――。データ収集コストも考慮し、一度に2畝分を撮影できる360度カメラの導入や、そのような動画にも使えるモデルの汎用性向上にも焦点を合せる予定であり、複雑な環境等に対する機能強化や、他の作物への適用性を広げることも視野に入れているという。