教師データを自動作成、精度84.7%にて24時間で9600枚も

画像認識に長けたAIが各種産業・医療現場、社会の仕組みで活躍し始めている。昨今、自動運転分野などでAIの活用が進む中、AI開発の大部分の時間がAIの学習に必要な教師データの作成に費やされていて、これは大量の教師データを手作業で作成していることが主な原因だという。

東芝情報システムは18日、高精度な教師データを自動作成する「自動アノテーションサービス」の提供を開始した。同サービスは、顧客の教師仕様に基づいた教師例と教師対象データを預かり、高精度な教師データを自動作成し、短期間で提供する。手作業による教師データ作成の中でも特に時間を要する画像のセマンティックセグメンテーションを対象としている。

同社が独自開発した自動アノテーションプラットフォームは、必要な事前学習を行っていて、顧客から預かった少量の教師例を追加学習させることで、顧客仕様に合わせた高精度な教師データを自動作成する。乗用車、トラック、バイク、自転車、車道、歩行者、空、車線、歩道、縁石、ガードレール、道路標識、植生、電柱、建物、障害物、駐車場、自車、その他(非認識対象物)といった18クラスを認識する――

自動運転向け教師データ作成のベンチマークを実施した。同プラットフォームに、顧客から預かる教師例とみなした5,000枚を追加学習させ、教師データを自動作成したところ、精度(mIoU) 84.7% を達成した。同ベンチマークでは、1日(24時間)で9,600枚の教師データが作成可能。手作業では1日(8時間/人)で16枚の教師データしか作成できず、99%以上の作成時間削減を実現するという。

同社は、質の高い大量の教師データを必要とする顧客に上記新サービスを提供し、AI開発の期間短縮に貢献する。画像のセマンティックセグメンテーション以外の教師データにも同サービスを対応させ、多様なAI開発に携わる顧客の事業発展に寄与していく考えだ。