港都KOBEで堅固に匿名化したデータの有用性が実証されオープンに

行政機関の保有データを住民サービスの向上や政策立案に役立てる。それを総務省が推奨していて、官民データ活用推進基本法では、行政府のオープンデータへの取り組みが義務付けられた。

政府CIOポータル「オープンデータ」に自治体ガイドラインがある。国民共有の財産である公共データは積極的に公開し、利活用を促進していくことが求められているという。神戸市ではこれまで多様なデータをBIツールで分析し、部局・分野横断的に活用することで、サービス向上に生かしてきた。オープンデータの整備にも力を入れてきた。

一般的に、集計された統計情報より1件1行の個票形式の方が分析に適しているが、個人を特定できない状態に匿名化することは時間的・技術的に困難な状況だったという。「Open Data Kobe」を運営している同市は、日立ソリューションズとともに、オープンデータの推進に向けて、より価値の高いデータ提供を可能にするため、"k-匿名化"したデータを作成する実証実験を行い、分析時の有用性を確認した。

匿名化データと非匿名化データ、各分析結果を比較して、前者が割合などの傾向を把握するのに十分な精度であることを確認するため、20年7月31日から約3ヶ月、統計情報から作成した個票サンプルデータ(データレコード数150万)の年齢・性別・国籍・住所など10項目について、k-匿名化(対象データ内に同じ属性値を持つデータがk件以上存在するようにデータ変換して、個人の特定・識別を困難にする技法)を検証した。

同社の「プライバシー情報匿名化ソリューション」を用いて、データの利用価値を保持したまま高い匿名性を実現した。k-匿名化後のデータを利用して基本的な人口や人口動態を分析し、有用な結果が出ることを確認した。神戸市は、今回の実験でk-匿名化したデータの1つをより活用しやすい統計情報に集計し、今月16日にオープンデータとして公開した。