グーグルがマシンアンラーニングのコンペ開催  なぜAIに「忘れさせる」のが重要なのか

Alastair Grant / AP Photo

◆「マシン・アンラーニング・チャレンジ」とは
 こうした背景を受け、マシンアンラーニングという新たな分野が展開し始めている。マシンアンラーニングは、その名の通り、機械学習とは逆で、学習済みモデルから学習例の特定の部分集合(forget set)の影響を取り除くこと、つまり「忘れさせること」を目的としている。グーグルによれば、理想的なアルゴリズムは、学習済みのデータセットにおいて、ほかの有益な特性を維持しながら、特定の事例における影響を削除することで、取り除くべき事例を除外したデータセットを再学習(再計算)させることだが、このやり方には計算コストがかかり、効率的ではない。そのため、すでに学習済みのモデルを活用しながら、「忘れるべき」データの影響を取り除くという調整が必要だ。同時に、取り除いたモデルの精度を評価することも求められる。

 マシン・アンラーニング・チャレンジ」は、アンラーニングの評価指標を統一化・標準化するとともに、誰でも参加できるオープンな場を設けることで、斬新な解決策を生み出したいという狙いがある。コンペは、7月中旬から9月中旬まで開催され、Kaggleというデータサイエンティストや機械学習エンジニアのためのプラットフォームを通じて参加できる。コンペでは、年齢予測ツールが顔写真で学習された後、個人のプライバシーや権利などを保護するために特定の画像を忘れさせるというような現実的なシナリオを想定したものだ。コンペ終了後は、10月に優勝者が発表される予定だ。

 プライバシー保護だけでなく、誤った情報の拡散や情報操作を防ぐ意味でも重要となるマシンアンラーニング。コンペなどを通じて、今後さらにリスク軽減のための研究開発が進むことに期待したい。

Text by MAKI NAKATA