データサイエンスとAIの作品でコンペを行うKaggleが国土安全保障省の空港のセキュリティ改善策懸賞に協力

2017年6月24日 by Hiroshi Iwatani

空港のセキュリティを通ることは、どこでもうんざりする体験だ。しかも遅くて人に対し侵害的なプロセスでありながら、TSA（上図）には、脅威を未然に防いだという立派な実績があまりない。そこで国土安全保障省は、データサイエンスのソリューションのコンペを主催しているKaggleの協力を仰いで、空港のセキュリティシステムをより正確かつ効率的にするための、機械学習ツールの懸賞を開催している。

今年の早い時期にGoogleが買収したKaggleは、機械学習の難問の新しい視点による解を競う懸賞付きコンペを、定期的に主催している。今年の三度目のコンペであるこの危険検出アルゴリズムの改良というお題の懸賞は、賞金総額が100万ドルを超えている。

優勝賞金が50万ドルで賞金総額150万ドルのこのコンペの応募作品は、人間が身につけている危険物を正確に予見するアルゴリズムやシステムだ。機械学習を訓練するための画像データ集は、TSAが提供する。服をちゃんと着ていても武器の携行が分かる、という画像の集合だ。プライバシー保護のために、それらは実際の写真ではなくてTSAが作った画像だ。

コンピュータービジョンのスタートアップMatroidのファウンダーでCEOのReza Zadehはこう言う: “このコンペの結果から、実際にそんなシステムを作ったらどれほどのものができるか、その目安が分かるだろう。でも結果がどうであれ、現場の警備員が確実に危険物を見逃さないようにするための、補助的システムは絶対的に必要だ”。

これら17のボディゾーンのどれかに武器が隠されている可能性を検知するシステムが、コンペの課題だ。

もちろんTSAそのものが具体的に機械学習の問題を抱えているわけではない。むしろこのお役所の問題は、高価で複雑なマシンを自力でアップグレードする技術力がないことと、高価とはいっても、今の民間のデータセンターに見られる高度なGPUをまったく導入していないことだ。しかしGoogleやFacebookなどは、軽量級の機械学習フレームワークに重点投資し、エッジで〔各末端現場で〕ローカルに（インターネットなしで）使えるよう最適化しているから、TSAもそれらなら利用できるだろう。

そしてそれなら、コンペの応募作品がいきなり実際に空港の人体スキャンマシンで使われることもありえる。事前に訓練するほかに、いくつかの制約条件に合わせればよいだけの話だ。国土安全保障省も、真の評価のためには実地テストが必要だから協力する、と言っている。

Kaggleを作ったAnthony Goldbloomは、“エンドユーザーマシンに高速なGPUがないのは厳しいが、でも推論部分はヘビーな計算をしないからね”、と言う。

もうひとつの懸念は、危険検出を自動化した場合に起きうる、冤罪的/名誉毀損的な状況だ。旅行者が、身におぼえのない嫌疑をかけられるおそれがある。しかしTSAが作った訓練用画像のデータセットは、それを防ぐための工夫がしてある。

“TSAはそれに関してはいい仕事をしている。ボランティアを採用するときも、特定のタイプの人〔宗教、民族等〕が不名誉な誤認をされないために、十分なダイバーシティ（多様性）を確保するようにしている”、とGoldbloomは念を押す。

近い将来、応募者はGCP(Google Cloud Platform)を（使いたければ）使えるようになる。フレームワークも、KaggleがGoogleの企業だからといって、必ずTensorFlowを使わなければならないことはない。コンペの詳細はここにある。締め切りは12月だ。

[原文へ]
（翻訳：iwatani(a.k.a. hiwa））

近日開催のイベント