機械学習を利用して肺がんの兆候を早期発見する技術でKaggleが賞金100万ドルのコンペを主催

データサイエンスのコンペを毎年主催してほぼ10年になるスタートアップKaggleが、今度の賞金総額100万ドルのコンペでは、肺の中の癌になりそうな病変組織を見分ける今よりも良い方法を募る。この2017 Data Science Bowlと名付けられたコンペの資金提供者はLaura and John Arnold FoundationとBooz Allen Hamiltonだ。

目標を限定したコンペで高額賞金、というケースは、今回が初めてではない。昨年の同コンペでは心臓病の兆候を見つけるデータ分析技術に20万ドルの賞金が提供された。さらにその前年は、海の健康診断、という課題だった。

でもこれまでで最高額の賞金は、今年の100万ドルだ。優勝者が50万ドル、2位、3位、4位がそれぞれ20万、10万、2万5000ドルとなる。〔4位は複数か?〕

Kaggleは2010年にAnthony GoldbloomとBen Hamnerが創設した。これまですでにKhosla Ventures, Index VenturesなどからシリーズAで1100万ドルを調達している。

Goldbloomは本誌に、“うちは、データサイエンスのホームのような企業でありたい”、と語った。

同社の収益源は、このサイトでコンペを行う企業や財団などからの出資金の一部だ。また80万名近い会員のための求職求人掲示板からの収益もある。

2017 Data Science Bowlがローンチしたのは今朝(米国時間1/12)だが、すでに300のチームからの提出物がある。Goldbloomによるとこれらの提出物の多くは、提出の早さを競って自慢するためだ、という。しかし2017年4月12日の締め切りまでに、一日平均5件の提出がある、という予想だ。

参加チームは、国立癌研究所(National Cancer Institute)が提供する肺のスキャン画像を使って自分たちのモデルを作る。目標は、今のソリューションが不適切である最大の理由、すなわち高い偽陽性率を、大幅に減らすことだ。

GoogleのDeepMindMicrosoftには、どちらにも、目のスキャン画像を分析して今後失明になりそうな兆候を見つける機械学習モデルとそのためのリソースがある。

[原文へ]
(翻訳:iwatani(a.k.a. hiwa))