GTC 2015 - Deep Learningを理解する(中編)
(GTC 2015 - Deep Learningを理解する(前編)はコチラ)
当初は学習に使える画像が少なかったが、スタンフォード大がImageNetを立ち上げ、現在では2万カテゴリのラベル付けがされた、1400万枚の画像が集められている。
ImageNetでは、毎年、 ImageNet Large Scale Visual Recognition Challengeという画像認識のコンペが行われている。昨年のILSVRC2014では45万6567枚のトレーニング(学習)用の画像が提供された。これらの画像には200カテゴリの画像が含まれている。そして、2万121枚のバリデーション(確認)用画像が提供されており、これを使って学習したモデルの振舞いを確認する。
そして、テスト用の4万152枚の画像を認識して、その結果を競う。競うといっても一堂に会して行うわけではなく、期限までに提出された認識結果を審査して、最高の成績をあげたものを優勝として表彰を行うという形式である。
これらのデータには全部で200カテゴリの画像が含まれているが、例えばAで始まるカテゴリをリストするとaccordion、airplane、ant、antelope、apple、armadillo、artichoke、axeとなっている。