GTC 2015 - Deep Learningを理解する(中編)
4枚目は動物の種類を当てる難しい絵で、人間でも正解できる人は殆どいないと思われる。
ILSVRCは毎年行われており、2010年から2011年は2%程度しかTop-5エラー率が改善していないが、2012年のトロント大のHinton教授のグループの結果は、10%近い大幅な改善を達成した。2012年までは色々な認識法のシステムが使われていたのであるが、この成功から2013年以降は、ほとんどすべてのシステムがトロント大の方式になってしまった。GTCの基調講演で、Jen-Hsun Huang CEOがBig Bangと表現したのも頷ける。
そして、2014年にはGoogleが6.7%を達成して優勝している。
ILSVRCは、年ごとにトレーニング、ベリフィケーション、テストの画像の枚数や含まれるカテゴリ数が大きくなっている。そして、2015年のデータはまだ公表されていないので、公式記録は2014年までであるが、その後の改善も次の図には含まれている。2014年の次のHumanと書かれているのは、スタンフォード大学の研究者のAndrej Karpathy氏が1500枚の画像を見て認識した結果で、Top-5エラー率は5.1%であった。