GTC 2015 - Deep Learning一色となった基調講演
このコンペのトップの認識率は2010年に72%、2011年に74%と年率2%程度の改善で推移していたが、2012年にトロント大のHinton教授のグループがDeep Convolutional Networkを使い、学習速度を高める改善を加えたニューラルネットワークを使い、認識率を一気に84%に改善するという成果を挙げた。Jen-Hsun Huang CEOは、これをBig Bangと評価している、
このBig Bangを受け継いで進歩が続いており、2014年のILSVRCでは93.37%の認識率に改善され、今年の2月にはMicrosoftとGoogleが相次いで95%という結果を発表し、94.9%という人間の認識率を超えるまでになっている。
このようなアルゴリズムの改善とGPUを利用した高速実行により、ニューラルネットワークによる認識は実用化に近づいており、NVIDIAとしては今回のブームは本物と考えているようである。
そして、画像認識がどこまで来ているかを示す例として、Stanford大の研究者であるAndrej Karpathy氏とFei Fei Li氏の研究を紹介した。両氏の研究は、写真を認識してそれを説明する記述を付けるというものである。