GTC 2015 - Googleが「ディープラーニング」に対する取り組みを紹介
これには1万6000個のCPUコアによるシステムで1週間かかったという。
最上位のニューロンには、高いレベルのコンセプトが見つかった。例えば、あるニューロンは、人の顔の検出器になっていたが、ほかにも純粋に教師なし学習で画像を学習させ顔を認識するニューロンや猫を認識するニューロンも作るができたという。
ディープラーニングによる学習の精度も大きく向上している。ディーン氏が例としてあげたのは、画像を認識する「Imagenet」というコンテストでのデータだ。2011年の優勝者はTop5の誤差が25.7%だった。この値は、何年もかかって徐々に改善してきた結果である。
しかし翌年の2012年にCNN(畳み込みニューラル・ネットワーク)を利用したシステムが16.4%を達成した。
さらに2013年には、Googleのチームが6.66%という誤差で優勝し、2014年3月2日にGoogleの出した論文では4.8%にまで来た。ちなみに同じ画像の認識を人間が行うと5.1%とのことから、ついにコンピュータが人間と並び、超えつつある。
Googleの画像認識では、例えば、ハイビスカスとダリアを区別できる一方、さまざまな国の料理や料理が乗っているテーブルを「食事」