GTC 2015 - Deep Learningを理解する(中編)
これはかなり学習した結果で、普通の人間ではとてもこうは行かない。なお、ILSVRCのテスト画像は200カテゴリ4万152枚であるが、Karpathy氏はランダムに選んだ1500枚を認識しただけであり、5.1%は参考記録である。
その後、2015年に入って、Microsoftが4.94%のTop-5エラー率、Googleが4.82%というエラー率を発表している。ただし、これらは2014年のデータでの結果で、やはり参考記録であると思われる。しかし、2015年のILSVRCの結果締切は8月であり、これらの記録を上回る結果が提出される可能性は高いと思われる。
これまでに説明したように前側のConvolution層はエッジから始まって、だんだんと上位の部品を認識して行く層で、最後の3層程度が全体的な対象物の認識を行っている。従って、新しい画像セットの認識を行わせる場合も、前の方の層はそのまま使って、最後の数層を新しいデータセットを使って学習させることで対応できるという。
Facebookの論文では、このやり方でクラスあたり6枚の画像のトレーニングで以前に発表された論文のレベルの認識率が得られ、60枚の画像のトレーニング結果で比較すると、エラー率は半減した報告されている。
(後編に続く)
犬山のパッケージメーカー、12/11~12/15開催「文具女子博」に初出店!食べ物やネコの付箋など色鮮やかな文具を販売