2016年2月2日 10:00
ディープラーニングの原理とビジネス化の現状 (1) ディープラーニングシステムの基本を知る
また、max poolingと呼ぶ、小領域のデータの最大値を選択する演算が追加されることが多い。
ここで最初の層のxiは入力画像のピクセルで、単純な数値ではなく、RGBの値などを持っている。2層目以降の出力は、ネットワークの設計に依存し、もっと複雑な情報を持つ場合が多いが、最終出力では0~1の範囲の1つの数値という場合もある。
そして、このようなニューロンからなる層を重ねたニューラルネットワークを構成する。通常、この図のように、一番下の層が入力層で、一番上の層が出力層として描かれる。そして、中間の層は隠れ層と呼ばれる。
この図ではニューロンの数が少ないが、実際には各層のニューロン数はもっと多いし、層数も多いネットワークが使われる。
このニューラルネットワークが、猫の画像を見て、猫と認識できるかどうかは、学習に掛かっている。
最初は、まったく認識出来ないのであるが、猫の画像の場合は、出力層が猫と出力すれば正解と教え、猫でない画像の場合に猫と出力すれば誤りと教えてやる。
なお、猫であるかどうかだけを認識するシステムなら、出力は1つで猫らしさを示す値だけを出力すれば良い。手書きの郵便番号認識システムでは出力は10本あり、それぞれの出力は0~9の数字らしさを示す数値を出力する。