【数式編】(逆伝播)2つめの隠れ層の重みとバイアスを更新する 1-(1)
隠れ層の重みの更新式
今回から、隠れ層の重みとバイアスの更新式についてみていきます。
今回は、2層目の隠れ層の1つめのユニット ユニットh21 の重み についてみていきましょう。
隠れ層でも重みの更新式は以下のようにあらわすことができます。
連鎖率(チェインルール)
を求めるにあたっては注意が必要です。
損失関数の計算式を再掲してみましょう。
上のニューラルネットワークの図からもわかるように、 を求めるにあたっては、
それぞれで、 の値が計算に利用されています。
損失関数を で偏微分するには、それら が影響を及ぼした値も考慮する必要があります。
よって を求める式は、連鎖率によって次のようになります。
かなり複雑な式になりましたが、ひとつひとつみていけばそれほど難しくないことがわかります。
1つめのかたまり
まずは1つめのかたまりについて見ていきましょう。
の部分です。
左から第1項め、第2項め、第3項め、第4項めとします。
・第1項めと第2項めについて
第1項めと第2項めをまとめます。
実は、 は出力層の逆伝播で求めていて、
となっています。
・第3項めについて
第3項めは です。
は出力層の順伝播で求めているように以下の式になります。
よって
・第4項めについて
第4項めは ですが、 は次のように求めています。
の計算は で行われるので、次のように表されます。
は数学的には微分不可能ですが、微分については次のように定義されています。
のグラフを見るとわかりますが、負の値~0 までは傾き 0、それ以上で傾き 1 の直線となっているので、上記の定義となっていると思われます。
以上を念頭に
としておきます。
・まとめ1
ひととおり必要な部品が揃ったのでつなげてみましょう。
2つめのかたまり
今回はこの部分です。
1つめのかたまり同様に進めていきましょう。
・第1項めと第2項めについて
第1項めと第2項めをまとめます。
これもすでに出力層の逆伝播で求めています。
・第3項めについて
第3項めは です。
は出力層の順伝播で求めているように以下の式になります。
よって
・第4項めについて
第4項めはまったく同じです。
・まとめ2
ひととおり必要な部品が揃ったのでつなげてみましょう。
3つめのかたまり
最後のかたまりです。
・第1項めと第2項めについて
・第3項めについて
なので
・第4項めについて
第4項めはまったく同じです。
・まとめ3
ひととおり必要な部品が揃ったのでつなげてみましょう。
まとめると…
すべてのネタが揃ったのでまとめてみましょう。
残りの部分
あとは だけです。
これは簡単ですね。 は隠れ層2層めの順伝播で求めています。
よって
まとめ: の更新式
以上から、
と求めることができました。