平均場方程式の導出¶
ニューロン の初期値 とその更新のランダム性と初期値 に 関する平均を [1] と書き, ニューロン の(局所)活動率を
と定義する.
[1] | 初期値 に関する平均とは, 時刻 0 での集団活動率 が が 1 の確率で, それぞれの について が独立, という確率分布に関する平均である. |
課題
他の場所では, は使われていない. 使うべき? 例えば, 他の場所では だけど, ここでは である.
ニューロン への入力が閾値を超える確率 [2] は, 更新時間のランダム性に関する平均 で表すことが出来る. [3] さらに, 更新のタイミングはポアソン過程で表され, 入力が閾値を超えていた場合に状態 1 へ遷移する単位時間当たりの条件付き確率は, である. こられらを合わせると, 単位時間あたりにニューロン が状態を 1 に遷移する確率は で与えられていることが分かる. 期待値の時間発展 の関係式を用いれば,
と書くことができる.
[2] | 正確には, 系の状態 が与えられた時の条件付き確率, である. |
[3] | 確率変数 について事象 が起こる確率は指示関数 (indicator function) を用いて と書けることを思い出そう. |
この式の集団平均をとる (つまり両辺に を施す) と, 集団活動率 のダイナミクスを表す式
を得る. この節では, 右辺第二項
を計算する. 素朴に考えれば右辺は系の微視的な状態 に依存しているはずだが, 左辺は巨視的な状態, つまり集団活動率 のみに依存することを主張している. この微視的な状態への非依存性は の計算の過程で自動的に出てくる結果である.
確率 は以下の仮定 [4] のもとで計算することが出来る.
仮定
すべてのニューロンの活動が無相関である.
形式的に書けば, いかなるふたつのニューロン と (, , ) についても, それぞれの活動 , はすべての時間 について無相関, つまり,
が, 成り立つ.
[4] | 原著 [vanVreeswijk1998] での仮定は「すべてのニューロンについて, それに結合しているすべてのニューロンの活動が無相関である」であり, 本稿で使っている仮定より若干弱い. しかし, 無相関性の「証明」 より本稿で使っている仮定は [vanVreeswijk1998] の仮定と同じ条件 で成り立つことが分かる. さらに, すべてのニューロンが無相関でなければ, 無相関変数に対する大数の法則 が使えない (自己平均性 (self-averaging property) を参照). |
これは, が成り立てば成り立つ. 詳しい議論については, 無相関性の「証明」 を参照.
自己平均性 (self-averaging property) を の計算に適用すれば, と を交換することが出来て,
を計算すれば良いことが分かる.
ニューロン が 個の興奮性ニューロンと 個の抑制性ニューロンから入力を受けているとすれば, その全入力は
となる. 確率 はこの入力が正である確率であり,
となる. ただし, は集団 の活動率が の時にニューロン が集団 から 個の入力を受ける確率であり,
となる. ここで, (P1) は集団 のニューロン (どのニューロンでも成立する) が集団 の 個のニューロンからの結合を持つ確率であり, (P2) はその 個のニューロンのうち 個のニューロンが活動している ( である) 確率である. 最後の等式は, の定義に基づけば、以下の計算で確認できる.
この確率分布は平均と分散が の ポアソン分布 (Poisson distribution) なので, 極限 , つまりこの平均と分散が大きな極限では ガウス分布 (Gaussian distribution)
で近似できる. この極限 で,
と計算できる. ここで,
である. 上記の と はただ変数に名前をつけただけだが, これらの物理的意味については 入力のゆらぎ を参照せよ. は ガウス測度 (Gaussian measure) と呼ばれるただの省略記号である. 関数 は Q関数 と呼ばれる関数である. 上の計算では, (1) なる近似と ガウス確率変数の変数変換, (2) の定義, (3) ヘヴィサイド関数の多重ガウス積分とQ関数 の関係, (4) の定義をそれぞれ用いた.
無相関性の「証明」¶
以下の議論は [Derrida1987] に依る.
今, 初期状態から 回の更新が起こったとする. いかなるニューロンも, 回の更新の前まで遡れば最大でも 個 [5] のニューロンの初期状態に依存している. 2つのニューロンから伸びる「木」はそれぞれ平均で の「枝」をもつ. この中で最低でも1つの枝が同じニューロンに繋がっている確率は, (1) 2つの木からそれぞれの1つの枝を選ぶ方法の総数と, (2) 1つのニューロンの選び方の総数と, (3) ある1つのニューロンを2回選ぶ確率の積なので,
となる. これが 0 に漸近する, つまり (as ) という条件から, が導かれる. いかなる自然数 でもこれが成り立つには であれば十分である.
[5] | ただし, 各ニューロンの結合の数が平均 個のまわりでゆらいでいる効果は無視している. |