\(\newcommand{\D}{\text{d}} \newcommand{\I}{\text{i}} \newcommand{\E}{\text{e}} \newcommand{\Prob}{\mathbb{P}} \newcommand{\Expect}{\mathbb{E}} \newcommand{\Var}{\text{Var}} \newcommand{\PAvg}[1]{\left[#1\right]} \newcommand{\Avg}[1]{\left\langle#1\right\rangle} \newcommand{\AvgJ}[1]{\Avg{#1}_{\bm J}} \newcommand{\AvgDyn}[1]{\Avg{#1}_{\text{dyn.}}} \newcommand{\CAvg}[2]{\Avg{#1}_{\left|#2\right.}} \newcommand{\Devi}{\mathfrak{d}}\)

入力のゆらぎ

ここでは, 入力のゆらぎ \([(\Devi u_k^i (t))^2]_i\) と集団平均活動率 \(m_l(t)\) を結ぶ式

(1)\[[(\Devi u_k^i (t))^2]_i \xrightarrow{N \to \infty} \sum_{l = E, I} ( J_{kl} )^2 \, m_l(t) =: \alpha_k(t)\]

を導出する. ここで \([ \bullet ]_i\) は集団 \(k \in \{ E, I \}\) 内のニューロンに関する 集団平均 (population average; 添字 \(i\) に沿った平均) を表し,

\[[ \bullet ]_i = \frac{1}{N_k} \sum_{i=1}^{N_k} \bullet\]

で定義される. 文脈からどの添字に関する平均かが明らかであれば, 添字 \(i\) は省略する. また, \(\Devi\) は集団平均からの偏差 \(\Devi X_i := X_i - [X_i]_i\) である.

入力の集団平均

\[\begin{split}u_k(t) & = [u_k^i (t)]_i \\ & = \left[ \sum_{l = E, I} \sum_{j=1}^{N_l} J_{kl}^{ij} \sigma_l^j(t) + u_k^0 - \theta_k \right]_i \\ & = \sum_{l = E, I} \underbrace{ \left[ \sum_{j=1}^{N_l} J_{kl}^{ij} \sigma_l^j(t) \right]_i }_{(*)} + u_k^0 - \theta_k\end{split}\]

この (*) は以下のように近似的できる.

\[\begin{split}(*) & \overset{(1)} \approx \sum_{j=1}^{N_l} \left[ J_{kl}^{ij} \right]_i \sigma_l^j(t) \\ & \overset{(2)} \approx \sum_{j=1}^{N_l} J_{kl} \frac{\sqrt K}{N_l} \sigma_l^j(t) \\ & \overset{(3)} = J_{kl} \frac{\sqrt K}{N_l} \sum_{j=1}^{N_l} \sigma_l^j(t) \\ & \overset{(4)} = J_{kl} \sqrt K \left[ \sigma_l^j(t) \right]_j \\ & \overset{(5)} = J_{kl} \sqrt K m_l(t)\end{split}\]

ここで, (1) は, \([ \bullet ]_i\) の線型性 (よって和 \(\sum_{j=1}^{N_l}\) と集団平均 \([ \bullet ]_i\) は演算順序を入れ替えて良い) と \(\sigma_l^j(t)\)\(i\) に依らないこと (これの正しい解説は ニューロンの状態と結合係数の相関 を参照), (2) 大数の法則 (law of large numbers) より算術平均は期待値に収束する, つまり \(N \to \infty\) の極限で \(\left[ J_{kl}^{ij} \right]_i \to \AvgJ{J_{kl}^{ij}}\) が成り立つことと, \(\Prob \{ J_{kl}^{ij} = {J_{kl}}/{\sqrt K}\} = {K}/{N_l}\)\(\Prob \{ J_{kl}^{ij} = 0\} = 1 - {K}/{N_l}\) から期待値は \(\AvgJ{J_{kl}^{ij}} = ({J_{kl}}/{\sqrt K}) ({K}/{N_l}) = J_{kl} {\sqrt K}/{N_l}\) となること, (3) \(J_{kl} \sqrt K / N_l\)\(j\) に依らない定数であること, (4) 集団平均の定義, (5) \(m_l(t)\) の定義を用いた.

これらの計算を合わせ, \(u_k^0 = \sqrt K E_k m_0\) を思い出せば, 入力の集団平均 \(u_k(t)\)

\[\begin{split}u_k(t) & = ... \\ & \approx \sum_{l = E, I} J_{kl} \sqrt K m_l(t) + u_k^0 - \theta_k \\ & = \sqrt K \left( \sum_{l = E, I} J_{kl} m_l(t) + E_k m_0 \right) - \theta_k\end{split}\]

となる.

ニューロンの状態と結合係数の相関

上記の式変換(1)で「\(\sigma_l^j(t)\)\(i\) に依らない」ことを用いたが, これは正しくは, \(J_{kl}^{ij}\)\(\sigma_l^j(t)\) の相関が無い [1] と仮定することで, \(\sigma_l^j(t)\)\(i\), つまり \(J_{kl}^{ij}\) に依らずに決まるから集団平均 \([ \bullet ]_i\) の演算にとっては定数として扱えることから言える. この \(J_{kl}^{ij}\)\(\sigma_l^j(t)\) が無相関であるという仮定は,

  1. 事象 \(J_{kl}^{ij} \neq 0\)\(J_{lk}^{ji} \neq 0\) が独立 (\(J_{kl}^{ij}\) の定義より)
  2. \(\sigma_l^j(t)\)\(\sigma_l^{j'}(t)\) (\(j' \neq j\)) が無相関という仮定

から正当化される. この無相関の仮定は有限の \(N, K\) では正しくないので, この式変形は完全な等号では結ばれず, \(\approx\) と書いている.

[1]

原著 [vanVreeswijk1998] では,

Note that on the right-hand side (r.h.s.) of equation 3.11 we have neglected the correlations between the random fluctuations in the activity of a cell and the particular realization of its output connectivity. This is justified since such correlations are weak in the large \(N\) limit.

—p.1329 (p.9), van Vreeswijk, Sompolinsky (1998)

と説明されている. この “equation 3.11” はここで扱っている入力の集団平均 \(u_k(t)\) のことである.

課題

式変形 \([J_{kl}^{ij} \, \sigma_l^j(t)]_i = [J_{kl}^{ij}]_i \, \sigma_l^j(t)\) を正当化する議論をもっと形式化する. 説明に自然言語つかいすぎ!

先に確率平均に行く方法もあるかも?: \(J_{kl}^{ij}\)\(\sigma_l^j(t)\) が独立だという近似のもと, \([J_{kl}^{ij} \sigma_l^j(t)]_i \approx \AvgJ{J_{kl}^{ij} \sigma_l^j(t)} = \AvgJ{J_{kl}^{ij}} \AvgJ{\sigma_l^j(t)}\) であることを用いる. この \(\AvgJ{\sigma_l^j(t)}\) は式変形 (4) にあるように, さらに集団平均 \([\bullet]_j\) がかかるから, \(\left[ \AvgJ{\sigma_l^j(t)} \right]_j = \AvgJ{[\sigma_l^j(t)]_j} = \AvgJ{m_l(t)}\) となる. この系は self-averaging なので (とどこかで説明する必要があるけど,) \(\AvgJ{m_l(t)} = m_l(t)\) となる.

入力のゆらぎ

\[\begin{split}& [(\Devi u_k^i (t))^2] \\ & \overset{(1)} = \left[ \left( \Devi \left\{ \sum_{l = E, I} \sum_{j=1}^{N_l} J_{kl}^{ij} \sigma_l^j(t)) \right\} \right)^2 \right]_i \\ & \overset{(2)} = \left[ \left( \sum_{l = E, I} \sum_{j=1}^{N_l} J_{kl}^{ij} \sigma_l^j(t)) \right)^2 \right]_i - \left[ \sum_{l = E, I} \sum_{j=1}^{N_l} J_{kl}^{ij} \sigma_l^j(t)) \right]_i^2 \\ & \overset{(3)} = \left[ \left( \sum_{l = E, I} \sum_{j=1}^{N_l} J_{kl}^{ij} \sigma_l^j(t)) \right)^2 \right]_i - K \left(\sum_{l = E, I} J_{kl} m_l(t) \right)^2\end{split}\]

ここで, (1) \(\Devi(x + \text{const.}) = \Devi x\), (2) \([(\Devi x)^2] = [x^2] - [x]^2\), (3) 上記の \(u_k(t)\) の計算 (特に (*) の部分) を用いた.

\[\begin{split}& \left[ \left( \sum_{l = E, I} \sum_{j=1}^{N_l} J_{kl}^{ij} \sigma_l^j(t)) \right)^2 \right]_i \\ & = \left[ \sum_{l, l' = E, I} \sum_{j=1}^{N_l} \sum_{j'=1}^{N_{l'}} J_{kl}^{ij} J_{kl'}^{ij'} \sigma_l^j(t)) \sigma_{l'}^{j'}(t)) \right]_i \\ & = \sum_{l, l' = E, I} \sum_{j=1}^{N_l} \sum_{j'=1}^{N_{l'}} \underbrace{ \left[ J_{kl}^{ij} J_{kl'}^{ij'} \right]_i \sigma_l^j(t) \sigma_{l'}^{j'}(t) }_{(*)}\end{split}\]

上式の (*) の和は, 恒等式 \(1 = \delta_{ll'} (\delta_{jj'} + (1 - \delta_{jj'})) + (1 - \delta_{ll'})\) を用いて [2]

\[\begin{split}\sum_{l, l' = E, I} \sum_{j=1}^{N_l} \sum_{j'=1}^{N_{l'}} \bullet_{l,l',j,j'} = \sum_{l = E, I} \sum_{j=1}^{N_l} \bullet_{l,l,j,j} + \sum_{l = E, I} \sum_{\substack{j,j'=1 \\ j \neq j'}}^{N_l} \bullet_{l,l,j,j} + \sum_{\substack{l, l' = E, I \\ l \neq l'}} \sum_{j=1}^{N_l} \sum_{j'=1}^{N_{l'}} \bullet_{l,l',j,j'}\end{split}\]

のように分解できる.

[2]\(\sum_{j,j'=1} (1 - \delta_{j,j'}) \bullet = \sum_{\substack{j,j'=1 \\ j \neq j'}} \bullet\)

第一項の計算 (\(l = l'\), \(j = j'\))

\[\begin{split}& \sum_{l = E, I} \sum_{j=1}^{N_l} \left[ (J_{kl}^{ij})^2 \right]_i (\sigma_l^j(t))^2 \\ & \overset{(1)} \approx \sum_{l = E, I} \sum_{j=1}^{N_l} \AvgJ{(J_{kl}^{ij})^2} \, \sigma_l^j(t) \\ & \overset{(2)} = \sum_{l = E, I} \sum_{j=1}^{N_l} \left( \frac{J_{kl}}{\sqrt K} \right)^2 \frac{K}{N_l} \, \sigma_l^j(t) \\ & = \sum_{l = E, I} ( J_{kl} )^2 \frac{1}{N_l} \sum_{j=1}^{N_l} \sigma_l^j(t) \\ & \overset{(3)} = \sum_{l = E, I} ( J_{kl} )^2 \, m_l(t)\end{split}\]

ここで, (1) 大数の法則 (law of large numbers)\(\sigma_l^j(t)\) の取りうる値は 0 か 1 なので \(\left( \sigma_l^j(t) \right)^2 = \sigma_l^j(t)\) [3], (2) \(\Prob \{ J_{kl}^{ij} = J_{kl}/\sqrt K \} = 1 - \Prob \{ J_{kl}^{ij} = 0 \} = K/N_l\) (結合確率の定義 を参照), (3) \(m_l(t) = [\sigma_l^j(t)]_j = \sum_{j=1}^{N_l} \sigma_l^j(t) / N_l\), を用いた.

[3]二値変数のからむ計算ではよく使われるテクニック.

第二項の計算 (\(l = l'\), \(j \neq j'\))

\[\begin{split}& \sum_{l = E, I} \sum_{\substack{j,j'=1 \\ j \neq j'}}^{N_l} \left[ J_{kl}^{ij} J_{kl}^{ij'} \right]_i \, \sigma_l^j(t) \, \sigma_{l}^{j'}(t) \\ & \overset{(1)} \approx \sum_{l = E, I} \sum_{\substack{j,j'=1 \\ j \neq j'}}^{N_l} \AvgJ{J_{kl}^{ij} J_{kl}^{ij'}} \, \sigma_l^j(t) \, \sigma_{l}^{j'}(t) \\ & \overset{(2)} = \sum_{l = E, I} \sum_{\substack{j,j'=1 \\ j \neq j'}}^{N_l} \left( \frac{J_{kl}}{\sqrt K} \right)^2 \frac{K}{N_l} \frac{K}{N_l} \, \sigma_l^j(t) \, \sigma_{l}^{j'}(t) \\ & = K \sum_{l = E, I} (J_{kl})^2 \frac{1}{N_l} \sum_{j=1}^{N_l} \sigma_l^j(t) \left( \sum_{j'=1}^{N_l} \frac{1}{N_l} \sigma_{l}^{j'}(t) - \frac{1}{N_l} \sigma_{l}^{j}(t) \right) \\ & = K \sum_{l = E, I} (J_{kl})^2 \left( \left\{ \frac{1}{N_l} \sum_{j=1}^{N_l} \sigma_l^j(t) \right\}^2 - \frac{1}{{N_l}^2} \sum_{j=1}^{N_l} (\sigma_{l}^{j}(t))^2 \right) \\ & = K \sum_{l = E, I} (J_{kl})^2 \left( (m_l(t))^2 - \frac{1}{N_l} m_l(t) \right)\end{split}\]

ここで, (1) 大数の法則 (law of large numbers), (2) \(j \neq j'\) なので \(J_{kl}^{ij}\)\(J_{kl}^{ij'}\) が独立であることと, \(J_{kl}^{ij}\) の確率分布 \(\Prob \{ J_{kl}^{ij} = J_{kl}/\sqrt K \} = 1 - \Prob \{ J_{kl}^{ij} = 0 \} = K/N_l\) (結合確率の定義 を参照), を用いた. 残りは単純な式変形である.

第三項の計算 (\(l \neq l'\))

\[\begin{split}& \sum_{\substack{l, l' = E, I \\ l \neq l'}} \sum_{j=1}^{N_l} \sum_{j'=1}^{N_{l'}} \left[ J_{kl}^{ij} J_{kl'}^{ij'} \right]_i \, \sigma_l^j(t) \, \sigma_{l'}^{j'}(t) \\ & \overset{(1)} \approx \sum_{\substack{l, l' = E, I \\ l \neq l'}} \sum_{j=1}^{N_l} \sum_{j'=1}^{N_{l'}} \AvgJ{J_{kl}^{ij} J_{kl'}^{ij'}} \, \sigma_l^j(t) \, \sigma_{l'}^{j'}(t) \\ & \overset{(2)} = \sum_{\substack{l, l' = E, I \\ l \neq l'}} \sum_{j=1}^{N_l} \sum_{j'=1}^{N_{l'}} \frac{J_{kl}}{\sqrt K} \frac{J_{kl'}}{\sqrt K} \frac{K}{N_l} \frac{K}{N_{l'}} \, \sigma_l^j(t) \, \sigma_{l'}^{j'}(t) \\ & = K \sum_{\substack{l, l' = E, I \\ l \neq l'}} J_{kl} J_{kl'} \frac{1}{N_l} \sum_{j=1}^{N_l} \sigma_l^j(t) \frac{1}{N_{l'}} \sum_{j'=1}^{N_{l'}} \sigma_{l'}^{j'}(t) \\ & = K \sum_{\substack{l, l' = E, I \\ l \neq l'}} J_{kl} J_{kl'} \, m_l(t) \, m_{l'}(t)\end{split}\]

ここで, (1) 大数の法則 (law of large numbers), (2) \(l \neq l'\) なので \(J_{kl}^{ij}\)\(J_{kl'}^{ij'}\) が独立であることと, \(J_{kl}^{ij}\) の確率分布 \(\Prob \{ J_{kl}^{ij} = J_{kl}/\sqrt K \} = 1 - \Prob \{ J_{kl}^{ij} = 0 \} = K/N_l\) (結合確率の定義 を参照), を用いた. 残りは単純な式変形である.

合計

\[\begin{split}[(\Devi u_k^i (t))^2]_i & = \sum_{l = E, I} ( J_{kl} )^2 \, m_l(t) \\ & \qquad + K \sum_{l = E, I} (J_{kl})^2 \left( (m_l(t))^2 - \frac{1}{N_l} m_l(t) \right) \\ & \qquad + K \sum_{\substack{l, l' = E, I \\ l \neq l'}} J_{kl} J_{kl'} \, m_l(t) \, m_{l'}(t) \\ & \qquad - K \left(\sum_{l = E, I} J_{kl} m_l(t) \right)^2 \\ & = \sum_{l = E, I} ( J_{kl} )^2 \, m_l(t) + \frac{K}{N_l} \sum_{l = E, I} (J_{kl})^2 m_l(t) \\ & \qquad + K \underbrace{ \left( \sum_{l, l' = E, I} J_{kl} J_{kl'} \, m_l(t) \, m_{l'}(t) - \left(\sum_{l = E, I} J_{kl} m_l(t) \right)^2 \right) }_{= 0} \\ & = \sum_{l = E, I} ( J_{kl} )^2 \, m_l(t) + O(1/N) \\ & \xrightarrow{N \to \infty} \alpha_k(t)\end{split}\]

これで, 入力のゆらぎと集団平均活動率を結ぶ式 (1) が示された.