\(\newcommand{\D}{\text{d}} \newcommand{\I}{\text{i}} \newcommand{\E}{\text{e}} \newcommand{\Prob}{\mathbb{P}} \newcommand{\Expect}{\mathbb{E}} \newcommand{\Var}{\text{Var}} \newcommand{\PAvg}[1]{\left[#1\right]} \newcommand{\Avg}[1]{\left\langle#1\right\rangle} \newcommand{\AvgJ}[1]{\Avg{#1}_{\bm J}} \newcommand{\AvgDyn}[1]{\Avg{#1}_{\text{dyn.}}} \newcommand{\CAvg}[2]{\Avg{#1}_{\left|#2\right.}} \newcommand{\Devi}{\mathfrak{d}}\)

強フィードバック系

次の \(p\) 次元力学系を考えよう.

(1)\[\bm \tau \frac{\D \bm x(t)}{\D t} = - \bm x(t) + \bm f(C \, \{\bm J \bm x(t) + \bm h\}; \bm x(t))\]

ここで, \(\bm \tau = \diag(\tau_1, \ldots, \tau_p) \in \mathbb R^{p \times p}\) は時定数を決める行列, \(\bm J \in \mathbb R^{p \times p}\) は系の状態 \(\bm x(t) \in \mathbb R^p\) の各成分の相互作用を表す行列, ベクトル \(\bm h \in \mathbb R^p\) はこの系への外部入力を表す. 正数 \(C\) はこの系のフィードバックの強さを決めるパラメタである. 関数 \(\bm f\) の第一引数 \(\bm z = C \, \{\bm J \bm x(t) + \bm h\}\) を系への「全入力」と呼ぶことにする. 上述の記号, 特にパラメタ \(\bm \tau, \bm J, \bm h\)\(C\) に依存しない. フィードバック強度 \(C\) への依存性は全入力 \(\bm z\) を経由する影響のみである. 本稿では, 極限 \(C \to \infty\) におけるこの系の振る舞いについて興味がある場合に, 式 (1) のような系を 強フィードバック系 (strong feedback system) と呼ぶ.

この節では, 強フィードバック系が均衡固定点と呼ばれる特別な固定点を持ち, さらにその性質が系の詳細 (\(\bm f\) の定義) に依存しないことを示す. 均衡固定点のアイディア自体は簡単である (しかし, 今ここでアイディアにピンと来なくても以降の議論は読めるはずである). ここでの「均衡」とは, 固定点 \(\bm x^0\) において, フィードバック入力 \(\bm J \bm x^0\) と 外部入力 \(\bm h\) が打ち消し合って (= 均衡して), 「ほぼゼロ」になる, という意味である. 正しくは, これらが \(O(1/C)\) のオーダーで打ち消しあう, つまり \(\bm J \bm x^0 + \bm h = O(1/C)\) となることを言う. これより \(\bm x^0 = - \bm J^{-1} \bm h + O(1/C)\) となるので, まず固定点 \(\bm x^0\) が外部入力について \(\bm h\) 線型であるという性質が導かれる. さらに, 固定点 \(\bm x^0\) からの小さい摂動 \(\bm x - \bm x^0 = O(1/C)\) が, 大きな全入力の変化 \(\bm z - \bm z^0 = C \bm J (\bm x - \bm x^0) = O(1)\) を生むので, 摂動への応答速度が速いだろうということも予想できる. 今, 均衡固定点が 存在すれば どのような性質を持つかを簡単に議論したが, この均衡固定点はいつも存在するのだろうか? もちろん力学系に何らかの条件が必要だろうが, それは何だろうか? また, 均衡固定点は他の種類の固定点に比べてどう特別なのだろうか?

表記を簡潔にするために, 状態 \(\bm x^0\) からの 「摂動」 \(\bm y = C \, (\bm x - \bm x^0)\) に対して \(\bm f\) がどう変化するかを,

(2)\[\bm F(\bm y) = \bm F(\bm y; \bm x^0) := \bm f(\bm J \bm y + \bm z^0; \bm y / C + \bm x^0) - \bm f(\bm z^0; \bm x^0)\]

で定義する. 文脈から明らかな場合は, 第二引数は省略する.

正しく \(C \to \infty\) における系の振る舞いを表記するために, \(\sim\), \(O\), \(\Theta\), \(\Omega\) などの漸近関係記号を用いる (漸近解析 (Asymptotic analysis) を参照). この節では, これらの記号はすべて \(C \to \infty\) についての漸近関係を表すとする (末尾の “as \(C \to \infty\)” を省略する).

関数 \(\bm f\) が満たすべき条件

\(\bm x^0\) を力学系 (1) の任意の状態とし, \(\bm z^0 = C \, \{\bm J \bm x^0 + \bm h\}\) と定義する. (この節では \(\bm x^0\) が固定点の場合しか考えないが, ここでの定義においては固定点でなくても良い.)

伝達性

\(\bm z^0 = O(1)\) ならば \(\bm F(\Omega(1); \bm x^0) = \Omega(1)\).

省略せずに書けば, すべての \(\bm z^0 = O(1)\)\(\bm y = \Omega(1)\) について,

(3)\[\bm f(\bm J \bm y + \bm z^0; \bm y / C + \bm x^0) - \bm f(\bm z^0; \bm x^0) = \Omega(1).\]
飽和性

\(\bm z^0 = \omega(1)\) ならば \(\bm F(O(1); \bm x^0) = o(1)\).

省略せずに書けば, すべての \(\bm z^0 = \omega(1)\)\(\bm y = O(1)\) について,

(4)\[\bm f(\bm J \bm y + \bm z^0; \bm y / C + \bm x^0) - \bm f(\bm z^0; \bm x^0) = o(1).\]

関数 \(\bm F\) は陰に \(C\) への依存性をもち, 状態 \(\bm x^0\)\(C\) に依存しても良いことに注意.

この関数 \(\bm f\) への条件は, 後述する均衡固定点の性質を導くための必要条件ではなく, さらに広いクラスでこれらの性質は成り立つ. しかし, この条件が応用上必要な力学系では成り立たないことは稀だろう. [1] 簡単のために 飽和性条件 の成り立たない力学系を扱うことも多いが, この場合, 非均衡固定点は発散してしまい極限 \(C \to \infty\) で存在しないのでその点まわりの振る舞いなどは議論する必要も無い. 非均衡固定点まわりでの振る舞い以外で 飽和性条件 は使わないので, この条件は本質的な条件ではない. 結局, 伝達率条件 さえ成り立てば, 強フィードバック系の重要な性質はすべて保証される.

[1]これが成り立たない場合の取り扱いについては, 発火率モデル (rate model) の区分的線型関数についてのコメント参照.

支配項均衡の方法による解析

力学系 (1) の固定点は

(5)\[\bm x^0 = \bm f(C \, \{\bm J \bm x^0 + \bm h\}; \bm x^0)\]

は満たす系の状態であり, それに対応する全入力を \(\bm z^0 = C \, \{\bm J \bm x^0 + \bm h\}\) と置く. 全入力の各項がキャンセルしあって \(C \to \infty\) で発散しない場合, つまり \(\bm z^0 = O(1)\), あるいは同値の条件

(6)\[\bm J \bm x^0 + \bm h = O(1/C)\]

を満たす固定点を 均衡固定点 (balanced fixed point) と呼ぶ. これが成り立たない場合, つまり固定点での全入力が発散して \(\bm z^0 = \Omega(C)\) となる, あるいは同値の条件

(7)\[\bm J \bm x^0 + \bm h = \Omega(1)\]

を満たす固定点を 非均衡固定点 (unbalanced fixed point) と呼ぶ. [2]

[2]ここでの均衡固定点や非均衡固定点に属さないクラスの固定点, つまり \(1 \ll \bm z^0 \lesssim C\) (同値だが別の表記では, \(\bm z^0 = \omega(1)\) かつ \(\bm z^0 = o(C)\)) となる場合も考えられる. 例えば, \(\bm z^0 = \Theta(C^{1/2})\)\(\bm z^0 = \Theta(\log C)\) など. この場合, \(\bm J \bm x^0 + \bm h = o(1)\) なので, 「広義の均衡固定点」と呼んでも良いかもしれない. しかし, 以下で導く小さい摂動に対する応答速度のオーダーに関する性質は, (狭義の) 均衡固定点のみに成り立つ.

固定点まわりの座標系 \(\bm y = C \, (\bm x - \bm x^0)\) で微分方程式 (1) を書き直す. 座標変換 \(\bm x = \bm y / C + \bm x^0\) を施すと,

\[\begin{split}C^{-1} \bm \tau \frac{\D \bm y(t)}{\D t} & = - (\bm y(t) / C + \bm x^0) + \bm f(C \, \{\bm J (\bm y(t) / C + \bm x^0) + \bm h\}; \bm x) \\ & = - \bm y(t) / C + \underbrace{ \bm f(\bm J \bm y(t) + \bm z^0; \bm x) - \bm f(\bm z^0; \bm x^0) }_{= \bm F(\bm y)}\end{split}\]

なので, これの両辺に \(C\) をかけて

(8)\[\begin{split}\bm \tau \frac{\D \bm y(t)}{\D t} & = - \bm y(t) + C \bm F(\bm y)\end{split}\]

を得る (関数 \(\bm F\) の定義については式 (2) を参照).

支配項均衡の方法 を使ってこの系の小さな摂動 \(\bm y = \Theta(1)\) (元の座標系では \(\bm x - \bm x^0 = \Theta(1/C)\)) への応答を調べよう. もし, \(C \bm F(\bm y)\) のオーダーが \(O(1)\) より大きい (つまり \(C \bm F(\bm y) = \omega(1)\)) ならば, \(C \bm F(\bm y)\)\(\D \bm y/\D t\) のオーダーが等しい (つまり, \(\D \bm y/\D t \asymp C \bm F(\bm y)\) となる) ことが, 式 (8) の成り立つ必要条件である. これは, 元の座標系では \(\D \bm x/\D t \asymp \bm F(\bm y)\) を意味する.

仮定 \(\bm y = O(1)\) から, \(\bm F(\bm y)\) のオーダーは

\[\begin{split}\bm F(\bm y) & = \left\{ \begin{array}{lll} \Omega(1) & (\text{if } \bm z^0 = O(1)) \\ o(1) & (\text{if } \bm z^0 = \omega(1)) \end{array} \right.\end{split}\]

と見積もることが出来る. ここで, \(\bm z^0 = O(1)\) の場合は 伝達率条件 を, \(\bm z^0 = \omega(C)\) の場合は 飽和性条件 を用いた. \(\bm z^0\) が素性の良い振る舞いをするなら (正確には \(\lim_{C \to \infty} \bm z^0\) が有限値または無限大に収束すれば), \(\bm z^0 \neq O(1)\)\(\bm z^0 = \omega(1)\) は同値なので, \(\bm F(\bm y)\) のオーダーはこのふたつしかありえない.

ゆえに, 小さな摂動 \(\bm y = C \, (\bm x - \bm x^0) = \Theta(1)\) に関して, 均衡固定点 (\(\bm z^0 = O(1)\)) 周辺での応答速度のオーダーは \(\D \bm y/\D t = \Omega(C)\) (\(\D \bm x/\D t = \Omega(1)\)) となり, 非均衡固定点など, それを満たさない固定点 (\(\bm z^0 = \omega(1)\)) 周辺での応答速度のオーダーは \(\D \bm y/\D t = o(C)\) (\(\D \bm x/\D t = o(1)\)) となる. もし固定点 \(\bm x^0\) が安定ならば, 均衡固定点 (\(\bm z^0 = O(1)\)) への収束は速く (\(\D \bm x / \D t = \Omega(1)\) なので, \(C \to \infty\) の極限で消えない), 非均衡固定点 (\(\bm z^0 = \Omega(C)\)) への収束は遅い (\(\D \bm x / \D t = o(1)\) なので, \(C \to \infty\) の極限で限りなく小さくなる) ことが読み取れる. 以上の議論は抽象的な定義にのみ基づいているから, これは幅広いクラスの力学系の均衡固定点について成り立つ非常に強力な性質であるといえよう.

以上の議論では, 伝達率条件飽和性条件 のみを仮定し, 固定点における \(\bm z^0\) のオーダーについて (ほとんど相互排他的な) ふたつの場合にわけ, それぞれが固定点まわりの応答速度のオーダーが強フィードバック極限 \(C \to \infty\) で消えない場合と限りなく小さくなる場合に対応することを示した. さらに, 応答速度が速い (\(\D \bm x / \D t = \Omega(1)\)) 場合が実は均衡固定点 (\(\bm z^0 = O(1)\)) に対応することを示した. つまり, 固定点まわりのダイナミクスについて漸近解析をすれば, 固定点は均衡固定点と均衡固定点でないものに自然と場合分けされるのである.

均衡固定点の線型性

均衡固定点 \(\bm x^0\) は, 式 (6) より,

\[\bm x^0 = - \bm J^{-1} \bm h + O(1/C)\]

と書ける (ただし, \(\bm J\) が可逆だと仮定した). つまり, この固定点 \(\bm x^0\) は外部入力 \(\bm h\) に対し, \(O(1/C)\) の誤差を除けば線型の関係を持つ. もしこの固定点が安定ならば, この系は外部入力に対し, 「線型な応答」をしていることになり, しかもそれが系の詳細を決める関数 \(\bm f\) に依らないという著しい性質を持つ. 線型性から自明だが, 均衡固定点は存在すれば (極限 \(C \to \infty\) で) 一意である.

これが良く引用される「均衡固定点は線型性をもつ」という性質であるが, この「線型性」は 厳密な意味での線型性 ではない. 固定点の満たすべき式 (5) を思い出せば, \(- \bm J^{-1} \bm h\)\(\bm f\)内部 にあるという条件が必要である. 神経科学での応用上 \(x_i\) は常に発火率であるとみなされるから, \(f_i(\bm z) \ge 0\) なので, \(- \bm J^{-1} \bm h\) の成分に負の成分があってはならない. また, \(f_i(\bm z)\) には上限がある (大きい入力については飽和する) ことが応用上自然だから, 結局, 均衡固定点の存在する \(\bm h\) の領域は有界である. つまり, 「均衡固定点は線型性をもつ」は間違いで, 「均衡固定点は閾値を超えてから飽和するまでは線型」が正しい.

均衡固定点の安定性

支配項均衡の方法による解析 から, 均衡固定点まわりのダイナミクスは,

\[\begin{split}\bm \tau \frac{\D \bm y(t)}{\D t} & = - \bm y(t) + C \bm F(\bm y) \sim C \bm F(\bm y)\end{split}\]

つまり,

\[\frac{\D \bm y(t)}{\D t} \sim C \bm \tau^{-1} \bm F(\bm y)\]

で記述されると分かる. よって, この系の安定性の解析は, 行列

\[\bm \tau^{-1} \frac{\partial \bm F(\bm y)}{\partial \bm y} = \bm \tau^{-1} \frac{\partial}{\partial \bm y} \bm f(\bm J \bm y + \bm z^0; \bm y / C + \bm x^0) = \bm \tau^{-1} ((D_1 \bm f) \bm J + (D_2 \bm f) C^{-1})\]

の固有値で決まる (\(- \bm y(t)\) の寄与が消えていることに注意). ただし,

\[D_1 \bm f = \left. \frac{\partial \bm f(\bm z; \bm x^0)}{\partial \bm z} \right|_{\bm z = \bm z^0}, \qquad D_2 \bm f = \left. \frac{\partial \bm f(\bm z^0; \bm x)}{\partial \bm x} \right|_{\bm x = \bm x^0}\]

である. もし \(D_2 \bm f = O(1)\) なら第二引数からの寄与が消え, \({\partial \bm F(\bm y)}/{\partial \bm y} \sim (D_1 \bm f) \bm J\) となる. これは, この方向への摂動が \(\bm y / C = O(1/C)\) と小さいためである.

強フィードバック系の例

発火率モデル (rate model)

\(p\) 個の集団からなる発火率モデルのネットワークで, すべての集団の入出力関係 (input-output relationship あるいは transfer function) がシグモイド関数 \(g\) (例えば, ロジスティック関数 \(g(t) = 1/(1+\exp(-t))\)) [3] で与えられているとすれば, 関数 \(\bm f\)\(i\) 番目 (\(i = 1, \ldots, p\)) の成分は

\[f_i(\bm z; \bm x) = g(z_i)\]

と書ける.

[3]\(\arctan\), \(\tanh\), Q関数 (の \(x\) 軸を反転したもの) などでも構わない.

シグモイド関数 \(g\)\(z^0 = O(1)\) からの非ゼロの変化に対して, 必ず非ゼロの変化をうむ, つまり

\[g(\Theta(1) + z^0) - g(z^0) = \Theta(1)\]

が成り立つ. これは 伝達率条件 の十分条件である. また, ロジスティック関数の場合は極限 \(z \to \infty\)\(g(z) \to 1\), 極限 \(z \to -\infty\)\(g(z) \to 0\) だから, 飽和性条件 も成り立つ. 一般に, シグモイド関数のように入出力関係が極限 \(z \to \pm \infty\) で有限の値に収束すれば 飽和性条件 は成り立つ. 有限の値に収束しなくても 飽和性条件 が成り立つ (かなり人工的な) 例として, \(g = \log\) がある.

もし, 関数 \(g\)

\[\begin{split}g(z) = \begin{cases} 1 & (1 < z) \\ z & (0 < z \le 1) \\ 0 & (z \le 0) \end{cases}\end{split}\]

のような区分的線型関数の場合は, 伝達率条件 が成り立たない. 例えば, \(\Delta z := 1\), \(z^0 := 3\) とおくと \(\Delta z = O(1)\), \(z^0 = O(1)\) だが,

\[g(\Delta z + z^0) - g(z^0) = 0 \neq \Omega(1)\]

である. この場合, \(\bm x^0\) が均衡固定点であるためには, 各 \(z^0_i\) について, \(0 < z^0_i < 1\) なる条件が必要である.

二状態ニューロンから成るネットワーク

二状態ニューロンから成るネットワーク の平均場方程式も強フィードバック系である (平均場方程式の導出 を参照). この場合は, \(p = 2\) 個の集団からなる力学系で, 状態は集団平均発火率 \(\bm x = (m_1, m_2)^\intercal\) で, 外部入力は \(\bm h = (J_{10} m_0, J_{20} m_0)^\intercal\) である. 関数 \(\bm f\) は,

\[f_k(\bm z; \bm x) = H(-(z_k - \theta_k) / \sqrt{\alpha_k(\bm x)})\]\[\alpha_k(\bm x) = (J_{k1})^2 x_1 + (J_{k2})^2 x_2\]

で定義される. また, フィードバックの強さは \(C = \sqrt K\) で決まる. 上記のシグモイド関数の場合と同様に, 伝達率条件飽和性条件 が成り立つ.