« 朝起きたら本棚から大量の本が床にダイブしていた件について | Main | ceteris paribus »

February 16, 2005

佐々木(2000)

佐々木 貴宏.”動的環境下でのニューラルネットワーク集団の学習と進化---ダーウィン進化とラマルク進化の比較---” in 遺伝的アルゴリズム(4) 北野 宏明(編),pp.141-168.産業図書,2000年.

Gilbert and Troitzsch(2003)経由で.
たいへんおいしゅうございました.

若干,というか大いに飛躍があることを承知でメモる.
ニューラルネットワークをある種の組織としてみることは,情報処理機械としての組織のメタファーがあることからも,不自然ではない.
とすると,この研究成果はある意味で組織の学習・適応問題についての知見としてとらえられるものを含んでいる可能性がある.
僕が,僕の研究モデルとこの研究モデルに対して,ある種の同型性を感じるのは気のせいではないはずだ.

組織内部のエージェントの学習の効果と,組織自体をエージェントとしてみるような学習の効果について,説明する必要があると思っていたのだけど,ここでいうラマルク型の学習(進化)とダーウィン型の学習(進化)という形で説明すると良いのかもしれない.


進化論の歴史において,遺伝現象と学習・進化に関連してラマルキズムとダーウィニズムの2つの大きな思想の流れがある.前者では進化の原動力を「獲得形質
の遺伝」に置き,学習などの環境に対する応答として生物個体の生涯内に生じた適応的な変化が遺伝的に何らかの形で組み込まれて子孫の変異に方向性を与える
ことで進化が推し進められるという考え方をする.一方,後者では「ランダムな変異に引き続く非ランダムな自然淘汰」を進化の原動力とし,変異自体には方向
性がなく,たまたま適応的な変異を持って生じた個体が自然淘汰の過程で生き延びて繁栄するという考え方をする.つまり,生物個体の生涯の間に生じる適応的
な変化の効果が遺伝子に組み込まれるという獲得形質の遺伝の考え方を否定し,進化とは自然淘汰の累積的効果として生じる現象であるとする.周知のとおり,
今日の生物学や進化論において主流を占めるのは後者のダーウィニズムであり,ラマルキズムを異端もしくは誤りとするのが大半の見方である.
佐々木(2000) pp.143

ここでも書かれているが,工学的視点というか,焦点を進化・学習に絞ったときには,ダーウィン型のモデルに固執する必要はないと思う.
むしろ,ダーウィン型をいうように,ある種のスキーマなり偏見を持って見られることが却って,研究モデルの評価においてバイアスがかかる原因にもなりうるような気がする.
僕は,少なくとも,そう思われていると感じるときはある.生物学的な進化のメタファーを経営学等の社会科学領域に適用するとき,過剰に適用するか,適用自体を否定するか,極端な態度になりがちなので.
そういうわけで,いわゆる単なる進化・学習の実現というところに焦点を持っていきたい所存.


このような生物学的な背景もあるため,生命現象の計算的側面からその原理を探ろうとする人工生命研究としての立場からは,ダーウィン型の進化モデルの下で
の議論が中心的に為されてきた.一方,工学的な視点からはダーウィン型のモデルに固執する必要はない.実際,獲得形質を遺伝させるというその遺伝機構には
大いに魅力があり,これまでもいくつかの工学的応用の試みがなされてはいる.ところが,いずれの立場からの研究も,そのほとんどが静的な実験環境上でのみ
の評価および考察に基づくものであり,動的環境の上での議論がなされたものは少ない.というのも,概して,遺伝的アルゴリズム等に関する研究は,何らかの
問題が与えられた際に如何にその最適解に近いものを発見するか,如何に高速に発見するかといった単一問題(環境)への最適化の観点から議論されることが多
かったからである.しかし,実世界での応用を考える際には,「如何に効率よく環境に適応できるか」といった最適性・高速性に加えて「如何に環境の変動に追
従できるか」といった柔軟性を考えることも重要になってくる.実際に,近年何人かの研究者によって動的な環境下での適応についての議論もなされつつある.
そこで本章における実験でも,とくに動的環境下でのダーウィン型とラマルク型の遺伝機構を持つ集団の振舞いについて注目する.
佐々木(2000) pp.143-144

このリザルトは興味深い.
「うまく学習する」能力と「うまく行動できる」能力というのは,explorationとexploitationの概念ともマッチする.
とすると,ますます,メタファーレベルでは僕の研究へ与えるインパクトは大きいと感じる.ただ,このモデルのままでは,まだまだマネジリアルな含意は絶望的に少ないことも,明らかではある.


図5.6に見られるように,進化の初期段階に(一時的とは言え)生得的出力誤差が増加するということは,その段階では生まれつきの行動能力という観点から
は不利な個体集団が形成されていることを意味する.一方で,図5.5に示した適応度の世代変化ではそのような非単調性は見られず,世代経過にしたがってた
だ単調に増加していく.つまり,生まれつきの行動という面では多少不利でも,うまく環境の規則を学習できれば生涯全体を通じての適応度を上げることになる
のである.したがって,進化の初期の段階では「うまく学習する」能力が進化するように淘汰が働いていると言える.ここで興味深いのは,この「うまく学習す
る」能力というのが,進化の場として与えられている特定の環境に依存したものではなく,ある程度一般的な能力である可能性があるという点である.このこと
は,与えられた環境(ここの実験での「静的環境」)とは別の異なる環境(ここの実験での「未知環境」)下での学習特性も同時に向上していることより言え
る.そしてひとたび集団が学習能力の高い個体で占められるようになると,次の段階として与えられている環境下で生まれつき少しでも「うまく行動する」個体
が選択されるようになる.つまり,ここでボールドウィン効果が生じるのである.その後さらに長期間進化させると,集団内は与えられている下の環境で「うま
く行動できる」能力を持つ個体で占められることになり,進化の初期の段階で獲得した「うまく学習する」能力は徐々に失われていく.したがって,別の環境に
対する適応性という面では劣化していく.
佐々木(2000) pp.162-163

Posted by ysk5 at February 16, 2005 04:17 PM