2016年6月29日水曜日

報酬の坂道 ⑨

ここで「遂行システム execution system 」という概念を提案する。パンクセップの探索システムを少し一般化したものである。私たち人間は(高等な哺乳類も入るだろうが)ある種の行動の遂行を、それが最終的に約束してくれるであろう快を含めた一続きの行動として行うよう運命付けられる。喉の渇きに耐えて歩いてきた人が一本のミネラルウォーターを差し出されると、「やった!」と歓喜し、まだ一滴も飲んでいないうちからドーパミンのニューロンが発火する。その発火の積分値とでもいうべきものを考える事が出来る。脳は必ずそれを量的に把握しているはずだからだ。首尾よくその全量を最終的に獲得するためには、一連の行動を確実に最終目標まで持っていかなくてはならない。すると今度はそれを獲得するための行動それ自体が、そのプロセスも含めて報酬につながる。
想像してみよう。100メートル先に清涼飲料水の自動販売機を発見する。「やった!」と脳は報酬を先取り体験する。ミネラルウォーターを確実に手に入れるためには、100メートル歩かなくてはならない。10メートル歩けば、それを10%確実にしたと考えることが出来るだろう。次の10メートルも・・・・。こうやって一歩一歩歩くことは快を積み重ねることになり、ここに仮想的な報酬勾配が出来上がっているのだ。これを行うようなシステムが遂行システムであり、これがうまく働いている個体は生存確率が高くなる。10メートルで美味しい水に一歩近づいた、とありありと想像し、そこに快感を覚える事が出来る個体、想像上の報酬勾配を実体化する能力がそこにあるのだ。
時間をかけて獲物を獲得する動物なら、事情は同じであろう。ライオンの集団が、バッファローを狙う。一匹の群れから離れたまだ子供のバッファローを、雌ライオンたちがジワッと取り囲み、茂みに隠れながらとびかかるチャンスをうかがう。一匹のライオンが突然飛び出してバッファローに襲い掛かり、背中に飛び乗る。他のライオンたちがそれに続く・・・・。最後にバッファローは倒れ込み、哀れライオンたちの餌食となる。このライオンたちの一連の行動は、一度始まってしまえば決してライオンたちの注意をそらさないだろう。バッファローが逃げおおせて、メスライオンたちが餌にありつけなかったことを理解するまでは。ここにも遂行システムが働いている。
 というわけで遂行システムを再定義する。遂行システムは報酬系に備わったシステムであり、ある報酬を獲得すべく行う行動そのものが全体として報酬勾配を形成するように働くシステムである。このシステムは報酬を実際に獲得するまでのプロセスで、それが獲得に向かって近づく際にそれ自体が快楽を与えるような仕組みを作り上げるのである。それは生命体が獲物の獲得や交尾といったそれ自体が時間と手続きを要する一連の行動を間違いなく一気に遂行するために編み出したシステムということができるのだ。