2016年6月30日木曜日

報酬の坂道 ⑩

遂行システムにおける「慣性の法則」

遂行システムにおいては、一つの始まった行為は(ほかのどのような行為にも優先して)完結するという原則が存在することは間違いなさそうである。ある本を読みだす、ある行為を始める、するとそれが止まらない、という現象がある。なぜだろうか。なぜ推敲システムは、それを首尾よく終わらせることに貢献してくれるのだろうか?答えはネットワークの励起にある。そもそもネットワークは、それ全体が励起するためにエネルギーを要する。
私は最近浦沢直樹の漫画「Monster」を読む機会があるが、明らかに読んでいると次も読みたくなる。(全部で18巻ある。今9巻目の初めの部分を読んでいる)。これは例えばしばらくぶりに読み直そうとして、9巻目の35ページから読み直そうとすることとは異なる。なぜだろうか?それは読むことで物語全体の登場人物やストーリーの流れのネットワークが興奮して、その全体が新たなストーリーの展開を次々と欲するからである。「慣性」が生まれているのだ。しかししばらくぶりに読み直し、全体の流れを忘れかけていて、ネットワークの一部しか興奮していないと、そのストーリー展開により得られる興奮を一部しか感じられない。同様の現象は、音楽を聴いていても、絵画を見ていても、すべて起きることだ。これはネットワークの興奮という初期投資を行うことで初めて可能なのである。そしてこの事情が遂行システムの機能に深く関係しているのである。




2016年6月29日水曜日

報酬の坂道 ⑨

ここで「遂行システム execution system 」という概念を提案する。パンクセップの探索システムを少し一般化したものである。私たち人間は(高等な哺乳類も入るだろうが)ある種の行動の遂行を、それが最終的に約束してくれるであろう快を含めた一続きの行動として行うよう運命付けられる。喉の渇きに耐えて歩いてきた人が一本のミネラルウォーターを差し出されると、「やった!」と歓喜し、まだ一滴も飲んでいないうちからドーパミンのニューロンが発火する。その発火の積分値とでもいうべきものを考える事が出来る。脳は必ずそれを量的に把握しているはずだからだ。首尾よくその全量を最終的に獲得するためには、一連の行動を確実に最終目標まで持っていかなくてはならない。すると今度はそれを獲得するための行動それ自体が、そのプロセスも含めて報酬につながる。
想像してみよう。100メートル先に清涼飲料水の自動販売機を発見する。「やった!」と脳は報酬を先取り体験する。ミネラルウォーターを確実に手に入れるためには、100メートル歩かなくてはならない。10メートル歩けば、それを10%確実にしたと考えることが出来るだろう。次の10メートルも・・・・。こうやって一歩一歩歩くことは快を積み重ねることになり、ここに仮想的な報酬勾配が出来上がっているのだ。これを行うようなシステムが遂行システムであり、これがうまく働いている個体は生存確率が高くなる。10メートルで美味しい水に一歩近づいた、とありありと想像し、そこに快感を覚える事が出来る個体、想像上の報酬勾配を実体化する能力がそこにあるのだ。
時間をかけて獲物を獲得する動物なら、事情は同じであろう。ライオンの集団が、バッファローを狙う。一匹の群れから離れたまだ子供のバッファローを、雌ライオンたちがジワッと取り囲み、茂みに隠れながらとびかかるチャンスをうかがう。一匹のライオンが突然飛び出してバッファローに襲い掛かり、背中に飛び乗る。他のライオンたちがそれに続く・・・・。最後にバッファローは倒れ込み、哀れライオンたちの餌食となる。このライオンたちの一連の行動は、一度始まってしまえば決してライオンたちの注意をそらさないだろう。バッファローが逃げおおせて、メスライオンたちが餌にありつけなかったことを理解するまでは。ここにも遂行システムが働いている。
 というわけで遂行システムを再定義する。遂行システムは報酬系に備わったシステムであり、ある報酬を獲得すべく行う行動そのものが全体として報酬勾配を形成するように働くシステムである。このシステムは報酬を実際に獲得するまでのプロセスで、それが獲得に向かって近づく際にそれ自体が快楽を与えるような仕組みを作り上げるのである。それは生命体が獲物の獲得や交尾といったそれ自体が時間と手続きを要する一連の行動を間違いなく一気に遂行するために編み出したシステムということができるのだ。

2016年6月28日火曜日

報酬の坂道 ⑧

遂行システム
 報酬勾配という概念が探索システムという考え方を得てより理解がしやすくなったと私は考える。探索システムとは、そこに報酬勾配を見出し、作り上げるシステムということが出来るだろう。そしてこれはごく原始的な生命体にも見られるものと考えることが出来る。
しかし実際の私たちの生活で、報酬勾配がたとえば塩分濃度や光子の量などの物理的な裏づけを持つ場合ばかりではない。すでに何度も出てきた例だが、炎天下を歩き続けて渇きに苦しんだ人が、100メートル先のソフトドリンクの自動販売機を目指して歩く時、一歩ごとにのどが少しずつ潤う、ということはありえない。
あるいは自販機で手に入れたミネラルウォーターを夢中で飲み干すという動的な行為そのものに、報酬勾配は介在しているのか? たとえば一口飲むごとに水がおいしくなるような現象などあるのだろうか? 
 結論としては、実はここにも仮想的な報酬勾配があるのだ。目の前の冷水のペットボトル一本を前にして、私たちは得られる報酬の全量を先回りして認知しているだろう。それは「あ、あそこに自販機があった。手持ちの100円玉で一本のミネラルウォーターを買おう!」と思った時の喜びとして、すでに体験されているからだ。それをたとえば10単位としよう。すると水を飲み干す、という行為はそれに向かって進む、つまりは報酬の全量に向かって近づいていくということだ。一口ごとに0.5単位、という風に。頭の中では必ずそう計算しているはずだ。それを報酬勾配と見なしていいということである。
 その証明としてこんな思考実験をしてみよう。目の前のペットボトルの水が、最初から半量だったとする。ペットボトルに半分の水というわけだ。あるいは100円で出てきたのは最初から250ccの小さなボトルだった。最初からそれしか与えられなかったら、飲み干したあとに私は満足して余韻を味わうという静的なモードに入るはずである。「ああ、おいしかったなあ、ジーン」というわけだ。もちろんもう少し飲みたい、という気持ちはあるが、そもそもそれが実現する可能性は考えていない。水はすでに目の前からなくなっているし、もう一本の水を買うお金はもうない。その状態と、最初の全量の水500ccのちょうど半分だけ消費した時に、突然だれかにペットボトルを取り上げられてしまった場合を比べよう。その際には同じだけの水の量を飲んだはずなのに、著しい不快感を覚えるはずである。すなわち最初にどの程度の快を最終的に与えられるかを想定し、そこに向かうというプロセスにこそ意味があるのであり、そこで快の総和を水の量から判断することは出来ない。

2016年6月27日月曜日

報酬の坂道 ⑦

パンクセップの探索システム

ところでこれまで本書で論じてきた報酬系と深く関連した概念を紹介しよう。ここら辺はアカデミック話だ。
。私が注目しているニューロサイコアナリシスという学問があるが、この世界での論客にヤーク・パンクセップという学者がいる。彼は「探索システム」という概念を提唱している。以下は「ニューロサイコアナリシスへの招待」(岸本寛史編著、誠信書房、2015)を参考にする。彼は「探求(Seeking)システム」について、これが最も基本的な情動指令システムであり、あらゆるものが、その探求の目的となるという。そしてそれが従来は「報酬系」と呼ばれたものだとする。そう、パンクセップによれば、探求するシステムこそ、報酬と深く関連している、というよりは報酬と探求ということは同義だと考えられているのである。実際に報酬系は特定の対象を持たず、ただその満足を追い求めるシステムなのだ。
ここでseeking システムの具体的な神経回路を示すならば、それはとりもなおさず報酬系の場所であり、中脳の腹側被蓋野(VTA)から前頭葉へと投射される中脳皮質系と、VTAから側坐核へと投射するドーパミン作動神経・・・・・ということになる。
大体通常の脳科学の教科書ならここで終わるのだが、この報酬系の場所がわかったからと言って、いったいどうだというのだろう?と問うのがこのブログの方針である。これまでの様々な脳科学的研究により、脳のどこを刺激したら快感ないしは不快が生じるのか、ということを私たちは知るようになってきている。それがたとえばパンクセップの言う探求システムというわけだ。しかし最も根本的な問題、すなわち快感とは何か、ということについては、何一つなぞは解明されていない。
生命体の驚くべきことは、この脳のごく一部の報酬系を興奮させるために、あらゆる行動が構成されるということである。これが存在することで、捕食や生殖行動が可能となる。この仕組みは考えれば考えるほど不思議であり、かつ複雑である。それは同様のプログラムを人工知能に作ることを考えれば分かるだろう。
ヤーク・パンクセップは言う。このシステムにより、動物は世界を探索し、求めているものを見つけると興奮するようになる。その「求めているもの」とは食物であり、水であり、温かさであり、最終的にはセックスである。このシステムの興奮により人は好奇心を持ち、知的な意味でさえ探索をするのだ。(だからこれを探索システムとなずけたというわけだ。)
この探索システムは下等動物、aplysia、アメフラシなどにも存在するという。アメフラシは水の中で負の走光性を示し、暗い方を探索する。くりかえすが、パンクセップの概念の面白いところは、この快ということと、世界を探索し、自分の居場所を探すということを結び付けているというところだ。ところが、ここからがよくわからないのだが、彼は快感中枢の刺激を求めてレバーを押すラットも、報酬系と回路が重複するOCD(強迫性障害)も、同じようなコンセプトから説明できるという。ただし後者のOCDの場合は、探索が上手く行かずに、ある種のループに嵌っているということが特徴であるという。その場合には肝心の快感が消失しているということだ。
パンクセップの探索システムが教えてくれること。それはそこに介在するドーパミンは「そそる状態 appetitive state」には関係していても、「ガツガツ貪り状態 consummatory state」には関係していないということだ。探索は、「あ、あそこに餌があった。やった!」に関係はしていても、その餌にありついて貪り食っている時にはもう低下している。このことはすでにドーパミンシステムの不思議な振る舞いとして私たちが知っていることである。
そうしてもう一つ驚きの事実を書いておこう。この探索はまた、嫌悪の回避にも関係しているという。不快を避けようとさまよっている(これも一種の探索なのだ)時にも、ドーパミンが活発に活動しているというのだ。
ところでこの部分を書いているとき、私はあるブログの力を借りている。ここら辺、繰り返しね。MyBrainNotes.com Sarah-Neena Koch という女性の手によるこのブログは、脳科学に関するきわめて有益な情報源である。その彼女がこう書いている。報酬系の刺激に関する行動と、強迫行動はどこかとても似ているというのだ。少なくとも脳に刺激を与えるべくレバーを叩き続けるネズミはそうだという。自己刺激をしているネズミは、快感を得ているというよりは、追い立てられた状態に近いという。何かに夢中になり、駆り立てられ、それ自身は心地よくなく、ただただ上り詰めていく状態。ネズミを使って強制的に泳がせるという実験があるが、そのような時もやはりドーパミンが大量に放出されている。それは一種の探索が起きている状態である。そしてパンクセップによれば、快感とはむしろドーパミンが低減していくプロセスに関係しているという。探索が行き着いた先、というわけか。えーっ?
うーん、不思議なるかな、ドーパミン。私たちは通常、快楽とはドーパミンの放出に関係している、と習っている。常識ではそうだ。しかしドーパミンの放出は快楽の予期だけでなく、ストレスの体験の最中にも出る。そして快楽そのものはその低下で起きているというわけである。 
この世界に棲む私たちは、常に溢れるばかり情報に晒されている。それは脳の感覚野で情報処理された後に扁桃体に送られる。扁桃体は大脳辺縁系のポータルサイトとでもいう部分で、そこでは、蓄えられた記憶を頼りに、それを避けるか、求めるか、無関心でいるか、という分類をするのだ。情報はそれから下流に流れて、最終的には自律神経系に行き着き、体がいかに反応するかを準備する。たとえば心臓がドキドキしだすとか、汗が出てくるとか。そして扁桃体は、一種のサリエンス・ランドスケープを作る。それは一種のマップであり、世界の何が自分に欲望を抱かせるか、何がそうでないか、というランドスケープ(景色、見晴らし)のことだ。

Sarah はブログでオピオイド(アヘンの類)にも触れて、このオピオイドが一種の形状記憶 shape memory を、世代を超えて形成するということにも触れている。妊娠したネズミにストレス状態 (酸素をあまり与えない、など) に置くと、生まれた子供はより多くのオピオイドを消費する。またネズミが生まれて間もないときにストレスを与えると、より多くのオピオイドを摂取するなどのことが生じるというのだ。

2016年6月26日日曜日

報酬の坂道 ⑥

ちなみに、この報酬勾配がない場合の快楽、というのも考えるといいだろう。以前のブログにも書いたが、報酬の勾配を下ることのない快楽は、言わば静的な快楽だ。静的快は、それに浸っているだけで十分。あー気持ちいい、それだけ。ところが動的快は何かに向かっている。おなかをすかしたワンちゃんが餌をパクついて最後にはお皿をペロペロ舐めておしまい、という一連の動きを考えよう。(なんと穏当な例だろうか?)私は両者の違いは、そこに報酬の勾配が存在するか否か、という考えに行き着いた。ワンちゃんの場合は、「もっと、もっと」に駆られてえさを食べつくす。だから夢中になりその行為に没頭する。報酬勾配におかれた私たちが体験するのは、動的な快である。
様々な報酬勾配の例
 以下に様々な報酬勾配の例を考えてみる。順不同だ。すでにブログでも書いてあるものをアレンジしてある。
 あるダイバーが海底に不思議な貝殻のようなものを発見する。角張っていて、ちょっと六角形にも見える。汚れを落としてみると、なんと金貨であった!まだ確証はないが、きっと何かすごい価値があるに違いない。どうしてこんなところに いきなり金貨が落ちているのか、さっぱりわからないが、それにしてもたまたまこんなものを発見するなんて、なんと幸運なんだろう、すぐに近くにいる仲間のダイバーに伝えよう。ラッキー!ここまでは上述の静的快と言えるだろう。
 ところがふと気がつくとそばにある珊瑚の塊は、何か船のような形をしているようだ。ということは難破船の残骸か?ひょっとしたらこのあたりには、その船に積まれていた金貨がたくさん散らばっている可能性はないか? その目で見ると、そこここに似たような「貝殻」のような形のものが落ちているようだ。ダイバーは、仲間に知らせることをやめて、夢中で探し出す。どこかに金貨を入れていたツボごと発見できないだろうか、と時間の過ぎるのを忘れて・・・・。これは動的。後者で起きているのは、探すという行為が更なる快を生むという、「勾配」の存在なのである。
 報酬勾配が逆向きだったりする場合もある。その場合人は苦痛から逃れることに夢中になる。こんな例を考えよう。あなたが腰の痛みに耐えているとする。慢性的な痛みで、安静にしているとやがて落ち着いていくのがわかっているので、あなたはカウチに静かに横たわっている。これは静的な苦痛。ところが家族の誰かが「マッサージをしてあげるよ。」と言ってあなたの腰に手を当てる。最初は特に何も感じず、少し安心していたが、ある部位に触れられたら急に痛みが増したとする。あなたは悲鳴をあげて「そこはやめて!」といったり、逃げ出したりする可能性がある。急に生まれたマイナスの「報酬勾配」により、痛みは動的になり、人はそれに反応して活動的になるという例だ。
以上の考察から次の様に結論付けることが出来る。私たちが快や不快を静かに体験するとき、それは勾配が存在しないからだ。勾配が存在する場合には、人はそれに没入し、一定の場所に到達するまで、それをやめることがない。
しかし勾配が存在していても、その体験が静的である可能性がある。それは快中枢が飽和状態に達する場合だ。渇きを癒すために水を飲む場合を考えよう。どんなにのどが渇いていても、人は永遠に水を飲み続けるわけではない。コップに34杯も飲んだらもうたくさんという状態になるだろう。最初の一口、二口、あたりの快はきわめて大きいはずだ。しかしそのうち上限に達してしまうと、後はそれ以上にはならず、むしろ苦痛を伴うようになる。おそらく私たちが日常体験するナチュラルハイなどはこの飽和状態に早く行き着くために、環境としてはポジティブ、ネガティブな報酬勾配が提供されていても、そこでの体験は静的な快、不快に早晩行き着くことになるのだ。

2016年6月25日土曜日

報酬の坂道 ⑤

ではどのような形で走化性が生じるのだろう? またまたウィキ様の力を借りると、たとえば鞭毛を持っている細胞の場合次のようなことがおきるらしい。反時計回わりをすると、鞭毛はひとまとまりになる。それにより細菌などの細胞は直線的に泳ぐ。そして逆の時計回転をすると、繊毛がバラバラの方向を向き、その結果として生物はランダムな方向転換をするという。要するに逃げる、ということなのだ。そしてそれが起きるために存在するべきものがある。リセプター(受容器)だ。細菌がXという匂いに向かっているとしよう。するとXの分子が細菌の表面にあるリセプターにくっつく。そこからさまざまな化学反応を誘発するのであるが、簡単に言ってしまえば、一瞬前のXの濃度に比べて、現在の濃度が上昇しているか、下降しているかにより繊毛の回転方向が決まってくるわけである。たとえばリセプターが細胞の表面に沢山あり、ある時点でそれのNパーセントにXがくっついているとしたら、しばらく走るとNプラス1パーセントに上昇したことで、細菌は「ヨッシャー、この方向や」とばかりに鞭毛を反時計回りにブルンブルン回すという仕組みが出来ている。
もちろんこの場合、細菌はより濃いXを感じ取ることで「ヨッシャー」とは感じていないだろう。上のは少し擬人化して書いただけである。細菌は考えるべき心を宿すスペース自体がない。このままでは細菌はロボットそのものだ。でも一つだけいえる。生物はたとえ細胞一つでも、自分の体にいいものを求めて動く。そしてその際の決め手は濃度勾配、つまりは報酬の坂道を下るという作業なのである。後は生命がいくら複雑になっても、同じような仕組みを考えればいい。
たとえば産卵をしに川を遡行する鮭でもいい。あれほど一心不乱に、ボロボロになりながら上流を目指して一目散に及ぶメス鮭は、明らかにコーフンし、目的地に向かって期待を胸に泳いでいることだろう。もちろんもうひとつの仮説は、彼女たちが何かの恐怖におびえ、一目散に上流に「逃げ」ている可能性だ。しかし私は絶対前者に賭ける。少なくとも生まれた川を目指すプロセスは「匂い」という研究があるそうだ。すなわちその川に特有の物質(もちろんものすごい数の微量物質の組み合わせの「濃度勾配」に反応する「走化性」が決め手となるだろう。ただし鮭あたりになると、私はそこに心を宿していると思いたい。そのメスの鮭の頭には、産み落とされる卵たちの「早く、早く」という叫びや、排出された卵に狂ったように精子を振りかけるべく待ち構えているオス鮭のイメージが広がっているかもしれない。彼女たちは間違いなく上流を目指すことを命を懸けて、ある種の興奮状態に駆られて行っているはずなのだ。

報酬勾配に置かれた私たちは興奮する

ここで鞭毛を持った最近も、心を持っているか、いないかも分からないCエレガンスも離れて、私たちのことを考える。私たちが何事かに熱中し、夢中になって課題に取り組んでいるとき、それは「報酬勾配」に置かれた状態といっていいだろう。報酬勾配とは今出てきた言葉だが、要するにこれまでの濃度勾配の話から一歩進めただけである。Cエレガンスにとっての匂いの勾配のような、ある種の報酬の勾配に置かれたとき、私たちは興奮し、没頭する。これは生物学的な宿命といえる。おそらくその典型は動物における交尾であろうが、これはあまりに生々しいのでブログではかけない。


2016年6月24日金曜日

報酬の坂道 ④

基本は報酬勾配だろう

まず基本の基本からである。動物(人を含めて)を動かす原理。それは「快を求め、不快を回避するという性質である」。とりあえずこう述べてみよう。正解だろうか? いや、その答えをここではまだ急がないことにしよう。とりあえずこれを「快楽原則」としておこう。一見これはすごく正しいように思える。快を求め、不快を避ける。当たり前である。その通り。この原則はおおむねにおいては正しそうである。ただしすぐに一つの問題が生じる。「すぐにでも快楽が得られないとしたらどうするのだろうか?」そう。Cエレガンスも匂いのもとにすぐにでもたどりつくわけではない。Aさんだって家事が終わってほっと一息、となるために何時間も働き続ける。報酬が即座に保証されないのに、同粒はどうして動き続けるのか?それも夢中になって。
 私はこれを三日三晩考え続けた。(嘘である。)そして一つの結論にたどり着いた。そして動物生態学的にもそれが妥当であることを追認したので、ここに表明したい。それは生物がある種の報酬の勾配におかれた際に、それに惹かれていくということである。どういうことだろうか?
もちろんCエレガンスは水の中を泳ぎながら、「匂い」のもとに到達して、「やった!」と感じているわけではない。だから彼らは泳ぎ続けるのである。しかしここには一つの仕掛けがある。Cエレガンスが好む匂い物質の濃度勾配がそこに存在するということである。つまりシャーレの一端に患者の尿をたらし、そこからの距離に従って、そのにおいが拡散していく、という状態に置かれることで、生物は動いていくのだ。以前出て来たもと商社マンAさんなら、「さあ次は掃除だ。これが終わったら洗濯をして…」と頭の中の予定表にある項目をこなしていく。それが実は楽しいはずなのである。それをここでは報酬勾配、と呼んでおこう。そしてその由来は、濃度勾配である。濃度勾配こそ、生物が動いていく際の決め手として注目されているテーマなのだ。

走化性(ケモタキシス)という仕組み
匂いに向かって進む性質、それはCエレガンスはおろか、単細胞生物にも存在することが分かっている。それを走化性 Chemotaxis と呼ぶ。“chemo”とは化学の、“taxi”とは走る、という意味だ。化学物質に濃度勾配があれば、鞭毛をもった細菌などはそれに従って移動する。いや鞭毛をもたない白血球なども同様の行動を示す。もちろん何に向かって走るかにより、温度走性、走光性などがあるが、医学の分野との関連で濃度勾配により移動をする走化性の研究がずば抜けて多いのは、これが生物学と医学の両方で特筆すべき重要性を持っていることの証である。
ここからはWIKI様(敬称付きである)に御頼りするしかないが、何しろ1700年代初頭にレーベンフックが顕微鏡を発見した時から、「なんだ、この細胞、じわじわとどっかの方向に動いている様だぞ!」ということが発見されたという。生命のもとになる単細胞が、どこかに向かって泳ぐ(移動する)ということが分かっていた。そしてそれがある種の化学物質に向かう、あるいはそれを嫌って避けるということは、その細胞の基本的な性質としてあるのだ、という認識が高まってきた。あとはその研究の歴史が延々と続くのである。Cエレガンスどころの話ではなかった・・・・・。Cエレガンスは多細胞生物である。体長一ミリ、細胞の数は1000前後で立派なものである。彼が「走る」のはむしろ当たり前であったのだ。

2016年6月23日木曜日

報酬の坂道 ③

 Cエレガンスは、尿の特定の「匂い」を求めて泳ぐという。もちろん水の中のことだから、本当の「匂い」ではない。液体に溶け込んでいる極めて微量の化学物質を求めるのだ。そう、Cエレガンスは特定の化学物質を求めて泳いでいくのだ。たった302個の中枢神経の細胞で、どうしてそんな事が出来るのだろうか?1000億個の神経細胞を持った私たちが、喉の渇きのために砂漠の向こうに泉を求めてさ迷い歩くのならよくわかる。しかしたった300個の神経細胞の集まり、脳ともいえないようなとてつもなく単純な神経組織しか供えない生物も、また同じような行動を起こすのである。
 家事に熱中するAさんの話からいきなり特定の尿の匂いを求めるCエレガンスに話が移ったが、私が興味を抱くのは次の一点である。生物はどのようにして動いていくのか。それを駆動する力はなんだろうか?渇きや飢えといった感情であろうか?それともロボットのように自然と匂いや光に向かうのであろうか? もしCエレガンスが求めるのは匂いのもとに到達した時の快感や喜びであるとしたら、そのもとに向かう、という行動はどのようにして成立するのであろうか?直接その匂いのもとに到達したわけでもないのに、どうしてそれを求めて泳ぐということが可能だろうか?
 もちろん読者の中にはこう考える人がいるだろう。「単純な生物が欲望を持つはずはないであろう。」ロボットのように自動的に匂いのもとに泳いでいくのだ。どうして感情など必要なものか?」しかしそれならばこう聞きたい。「では私たちはどうして欲望という厄介なものを持っているのだろう?快や不快や渇望や苦痛など、ややっこしいものをどうして体験しなくてはならないのだろうか?」
おそらくこの疑問には永遠に正解はないのであろうが、少しでもそれに迫っていくのが本ブログの目的である。

基本は報酬勾配だろう

 まず基本の基本からである。動物(人を含めて)を動かす原理。それは「快を求め、不快を回避するという性質」である。よろしい。とりあえずこう述べてみよう。正解だろうか? いや、その答えをここではまだ急がないことにしよう。とりあえずこれを「快楽原則」としておこう。一見これはすごく正しいように思える。快を求め、不快を避ける。当たり前である。その通り。この原則はおおむねにおいては正しそうである。ただしすぐに一つの問題が生じる。「すぐにでも快楽が得られないとしたらどうするのだろうか?」そう。Cエレガンスも匂いのもとにすぐにでもたどりつくわけではない。Aさんだって家事が終わってほっと一息、となるために何時間も働き続ける。報酬が即座に保証されないのに、生命体はどうして動き続けるのか?それも夢中になって。
 私はこれを三日三晩考え続けた。そして一つの結論にたどり着いた。そして動物生態学的にもそれが妥当であることを追認したので、ここに表明したい。それは生物がある種の報酬の勾配におかれた際に、それに惹かれていくということである。どういうことだろうか?
もちろんCエレガンスは水の中を泳ぎながら、匂いのもとに到達して、「やった!」と感じているわけではない。だから彼らは泳ぎ続けるのである。しかしここには一つの仕掛けがある。Cエレガンスが好む匂い物質の濃度勾配がそこに存在するということである。つまりシャーレの一端に患者の尿をたらし、そこからの距離に従って、そのにおいが拡散していく、つまり距離とともに徐々に薄まっていく、という状態に置かれることで、生物は動いていくのだ。Aさんなら、さあ次は掃除だ。これが終わったら洗濯をして… と頭の中の予定表をこなしていく。それが実は楽しいはずなのである。それをここでは報酬勾配、と呼んでおこう。そしてその由来は、Cエレガンスの場合は特定の物質の濃度勾配である。濃度勾配こそ、生物が動いていく際の決め手として注目されているテーマなのだ。

2016年6月22日水曜日

報酬の坂道 ②

 人は、動物は何を求めて行動するのか? 何が楽しいのか。人には様々な行動パターンがあり、趣味や楽しみがあり、仕事がある。それぞれが違った人生を送り、違った脳を持ち、違った目標を持って生きていく。
「何が人を動かすのか? what makes a man tick? 」
私はこの素朴な疑問をおそらくこの30年間持ち続けながら精神科医になり、精神分析を学び、現在に至るが、いまだに解決がつかない。しかし30年前に持っていた疑問に対して、今はその解決の糸口くらいはつかんだ気がする。それは報酬系という人間の脳のシステムと深くかかわっているということである。そして人間が何かに惹かれて行動するように、もっとも下等な動物は、それが自由な運動を獲得し、敵を避けて餌を求めるという行動をとり始めたときに、すでに私たち人間と同じような原理で動いていることを知った。そこでも決め手はやはり報酬系。報酬系を知ることが心を、心を持った人間の行動のなぞを知る手がかりになる。
C. エレガンスは幸せなのだろうか?
 ということで、私の心はどうしてもC. エレガンスに向かってしまう。正式な名前はCaenorhabditis elegans(カエノラブディティス・エレガンス)あまりに長たらしい名前なので、科学者も単純にC.エレガンスと呼ぶというのが決まりごとになっている。(本ブログでは「Cエレ君」)などの名前でも登場する。
 この体長一ミリほどの小さな虫(正式には線虫と呼ばれる)は、一種のモデル生物として実験に非常によくつかわれる。体細胞は約1000個。神経細胞は302個。しかしこれほど単純なのに、学習をし、もちろん生殖もする。そして走性を示す。走性とは好みの匂いの方向に進んでいく、という性質である。染色体は6本あるが、そのゲノムはいち早く解析された。その結果、6本の染色体上に約 19000 個の遺伝子の存在が予測された。(これって人の遺伝子の3万程度と比べてもものすごく多いという印象を与える。)2015年に九州大学の研究グループは、 C. エレガンスが特定のがん患者の尿の臭いを求めて泳ぐという性質を発見した。

2016年6月21日火曜日

報酬の坂道 ①

Cエレガンスは報酬の坂道を下っていく

ある知人の話である。彼はまだ60前の有能な商社マンだった。もっと若い頃は世界各地の油田地帯を飛び回り、重要な商談をいくつもまとめてきた。しかし長期間にわたって家を空けることが多く、病弱な妻の面倒は彼女の両親にまかせっきりというところがあった。ところが定年を前にして腰を痛め、入院をして何十年ぶりかの休養を取ることになった。そしてふと考えたのである。
自分は幸せなのだろうか?
  本当は妻の介護をして家事をするのが性にあっているのではないか? まさか? バリバリの商社マンである。高収入でまだまだ働いて会社に貢献することを期待されている。
  それでも彼は会社をすっぱりやめ、「主夫」になった。幸い蓄えは十分であり、しかも妻の家は旧家で資産があったので、金銭的には困らない。彼はそれまで雇っていたメイドを解雇し、家の掃除から料理まで一人でこなすようになった。朝は毎日7時おきで90分間、家中の部屋を回り、音を立てて掃除機をかける。絨毯は同じところを少なくとも五往復。高価なペルシャ絨毯が擦り切れんばかりの勢いだ。それから手の込んだ朝食作り。糖尿病予備軍の妻を気遣って、カロリー計算もおろそかにしない。その後は家計簿の整理。エクセルに細かな表を作り、アマゾンで注文した文庫本一冊まで支出を記入していく。もちろんその合間を縫って妻の介護。リハビリ通院の送り迎えも欠かさない。
そんな「仕事」に没頭して3年たった彼に聞いてみた。そろそろ復職を考えているのではないかと思ったからだ。彼の有能さを買って、戻ってきてほしいという会社からの声は今でも多いという。
「あなたは今、幸せですか?」
彼は「もちろんです。」といった。夕方には5キロのジョギングを毎日欠かさない彼の顔は少し日に焼けて健康そうだった。「毎日が充実しています。スケジュールがいっぱいで、こなすのがやっとです。でも自分がいかに家事に向いているかを実感しました。本当は人と会うのは苦手なんです。」数々の商談をまとめた彼とは思えない言葉が返ってきた。

2016年6月20日月曜日

快感原則 ③

一部は前書「脳から見た心」と同じ内容である。

ここで一つ種明かしをすると、実はこれまで「快感原則」、つまり気持ちいいことはやる、としていたところに、「不快の回避」というファクターもある程度は含めていたのである。不快の回避はしばしば安堵感を生むので、それも快感としてカウントしてしまおう、ということだったのだ。確かに両者は区別しにくいところもある。しかし厳密に言えば、不安の回避と快感そのものを一緒にするわけには行かない。
たとえば散歩の例を思い出そう。そこで快感のリストに挙げられるものとして次のように述べた。歩くこと自体を気持ちよく感じている場合には、それを各瞬間に体験していることになるだろう。それ以外にも終わった際の「今日もルーチンをこなした」「体にいいことをきちんとした」という達成感を先取りして体験していることになる。ホラ、快のリストに実は「不快の回避」が含まれていたではないか。「今日もルーチンをこなした」というのは、一種の義務を自分に課して、それを遂行したということを意味する。それは散歩をしないことにより生ずるさまざまな健康上の問題を考えることの苦痛や不安を回避するという意味を持っていたのだ。
 考えてみればお預けの行動を分析する際に、最初から不快の回避をしっかり数え入れておくべきであった。というのも私たちの行動のかなりの部分は、この不快の回避としての要素を非常に多く持っているのだ。いやいやながらする勉強、不承不承に通う職場などを考えればそれは明らかであろう。それに何しろまったく快の要素がなく、「不快の回避」だけの行動というのもいくらでもあるからだ。誰かにムチをもって追いかけられて必死になって逃げているという場合などはそうだろう。
  ところで「すべての行為は快の追及と不快の回避の二つの要素からなる」という提言は、誤ってはいないものの、ちょっとしたトリックがある。これは一種のトートロジーとなりうるのだ。この点を少し説明しよう。
ある行為を行うということは、「その行為を行わないという行為を行わないこと」でもある。先ほどの犬のお預けの例では、餌に突進するということは、「お預け」に従うのを中止すること、つまり「えさに突進するという行為を行わないこと」をしないこと、でもある。するとある行為にともなう快のリストには、その行為をしないことによる不快を回避すること、という項目は必然的に含まれることになる。それも結局は「不快の回避」の一つの形といえるのだ。では私はどうしてこれを快の追求と同じものとして扱ってきたのか?それは不快の回避にはグラデーションがあり、それ自身が不快な「不快の回避」から、しないではいられない、つまりそれ自身が不快ではない「不快の回避」までさまざまなものがあり、しかも後者から前者への以降が、私たちの精神の力で、想像力で可能だからだ。(私たちの想像力が、不快の回避から新たな快を生むことが出来る。それをちょっと奇をてらった言い方ではあるが「快の錬金術」と称して、次に論じよう。それはともかく。)
整理しよう。
散歩をすることの快、散歩をしないことによる不快の回避。両者は時々、区別がつかないほど似ることがある。散歩をすごくしたい場合には我慢をすることが苦痛だから。これは当たり前でトートロジカルとも言える。(散歩をしたい≒散歩をしないではいられない。)
散歩をしないと三日坊主といわれるから、というのはどうだろう? これは「三日坊主と言われないため」の散歩ということになり、積極的な快はそこにはあまり存在しない。散歩をしたからといって積極的な評価を受けるわけではないのである。でも理論的な思考や想像力を働かせて最終的に選択するものだ。その想像を必要とするという意味では「心の労働」ともいえる。散歩をしないことの苦痛は将来生じるのであり、今は困ることではない、でもよくよく考えると、やはり散歩をしないことはマズイ、だから散歩をするというわけだ。これを私は「不快な『不快の回避』」、と呼ぶことにする。「不快の回避」そのものがつらい、という意味だ。一方散歩をしたくてたまらない場合は、「不快の回避」は決して不快ではない。むしろ望むところだ。ここに違いがある。
 しつこいようだが説明を追加しよう。わかりやすいタバコの例で。
タバコを吸い続けると癌になるとテレビでやっていた。でも今、この一本を吸う事で突然癌になるわけではない。ヤメたくないなあ。長年吸っていたんだし。でも止めると決めたし。これが不快な「不快の回避」。こちらは止めることのメリットが実感できず、しかし過去にすべきではないこと、長期的には不快であるから止めるべきと、自分で認定し、評価を下したことだからというそれだけの理由で回避する不快だ。ではこれを不快な「不快の回避」から、不快ではない「不快の回避」にするのはどうしたらいいかというと、その「タバコを吸うと癌になるぞ」というテレビの内容を思い出し、あるいはさっき吸ったタバコのタール成分が肺の細胞に突然変異を起こしたことをありありと想像することである。一種のイメージトレーニングだな。これは実は副流煙を毛嫌いする人が皆やっていることなのだ。「今、となりの喫煙者の口から出て目の前を漂っているこの煙を吸い込むと、肺に入って、肺が黒くなって・・・・。オー、ヤダヤダ。」もしそれを喫煙者自身がありありと実感したら、これから吸おうと思っていた目の前の煙草をゴミ箱に捨てることは、鞭を持った人に追いかけられるときの気持ちと似て、特に苦痛を伴うわけではなく(恐怖はあるだろうが)、むしろ反射に近い行動になるのだ。
今日発見したことを急いでまとめる。「不快の回避」と呼ばれるものにはグラデーションがある。一番左端にあるのが、その行動をしないことのメリットの実感がなく、ただ「自分が決めたから」「人に言われたから」というもの。それをしないという決断自身は自分の下したものである。人から「止めなさい」といわれてしぶしぶ止める場合はどうだろうか? おそらく止めなさいといった人間との関係性が重要になるだろう。前者は止めないとデメリットがあることを自分で想像し、しかし実感がなく止める。それに比べて後者はいわば他者に脅されて止めるのであり、そこに一種の「恐怖」や不都合が介在するために、自動的、反射的なものに近くなり、左端からは一歩右にずれることになる。この一番端の「不快の回避」は、不快自体が実感を伴わない、記号化したものであることに注意すべきであろう。そして私はこの種の「不快の回避」こそが一番不快であろうと思う。「不快の回避」のメリットが実感される度合いにしたがって、この端から離れ、最後にはまさに「鞭を持て追われる」状態になるが、これは「快」にかなり近くなる可能性がある。なぜなら逃げおおせた場合には、恐怖から解放されるからだ。どういうことか。不快の体験の際は、不快が払拭されること自体を切望するようになる。すると苦痛の終わりは、事実上「快」に変質するからだ。
ただしこの「不快の回避軸」上のどこにあるかという問題と、その時の不快の度合いは必ずしも一対一対応することは出来ない。タバコの例だと、「止めたと決めたから」というだけで喫煙できないことの苦痛(一番左端)は、「タバコは怖いから」(少し右側)よりは大きいだろう。でもたとえば修士論文を書くというのはどうだろう。まだ締め切りが先(左端)だとダラダラ書けるから、さほど苦痛ではない。しかし締め切りが近づくと、締め切りに遅れることの恐怖も実感されることになり、軸上の右に移動するわけだが、それがどんどん苦しくなってくる可能性がある。それは論文を書くスピードも速めなくてはならないからだ。私は個人的には、締め切りが迫って急いで仕上げなくてはならない論文を書いているときが一番の苦痛である。その苦しみを味わうくらいなら、早めに準備する。
 ただし切羽詰って書いているうちに、少し躁気味になり、ノッてくるということが起きると話は違う。今度はそれ自身が楽しくなるという人がいる。ここが人間の複雑なところだ。人間の行動は、突如としてそれそのものが快楽の源泉となったり、不快の源泉になったりする。

2016年6月19日日曜日

快楽原則 ②


快感原則」と「不快原則」の綱引きの関係

「快感原則」と「不快原則」の関係性についてもう少し説明を続けよう。私たちが日常的に行う行為の大部分は、この両者が同時に関係しているといえる。私たちの行動のほとんどが、快楽的な要素と不快な要素を持つ。だから常に快感原則と不快原則の綱引きが起きていることになるが、実際にはそれがルーチン化すると、一部は自動化され、反射的、常同的に処理されるようになっていく。
健康のためにウォーキングを始めた、という例を考えよう。小一時間汗を流すのは気持ちいいが、同時に疲れる、めんどうくさい、という部分も伴うだろう。空模様が怪しかったり、ムシ暑かったり、逆に冷たい風が肌をさす日などは、いつものように歩きながらも「私は何のためにこんなことをやっているんだろう?」と思うこともあるだろう。しかしあなたがそれでも散歩に出ることを決めたとすれば、散歩に出ることが現実原則に則っている (つまり散歩による快 散歩による不快、であるからだということになる。
 この散歩の例における快にはどのようなものがあるのか? それをリストアップしてみよう。歩くこと自体を気持ちよく感じている場合には、それを各瞬間に体験していることになるだろう。それ以外にも終わった際の「今日もひと仕事をした」「体にいいことをきちんとした」という達成感を先取りして体験していることになる。つまり快は、即時的に体験される部分と、間接的、ないしは遅延された部分により成り立っている。ただし歩きながら距離を測って、たとえば「今日の散歩のルーチンの35パーセントは達成できた。やった!」などと考えることができる場合には、歩いている間にもそのパーセンテージが徐々に上がっていくことになり、遅延部分は即時的な部分と事実上あまり変わらなくなるだろう。
 では不快はどうだろうか? 天候がすぐれない時や道がぬかるんでいる時、体調が悪い時などは、歩いている各瞬間が苦痛となるであろう。実は右足の親指が巻き爪で、歩くたびに少し痛みを感じる、なども入れておこう。こちらの方はほとんど即時的なものくらいしか思いつかない。遅延した不快体験というのはこの場合あまり考えられないからだ。「今日散歩をしたら、何か悪いことが起きる」などと占い師にへんな予言をされた場合、くらいか。
 さてこの散歩がルーチン化していったならば、それは半ば無意識化され、自動的なものになるかもしれない。仕事から帰るといつの間にか散歩用のスポーツ着に着替え、歩き出している、などのことが生じる。その時はいちいちそれが快か不快かを問うことなく、その行動が自然と起きてしまうかも知れない。ただしその行動がマイルドな形で快を与えることが、その継続にとっては重要である。なぜなら自動的な行為は、それが不快だと気がついて止めたければ、いつでも止められるからだ。それでも続けているということは、少なくとも「やめることも何となく苦痛」くらいではあるだろう。
 散歩の例は、快が即時的なものと将来の先取り分という複雑な構造を持ち、不快の方は即時的なものだけだったが、逆の例を考えることも容易である。たとえば喫煙。こちらは快はもっぱら即時的だ。「こうやって煙草を毎日吸っているのは辛いが、将来きっといいことがある」などと考える人はあり得ないだろう。ただしおいしそうな外国製の葉巻のボックスを手に入れ、家に帰ってから一人で吸おうと帰途につく時の快は、遅延部分といえるだろう。
 今度はこの喫煙の例での不快の方のリストだが、これも複合的だ。即時的なものとして「まずい、煙い」などといいながら吸い続けるということもあるのだろうか? 私は喫煙者ではないのでわからない。しかし「これ喫っていると、どんどん肺が真っ黒になっているんだろうな」とか「肺がんや膀胱がんに確実になりやすくなるだろうな。オソロシイ」などの考えは起きるだろう。これは将来の苦痛を先取りしたものといえなくもない。

「快感原則」と「不快原則」と「不快の回避」との関係

ところでこの快感原則と不快原則との綱引きの関係についての議論を読んでいる方の中には、ウォーコップ・安永の提言である「すべての行動は、快の追求と、不快の回避の混淆状態である」という理解(安永浩(1977)分裂病の論理学的精神病理-「ファントム空間」論-.医学書院、東京)との違いについて疑問に思うかもしれない。この提言は英国の不思議な学者ウォーコップが示した人間観を日本の精神医学者である故・安永浩博士が継承しつつ発展させたものだが、それと「快楽原則」と「不快原則」との関係はどうなっているのか。この問題についても触れておきたい。
ここでウォーコップ・安永の理論の詳細に立ち入る余裕はない(というか詳しいことが私にはまだ理解できていない)が、ウォーコップの理論をひとことで言えば、人間の行動は必ず、それを「したい部分」と、「しなくてはならないからする部分」がまじりあっているということだ。彼は前者を「生きる行動 living behavior」、後者を「死を回避する行動 death-avoiding behavior」と名付けている。
 この観察は私たちの日常生活に照らせばかなり妥当である。というよりそうでない行動を見つけることが難しい。どんなにその行動に喜びが伴っても、義務の部分は何らかの形で入り込んでくるものだ。先ほどの散歩の例で言えば、楽しく歩いている場合にも、義務感に駆られてやっているという部分が多少なりともある。義務感に駆られているというのは、それを「しない」ことによる後ろめたさや罪悪感を回避するためにそれを行うということである。「死・回避行動」とはそれを少し極端な形で言い表したものなのだ。
このことをこれまで見た快感原則と不快原則の議論に引き付ければどうか?「死・回避」の部分は、見た目は不快原則に従った行動とは似て非なるものだということがわかる。「死を回避する行動」の場合、それは散歩を継続するという方向に働くが、不快原則の場合はそれは散歩をやめる方向に綱を引くことになる。前者は、「散歩はしないことに伴う苦痛から逃れるためにせよ」(「散歩はやらないよりはマシだから続けよ」)であるのに対し、後者は「散歩は苦痛だからやめよ」と当人に働きかけるだろうからだ。すると快楽原則とペアになって意味をなすと考える「不快原則」と、もう一つのペアの候補「死を回避する行動」とはまったく別のものなのか?

2016年6月18日土曜日

快楽原則 ①

●「快感原則」の嘘

本書(????)にはどうしてもこの章が必要なのだ。しかし前書「脳から見える心」ですでにこの問題について書いてあるのだ。そこでまず何を書いたか振り返ろう。
「第15章 報酬系という宿命 その2 「快の錬金術」
相変わらず大仰な題だ。
しかし読み直してみると・・・・・われながら感心した。よくもここまで考えていたものである。読み返しても最初は自分でも何を言っているのかよくわからなかった。作者も分からないのであるから、読者はもっと困ったことだろう。そこで一生懸命サマライズしたい。

快楽原則と不快原則

人は「究極的に快感中枢の刺激を求めている」というテーマについて論じた。人は突き詰めれば快感を追求して動くのであり、理屈で動くのではない。それは私たちにとって一種の宿命なのだ。そしてありがたいことに、脳の中でここが活動すれば快感が得られる、という場所がわかっている。それが脳の深部にある報酬系という場所であった。そこを電気刺激すると、スイッチが入ったみたいに心地よさを感じるのである。もちろん何が人の報酬系を刺激するかということが、実はきわめて込み入っているのは当然である。
 人は自らの報酬系を刺激するものを求めて動くという原則を「快感原則」と呼ぶ。精神分析のフロイトが論じた快感原則も同様の趣旨だ。これが人の心や体を動かす大原則、というわけである。フロイトは正しかったのだ・・・・・・。
 ただし少し考えたら、この原則にはいろいろ分からないところがあることに気がつく。たとえば私たちは「苦痛を回避する」という原則も成り立たないであろうか? 確かに。そこで「快感原則」を考えるなら、「不快原則」も必要ということになる。何しろ私たちは人生では快だけでなく、不快も体験するからだ。
「不快原則」:「人(動物)は自らに不快を与えるものを回避する。」とでもしておこう。

それともうひとつ。遠くにオアシスを見つけたときのように、まだ今現在は喉の渇きを癒していないにもかかわらず、人は喜ぶ。それも「快感中枢の刺激」と考えていいのであろうか? おそらく。ということは快感中枢は、現在直接的に味わっている快と、将来味わうであろう快の二種類の快を味わい分けでいることだろうか?
報酬系におけるドーパミン系のニューロンの興奮の仕組みは、これらの事情をある程度は説明してくれる。ドーパミンニューロンの興奮には二つのパターンがある。一つはトーン信号、もう一つはバースト信号である。バースト信号は、短時間で一気に見られ、実際に水を目の前にした時も、砂漠の先にオアシスがあることを知った時も、あるいは水を飲むことを想像しても、その瞬間に一時的に生じる。このようにバースト信号による報酬系の示す反応は、そこに実際の快だけではなく、快の予想に関して反応する仕組みがあることを教えてくれる。リアルな想像によりバースト信号を生じさせ、いわば快感の「味見」をさせてもらえるということが、これを実際に獲得したい!という気持ちにさせるのだ。他方のトーン信号はジワーッと持続的な快感を与えてくれる。こちらのほうが快感としては本物と言えるだろう。
 前書では、私はここでわかりやすい例を挙げた。
ユーチューブに掲載された犬の「お預け」のシーンである。20匹ほどの犬が、自分たちの前にある複数の餌の入ったボールを前にして、ムチを持った飼い主の合図を待っている。ある犬はすでによだれをダラダラ流している。大抵の犬は居ても立っても居られない様子でジタバタしながら、でも決してボールに口を近づけようとはしない。もしそんなことをしたら、飼い主のムチが飛んでくることをよく知っているからだ。(もちろん年月をかけてそのように調教してあるのである。)そして犬たちは、飼い主の合図により一斉に餌のボールに突進する。これを一匹の犬ではなく、20匹以上の犬が行うから壮観である。人間ではなく、動物が見せる快の遅延の例なのだ。
 ここで犬たちの快感中枢で起きていることを考えてみよう。目の前に餌の入ったボールを出された時点で、快感を査定すべく想像力が働くが、その際はドーパミン作動性のニューロンのバースト信号が生じる。「やった、これから餌だ!」という感激である。これはすでに見たとおりだ。しかしこのバーストはすぐ止む。そして実際のエサは口の中に入り込んでは来ないからトーン信号も低いままだ。そして同時に不快原則も働いている。お預けに反してえさに飛びついたら、飼い主にムチ打たれることを犬たちは良く知っている。それを想像した「イタい、コワい!」感もあるだろう。両者を比べて後者の方が凌駕しているから犬は「お預け」を選択するのだろう。もし逆の関係なら、ムチが身体に食い込み、皮膚を引き裂く苦痛に耐えながらも餌に食らいつくことになるのだ。ということは犬の脳内には、そして同様の状況に置かれた人間の脳内においては、快感原則と不快原則が常に競合し、最終的に勝ったほうを選んで行動を決めていることになる。そこでそれを「現実的な路線を選ぶ」という意味で「現実原則」と呼ぶなら、それを以下のような式に表現することが出来るだろう。
「快感原則」+「不快原則」=「現実原則」


本能的、常同的、無意識的な活動について

以上、人や動物の行動を「快感原則」と「不快原則」の両方に支配されたものとして描いた。しかしこれらの二原則がある程度うまく働くためには、その生物がある程度以上に高等である必要があるという事情もご理解いただけるだろう。なぜなら両「原則」とも実際には体験されていない快感や不快を査定ないし検出するために、それ相当の想像力を必要とするからである。下等動物ではこうは行かない。

1章「報酬系という宿命 その1」で出したヒメマスなどは、産卵の後、一生懸命ひれをパタパタさせて卵に新鮮な水を送る。でも彼らは自動的に、無意識的に、常同的にひれのパタパタを続けるだけだ。それはすでに一つの回路として脳の中にプログラムされている本能の一部というわけだ。生物が高等になるにつれて、本能による行動の間に出来た隙間を、自由意思による主体的な行動が埋めることになる。しかし、だからといって本能に従った行動が快、不快と無関係というわけでもない。それ自身がおそらく緩やかな快を伴っていることも想像できる。ひれをパタパタして卵に水を送るヒメマスは、おそらくなんとなく心地いいから続けるのだろう。本能に従った行動それ自身が緩やかな快を伴うのは、その本能的な行動が中止されないための仕組みと考えられる。これが生殖活動などになると、大きなエネルギー消費を伴うためにそれ自身が大きな不快ともなりかねない。だからこそ当然強烈な快に裏打ちされていなくては閾値を超えられない。またメスのヒメマスが産んだ卵に必死に精子をかけて回るときのオスは相当コーフンしているはずだ。そしてこれらの事情は私たち人間にとっても変わらない。食行動、生殖行動など、明らかに本能に深く根ざしている行動には強い快感が伴う。また無意識的に行っている、いわばルーチンとなった行動についても、穏やかな快感くらいは伴っていることが多い。例えば人は決まった通勤路を歩いている時には、その行為について意識化していないことが多いが、おそらくはある種のゆるやかな快を伴っているからそれが続けられるのだろう。だから風邪などをひいて体調を崩しているときには、いつもは何ら苦痛に感じられない通勤もすぐに不快に転じてしまうので、少し歩いてはみても、結局はタクシーを呼んだり、道に座り込んでしまいたくなったりするはずである。

2016年6月17日金曜日

装置 ⑥

 ということで、「報酬系という装置」についてのまとめに入ろう。いずれも思考実験の結果である。(私の頭の中で、あれこれCエレ君を動かしてみた。)
 報酬系とは、生物が生き残るために必須の装置である。報酬系はそれなりに複雑な仕組みを備えなくてはならないが、それは自然界が複雑だから仕方がないのだ。
私は生物自体は非常に単純化して、生命維持に必須な要素(Cエレ君にとっての電気に相当)を摂取し、危険(外敵、捕食生物など)を回避するというだけの条件を付けた。ただし生命本来の性質である「動き回る」は付け加えた。これは植物とは異なることを意味し、植物には報酬系は必要がない、ということになる。実はこの点は面白い。生命体は、動き回るという条件を外しただけで、報酬系を必要としなくなるのである!!
自然界の複雑さが報酬系を発達させたというのが私の主張だが、どういう意味での複雑さか?まず報酬が動き回る。大概相手もまた生命体であることが多いからだ。そして外的もまた動く。これが決定的に報酬系の働きを複雑にするのだ。その結果として「予測」はやはり決定的な要素となる。報酬や(外敵により被る)苦痛をどれだけ予測できるか、どれだけそこに動いていき、あるいはそこから遠ざかる事が出来るかが、生存にとって極めて重要となる。というか全てと言ってもいい。その結果として生命体はどうしても記憶装置が必要となる。ただしそのために人間が持っている海馬や扁桃核は必ずしも必要ではないだろう。ニューラルネットワークを与えておいて学習させればいい。ただしその結果として報酬系は遠くにある報酬や外敵に力価(ないしは「期待値」)を与える事が出来なくてはならない。なぜならばエサを求めて進むか、途中に待っている外敵のために遠ざかるか、という決定を各瞬間に迫られているからだ。「どっちにしようかな…」と留まることは、死を意味してしまう。
少し別のまとめ方をしよう。自然界にあるもっとも単純な生命が生存する条件を考えた結果、次のようなプログラム(≒報酬系)を備えていることが分かった。生命保持のために摂取すべきものや、生命を脅かす外敵を、予測する能力。それに従って進むか、退くかを決定して実行する能力。以上である。ただし実は、このモデルは、生命体に関してとんでもない単純化をしていることになる。つまり繁殖を省略しているのだ。生命体の変化、複雑化に、実は生殖は絶対的に重要な意味を持つ。生存より、子孫を残して死ぬ方が意味があったりする。繁殖は、種全体としての生存、と言い換えてもいい。
以上の思考実験で面白いと思うのは、生命体を動き回り、えさを求め、敵を回避するものとして考えた場合、そこに感情、痛み、喜び、快感などの必要性がどうしても生じてこないということである。その生命体は報酬を獲得している最中はじっとそこにとどまったり、痛みからは急いで遠ざかったり、遠くの報酬に向かって進んだり、という複雑な運動を必要とする。しかし主観的に快や不快を体験するかは、どうだっていいということだ。この思考実験は、その意味で意義深かった。


2016年6月16日木曜日

装置 ⑤

さてここまででCエレ君のチップの中身は分かった。しかしまったく置き去りにしているのが、Cエレ君の感情体験である。たとえばCエレ君が紺色マットに遭遇して、大量の電気を貪っている時、どこかに「快感」を感じる必要はあるのだろうか? あるいは高温マットに焼かれるときの痛みは? そして高い力価を持った充電マットを視野の中に感知した時の「やった!」感は?近くに恐ろしげな高温マットを感知した時の背中のゾクゾク感は? Cエレ君はそれらの感情を持つ必然性はあるのであろうか? これは報酬系について探求を行っている私たち(私、だけか?)にとって極めて本質的な問題なのだ。
ここで電源マットに遭遇した瞬間にCエレのチップ内で起きることをもう一度見てみよう。そのマットが意外に蓄電量が多く、Cエレ君はコーフンする。先ほどその存在に気が付いたときに査定した力価+2は、実質は+3だったことがわかった。そこでネットワークが改編されて、次回それが検出された時、それに向かってさらに力強い尻尾のひと振りが生じるだろう。ということは喜びとは結局「尻尾のさらなる一振りを引き起こす体験」と単純化できないだろうか? 
言い直そう。電源マットから充電されている最中の喜びとは、結局後にその電源マットが遠くに検出された時に、そちらに向かって尾のもうひと振りを起こすような体験。もし現在電源マットをむさぼっている最中なら尻尾は振られてはならないだろう。今は大事な時間だし、その場を動くわけにはいかない。すると将来の充電を予測した場合との違いは尻尾の一振りが今生じるかどうか、ということだけ。
こんどは不快のことを考えよう。今高温マットに焼かれているかわいそうなCエレ君を想像しよう。彼は尻尾の反対方向への一振りは、今起こさなくてはならない。このままとどまっていると焼き殺されてしまう。そしてもしそれを遠くから察知した場合も、力価-3くらいを検出してやはり反対方向に力強い尻尾のひと振りが生じるだろう。すると電源を貪っている瞬間、焼かれている瞬間の決定的な違いがあることがわかる。前者はそこにそのまま留まる。(きっと恍惚とした表情を浮かべている、などど外部からは想像されるだろう。アヘンの巣窟でアヘンを吸っている人は恍惚としてみしろぎ一つしないそうだ。)この種の「静的な」快感とはそこを離れないように、と動きを止めるのである。それに比べて後者はそこから逃げ出す。そこに決定的な違いがあるのだ。しかしここに感情の存在を必然と考えるべきだろうか?
 結論から言おう。快感とはその場を動かずにその体験を維持しようとする動きを促す。(それも動きだ。抑制系の運動が常に起きていることになる。)その快感の源が察知された時にはそこへの志向性(そちらに向かっての尻尾のひと振り)を促す。不快とは、それを回避し、その源が察知されたときは、そこからの逃避傾向(逆方向の尻尾のひと振り)を生み出すような体験。以上、終わり。快感、苦痛は幻であり、主観的体験であり、実体はない。
 おかしいだろうか?この痛みや心地よさが幻だなんて。しかしこれはようするに「クオリア問題」なので、結論が出せないことはもうわかっている。
(というかクオリア論争には容易に結論が出せないことを大多数の人が認識している。) 快、苦痛とは実はそういうものである。「夕日の赤い色」の、あの「赤い」体験と、結局は一緒に論じざるを得ないのだ。
 それは脳内のネットワークの興奮のある種のパターンである。でもそれ以上でも以下でもないのだ。


2016年6月15日水曜日

装置 ④

いや、と考え直す。それほど報酬系の複雑ではないのではないか?記憶といったって複雑なプログラムではなく、案外単純ではないか。要は深層構造、hidden layer を持ったニューラルネットワークがあればいいだけの話だ。最近グーグルの「アルファー碁」が、韓国のプロ棋士イ・セドルに圧倒的な勝利を見せたが、実は深層構造に囲碁のルールを教え込んだわけではなかった。対戦をいくつも経験させてネットワークの結合の度合い(パラメータ)が変化して行った結果、あれだけ強くなったのである。
Cエレ君はコンピューターに比べて用いるネットワークは少ない。だからとても囲碁をプロ並みに打てるようにはならない。でも過去の電源マットとのおいしい体験、高温マットとの遭遇による痛い体験を多少ではあれ「記憶」する力はある。そしてある瞬間にCエレ君は周囲を見渡して検知する複数のマットからの「力価」を把握し、比較する事が出来るようになるのだ。
 私が書いていることが全く意味不明と思われると心外なので、例を出す。Cエレは、5メートル先に紺色の小ぶりの電源マットを見る。「おいしそう!」という3+の力価がはじき出されるとしよう。実は最近までこの色のマットには2+の査定であったが、先日「食べた」ところ、意外にエネルギーが豊富で、紺色とは「熟れ具合」を示していることが分かった。だからこれを見た時はいつにもまして強く尾を振ってそちらに近付こうとした。しかしCエレ君は同時に、すぐ右前方に、こちらにゆっくり進んでくる淡いピンクのマットを発見したのだ。これにも遭遇したことがある。ピンクだから少し熱い、くらいで多少のダメージに過ぎなかった。あのスピードだと自分が紺色のマットに到達するまでには追い付かないだろう。とすると1-くらいか。合計でプラス2なのでCエレ君は紺色のマットに向かって前進を開始するのだ。その時Cエレのチップの中身を覗くと、紺色のマットを過去に捕まえ、おいしくいただいた時に、紺色に反応するネットワークのパラメータのノッチが上がっていることがわかる。このために紺色のマットに対してより良い力価が与えられるようになっていたのだ。

さてこの思考実験は報酬系(もうそう呼んでしまおうか?)一つの重要な性質を示唆している。過去に紺色マットに意外と多くの電気が蓄電されていた時の「おいしい!」という体験が紺色マットに反応する一群のネットワークのパラメータの数値を上げていたことと、今回遠くから同じような紺色マットを検出した時の力価は対応している。過去の報酬の大きさが現在の報酬の予知に対応している。Cエレは過去の紺色マットを検出した時の体験(その時査定した力価を1+としよう)から変化を起こしている。同じような紺色マットを検出すると「2+」と査定する。それは紛れもなく紺色マットを実際に「おいしく頂いた」という体験に基づく。そのときCエレ君はショックを受けたはずだ。「あれ、1+と思っていたのに、もっとおいしい!」ここでパラメータのノッチが上がってるわけだ。うまくできている!