大脳基底核による行動学習、環境変化時に望ましくない行動を避ける仕組みは?
玉川大学は11月1日、大脳基底核回路の新たな機能を発見したと発表した。この研究は、同大脳科学研究所、東京科学大学、福島県立医科大学、京都大学の共同研究グループによるもの。研究成果は、「Science Advances」にオンライン掲載されている。

画像はリリースより
(詳細は▼関連リンクからご確認ください)
ヒトや動物の行動は、満足できる結果につながった行動を再び試み、不快感を伴った行動を避ける効果の法則や、強化学習理論の報酬最大化でよく説明される。脳の神経活動の記録、活動操作、計算モデルなど幅広い研究によって、こうした行動の学習には脳の奥深くにある大脳基底核の神経回路が深く関わることが裏付けられている。特に、大脳基底核の主要な回路を構成する直接路は望ましい行動の強化に、間接路は望ましくない行動を避けることに寄与することが知られている。また、行動と結果の経験により、直接路と間接路が共同して得られる結果、つまり報酬を最大化する行動を獲得することが知られている。
報酬最大化によって獲得された行動は、安定した環境ではおおむね望ましい結果が得られ、習慣化していく。しかし環境が変わった際には、習慣化した行動が新たな試行錯誤を妨げるという難点がある。これは従来から認識されているが、脳がどのような仕組みで解決しているのか不明だった。
行動結果が報酬なしに終わった合図の音により、間接路の細胞が活動を上げることを確認
研究では、不確実な状況で試行錯誤によって望ましい結果を得るための行動を学習する行動課題をラットに訓練した。ラットは頭部を固定した状態で前肢を使ってハンドルを押すまたは引く行動を選ぶ。押すか引くかで報酬として水が与えられる確率が異なる(80~20%または70~10%)。どちらが高確率なのかを数十試行でラットにわからないように切り替える。したがって、ラットは予期せぬ切替に適応して試行錯誤の上、押し引きのどちらを選択するかを変化させなければならない。訓練の結果、切替から20~30回の試行錯誤を経て、報酬確率が高い方の選択肢を8割以上選べるようになった。
この行動課題中に、間接路を担う基底核線条体の神経細胞特異的に遺伝子を発現した遺伝子組換えラットを用いて、神経活動を記録した。すると、まず行動の結果が報酬なしに終わったことを合図する音によって、間接路の細胞が活動を上げることを確認した。これは、間接路が望ましくない行動を避けることに寄与する知見と整合するものだった。
あえて低価値の行動を選択した際は、結果の合図終了後も顕著で持続的な活動を観測
ところが、あえて低価値の行動を選択したときには、行動の結果を知らせる合図が終わった後も顕著で持続的な活動が観測された。また、合図の結果すぐに次の試行に行くときより、しばらく待っているときの方が顕著だった。これは、次の試行に行く前に今回の試した結果を熟慮しているかのような行動ではないかと推測された。
間接路の持続活動と、低価値行動の試行継続との関連を発見
この持続活動がどのような機能を担うのかを調べるために、強化学習モデルで直近の結果を反映した低価値行動の相対価値を推定し、持続活動との相関を調べた。その結果、相対価値を良く反映することがわかった。つまり、これまで選択してきた高価値なはずの行動の相対的価値の低下を検出して、低価値行動を試したときに、持続活動していることが判明した。
これは低価値行動を試して結果が出なかった(無報酬)ときに現れた神経活動だ。その後の行動選択にどのような影響を及ぼしているか調べると、持続活動の大きさが、その後の数試行で低価値行動を模索し続ける程度に反映されていることがわかった。直近の結果を反映した相対価値と、その後の数試行の行動は、神経活動とは無関係に関係し得るため、直接の相関を取り除いた偏相関解析をした結果、間接路の持続活動が、この両者を媒介していることがわかった。
光照射による間接路制御でも模索行動との関連示す
しかし、研究グループは神経細胞活動と行動との対応関係は、他の脳の回路システムの影響で観測されているだけかもしれないと考えた。そこで、本当に因果的に関わっているのかを調べるため、間接路細胞の活動を制御できる光受容型タンパク質を発現させて、光照射によって、活動を刺激したり抑制したりした。
その結果、刺激すると、刺激しないときに比べて低価値行動を模索し続ける程度が増大し、抑制すると減少した。またこの神経活動操作が、2~3試行後までの選択に影響を与えることがわかった。
大脳基底核の回路や計算モデル研究が精神・神経疾患の治療法開発につながることに期待
これまで、大脳基底核の間接路は、結果が出なかった行動を抑制する機能を果たすことが知られていた。研究グループも行動結果の合図直後の間接路活動に関して、これと整合することを確認した。これに加えて、望ましいはずの行動で結果が出ないときに代替の行動を試し、その結果が出なくても代替案を模索し続ける機能に、大脳基底核の間接路が関わっていることを実証した。これについて研究グループは、直前の結果だけでなく、長い目で見た評価を反映させて、直前の結果を反映する報酬最大化システムを加速する機能ではないかと考えているとした。
今回新たに見出された基底核の回路機能が、従来の一般的理解や計算モデルとどのように協調、競合して大脳基底核の統合機能を実現するかを解明する必要がある。そのためには間接路とともに直接路の関与、回路全体を駆動する大脳皮質線条体系、黒質線条体系の役割の理解が必須だ。
「私たちの予備的な研究でも知見を得ているが、現在多くの研究によって大脳基底核システムの新しい知見が次々と蓄積されており、意思決定、判断や行動選択のメカニズムの理解が加速している。また、強迫性障害にみられる大脳皮質線条体投射の異常や統合失調症で認められる間接路細胞(D2受容体含有)の動作障害が検証されたように、大脳基底核の回路機能研究と計算モデル研究がさらに発展し、精神・神経疾患の病因と病態解明、やがて治療法の開発につながると期待される」と、研究グループは述べている。
▼関連リンク
・玉川大学脳科学研究所 ニュース&イベント


