>> 自然の科学 >  >> 生き物

現在を理解するために、脳は未来を予測するかもしれない


先月、人工知能企業の DeepMind は、仮想の部屋でいくつかのオブジェクトの単一の画像を撮影し、人間の指示なしに、まったく新しい視点から 3 次元シーンがどのように見えるかを推測できる新しいソフトウェアを発表しました。 Generative Query Network (GQN) と呼ばれるこのシステムは、そのような画像がほんの一握りあれば、単純なビデオ ゲーム スタイルの迷路のレイアウトをうまくモデル化できます。

GQN には明らかな技術的応用がありますが、タスクの実行方法を学習するために使用するトレーニング アルゴリズムに特に関心を持っている神経科学者の目に留まりました。提示された画像から、GQN はシーンがどのように見えるべきかについての予測を生成します — オブジェクトをどこに配置すべきか、影が表面に対してどのように落ちるか、特定の視点に基づいてどの領域を表示または非表示にする必要があるか、およびそれらの予測とその予測の違いを使用します。将来の予測の精度を向上させるための実際の観測。 「モデルの更新を可能にしたのは、現実と予測の違いでした」と、プロジェクトのリーダーの 1 人であるアリ エスラミは言いました。

Eslami の共著者であり、DeepMind の同僚である Danilo Rezende によると、「アルゴリズムは、次回同じ状況に遭遇したときにあまり驚かないように [予測] モデルのパラメーターを変更します。」

神経科学者は長い間、同様のメカニズムが脳の働きを動かしていると考えてきました。 (実際、これらの憶測は、GQN チームがこのアプローチを追求するきっかけとなったものの一部です。) この「予測コーディング」理論によれば、認知プロセスの各レベルで、脳はどのような情報であるべきかについてモデルまたは信念を生成します。その下のレベルから受信します。これらの信念は、特定の状況で何を経験する必要があるかについての予測に変換され、そこにあるものについての最良の説明を提供して、経験が意味をなすようにします.その後、予測はフィードバックとして脳の下位レベルの感覚領域に送信されます。脳は、その予測を受け取った実際の感覚入力と比較し、内部モデルを使用して不一致の可能性のある原因を特定することで、違いや予測エラーを「説明」します。 (たとえば、テーブルの内部モデルが 4 本の脚で支えられた平らな面であるとしますが、オブジェクトの半分が視界から遮られていても、オブジェクトをテーブルとして識別することができます。)

説明できない予測エラーは、より高いレベルへの接続を介して (フィードバックではなく「フィードフォワード」信号として) 渡され、そこでニュース価値があると見なされ、システムが注意を払い、それに応じて対処する必要があります。 「ゲームは現在、内部モデル、つまり脳のダイナミクスを調整して、予測エラーを抑制しようとしています」と、著名な神経科学者で予測コーディング仮説のパイオニアの 1 人であるユニバーシティ カレッジ ロンドンの Karl Friston 氏は述べています。

過去 10 年間、認知科学者、哲学者、心理学者は、特に知覚がどのように機能するかを説明するための説得力のあるアイデアとして、また脳全体が何をしているかについてのより野心的で包括的な理論として、予測コーディングを取り上げてきました。実験ツールにより、仮説の特定のメカニズムを直接テストすることが可能になったのはつい最近のことであり、過去 2 年間に発表されたいくつかの論文は、この理論の顕著な証拠を提供しています。それでも、いくつかの画期的な結果が再現可能であったかどうかについての最近の議論によっておそらく最もよく証明されているように、それは物議をかもしています.

コーヒー、クリーム、犬

「私はクリーム入りのコーヒーと____を飲みます。」空白を「砂糖」で埋めるのは当然のことのようです。これは、カリフォルニア大学サンディエゴ校の認知科学者であるマルタ クタスとスティーブン ヒルヤードが 1980 年に頼っていた本能であり、彼らは一連の実験を行い、画面上で一度に 1 語ずつ文章を人々に提示しました。脳の活動を記録しました。ただ、「シュガー」で終わる代わりに、最後の言葉が飛び出すと、次の文が読み上げられました。 .」

研究者は、被験者が予期しない単語「犬」に出くわしたとき、より大きな脳反応を観察しました。これは、「N400 効果」として知られる特定の電気的活動パターンによって特徴付けられ、単語が明らかにされてから約 400 ミリ秒後にピークに達しました。しかし、それをどのように解釈するかは不明のままでした。単語の意味が文の文脈で無意味だったために脳が反応したのでしょうか?それとも、言葉が単に予期せぬものであり、何を期待するかについて脳が行った予測に違反していたために反応していたのでしょうか?

2005 年、クタスと彼女のチームは、後者の可能性を指摘する別の研究を実施しました。参加者は再び画面に表示される文章を 1 語ずつ読むように求められました。 「a kite」が文を締めくくる可能性が最も高いと思われたため、被験者は次に「a」が表示されることを期待しました。この単語には本質的な意味はありませんが、その後に続く単語を予測していました。参加者が代わりに(「飛行機」のように)「an」を見たとき、彼らは N400 効果を経験しました。これは、脳が期待と現実の間の不一致を処理しなければならなかったためと思われます。この効果は、単語の意味や、提示された刺激自体を処理する際の困難とは明らかに無関係でした.

2005 年の調査結果は、予測コーディング フレームワークにぴったりのように思えました。しかし、この 4 月、eLife に掲載された論文が は、いくつかのラボが結果を再現できなかったと報告しています。現在、他の研究者が反応し始めており、複製方法の微妙な点が依然として予測ベースの解釈を支持していると主張する人もいます.

このやり取りは、予測コーディングを取り巻く多くの議論を反映しています。 Kutas のような実験は、多くの解釈の対象となります。それらは予測コーディング以外のモデルで説明できますが、実際のメカニズムを掘り下げていないため、仮説の決定的な証拠にはなりません。脳が常に推論を行っている (そしてそれらを現実と比較している) という考えは、現時点ではかなり確立されていますが、予測コーディングの支持者は、ストーリーの特定のバージョンが正しいものであることを証明する方法を模索してきました。それはすべての認識にまで及びます。

ベイジアン ブレインと効率的なコンピューティング

脳が絶え間なく進行中の経験に関する独自の予測を作成および評価するという基本的な洞察は、常に当然のこととは見なされていませんでした。 20 世紀を支配した神経科学の見解は、脳の機能を特徴検出器の機能として特徴づけました。脳は刺激の存在を記録し、それを処理し、信号を送信して行動反応を生成します。特定の細胞の活動は、物理世界における刺激の有無を反映しています。たとえば、視覚野の一部のニューロンは、視野内のオブジェクトのエッジに反応します。他のものは、オブジェクトの向き、色、または陰影を示すために発火します。

しかし、そのプロセスは思ったほど簡単ではありませんでした。さらなるテストでは、脳が線を認識すると、線が消えていなくても、線の検出ニューロンの発火が停止することがわかりました。そして、非常に多くの情報が謎のトップダウン フィードバック接続を通じて伝達されているように見えるという事実は、何か別のことが起こっていることを示唆していました.

そこで、従来のモデルをひっくり返す 1860 年代にルーツを持つ一般的なフレームワークである「ベイズ脳」が登場します。この理論は、脳が内部モデルに基づいて世界について確率論的推論を行い、本質的に、それが認識しているものをどのように解釈するかについて「最良の推測」を計算することを提案しています (イベントベースの確率を定量化するベイジアン統計の規則に沿って)以前の経験から収集した関連情報に基づく)。感覚情報が認知を促進するのを待つのではなく、脳は常に世界がどのように機能するかについて積極的に仮説を立て、それらを使用して経験を説明し、不足しているデータを埋めています.そのため、一部の専門家によると、私たちは知覚を「制御された幻覚」と考えるかもしれません。

同様に、ベイジアン脳は錯視が機能する理由も説明しています。たとえば、画面上で 2 つの点が交互に高速で点滅していると、1 つの点が前後に動いているように見えるため、私たちの脳は無意識のうちにそれらを 1 つの物体のように扱い始めます。オブジェクトがどのように動くかを理解することは、より高度なタイプの知識ですが、基本的に私たちが知覚する方法に影響を与えます.脳は情報 (この場合は動きに関するもの) のギャップを埋めて、完全に正確ではない絵を描くだけです。



しかし、生成モデルと期待が脳機能で果たしている明確な役割にもかかわらず、科学者は、それが神経回路のレベルでどのように実装されているかを正確に特定する必要があります. 「ベイジアンの脳の話は、根底にあるメカニズムが何であるかについて比較的不可知です」と、スコットランドのエジンバラ大学の心の哲学の教授であるマーク・スプリーヴァクは言いました.

脳がどのようにベイジアンになり得るかの特定の定式化を提供する予測コーディング理論を入力してください。予測コーディングの名前は、通信信号をより効率的に送信するための技術に由来しています。ビデオ ファイルには、フレームごとに多くの冗長性が含まれているため、データを圧縮するときにすべての画像のすべてのピクセルをエンコードするのは効率的ではありません。代わりに、隣接するフレーム間の違いをエンコードし、逆方向に作業してビデオ全体を解釈する方が理にかなっています.

1982 年、科学者たちは、このアイデアが神経科学にうまく応用できることを発見しました。これは、網膜のニューロンが視覚刺激に関する情報をどのようにエンコードし、それを視神経に沿って伝達するかを説明しているように見えるからです。また、脳の報酬システムがどのように機能するかの原則としても確固たるものになっています。ドーパミンニューロンは、期待される報酬と実際に受け取った報酬との間のミスマッチの大きさをエンコードします。研究者によると、これらの予測エラーは、動物が将来の期待を更新し、意思決定を促進するのに役立ちます.

しかし、これらの例にもかかわらず、科学者はほとんどの場合、予測コーディングを特定のネットワークに固有のプロセスと見なしていました。機能的磁気共鳴画像検査やその他の種類の実験は、それを変え始めています.

ユニバーサル フレームワーク

予測コーディングの仮説を非常に説得力のあるものにしている理由の 1 つは、その信じられないほどの説明力です。エジンバラ大学の論理学と形而上学の教授であり、理論の専門家であるアンディ・クラークは、次のように述べています。

まず、単一の計算プロセスの下で知覚と運動制御を統合します。この 2 つは、本質的に同じコインの反対側です。いずれの場合も、脳は予測エラーを最小限に抑えますが、その方法は異なります。知覚では、調整されるのは内部モデルです。モーター制御では、それは実際の環境です。 (後者の場合、手を上げたいと想像してください。手がまだ上げられていない場合、その不一致により大きな予測エラーが発生します。これは、手を動かすだけで最小限に抑えることができます。)

知覚と運動制御の実験は、これまでのところ、予測コーディング理論の最も強力な証拠を提供してきました。先月 Journal of Neuroscience に掲載された論文で たとえば、実験者は、被験者に画面上の「kick」という単語を読んでもらい、大きなささやき声のように聞こえる「pick」という単語の歪んだ録音を聞いてもらいました。多くの人は代わりに「キック」を聞いた.fMRIスキャンは、脳が最初の「k」または「p」の音を最も強く表していることを明らかにした.音は予測エラーと相関していた.脳が単にその知覚経験を表しているのであれば、最強の信号は代わりに「イケる」に対応していたはずです (それは画面と音声の両方で表されていたからです)。

しかし、予測コーディングの関連性を知覚や運動を超えて広げ、脳内で起こっているすべての共通通貨として確立するための取り組みも進行中です。 「それは、さまざまな戦略を構築できる構成要素を持っているようなものです」とクラークは言いました。異なる脳領域は、異なる種類の予測を交換するだけです。

特にフリストンは、これが注意や意思決定を含む高次の認知プロセスに当てはまると主張しています。前頭前皮質に関する最近の計算研究は、作業記憶と目標指向行動における予測コーディングに関与しています。一部の研究者は、感情と気分は予測コーディング用語で定式化できると理論付けています。感情は、体温、心拍数、血圧などの内部信号に関する予測誤差を最小限に抑えるために脳が表す状態である可能性があります。たとえば、脳が動揺していることを認識した場合、それらすべての要因が上昇していることを認識します。おそらくそれが、自我という概念が生まれる方法でもあるのでしょう。

この流れで行われている研究のほとんどは、予測コーディングが神経精神障害および発達障害をどのように説明できるかに焦点を当てています。 「その考えは、脳が統計の器官である推論マシンである場合、それがうまくいかない場合、統計学者が犯すのと同じ種類の間違いを犯すということです。」つまり、予測または予測エラーのいずれかを強調しすぎたり、強調しすぎたりして、誤った推論を行うことになります。

たとえば、自閉症の特徴は、脳の処理階層の最下位レベルにある感覚信号に関連する予測エラーを無視できないことです。それは、感覚への没頭、繰り返しと予測可能性の必要性、特定の幻想への感受性、およびその他の影響につながる可能性があります.統合失調症のような幻覚に関連する状態では、逆のことが当てはまる可能性があります。脳は、何が起こっているかについての独自の予測に注意を払いすぎて、それらの予測と矛盾する感覚情報に十分な注意を払わない可能性があります. (ただし、専門家は、自閉症と統合失調症は複雑すぎて、単一の説明やメカニズムに還元できないとすぐに警告しています。)

イェール大学医学部の臨床神経科学者であるフィリップ・コーレットは、「その最も重要な部分は、私たちの精神機能がいかに脆弱であるかを示していることです.コーレットの研究室での実験は、健康な被験者に、以前に経験した刺激を幻覚させるように促す新しい「信念」を設定しました。 (たとえば、ある実験では、科学者は参加者に音を視覚パターンと関連付けるように調整しました。被験者は、音がまったくない場合でも、パターンを見たときに音を聞き続けました。)研究者は解明しようとしています.それらの信念がどのように知覚に変換されるか。これらの研究を通じて、「知覚と認知がそれほど分離されていないことを示唆する証拠が得られました」とコーレットは言いました。 「新しい信念は教えられ、あなたが知覚するものを変えることができます。」

しかし、その証拠は証拠を提供するほどのものではありませんでした — 今まで.

見栄えを良くするためにズームインする

「実験的な研究では、特定の結果が予測処理と互換性があることが示されることがよくありますが、それがその結果の最良の説明であるとは限りません」と Sprevak 氏は述べています。この理論は認知科学では広く受け入れられていますが、「システム神経科学の分野では、まだ少し劣勢です」と、スイスのフリードリッヒ・ミーシャー生物医学研究所の神経科学者であるゲオルク・ケラーは述べています。彼の研究室は、より確固たる証拠でこれを変えようとしています.

昨年 Neuron に掲載された研究では 、ケラーと彼の同僚は、時間の経過とともに予測可能になったマウスの視覚系のニューロンの出現を観察しました。それは、彼らがビデオゲームでマウスを訓練しようとしたときの事故から始まりましたが、仮想世界の方向が混乱していることに気づきました.通常、そして実験時までは、マウスは左を向くたびに視野が右に移動するのを見ており、その逆も同様でした.しかし、研究者が研究で使用した仮想世界を何者かが意図せずに反転させて左右を反転させたため、左に回転するとマウスも左方向に視覚を経験したことになります。研究者たちは、この事故を利用できることに気づきました。彼らは、この視覚的な流れを表す脳信号を監視し、マウスが反転環境のルールを学習するにつれて、信号がゆっくりと変化することを発見しました。 「シグナルは、左側への視覚的な流れの予測のように見えました」とケラーは言いました.

信号が単にマウスの視覚体験の感覚的表現であった場合、それらは仮想世界ですぐに反転したでしょう.それらがモーター信号であった場合、それらはまったく反転しなかったでしょう.代わりに、「それは予測を特定することです」とケラーは言いました。 「動きが与えられたときの視覚的な流れの予測。」

「この研究は、以前には存在しなかった一種の証拠を提供します」とクラークは言いました。 「何が起こっているのかに最適なモデルが予測コーディングであることを示す、非常にローカルな、セルごと、レイヤーごとのデモンストレーションです。」

マカクザルが顔を処理するために使用する脳の部分での同様の発見がほぼ同時に報告されました.以前の研究では、ネットワークの下位レベルにあるニューロンが、顔の向きに基づく側面をコードしていることをすでに示していました。より高いレベルでは、ニューロンは顔の位置ではなくアイデンティティに注意を払うことにより、顔をより抽象的に表現します。マカクの研究では、研究者は、最初に現れた顔が常に次の顔について何かを予測する顔のペアでサルを訓練しました。その後、実験者は、同じ顔を別の角度から見せたり、まったく別の顔を見せたりするなど、特定の方法でこれらの期待を妨害しました。彼らは、顔処理ネットワークの下位レベルの領域で予測エラーを発見しましたが、これらのエラーは向きに関する予測ではなく、アイデンティティに関する予測に関連していました。つまり、エラーはシステムの上位レベルで起こっていたことから生じたものです。これは、下位レベルが、入ってくる認識を上位レベルからの予測と比較することによってエラー信号を構築することを示唆しています。

「そのシステムで予測エラーを見つけ、予測の特定の内容を見つけることは刺激的でした」と、論文の筆頭著者でドイツの欧州神経科学研究所ゲッティンゲンの神経科学者 Caspar Schwiedrzik は述べています。

ドイツのフランクフルトにあるマックス プランク経験美学研究所の研究者であるルシア メローニによると、彼女のグループは、現在人間から収集されているニューロン データの予測誤差の説明と一致する結果を見始めています。

より多くの予測マシンを見つける競争

脳内の予測コーディングの主張が強まっていることに誰もが同意するわけではありません。一部の科学者は、理論が認知の特定の側面を説明できることを認めていますが、それがすべてを説明できるという考えを拒否しています.他の人はそれほど認めません。ニューヨーク大学の心理学教授であるデビッド・ヒーガーにとって、情報を効率的に伝達することに関する「予測コーディング」と、時間の経過とともに予測を行うことと彼が定義する「予測処理」を区別することが重要です。 「これらはすべて同じスープの一部であると想定されているため、文献には多くの混乱があります」と彼は言いました. 「必ずしもそうであるとは限りませんし、研究を進める上で必ずしも最善の方法であるとは限りません。」たとえば、他のタイプのベイジアン モデルは、特定の状況下での脳機能のより正確な説明を提供する可能性があります。

しかし、この分野の多くの専門家が同意しているのは、この研究が機械学習におけるエキサイティングなアプリケーションの可能性を秘めているということです.現在、人工知能研究の大部分は予測コーディングを含まず、代わりに他の種類のアルゴリズムに焦点を当てています.

しかし、深層学習のコンテキストで予測コーディング アーキテクチャを定式化することで、機械を知性に近づけることができるとフリストンは主張します。

DeepMind の GQN は、その可能性を示す良い例です。そして昨年、サセックス大学の研究者は、予測コーディング機能を含む仮想現実と人工知能技術を使用して、幻覚剤によって通常引き起こされる幻覚状態の変化を模倣できるツールである「幻覚マシン」を作成しました。 .

機械学習の進歩を利用して、予測コーディング モデルのパフォーマンスを他の手法と比較することで、脳内で何が起こっているかについての新しい洞察を得ることができます。少なくとも、予測コーディングを人工システムに導入することで、それらのマシンの知能を大幅に向上させることができます.

しかし、それが実現する前に、多くの作業が待ち構えています。科学者は、たとえば脳の内部表現がどこにあるのかを特定するために、ケラー、シュヴィードルジクなどによって行われている種類の研究を継続する必要があります。そして、同様の実験が高次認知プロセスにおける予測コーディングの主張を立証できるかどうかはまだ分からない.

予測コーディングは、「進化が生物学にとって重要であるのと同じくらい神経科学にとって重要です」と、理論に関する広範な研究を行ってきたグラスゴー大学の神経生理学者であるラース・マックリは述べています。しかし今のところ、Sprevak 氏は、「陪審はまだ出ていない」と述べています。



  1. 眼球の色が違うのはなぜ?
  2. メガスポロフィルとマイクロスポロフィルの違いは何ですか
  3. 腹腔内と後腹膜の違いは何ですか
  4. アオウミガメはどのくらいの深さまで潜ることができますか?
  5. コドンとアンチコドンの違い
  6. なぜ春に木を植えるのですか?