>> 自然の科学 >  >> 生き物

脳は音声を他の音と並行して処理する


私たちのほとんどにとって、聞くことはとても簡単なことなので、脳の聴覚系が処理して解きほぐすために必要な情報量を理解することはしばしば困難です.入ってくる音を、友人の声、犬の鳴き声、雨の音など、私たちが知覚する音響オブジェクトに変換する必要があります。バックグラウンドノイズから関連する音を抽出する必要があります。 2 人の異なる人によって話された単語が同じ言語的意味を持っていることを判断する必要があります。また、それらの声を区別し、ピッチ、トーン、およびその他の品質を評価する必要もあります。

ニューラル処理の従来のモデルによると、私たちが音を聞くと、聴覚系はそれらから単純な特徴を抽出し、それらが組み合わされて、ますます複雑で抽象的な表現になります。このプロセスにより、脳は誰かが話している音を、たとえば音素、音節、そして最終的に単語に変換することができます。

しかし、Cell に掲載された論文では 8 月には、研究者チームがそのモデルに異議を唱え、代わりに、聴覚系はしばしば音と会話を同時に並行して処理することを報告しました。この発見は、脳が発話の意味を理解する方法が科学者の予想とは劇的に異なることを示唆しており、耳からの信号は驚くほど処理の早い段階で異なる脳経路に分岐し、時には重要なステップであると考えられている脳領域を迂回することさえあります。複雑な音の表現を構築する石。

この研究は、脳が聴覚刺激の重なり合う流れをいかに迅速かつ効果的に解くことができるかについての新しい説明のヒントを提供します。しかし、この発見は、音声処理に関するより確立された理論に疑問を投げかけるだけではありません。また、聴覚系全体がどのように機能するかについてのアイデアにも挑戦します。私たちの音の知覚に関する一般的な知識の多くは、視覚系で実行される計算について私たちが知っていることとの類似性に基づいています。しかし、発話に関する最近の研究を含め、増え続ける証拠は、聴覚処理が非常に異なって機能することを示唆しています。そのため、科学者は、聴覚系のさまざまな部分が何をしているのか、そしてそれが豊かなサウンドスケープをどのように解読するのかについて再考し始めています.

ハーバード大学の認知神経科学者で、この研究には関与していないダナ・ボービンガーは、「この研究は記念碑的な仕事です。彼女は、脳が複雑な聴覚情報をどのように処理するかについての従来の理論を放棄する準備ができていませんが、「実際には何が起こっているのかについてあまり良い考えを持っていない可能性がある」ことを示唆しているため、結果は「挑発的」であると考えています.

階層をひっくり返す

私たちが音を知覚する最初の段階は、よく理解されています。誰かが話しているのを聞くと、耳の中の蝸牛が複雑な音をさまざまな成分周波数に分離し、その表現をいくつかの処理段階を経て聴覚皮質に送ります。まず、これらの信号から、空間内の音の位置、ピッチ、変化の程度に関する情報が抽​​出されます。次に何が起こるかを特定するのはより困難です。高次皮質領域は、音素から韻律まで、音声に特に関連する機能を階層的なシーケンスで引き出していると考えられています。音楽など、他の複雑な種類の音の特徴も同様に処理されます。

この配置は、視覚系の仕組みのモデルを反映しています。網膜の細胞に当たる光のパターンを最初に線とエッジとして解釈し、次により複雑な特徴とパターンとして解釈し、最終的に顔やオブジェクトの表現を構築します.

しかし、聴覚情報の流れの詳細を分析することは困難でした。発話は人間特有の特性であるため、動物を使って発話の研究を進めることはできません。また、人間の場合、ほとんどの研究では間接的な方法を使用して脳の活動を測定する必要があります。侵襲的であるため、直接記録を取得することははるかに困難です。科学者は、医療処置に便乗して、てんかんの手術を受ける患者の脳に埋め込まれた電極からデータを収集する必要があります。しかし、関心のある聴覚領域の多くは、前頭葉と側頭葉の間の脳の奥深くに位置しています。この領域は、通常、外科医が録音を求めることはありません。

それでも、これらの直接的および間接的な研究の多くは、聴覚および音声処理の伝統的な階層モデルの証拠を発見しました。プロセスの初期段階の停止の 1 つである一次聴覚皮質は、周波数などの音の単純な特徴をエンコードするように調整されているようです。 .信号が一次聴覚皮質から遠ざかるにつれて、他の脳領域は、音素などの音声に固有の機能を含む、ますます複雑になる音の機能に反応するようです.

しかし、科学者たちは、「これらの領域がどのように接続されているかを必ずしも調べていない実験に基づいて」この階層的なフレームワークを推測した.>

そこで 2014 年、彼女は聴覚皮質全体の発話音表現のより包括的なマップの作成に着手し、さまざまな脳領域で音からどのような情報が抽出され、その情報がどのように 1 つの領域から別の領域に統合されるかを調べました。

彼女は、最初はカリフォルニア大学サンフランシスコ校の脳神経外科医であるエドワード・チャンの研究室でポスドク研究員として、次にオースティンの彼女自身の研究室で、その質問を探求するまれな機会を得ました. Chang、Hamilton とその同僚は、治療のためにさまざまな聴覚部位に電極グリッドを配置する必要があった数人の患者を集めることができました。



これらの領域を監視する機会は非常に難しいため、彼らの記録は「非常に貴重なデータであり、刺激的でした」と Boebinger 氏は述べています。研究者は、脳が一次聴覚皮質の低レベルの音の表現を、階層のさらに上の領域である上側頭回のより複雑な音声の表現に変換する方法について詳細を記入できることを望んでいました.

代わりに、彼らが見つけたものは「アイデアをひっくり返したようなものでした」とハミルトンは言いました.

早期に分岐する経路

物事が予想通りに進んでいないという最初のヒントはすぐに届きました。チャンのグループは、純音と話された言葉と文の特徴に対する多様な聴覚領域の反応を分析しました。以前の調査結果を確認し、欠けていた地図の詳細を埋めることができました。

しかし、彼らは奇妙なことも観察しました。彼らが考えたように、情報が「下位」から「上位」の領域に階層的に流れる場合、一次聴覚皮質は上側頭回よりも先に入力に応答するはずです。しかし、上側頭回の一部の領域は、一次聴覚皮質が周波数などの単純な音の特徴に反応するのと同じくらい速く発話の開始に反応するように見えました.

この観察は、2 つの脳領域が同じ入力の異なる側面を並行して処理しており、「発話知覚のためのこの並行経路は、すべての情報が想定されている場所である一次聴覚皮質を迂回できる」という、興味をそそる仮説を引き起こしました。行きなさい」とハミルトンは言った。これは、一次聴覚皮質で抽出された低レベルの特徴から音声の表現を構築する必要がないことを意味します。 「階層モデルでは、一次聴覚野は、大脳皮質の発話領域に到達する前に通過しなければならない最初の中継点であると予想されます」とハミルトンは言いました。しかし、彼女の結果は、それが必ずしも真実ではないことを示唆しています.

チャン、ハミルトン、および彼らの同僚は、そのアイデアをさらにテストすることにしました。彼らが患者の一次聴覚皮質を刺激してその機能を混乱させたとき、患者はまだ会話を知覚することに何の問題もありませんでした.代わりに、彼らは幻聴を報告しました:彼らが聞いていた言葉や文章の上に、ブーンという音やタッピングから流水や砂利の移動に至るまでの音.

研究者が上側頭回の部分領域を刺激すると、逆のことがわかりました。患者は言葉を理解できませんでしたが、音は正常に聞こえたようです。 「あなたが話しているのは聞こえましたが、言葉がわかりませんでした」とある被験者は報告しました。

繰り返しますが、「まるで 2 つの別個のプロセスがあるようでした」とハミルトンは言いました。音を処理するための独立した経路と、音声に関連すると思われる高レベルの機能です。

聴覚皮質で並列処理が見られることはまったく驚くべきことではありません。ユニバーシティ カレッジ ロンドンの神経科学者であるソフィー スコットは、次のように述べています。研究に参加しなかった人。 「しかし、それが最も簡単でクリーンな方法でなければならないと、誰も自然に言いませんでした。」

ある時点で、別々の脳回路が異なる種類の聴覚情報を同時に処理しなければならないことは理にかなっています。実際、研究者は聴覚処理の後期段階で並列機能をすでに報告しています。複雑な音楽要素と音声要素は別々に処理され、それらの表現は少なくとも部分的に並行して形成されます。

しかし、音声と音声の処理におけるこれらの分割は、信号が一次聴覚皮質を通過した後にのみ発生します。ハミルトンとチャンの研究は、プロセスの非常に早い段階でそのような分岐点を発見しました。非常に早い段階で、皮質だけでなく皮質下レベルで発話音を表現するために情報が統合されることを意味する可能性があります。また、発話において皮質下処理が非常に大きな役割を果たしている場合、研究者は、脳が複雑な音を理解する他の重要な方法を見落としている可能性もあります。

「私たちが皮質であると考えていたものの多くが、実際には少なくともある程度は皮質下でもあったことを、私たちは何年にもわたって繰り返し学んできました」エルサレムのヘブライ大学の脳科学センター。

実際、新しい結果は、皮質の「より低い」レベルがより複雑なものを隠している可能性があることを示しています.たとえば、スコットは、一次聴覚皮質を刺激すると、チャングループの患者に非常に豊富な一連の幻聴が引き起こされることに興味をそそられました。彼女によると、そのような幻覚は通常、高次の皮質領域に関連しています。

したがって、一次聴覚皮質は、通常認められている以上のことをしている可能性があります。他の最近の研究でも同じ結論が示されています。一次視覚野とは対照的に、一次聴覚野はすでにはるかに多くの処理を経た信号を受け取り、より状況に応じた方法で情報を表現します。ニューヨーク大学の神経科学者である David Poeppel は、「機能的には、一次視覚野よりもはるかに下流にあります」と述べています。

「稲妻の嵐のように」

それでも、「ヒエラルキーの赤ちゃんを風呂の水で完全に捨てたいとは思わない」とポッペルは言った.このシステムにはまだ階層があり、ますます抽象的な精神的表現を構築するために重要です.

しかし、その階層から離れて、非常に早い段階で音声とその他の音を並行して処理することで、多くの利点が得られる可能性があります。 1 つには、音の一時的な性質のためにマイクロ秒レベルの精度が要求される聴覚系の速度を最適化するのに役立つ可能性があります。 「したがって、この種の並列組織を持つことで、音声やその他の複雑な音に関する情報をより迅速に分析できるようになる可能性があります」と Boebinger 氏は述べています。さらに、聴覚信号は本質的に乱雑です。個人は音素を落としたり単語をスキップしたりすることに一貫性がなく、異なる社会的状況では異なる話し方をする可能性があります。このような無秩序な入力を処理するには、並列処理システムの方が優れている可能性があります。

また、聴覚系が複雑で重なり合う音をより効率的に分離し、脳がこれらの音響ストリーム間で注意をすばやく切り替えるのに役立つ可能性もあります. 「聴覚環境は一瞬で変化する可能性があるため、さまざまな種類の情報の複数のストリームが同時に、非常に柔軟な方法で処理される必要があります」と Scott 氏は言います。人間にとって言葉の音の重要性を考えると、私たちの脳がそれらを背景音や環境音と区別できる方法で迅速に処理することは理にかなっています.

音声とそれを生成する音が非常に早い段階で個別に処理される場合、おそらく他の種類の音も同様に処理されます。これを解明するために、ハミルトンらは、さまざまな種類の並列処理がいつ、どこで発生する可能性があるかを調べるために、環境音、音楽、無音ではなくバックグラウンド ノイズの中で話された文章など、より幅広い聴覚入力を使って実験を行うことを望んでいます。

南カリフォルニア大学の神経科学者である Robert Shannon は、次のように述べています。おそらく、表現は昇順の階層や整然とした平行な経路だけでなく、「稲妻の嵐のように」非常に多くの平行性と複雑さで形成されることが判明するだろう.

そして、それは「感覚系がどのように機能するかについての非常に異なる図です」とネルケンは言いました.

QuantaQuanta

  1. 生物電気:細菌は私たちのエネルギー危機を解決できるか?
  2. 胞子と配偶子の違い
  3. アフリカゾウの耳が大きいのはなぜですか?
  4. モクレンはなぜ花が咲いてから葉が出るのですか?
  5. クジラとイルカが魚ではない理由
  6. ステゴサウルスの尻尾に長くて鋭いトゲがあるのはなぜですか?