>> 自然の科学 >  >> 生き物

DNAに隠された人類の歴史の地図


John Novembre に楽しい時間を思い出してもらいましょう。最近の 1 週間にわたるハッカソンについて教えてくれるかもしれません。彼と彼の学生とポスドクは、テイクアウトを食べてデータを処理するために夜更かしするという毎日の義務を脇に置いています。

これは、計算生物学者である Novembre が純粋にコンピューター オタクであると言っているわけではありません (彼はそれが彼のアイデンティティの一部であることを認めますが)。はい、シカゴ大学のホワイトボードが並ぶ壁は、シンボル、グラフ、方程式で飾られています。これは、彼が世界最大のゲノムデータセットから意味を引き出すことを可能にする巧妙なアルゴリズムと計算トリックの胚です。しかし、それは彼の仕事のほんの一部です。

軍人の家庭に生まれたノベンブレは、母親の出身地であるウルグアイで 3 年間を過ごしながら、転居しながら育ちました。 「私は地理、言語、歴史が好きだった」という人間の違いへの彼の初期の露出は、進化と遺伝的多様性についての深い好奇心に変わりました。彼の研究は、人口が時間と空間でどのように変化するかを理解するという幅広い野心を反映しています。彼は、グループが拡大、縮小、移動、混合、進化、消滅するにつれて、人類の遺伝暗号がどのように変化し、混ざり合うかを研究しています。

彼の数学的手腕は、この試みに大いに役立っています。彼の革新的な分析と複雑なデータを視覚化する新しい方法により、祖先の遺伝的特徴と、遺伝子と地理との間の驚くべき関係が明らかになります。 2015 年、37 歳のノベンブルはマッカーサー フェローシップ (いわゆる「天才助成金」) を獲得しました。これは、「並外れた独創性を示した才能のある個人」と「重要な業績の実績に基づいて重要な将来の進歩を約束する人」を表彰するものです。 .」

しかし、彼の称賛の数々にもかかわらず、Novembre は真に謙虚であり、英語の専攻者がディキンソンとイェイツを引用するように同僚の論文を引用しているように見えます。彼の机の上にぶら下がっているのは、ホワイトボードのブレインストーミングの目の前にある古い地図で、1600 年代のものだと彼は考えています。世界をモデル化しようとする人間の試みは、常に「非常に不完全な表現」になることを常に思い出させます。

クォンタ マガジン は、彼の研究の背後にある動機、過去を解釈するために DNA を使用することの難しさ、および遺伝学研究の人種的遺産について Novembre と話しました。会話の編集および要約版が続きます。



QUANTA MAGAZINE:遺伝的多様性を計算上の問題として考えたきっかけは何ですか?

JOHN NOVEMBRE:私にとって、道のりはかなり前にさかのぼります。高校時代、私はコンピュータープログラミングのオタクでした。しかし、私のクラスでは、完全に魅了された遺伝暗号について学んでいました.その後、大学で、スタンフォード大学で夏の研究インターンシップを行う機会があり、ルイージ・ルカ・カヴァリ・スフォルツァの研究室でインターンをした学生の話を聞きました。彼らがしていること、つまり彼らが有名になったのは、人間の遺伝子のバリエーション、それらが世界中にどのように分布しているか、そして人類の歴史について私たちに何を教えてくれるかを調べることです.それは私にとって魅力的でした。

ホーム キャンパスに戻ると、Quercus gambelii の集団遺伝学を研究している研究室を見つけました。 、ガンベルオーク。多くの分析ツールを使用するのがいかに難しいか、そして遺伝子データの分析にどれほどの数学と計算が必要かを学びました。ふと気がついたのですが、「ちょっと待って。これが私が本当に愛していること、つまりプログラミングです。この 2 つの情熱を組み合わせてみませんか?」私の日々の活動はコンピューターをいじることになりましたが、私のより大きな目的は、遺伝的変異とそれが時間とともにどのように変化するかを理解することで、私を知的に魅了するものです.

あなたはキャリアの早い段階で、主成分分析 (PCA) として知られる一般的な統計ツールの欠陥を明らかにすることで話題になりました。この発見により、遺伝学の研究がどのように進展しましたか?

PCA が行うことは、個人の遺伝子データを取得し、それをいくつかの数字に要約することです。この方法がどのように機能するか (長所と短所) を学ぶ中で、私は、この方法が生成するパターンが人口データの空間構造を反映している可能性があることを理解しました.

私は、集団が互いに混じり合っている連続的なスケールで変動がどのように見えるかを確認できるように、密集したサンプリングが行われている世界の地域から遺伝子データにアクセスできるようにしたいと考えていました。そして、コーネル大学の [当時] カルロス ブスタマンテとの共同研究に招待されて、人類に適用されている [ゲノム データ] の最大のコレクションの 1 つを分析するよう招待されたという点で、私は非常に幸運でした。完全なデータ セットは 3,192 人のヨーロッパ人でした。サンプルの大部分は、祖父母がどこから来たかを言う祖先アンケートに回答しており、それに基づいて、ヨーロッパ全体で約 37 の異なる起源からのサンプルがあることがわかりました.

では、何を学びましたか?

PCA を適用すると、すぐにこの主要なパターンが見られました。個人が遺伝空間のどこに位置しているか、地理的位置 (祖父母の出身地) との間に驚くほどの類似性がありました。人間の個人がどれほど密接に関連しているかを考えると、これは本当に驚くべきことです.ほとんどの遺伝学者は、大陸スケール内の非常に細かいスケールの構造を分解できるとは考えていなかったでしょう.

どのくらい細かいスケールについて話しているのですか?

ある個人を取り上げて、その地理的位置を非表示にしてから、地図に戻そうとしたとしましょう。私はどれだけうまくやれるでしょうか?これを行うと、数百キロ以内に到達できることがよくありました。ドイツ語を話すスイス人、フランス語を話すスイス人、イタリア語を話すスイス人を比較しても、遺伝子分布に変化が見られました.

人間が移動する頻度を考えると、祖父母の地理的座標が私の遺伝学にこれほど顕著な影響を与える可能性があることに驚いています。この影響をどのように説明しますか?

これは私が強調したいことです:あなたの遺伝学への影響は実際には信じられないほど小さい.ゲノムの非常に多くの場所を見ているだけで、非常に小さな影響を拾うことができます.これがビッグデータの魔法です。非常に微妙なパターンが検出可能になります。ですから、祖父母が住んでいる場所があなたの遺伝学に大きな影響を与えるというわけではありません。それは実際には非常に小さな影響です。しかし、数十万回の測定値があると、ある個人が別の場所から来たように見えることを見つけ始めることができます.

商用祖先検査の倫理についてどう思いますか?

私は Ancestry.com (彼らの DNA ブランチ) にアドバイスを提供しているので、結果を伝えるという課題に非常に敏感です。一方では、ヨーロッパの遺伝子地図のようなプロジェクトは、祖先について学ぶためのこれらのツールの途方もない可能性と力を示しています。しかし、それには非常に複雑な問題もあります。個人の出身地について話すことの本当の意味は何でしょうか?私たちは両親や祖父母の出身地について話すことができます。あるいは、私たちがアフリカから来たはるか昔にさかのぼることもできます。また、地理的な場所とある種の文化的または民族的集団の観点から、起源についてさまざまな考えを持つことができます.

今日の遺伝子データを使用して過去を解釈するというこの問題を本当に解決するには、まだ初期段階にあると言えます。私たちはまだ現実の生物学的システムと個体群の複雑さに直面しており、歴史の非常に単純なモデルを使用しようとするいくつかの試みに抵抗しています.

あなたの作品は、人種についての考え方にどのような影響を与えましたか?

遺伝学研究が困難で暗い歴史を持っていることは明らかです。しかし、多様性がより高く評価され、理解され、評価される時代に、この種の仕事をしている新しい世代の一員であることはエキサイティングでした。 .

特定の例を考えていますか?

私にとって非常に強力だったのは、複数のヒト集団から得られたゲノム全体のデータを調査する最初のチームの一部に参加したことです。人類全体でどの領域が最も異なるかによってゲノムを並べ替えてから、「OK、それらの場所の近くにある遺伝子はどれで、それらについて何を知っているか?」と尋ねることができます。

この演習を行うと、リストの一番上に、皮膚の色素沈着、目の色、髪の色に関与するバリアントが表示されます。したがって、互いの違いを確認するために使用するものが、ヒトゲノムの外れ値であることは経験的な事実です。ヒトゲノムの平均的な遺伝子セットは、世界的にはるかに類似しています.

あなたは、ハイイロオオカミ 3 種の最初の全ゲノム シーケンスを分析し、それらをイヌ 3 種のゲノムと比較しました。何を発見しましたか?

それは大きな驚きでした。私たちは、3 つの犬の血統すべてが 3 つのオオカミの血統のうちの 1 つと最も密接に関連していることがわかるかもしれないと考えていました。たとえば、犬は中東で飼いならされていたので、それらはすべてイスラエルのオオカミに関連している可能性があります。あるいは、犬の家畜化が 2 種類あり、ディンゴは中国のオオカミに関連し、バセンジーはクロアチアのオオカミに関連していた可能性があります。

しかし、私たちが見たのは、3匹の犬は互いに最も密接に関連していましたが、3匹のオオカミの系図には組み込まれていないということでした.私たちの仮説は、犬が家畜化されたオオカミの系統があり、その後絶滅したというものです。話は信じられないほど複雑になり、最終章はまだ書かれていないと思います.

あなたは犬好きですか?

特にありません。私の動機は主に、この分野全体に対するこのより大きな課題を解決しようとすることだったと言えます。種の名前を私に置き換えても構いませんが、それでも面白いです。相変わらず楽しい問題です。

遺伝子データを分析するアプローチは、時間とともにどのように進化してきましたか?

私の仕事では、データの視覚化への動きが高まっています。あなたの目は実際に大量の情報を処理し、複雑なパターンを解釈することができます.適切な視覚化ツールを使用すると、データの主要な特徴と、それらが生物学的プロセスをどのように反映しているかを、より直接的かつ直感的に理解できます。



例を挙げていただけますか?

私たちが開発したツールの 1 つは、ランドスケープのどこで遺伝子の流れが多かれ少なかれあるかを教えてくれる方法です。つまり、個人が集団間をどのように移動しているかを教えてくれます。私たちの分析は、地理的距離の単位あたりに予想されるよりも多くの遺伝的差異がある地域と、そうでない他の地域を推測します。そのため、移行の少ない地域と多い地域を表すために茶色と青で色付けされた地理マップを作成できます。

たとえば、アフリカ全土でサンプリングされた 1,000 頭を超えるゾウの遺伝子データを調べました。私たちのアプローチでは、事前の知識なしにデータを入力すると、移行率のこのマップが得られます。中央アフリカを下るこの茶色のバリアは、移動が少ない場所を示し、東側の青い回廊は移動が多い場所を示しています。もちろん、生態学を知っていれば、次のことがわかります。片側は森林ゾウで、反対側はサバンナゾウです。」

この方法を他の集団に適用しましたか?

はい。たとえば、ヨーロッパからの人間のデータで実行すると、英国とフランスの間の移動が減少した茶色の領域が推測されることがわかります。これは、本質的に英国海峡を表しています。スカンジナビアと英国の間のバイキングの接触など、北海では歴史的なつながりがあるため、北海では多くの青 — 高度な移動 — が見られます。次に、アルプスを表すと考えられるスイスとオーストリアの周りに茶色が散らばっています。

移動が少ない地域や多い地域など、不可解な結果が得られましたか?

遺伝学が地質学的特徴と一致する頻度には、さらに驚かされます。たくさんの生きている個体の体から分子を抽出し、それらを互いに比較すると、アルプスが地球の特徴であることがわかります。ちょっとワイルドです。

調査を開始したときと比べて、調査している質問はどのように変化しましたか?

データ型が変更され、データのスケールが変更されました。博士号を取得するために、71 の集団で観察された単一の遺伝子変異から何ができるかを学ぼうとしました。今では、何百万ものバリアントを含むデータセットを持つことは完全に日常的になっています。当時は、今のようになるとは想像もできませんでした。これは驚くべきゲームチェンジャーですが、核となる問題は同じです:人口遺伝データを解釈するために、数学と統計モデルをどのように使用すればよいでしょうか?

あなたが解決したいと思っている大きな問題は何ですか?

聖杯の 1 つは、移動率と人口規模が時間と空間によってどのように変化するかを推測できる方法だと思います。それは、人口とその人口史の非常に完全な説明になります.



  1. 黄山の松はなぜ奇妙に見えるのでしょうか。
  2. 遊走子と接合子の違い
  3. クラドグラムは進化的関係をどのように明らかにしますか
  4. ツノガエルがカエルの中で「悪魔」と言われる理由とは?
  5. マングローブはなぜ浜辺に生えるのですか?
  6. ネズミが物をかじるのはなぜ?