>> 自然の科学 >  >> 生き物

人工知能が現代の DNA から古代の「幽霊」を発見


深層学習は、古生物学者や遺伝学者が幽霊を探すのに役立つでしょうか?

70,000 年前に現生人類が最初にアフリカを出たとき、現在絶滅している少なくとも 2 つの関連種がユーラシア大陸で彼らを待っていました。これらは、ネアンデルタール人とデニソワ人であり、初期の現代人と交配した古代の人間であり、今日、非アフリカ系の人々のゲノムに彼らの DNA の一部を残しています。

しかし、さらに複雑でカラフルな歴史のヒントが増えています:研究者チームが Nature に報告しました たとえば昨年の夏、シベリアの洞窟で発見された骨の破片は、ネアンデルタール人の母親とデニソワ人の父親の娘のものでした。この発見は、第一世代の人間の雑種の最初の化石の証拠を示しました.

残念ながら、そのような化石を見つけることは非常にまれです。 (たとえば、デニソワ人に関する私たちの知識は、単なる指の骨から抽出された DNA に基づいています。) 他の多くの先祖のペアリングは、以前の交配からのハイブリッド グループを含むものを含め、簡単に発生した可能性があります。物的証拠。その発生の手がかりは一部の人の DNA にしか残っていない可能性があり、その場合でも、そこにあるネアンデルタール人やデニソワ人の遺伝子の痕跡よりも微妙な可能性があります。統計モデルは、科学者が化石データなしでこれらの個体群のいくつかの存在を推測するのに役立ちました。彼らの祖先)。しかし専門家は、これらの方法は必然的に多くのことを見落としていると考えています.

今日のゲノムに貢献したのは誰ですか?これらのいわゆる幽霊集団はどのような外見で、どこに住んでいて、どのくらいの頻度で他の人類種と交流したり交尾したりしたのでしょうか?

先月 Nature Communications に掲載された論文で 、研究者は、専門家が気付いていなかったかもしれない欠落している部分のいくつかを埋めるのに役立つディープラーニング技術の可能性を示しました.彼らは深層学習を使用して、別の幽霊個体群の証拠を選別しました。それは、ユーラシアの未知の人類の祖先であり、ネアンデルタール人とデニソワ人のハイブリッドまたはデニソワ人の近縁種である可能性があります。

この研究は、古生物学における人工知能の将来の有用性を示しています。これは、予期せぬ幽霊を特定するためだけでなく、私たちが誰になるかを形作った進化プロセスの非常に色あせた足跡を明らかにするためでもあります.

微妙な署名の検索

現在の統計的手法では、共有形質について一度に 4 つのゲノムを調べる必要があります。それは類似性のテストですが、必ずしも実際の祖先のテストではありません。なぜなら、それが明らかにする少量の遺伝的混合物を解釈する多くの異なる方法があるからです.たとえば、そのような分析は、現代のヨーロッパ人がネアンデルタール人のゲノムと特定の特徴を共有しているが、現代のアフリカ人とは共有していないことを示唆している可能性があります。しかし、これらの遺伝子がネアンデルタール人とヨーロッパ人の祖先との間の交配に由来するものであるとは必ずしも断言できません。たとえば、後者は、ネアンデルタール人とは密接に関連しているが、ネアンデルタール人自身ではなく、別の集団と交配した可能性があります。

遺伝的変異の古代の仮説的ソースがいつ、どこで、どのように生きていたのかを示す物理的証拠がないため、多くの推測された祖先のどれが最も可能性が高いかを言うのは難しい.ウィスコンシン大学マディソン校の古人類学者であるジョン・ホークス氏は、この手法は「その単純さゆえに強力ですが、進化を理解するという点では多くのことが残されています」と述べています。

新しい深層学習手法は、通常の統計的アプローチには小さすぎる遺伝子フローのレベルを説明しようとする試みであり、それを行うためのはるかに広大で複雑な範囲のモデルを提供することによって、よりうまくやろうとする試みです.トレーニングを通じて、ニューラル ネットワークは、ゲノム データのさまざまなパターンを、人口統計学的な歴史が最も可能性が高いものに基づいて分類することを学習できます。これらの関係を確立する方法は教えられません。

このディープ ラーニングの使用により、私たちが思いもよらなかった幽霊を明らかにすることができます。 1 つには、ネアンデルタール人、デニソワ人、現生人類の 3 つだけが写真にあると考える理由はありません。ホークスによれば、何十人もいた可能性が非常に高い.

ニューヨークのストーニーブルック大学の人類学者であるジェイソン・ルイスは、その見解を共有しています。 「私たちの想像力は、生きている人々や、ヨーロッパ、アフリカ、西アジアで発見された化石に焦点を当てているために制限されてきました」と彼は言いました. 「深層学習技術ができることは、奇妙な方法で、可能性に焦点を合わせ直すことです。このアプローチは、もはや私たちの想像力によって制限されることはありません。」

シミュレートされた歴史の真の価値

ディープ ラーニングは古生物学者の問題に対する解決策とは思えないかもしれません。そのような方法は通常、大量のトレーニング データを必要とするからです。その最も一般的な用途の 1 つである画像分類器を取り上げます。専門家がモデルをトレーニングして、たとえば猫の画像を特定する場合、トレーニングに使用できる何千もの写真があり、猫がどのように見えるべきかを知っているため、専門家自身がモデルが機能しているかどうかを知っています。

しかし、利用可能な関連する人類学的および古生物学的データが不足しているため、ディープラーニングを使用して賢くなりたい研究者は、独自のデータを作成することを余儀なくされました。バルセロナにある国立ゲノム解析センターの研究者で、この研究の著者の一人であるオスカー・ラオ氏は、「私たちはちょっと汚いふりをしていました」と語った。 「シミュレーションを使用していたので、深層学習エンジンのトレーニングに無限の量のデータを使用できました。」

研究者たちは、人口統計学的詳細のさまざまな組み合わせに基づいて、何万ものシミュレートされた進化の歴史を生成しました:祖先の人類集団の数、それらのサイズ、それらが互いに分岐した時期、それらの混合率など。これらのシミュレートされた歴史から、科学者たちは現代人の膨大な数のシミュレートされたゲノムを生成しました。彼らは、これらのゲノムで深層学習アルゴリズムをトレーニングし、どの種類の進化モデルが特定の遺伝子パターンを生成する可能性が最も高いかを学習しました。

次に、チームは人工知能を自由に設定して、実際のゲノム データに最も適した履歴を推測しました。最終的に、このシステムは、以前は特定されていなかった人間グループが、アジア系の人々の祖先にも貢献したと結論付けました。関連する遺伝子パターンから、それらの人間はおそらく、約 30 万年前にデニソワ人とネアンデルタール人の交配から生じた別個の集団か、またはその直後にデニソワ人の系統から派生したグループのいずれかでした。

深層学習がこのように使用されたのはこれが初めてではありません。この分野の研究室のいくつかは、進化研究の他のスレッドに対処するために同様の方法を適用しています。オレゴン大学のアンドリュー・カーンが率いるある研究グループは、シミュレーションベースのアプローチと機械学習技術を使用して、人間を含む種がどのように進化したかのさまざまなモデルを区別しました。彼らは、進化によって好まれる適応のほとんどが、集団における有益な新しい突然変異の出現に依存するのではなく、すでに存在する遺伝的変異の拡大に依存していることを発見しました.

「これらの新しい問題に」深層学習を適用することで、「エキサイティングな結果が得られています」と Kern 氏は述べています。

新しいツールに対する誇大広告と希望

もちろん、大きな注意点があります。 1 つには、実際の人間の進化の歴史が、これらの深層学習手法が訓練されたシミュレートされたモデルに似ていない場合、その手法は誤った結果を生み出すでしょう。これは、Kern と他の人々が取り組もうとしている問題ですが、正確さをより確実にするためには、まだ多くの作業が必要です。

プリンストン大学の生態学者で進化生物学者の Joshua Akey は、次のように述べています。 「ディープラーニングは素晴らしい新しいツールですが、それは単なる別の方法です。人類の進化において知りたい謎や複雑な問題をすべて解決できるわけではありません。」

一部の専門家はさらに懐疑的です。ハーバード大学とピーボディ博物館の古生物学者であるデビッド・ピルビームは、「私の判断では、データの密度と品質は、思慮深くインテリジェントな非人工分析以外には理想的ではありません.

それでも、他の古生物学者や遺伝学者の意見では、これは良い前進であり、将来の化石発見の可能性や、何千年も前から人間の間に存在していたはずの遺伝的変異についての予測に使用できるものです. 「ディープ ラーニングは集団遺伝学を本当に後押しすると思います」と Lao 氏は述べています。

同じことが、データにアクセスできるがデータを生成したプロセスにアクセスできない他の分野にも当てはまる可能性があります。カーンをはじめとする集団遺伝学者や進化生物学者がシミュレーションベースの AI 技術を開発して問題に対処していたのとほぼ同時期に、物理学者は大型ハドロン衝突型加速器やその他の粒子加速器で生成された大量のデータをふるいにかける方法を見つけようとしていました。 .地質学研究と地震予知手法も、この種の深層学習アプローチの恩恵を受け始めています。

「これがどこにつながるのか、私には本当にわかりません。マサチューセッツ工科大学ブロード研究所およびハーバード大学の計算生物学者、ニック・パターソン氏は次のように述べています。 「しかし、新しい方法を見るのは常に良いことです。私たちが答えたい質問にうまく答えられると思われる場合は、できる限り何でも使用します。」

この記事はに転載されました Wired.com .



  1. 細胞周期の最も長い段階は何ですか
  2. 疫病を定義するとらえどころのない数字を追う
  3. 同じ種から違う色の花が咲くのはなぜですか?
  4. ノロウイルスとロタウイルスの違いは何ですか
  5. 自然と人工の栄養繁殖の違い
  6. 魚の生臭さはなぜ?