数学的単純さが進化の速度を促進する可能性がある|生き物

創造論者は、中型の人間のタンパク質を 1 つだけ作成するために、進化が正しい順序で 300 以上のアミノ酸を組み立てる必要があったと主張するのが大好きです。これらの位置のそれぞれを占める可能性のあるアミノ酸が 20 個ある場合、ふるいにかける可能性は 20 個以上あるように思われます。これは、観測可能な宇宙の原子の数を取るに足らないものにする量です。これらの配列の一部を実質的に同等にする冗長性を無視したとしても、進化が数十億年以内にランダムな突然変異によって正しい組み合わせにたどり着く可能性は非常に低いでしょう.

彼らの主張の致命的な欠陥は、進化がランダムにシーケンスをテストしただけではないということです。自然選択のプロセスがフィールドを選別しました。さらに、自然はどういうわけか他のショートカット、つまり、有用な解決策を生み出す可能性が高い、より小さく探索可能なサブセットに可能性の広大なスペースを絞り込む方法も見つけたようです.

コンピュータサイエンティストは、天文学的に膨大な数の可能性の中から最適なソリューションを見つけるという問題で、同様の課題に直面しています。生物学にインスピレーションを求めている人もいます — 生物学者は今でも生命がどのように機能するかを正確に理解しようとしています.

何十年にもわたって普及してきた最適化手法である遺伝的アルゴリズムは、自然選択の原則を使用して、新しい設計 (ロボット、医薬品、輸送システムなど) を設計したり、ニューラルネットワークをトレーニングしたり、データを暗号化および復号化したりします。この手法は、問題に対するランダムな解決策を、コードに「遺伝的に」記述された特定の機能または要素を持つ「生物」として扱うことから始まります。これらの解決策は特に優れたものではありませんが、ランダムな変異 (および時には遺伝子シャッフリングプロセスを模倣するその他の変更) の組み合わせを経て、生物の第 2 世代を生成します。仕事。最終的に、このプロセスを何度も繰り返すことで、非常に適した個人または解決策が生まれます。

一部の専門家は、この方法をさらに一歩進めて、遺伝的プログラミングとして知られている方法で、プログラムを作成して効率的に解決策を考え出すことができるソフトウェアを進化させています (ここでの「遺伝子」はプログラミング命令である可能性があります)。研究者は特定のデータ型と構造、およびその他の条件を考慮に入れる必要があったため、この目標は特に難しいことが判明しました。

しかし、興味深いことに、これらの進化に基づく考え方 (特に遺伝子プログラミング) は、生物学とコンピューターサイエンスの両方の傍観者として扱われている数学的理論と概念的に重なっています。ごく少数の科学者が最近、それを使用して、自然と人工の両方の進化がどのように効率的であり、目新しさを生み出し、学ぶことを学ぶことができるかについての洞察を得ようとしています。鍵となるのは、複雑さ、ランダム性、情報の特定の概念であり、これまであまり実用化されていませんでした。

キーボードのサル

1960 年代に開発されたこの理論は、アルゴリズム情報として知られるものを扱っています。その出発点として、確率と複雑さについての直感的な考え方、つまり、少なくとも一部の出力については、何かを実際に生成するよりも、何かを生成する方法を記述する方が計算上簡単であるという考えが採用されています。猿がコンピューターのキーを無作為に押すことにたとえてみましょう。円周率の最初の 15,000 桁を入力する可能性は非常に低く、必要な桁数が増えるにつれて、その可能性は指数関数的に減少します。

しかし、サルのキーストロークがランダムに書かれた pi を生成するコンピュータープログラムとして解釈されると、成功の確率、つまり「アルゴリズムの確率」が劇的に向上します。たとえば、プログラミング言語 C で pi の最初の 15,000 桁を生成するためのコードは、133 文字ほど短くすることができます。

言い換えれば、アルゴリズム情報理論は本質的に、ある種の出力を生成する確率は、ランダム性が出力自体のレベルではなく、それを記述するプログラムのレベルで動作する場合にはるかに大きくなると述べています。そのプログラムは短いためです。このようにして、複雑な構造 (フラクタルなど) をより簡単に偶然に作り出すことができます。

しかし、そのアプローチの問題がすぐに明らかになりました。数学者は、与えられた出力のアルゴリズムの複雑さ (理論の創始者の 1 人であるアンドレイコルモゴロフにちなんで、コルモゴロフ複雑度としても知られています) は、それを指定するために必要な最短の可能なプログラムの長さであることを学びました。計算できません。そのため、コンピューター科学者は、文字列やその他のオブジェクトを圧縮する理想的な方法を判断できませんでした.

その結果、アルゴリズム情報理論は、関連する定理を探索し、ランダム性と構造の概念を定義するために使用される純粋数学の領域にほとんど追いやられました。実際の使用は手の届かないところにありました。「数学的には、これは複雑さのシンプルで美しい尺度です」と、以前は IBM トーマス J. ワトソンセンターとリオデジャネイロ連邦大学に所属し、この理論の創始者の 1 人である著名な数学者 Gregory Chaitin は述べています。「しかし、実際のアプリケーションには近づきにくいように見えました。」

それは彼が試みることを止めませんでした。彼は、この理論が、DNA がソフトウェアとして機能するという考えを形式化するために使用できることを望んでいました。 2012 年に彼は、進化がソフトウェア空間のランダムウォークとしてどのように見られるかを説明する本を出版しました。その道に沿った突然変異は、統計的にランダムな確率分布に従っていない、と彼は主張した。代わりに、コルモゴロフの複雑さに基づく分布に従います。しかし、彼にはそれをテストする方法がありませんでした.

現在、一部の科学者は、その文脈で理論を復活させ、生物学とコンピューターサイエンスの両方の分野に関連させることを望んでいます。

シンプルさへの偏見

スウェーデンのカロリンスカ研究所のコンピューター科学者であるヘクター・ゼニルは、この理論を復活させようとしている人々の 1 人です。彼は他の研究者と協力して、コルモゴロフの複雑さを生物学的ネットワークの複雑さを分析するための指標として使用しています。たとえば、細胞内の遺伝子調節やタンパク質相互作用をモデル化するネットワークなどです。研究者は、ネットワークのアルゴリズム情報コンテンツを概算し (実際の値は計算できないため)、ネットワークに突然変異を導入し、コルモゴロフの複雑さに対するその影響をテストします。彼らは、この方法がネットワークのさまざまな要素の相対的な重要性と、ネットワークが意図的な変更に機能的にどのように反応するかを明らかにすることを望んでいます.

たとえば、プレプリントサイト arxiv.org に掲載されたある最近の結果では、ネットワークの記述プログラムを長くする突然変異を導入することによって、ネットワークをより複雑なコルモゴロフに移行すると、システムが実行できる機能の数が増える傾向があることがわかりました。摂動に対してより敏感にしながら実行します。ネットワークをより単純化する方向に微調整すると、より安定した機能が出現しました。

しかし、コルモゴロフの複雑性がツール以上の何かとして機能できるかどうか、チャイティンが信じていた変化の原動力として機能できるかどうかはまだわかりません.問題はあるものの、アルゴリズム情報は、生物学の領域で魅力を発揮します。伝統的に、進化のダイナミクスを記述するために使用される数学的フレームワークは、集団遺伝学、つまり遺伝子が集団内に出現する頻度の統計モデルです。しかし、集団遺伝学には限界があります。たとえば、生命の起源やその他の主要な生物学的変化、またはまったく新しい遺伝子の出現を説明することはできません。「この素敵な数学的理論の中で失われがちな概念は、生物学的創造性の概念です」と Chaitin 氏は述べています。しかし、アルゴリズムの情報を考慮に入れると、「創造性は自然に調和する」と彼は言いました。

進化のプロセス自体が時間の経過とともに改善され、より効率的になっているという考えも同様です。「私は、進化が本質的に学習することを確信しています」と、英国のハートフォードシャー大学のコンピューター科学者で人工知能の教授であるダニエル・ポラニは言いました。「アルゴリズムの複雑さが漸近的に低下することでこれが表現できたとしても、私は驚かないでしょう。」

Zenil と彼のチームは、アルゴリズムの複雑さのフレームワークの生物学的および計算上の意味を実験的に調査することに着手しました。ネットワークを分析して摂動するために開発したのと同じ複雑さの近似手法を使用して、特定のターゲット (遺伝子間の相互作用を表すことを意図した 1 と 0 の行列) に向かって人工的な遺伝的ネットワークを「進化」させました。アルゴリズムの複雑さを軽減します。言い換えれば、彼らはより大きな構造を選択したのです。

彼らは最近Royal Society Open Scienceで報告しました統計的にランダムな突然変異と比較して、この突然変異バイアスにより、ネットワークはソリューションに向かって大幅に速く進化しました。永続的で規則的な構造、つまり新しい世代が改善する可能性が低い程度の単純さをすでに達成しているマトリックス内のセクションなど、他の機能も明らかになりました。「いくつかの地域は、ある程度の単純さを進化させた可能性があるという理由だけで、突然変異の傾向が強かったり弱かったりしました」とZenil氏は述べています。「これはすぐに遺伝子のように見えました。」次に、その遺伝的記憶は、より大きな構造をより迅速に生み出しました。つまり、研究者は、アルゴリズム的に可能性のある突然変異が多様性の爆発と絶滅にもつながる可能性があることを示唆しています.

「これは、進化について話しているときに計算プロセスを考慮することが有益であることを意味します」とゼニルは言いました。彼は、このランダム性と複雑さの理解を利用して、突然変異を起こしやすい経路を特定したり、特定の遺伝子相互作用が癌などの病気に関連している理由を解明したりしたいと考えています.

進化するソフトウェア

ゼニルは、生物学的進化が同じ計算規則に従って機能するかどうかを調査したいと考えていますが、ほとんどの専門家は疑問を抱いています。アルゴリズムの複雑さを概算したり、その種の突然変異バイアスを機能させたりするのに、どのような自然のメカニズムが関与しているのかは不明です。さらに、フランス国立科学研究センターの数学者であるジュゼッペ・ロンゴ氏は、「生命が4文字に完全に暗号化されていると考えるのは間違っている」と述べた。「DNAは非常に重要ですが、細胞、生物、生態系になければ意味がありません。」他の相互作用が行われており、アルゴリズム情報のこのアプリケーションでは、その複雑さの程度を捉えることができません.

それでもなお、この概念にはある程度の関心が寄せられています。特に、進化と計算プロセスに関するこの考え方は、少なくともテーマ的には、ソフトウェアを進化させるという遺伝的プログラミングの目的と共通点があるように思われるためです。

確かに、コルモゴロフの複雑さと遺伝的プログラミング法に関するChaitinとZenilの考えの間の潜在的なリンクについて、いくつかの興味深いヒントがありました。たとえば、2001 年に研究チームは、遺伝子プログラムの出力の複雑さは、元のプログラムのコルモゴロフ複雑さによって制限される可能性があると報告しました。

しかし、ほとんどの場合、コルモゴロフの複雑さは、コンピューター科学者がそれらのアイデアを理解する上で役割を果たしていません。代わりに、彼らは関連する遺伝学と突然変異を変更する他の方法を試みました.一部のグループは、突然変異率をゆがめています。より大きなコードのチャンクを置き換えるミューテーションを優先するようにシステムを偏らせた人もいます。マサチューセッツ州ハンプシャーカレッジのコンピューター科学者であるリースペクター氏は、「人々が思いついた突然変異や交差には、数十、おそらく数百の異なるバージョンがあります。スペクターは最近、ある遺伝子を別の遺伝子に直接置き換えるのではなく、生物のゲノム全体に突然変異を追加および削除することの利点を示すチームを率いました。この新しい種類の遺伝的演算子は、ゲノム検索空間を通る経路の数を指数関数的に拡大し、より良い解決策につながりました.

とは言うものの、多くの研究者は逆の方向に進み、検索で最適な結果が得られないほど制限することなく、検索スペースを狭めることでプロセスを高速化する巧妙な方法を探しています。 1960 年に Eugene Wigner が「自然科学における数学の不当な有効性」を指摘したように、コンピューター科学者は、より単純で洗練されたモデルがより一般的に適用可能で効果的であることがしばしば証明されることを発見しました。「そして問題は、それが宇宙について何か深いことを教えてくれるかどうかです」とスペクターは言いました。いずれにせよ、それは役に立ちそうですか?」

彼はまた、進化するプログラムを単純化する方向に偏らせようとする試みも、破壊的になり得ると警告しています。たとえば、プログラムの長さを短くするなどの報酬を与えると、後の世代で役に立った可能性のある推定ジャンクが削除され、その過程で最適なソリューションであった可能性があるものが犠牲になる可能性があります。 . 「だから行き詰まります」と彼は言いました。

しかし、シンプルさは依然として魅力的な目標であり、有用であることが証明されています.昨年発表された論文で、Spector と彼の同僚は、遺伝的プログラミング手法を実行した後に、プログラムのサイズを元のサイズの 25% 程度にまで縮小すると、プログラムが新しいデータに対してより優れたパフォーマンスを発揮することを発見しました。より広い範囲の一般的な問題に使用できます。

それが、彼がアルゴリズム情報理論で行われている研究に目を光らせている理由の一部ですが、それがこの分野にどのように影響するかはまだ正確にはわかっていないと言います.

人生から学ぶ

おそらく、Zenil のチームはその影響を見つけるための第 1 歩を踏み出しましたが、彼らの研究の応用をより一般的に現実的なものにするためには、まず他のタイプの検索問題で彼らの方法をテストする必要があります.

それでも、「構造に基づいて制限することには非常に良い点があります」と、ウィスコンシン大学マディソン校の理論神経科学者であるラリッサ・アルバンタキスは言いました。彼はまた、トラバースしなければならない検索空間を制限することによって遺伝的アルゴリズムを高速化する研究を行っています. 「自然は多くの点で構造化されており、それを出発点として考えれば、可能なすべての均一な突然変異を試すのはちょっとばかげています。」

彼女は、「私たちにとって意味のあるものはすべて、何らかの形で構造化されています」と付け加えました。

Spector は、Zenil の最近の研究が、彼が調査した非常に具体的な問題を超えたアプリケーションを持っていることに懐疑的なままですが、「ここでの概念の背後にある情報理論は興味をそそられ、潜在的に非常に重要です」と彼は言いました。「別の惑星にあるように見えるので、エキサイティングだと思います。私たちのコミュニティの人々が気づいていない洞察があるかもしれません。」結局、アルゴリズム情報は、遺伝的プログラミングの一部の専門家が自分たちの研究に取り入れない可能性のある幅広い概念を利用しています。

「ここには重要なものがあると強く感じています」とスペクターは言いました。とはいえ、現時点では「彼らが取り組んでいるものと実際のアプリケーションとの間にはまだ大きな隔たりがあります」と彼は付け加えました。

「進化するソフトウェアとして生命を考えることは有益です」と Chaitin 氏は述べていますが、その価値を判断するのは時期尚早かもしれません。人工生命であろうと生物生命であろうと、「どこまで到達できるかを見る必要があります」