>> 自然の科学 >  >> 生き物

ゲーム理論は協力を疑問視する


ペンシルバニア大学の理論生物学者である Joshua Plotkin は、原稿が机の上を横切るとすぐに興味をそそられました。物理学者のフリーマン ダイソンとコンピューター科学者のウィリアム プレスは、どちらもそれぞれの分野で高い成果を上げており、囚人のジレンマと呼ばれる有名な数十年前のゲーム理論シナリオに対する新しい解決策を発見しました。相棒。囚人のジレンマは、協力が自然界でどのように持続するかを説明するために長い間使用されてきました。結局のところ、自然淘汰は適者生存によって支配されるため、個人に利益をもたらす利己的な戦略が存続する可能性が最も高いと予想されるかもしれません.しかし、囚人のジレンマを注意深く研究した結果、有機体は完全に自分の利益のために行動し、協力的なコミュニティを形成できることが明らかになりました.

しかし、この問題に対するプレスとダイソンの新しいソリューションは、そのバラ色の見方に疑問を投げかけました。最良の戦略は、協力ではなく、恐喝につながる利己的な戦略であることが示唆されました.

プロトキンは、デュオの数学がその優雅さに際立っていることに気づきました。しかし、その結果は彼を悩ませました。自然界には、協調行動の例が数多く含まれています。たとえば、吸血コウモリは、獲物を見つけられなかったコミュニティ メンバーに血液の一部を寄付します。ある種の鳥や社会性昆虫は、日常的に別の種を育てるのを手伝っています。細菌でさえ協力して互いにくっついて毒を生き抜くことができます。強要が蔓延している場合、これらおよびその他の無私無欲の行為を駆り立てるものは何ですか?

Press と Dyson の論文は、古典的なゲーム理論のシナリオ、つまり 2 人のプレーヤーが繰り返し対立するシナリオに注目しました。プロトキンは、同じ計算を自然により近い状況に適用した場合、寛大さが復活するかどうかを知りたがっていました。そこで彼は集団でのアプローチを作り直し、個人がグループの他のすべてのメンバーと一連のゲームをプレイできるようにしました。彼の実験の結果。最新のものは 12 月に 全米科学アカデミー紀要 に掲載されました。 、寛大さと利己主義が不安定な道を歩むことを示唆しています。場合によっては、協力が勝利します。しかし、変数を 1 つだけシフトすると、再び恐喝に取って代わられます。 「集団内で協力が進化する時期と予想されない時期について、非常に一般的な説明が得られました」と、同僚のアレクサンダー・スチュワートとともに調査を行ったプロトキンは述べています。

この時点では、作業は完全に理論的なものです。しかし、この発見は、複雑な生物間の協力から、個々の細胞間の協力の一形態である多細胞性の進化に至るまでの現象を説明する、幅広い意味を持つ可能性があります。

Plotkin らは、Press と Dyson の研究は、ゲーム理論を使用して協力の進化を研究するための新しいフレームワークを提供し、研究者が協力の存在を可能にするパラメーターを導き出すことを可能にする可能性があると述べています。ハーバード大学の生物学者で数学者の Martin Nowak は、「基本的にこの分野を復活させました。」と述べています。

しっぺ返し

ベルベット モンキーは、アラーム コールで知られています。サルは、捕食者が近くにいると叫び声を上げて隣人に警告します。しかしそうすることで、それ自体に危険な注意を引きます。ダーウィンにまでさかのぼる科学者たちは、この種の利他的行動がどのように進化したかを説明するのに苦労してきました。絶叫するサルの割合が十分に高くなれば、自然淘汰によって遺伝子プールから絶叫するサルが消えてなくなると予想される。しかし、そうではなく、その理由についての憶測は、何十年にもわたる (時には白熱した) 議論につながっています.

研究者は、協力を説明するためのさまざまなメカニズムを提案しています。親族選択は、家族を助けることが最終的に個人を助けることを示唆しています。グループ選択は、協力的なグループが非協力的なグループよりも生き残る可能性が高いことを示唆しています。また、直接互恵主義は、過去に自分を助けてくれた人を助けることで個人が利益を得ることを前提としています。

囚人のジレンマは、研究者が寛大なコミュニティ メンバーと協力し、詐欺師をだますなどの単純な戦略を理解するのに役立ちます。 1950 年代に最初に説明された、古典的な囚人のジレンマには、逮捕されて別々の部屋に入れられる 2 人の重罪犯が含まれます。それぞれに選択肢が与えられます:告白するか、黙っています。最良の結果では、両方とも何も言わずに自由になります。しかし、どちらも相手が何をするかわからないので、黙っているのは危険です。 1 人が密告し、もう 1 人が黙っていれば、静かなパートナーが苦しんでいる間、ラットは軽い判決を受けます。

微生物などの単純な生物でさえ、この種のゲームに関与しています。一部の海洋微生物は、重要な栄養素である鉄を収集するのに役立つ分子を生成します。微生物のコロニーには、生産者と詐欺師の両方がいることがよくあります — 微生物は化合物を自分で作らず、隣の分子を利用します.

囚人のジレンマの 1 つの例では、最善の戦略は脱走することです。しかし、ゲームが何度も繰り返されると、最適な戦略が変化します。 1 回の遭遇で捕食者を見つけたベルベット モンキーは、黙っていれば安全です。しかし、生涯にわたって、差し迫った危険を隣人に警告し、彼らも同じことをした場合、サルは生き残る可能性が高くなります. 「各プレーヤーには裏切るインセンティブがありますが、全体としては、協力すればうまくいくでしょう」と Plotkin 氏は述べています。 「これは、どのようにして協力が生まれるかという古典的な問題です。」

1970 年代、ミシガン大学の政治学者 Robert Axelrod は、さまざまな戦略を互いに競い合うラウンドロビン トーナメントを開始しました。多くの候補者が驚いたことに、最も単純なアプローチが勝利しました。他のプレーヤーの前の動きを単に模倣する、報復と呼ばれる戦略は、はるかに洗練されたプログラムを打ち負かしました.

しっぺ返しの戦略は、生物学の世界全体で見つけることができます。たとえば、トゲウオのペアは、しっぺ返しのデュエットで近くの捕食者を偵察します。 1 匹の魚が危険を冒して前に飛び出すと、もう 1 匹の魚が同様の勇敢な行動で報復します。パートナーにリスクを負わせようとして、しがみつくと、パートナーも引き下がります。

過去 30 年間、科学者たちはアクセルロッドの単純なバージョンよりも進化的に現実的なバージョンの囚人のジレンマを探求してきました。大規模なラウンド ロビン トーナメントのプレーヤーは、さまざまな一連の戦略から始めます。これは、遺伝的に決定されたフィットネスと考えてください。適者生存を模倣するために、各相互作用の勝者は、親と同じ戦略を継承するより多くの子孫を生み出します。したがって、最も成功した戦略は、時間の経過とともに人気が高まります。

勝利へのアプローチは、グループの規模、最初に提示された戦略、プレーヤーがミスを犯す頻度など、さまざまな要因によって異なります。実際、ゲームにノイズを追加すること (遺伝子突然変異の代役として機能する戦略のランダムな変更) は、しっぺ返しの支配を終わらせます。このような状況では、他人の裏切りを時折許すことを含む寛大な報復として知られる変種が勝利します.

これらのシミュレーションの全体的な風味は楽観的です — 優しさは報われます. 「最も成功する戦略は、他人を利用しようとしない戦略である傾向があります」と Nowak 氏は述べています。

プレスとダイソンは暗い絶望を抱えて登場します。

協力者の勝利

印象的な経歴にもかかわらず、プレスとダイソンはどちらもゲーム理論には比較的新参者でした。これにより、60 歳の囚人のジレンマに対する新しい解決策が生まれ、全米科学アカデミー紀要に掲載されました。 2012年、さらに予想外。 「これは、30 年前に書かれた可能性が十分にある驚くべき論文です」と Plotkin 氏は述べています。 「何百人もの科学者がゲーム理論とその応用を研究しているにもかかわらず、彼らの論文の中心にある数学的アイデアは見落とされていました。」

プレスとダイソンは、強要と呼ばれるアプローチを概説しました。このアプローチでは、1 人のプレーヤーが所定の一連の確率に従って裏切ることを選択することで常に勝つことができます。 Press and Dyson の戦略は、1 人のプレーヤーがゲームの結果をコントロールできるという点で注目に値します。ハーバード大学のノワクのグループの研究者であるクリスチャン・ヒルベは、「主な革新は、共闘者のやる気を完全になくすことなく、どのくらいの頻度で離脱できるかを計算することです」と述べています。さらに、勝者は以前の 1 つの動きを覚えているだけで済みますが、この戦略は、以前の多くのプレイ ラウンドを組み込んだものと同様に機能します。

2 番目のプレイヤーは、恐喝者に協力することを余儀なくされます。 「もし私が恐喝者なら、私たちが協力していたとしても、あなたが何をしようとも、私があなたよりも高い見返りを得るのに十分な割合で、私は時々裏切ります」とプロトキンは言いました.状況は中学校でのグループ プロジェクトを思い起こさせます。チームのメンバーの 1 人がサボると、良心的な生徒は良い成績を取るためにもっと頑張らざるを得なくなります。

Press と Dyson の最初の論文は、古典的なゲーム理論の文脈 (1 組のプレーヤー間の一連の相互作用) に設定されていました。しかし、Plotkin と Stewart は、ベルベット モンキーや吸血コウモリなど、個々の適応度に基づいて繁殖し、生存する進化するグループに同じ数学的アプローチを適用するとどうなるかを知りたがっていました。彼らは、Press と Dyson が特定したゼロ決定戦略と呼ばれる、より広いクラスの成功する戦略を調査しました。

このクラスの戦略には、恐喝の道徳的反対である寛大さが含まれます。一般に、寛大な戦略を採用するプレーヤーは、対戦相手が協力する場合は常に協力します。対戦相手が裏切った場合でも、最初のプレイヤーは一定の確率で協力し、対戦相手を寛大な心に戻そうとします。

Plotkin と Stewart の安堵のために、進化する個体群に適用した場合、強要的な戦略よりも寛大な戦略が最も成功しました。 2013 年にその結果を全米科学アカデミー紀要に発表した Plotkin 氏は、次のように述べています。 . 「他の戦略に取って代わることができない最も堅牢な戦略は寛大です。」

基本的な直感は単純です。 「恐喝は、相手が 1 人であればうまくいきます」と Plotkin 氏は言います。 「しかし、大規模な人口では、恐喝者は最終的に別の恐喝者とペアになります。」その後、両方が裏切りになり、見返りが少なくなります。 「プロトキンは私たちのモデルをひっくり返して改善しました」とダイソンは言いました。 「誰かに協力してもらいたいなら、その人をすぐに罰するよりも、短期的な利益で賄賂を贈るほうがよいでしょう。」

Hilbe は、現実世界のシナリオでこれらの調査結果を確認し、寛大な戦略または恐喝者の戦略を使用して、人間のプレーヤーをコンピューターと対戦させました。予想通り、利己的なコンピューターと対戦するよりも寛大なコンピューターと対戦した方が、より多くの賞金を獲得できました。しかし、人々は強奪者の反対者を罰する傾向もあり、協力することが彼らの最善の利益になるにもかかわらず、協力することを拒否しました.その結果、人間のプレーヤーとコンピューターの両方の利益が減少しました。最終的に、寛大なコンピューターは恐喝者のコンピューターよりも多くの賞金を獲得しました。

恐喝者の復讐

これらの結果を考えると、プロトキンは恐喝者を寄せ付けないことを望んでいました。しかし、その楽観主義は短命でした。 2013 年の彼の研究に続いて、Plotkin は、協力するか裏切ることによって利益が得られるように変更しました。プレーヤーは、自分の戦略と戦略的な見返りの両方を子孫に渡しました。両方の数量がランダムな変異を被る可能性があります。

環境条件の変化に対応する可能性のあるシステムへのこのシェイクアップにより、結果はダークサイドに戻りました.寛大さはもはや好ましい解決策ではありませんでした。 「欠損への誘惑を増大させる突然変異がグループ全体を席巻するにつれて、人口は転換点に達します」とプロトキンは言いました。 「裏切りへの誘惑は圧倒的で、裏切りが一日を支配しています。」

プロトキン氏は、結果は予想外だったと述べた。 「人々が協力を説明するのに使ってきたのと同じフレームワーク、つまりゲーム理論の中にあるというのは驚くべきことです」と彼は言いました。 「ゲームを進化させたとしても、協力が勝つと思っていました。」

要点は、条件を少し調整するだけで、協力と恐喝のどちらが勝利するかに大きな影響を与える可能性があるということです。マサチューセッツ工科大学の生物物理学者で、今回の研究には関与していないジェフ・ゴア氏は、「これが質的に異なる結果につながることは非常に素晴らしいことです」と述べています。 「制約に応じて、質的に異なる種類のゲームを進化させることができます。」

ミシガン州立大学の計算生物学者である Chris Adami は、最適な戦略など存在しないと主張しています。勝者は条件によって異なります。

確かに、プロトキンの研究が物語の終わりになる可能性は低い. 「結果が仮定にどのように依存するかを見る人がいると確信しています」とヒルベは言いました。 「どうにかして協力を取り戻せるかもしれません。」

囚人の未来

囚人のジレンマは明らかに、実際のやり取りを非常に単純化したものです。

では、協力の進化を研究する上で、それはどれほど良いモデルなのでしょうか?ダイソンは楽観的ではありません。彼はプロトキンとヒルベの研究が好きですが、それは興味深い数学が関係しているからです。 「確かに可能世界の記述としては非常に興味深いですが、私には生物学の世界のようには見えません」とダイソンは言いました.

Press や Dyson と同様の戦略を研究してきた数学者の Ethan Akin は、この結果は協力の進化よりも社会学的意思決定に適用できると考えていると述べています。

しかし、一部の実験生物学者は、囚人のジレンマとゲーム理論の両方がより広く彼らの分野に大きな影響を与えていると言って、これに同意しません。ジョージア工科大学の進化生物学者であるウィル・ラトクリフは、次のように述べています。

たとえば、抗生物質耐性を研究している科学者は、プレイヤーが協力することで常に恩恵を受ける、雪の吹きだまりゲームと呼ばれるゲーム理論のシナリオを使用しています。 (吹雪の後でアパートの建物で立ち往生している場合は、私道をシャベルで掃除することで利益が得られますが、そこに住んでシャベルを使わない他のすべての人もそうです.酵素は生産するのに費用がかかり、それを作らない怠惰なバクテリアは、より勤勉な隣人によって生産された酵素を使用することで利益を得ることができます.厳格な囚人のジレンマのシナリオでは、怠け者は最終的に生産者を殺し、全人口を害します。しかし、雪の吹きだまりゲームでは、生産者は酵素へのアクセスがより多くなるため、フィットネスが向上し、2 種類のバクテリアが共存できます。

研究室の微生物はゲーム理論のシナリオを模倣することができますが、これらの制御された環境が自然界で起こっていることを正確に反映しているかどうかは別の話です. 「ある種の生態系を想定することで、ゲームのダイナミクスを設定しました」と Ratcliff 氏は言います。しかし、これらのパラメータは、微生物の通常の生息地を反映していない可能性があります. 「実験のダイナミクスが囚人のジレンマや他のゲームに適合することを示すことは、それらのメカニズムが本質的にそれらを駆動することを必ずしも意味しません」と Ratcliff は言いました。



  1. トリケラトプスとティラノサウルスどっちが強い?
  2. 神経とニューロンの違い
  3. 私たちの足元に、隠された生命の世界
  4. 色が感情に影響を与える理由
  5. 食用蝶のライフ サイクル
  6. Rewilding とは何ですか? なぜ重要なのですか?