>> 自然の科学 >  >> 生き物

デジタル鍵屋が生物学の分子キーを解読しました


計算生物学者のブルーノ・コレイアは、自分の研究室で「機械学習は許可されない」というルールを持っていました。彼はそれを本当の科学とは考えていませんでした。現在、Correia はそれを使用して、多くの生物学的プロセスに関与する複雑に折り畳まれた分子であるタンパク質間の潜在的な相互作用を、従来の方法よりも 40,000 倍速く検出しました。ジャーナル Nature Methods は 2020 年 2 月の表紙で彼のシステムを取り上げました。Correia は、機械学習を採用することに最初から消極的だったことについて、「私は間違っていました。間違っていてよかったです」と述べています。

何が彼の心を変えたのですか?幾何学的深層学習:曲面のパターンを学習できる人工知能の新たなサブフィールド。

タンパク質は、立体的なパズルのピースのように、でこぼこの不規則な形状を合わせることで相互作用します。研究者たちは、その方法を解明するために何十年も費やしてきました。 20 世紀半ばから科学者たちを悩ませてきたよく知られたタンパク質の折り畳みの問題は、タンパク質の構成アミノ酸とその最終的な 3D 形状との間のリンクを解読することによって、タンパク質の相互作用を理解しようとしています。 1999 年、IBM は折り畳みの問題に取り組むために Blue Gene スーパーコンピューターのラインアップの開発を開始しました。 20 年後、DeepMind は最先端の深層学習アルゴリズムをそれに適用しました。

MaSIF (分子表面相互作用フィンガープリンティングの略) と呼ばれる Correia のシステムは、分子の内部構造を無視することで、タンパク質の 3D 形状に固有の複雑さを回避します。代わりに、システムはタンパク質の 2D 表面をスキャンして、研究者が相互作用フィンガープリントと呼ぶものを探します。これは、別のタンパク質がそこに結合できることを示すニューラル ネットワークによって学習された特徴です。 「アイデアは、2 つの分子が一緒になるとき、それらが本質的に互いに提示しているのはその表面であるということです。必要なのはそれだけです」と、ハーバード大学医学部のタンパク質研究者で、深層学習も使用しているモハメド・アルクライシは述べています。 「非常に革新的です。」

タンパク質相互作用を予測するための MaSIF の表面に焦点を当てたフレームワークは、いわゆる de novo タンパク質設計を加速するのに役立つ可能性があります。これは、天然に存在する種類に依存するのではなく、有用なタンパク質をゼロから合成しようとするものです。しかし、このシステムの開発に協力したインペリアル カレッジ ロンドンの幾何学深層学習の専門家であるマイケル ブロンスタイン氏は、基礎生物学にも使用できる可能性があると述べています。 「がんはタンパク質の特性にどのように影響しますか?」彼は言った。 「がんの結果としての突然変異が、本来あるべきものに結合しないことによって、異なる方法で機能させるタンパク質の何かを破壊するかどうかを尋ねることができます. [MaSIF] は基本的な質問に答えることができます。」

スキンディープ

深層学習がどのようにしてタンパク質の指紋を作成できるかを理解したい場合、Bronstein は 2000 年代初頭のデジタル カメラに目を向けることを提案しています。これらのモデルには、比較的単純な仕事をする顔検出アルゴリズムがありました。 「顔があることを検出する必要があるだけです」—目、鼻、口—「鼻が長いか短いか、唇が太いか薄いかは関係ありません」と彼は説明しました。

最近のカメラはより用途が広いです。特定の人物を識別できるため、写真ライブラリをすばやく検索して、その人物が写っているすべての写真を見つけることができます。

この進歩は、コンピューターがトレーニング データから個人の微妙な特徴を学習する方法を提供するディープ ニューラル ネットワークによって可能になりました。このプロセスでは、特定の顔の多くのインスタンスをネットワークにフィードし、それらすべてを同じ人物としてラベル付けします。緑色の目、幅広の眉毛、黒い髪など、どの属性が正確に混ざり合っているかをコンピューターに事前に伝える必要はありません。代わりに、適切にラベル付けされた十分な例があれば、ネットワークは区別自体を学習します。

MaSIF は、タンパク質に対して同じことを行います。インタラクション フィンガープリンティングに対する以前のアプローチは、基本的な顔検出アルゴリズムに似ていました。彼らは研究者に特定の幾何学的パターンを事前に定義することを要求しました.対照的に、MaSIF は、タンパク質相互作用に関連することが知られているいくつかの基本的な表面の特徴から始まります。たとえば、表面の物理的な曲率 (ノブまたはポケットへの曲率)、その電荷、水をはじくか引き付けるかなどです。次に、トレーニング中に、ネットワークはこれらの特徴をさまざまな上位レベルのパターンを検出するフィンガープリントに結合する方法を学習します。

最近まで、この種の機械学習は、タンパク質の曲面で不規則な表面には使用できませんでした。幾何学的深層学習の台頭により、可能性が開かれました。コレイアは、2018 年 2 月にブロンスタインの自宅で行われた 2 週間の共同研究で、ブロンスタインがこの手法に注目したことを認めています。 「手作りの記述子はどこにも行きませんでした。」

MaSIF サイトと呼ばれるシステムの 1 つのバージョンは、タンパク質の表面全体を調べて、別のタンパク質が結合する可能性が最も高い場所を予測できます。これは、湾曲したキャンバスにターゲットを描くのと同様のアプローチです。 「これは私たちが一体型問題と呼んでいるものです」とコレイアは言いました。 「これは、特定のタンパク質の機能部位がどこにあるかを理解する方法と考えることができます。」 MaSIF サイトは、このタスクで 2 つの主要なサイト相互作用予測因子よりも約 25% 優れたパフォーマンスを示しました。

MaSIF-search と呼ばれるシステムの別のバージョンは、Correia が多対多の問題と呼んでいるものに取り組んでいます:1 つのタンパク質が 1 つの標的分子とどのように適合するかを予測する代わりに (ドッキングシミュレーションで通常起こるように)、システムは相互作用を比較します。多くのタンパク質のフィンガープリントを他の多くの人に提供し、適合を探します。 (「細胞内には 10,000 のタンパク質があり、それらの多くは常に互いに衝突しています」と Correia 氏は説明します。) このタスクでは、MaSIF は主要な分子ドッキング予測因子よりも優れていませんでした。 100個のタンパク質のランダムなセット内に適合する可能性のある数の約半分が見つかりました.しかし、ドッキング予測は、その検索を実行するのに 100 日近くの計算時間を必要としました。 MaSIF は 4 分かかりました。

その大幅なスピードアップは、基礎研究の「興味深い可能性を開く」とブロンスタイン氏は述べています。結局のところ、人体では、タンパク質は何万もの相互作用からなる機能ネットワークを形成しています。 「これらのグラフの作成には多くの時間がかかります」と Bronstein 氏は言います。 「[MaSIF のような] メソッドを使用すると、近似値にすぎない可能性がありますが、少なくとも、任意の生物のこれらのタンパク質間ネットワークの大まかなバージョンを構築できます。」

AlQuraishi は、タンパク質相互作用を予測するための MaSIF の肌の深いアプローチは理にかなっているが、誘導適合と呼ばれる現象を捉えることができなかったと指摘しました。それは、分子表面が互いに接近したときに形状 (および化学) が変化する方法です。言い換えると、2 つのタンパク質の表面は、ほぼ接触するまで相補的なフィンガープリントを示さない可能性があります。誘導された適合はタンパク質の表面下の構造に依存するため、MaSIF が見逃してしまう要因です。 「おそらく進化が最適化しているのは、まさにこの誘導された適合です」とアルクライシは言いました。 「[MaSIF] の驚くべき点は、この注意事項があっても、うまく機能することです。」

誘導フィットやその他の表面ダイナミクスを MaSIF に組み込むことは、Correia が探求する計画です。 「私にとって、それは [タンパク質] 機能を理解する最後のフロンティアです」と彼は言いました。 「それはおそらく、今後10年間をどのように過ごすかです。」しかし現在、彼には別の差し迫った仕事があります。それは、MaSIF を使用して、COVID-19 を引き起こすウイルスである SARS-CoV-2 の表面に散在するスパイク状のタンパク質をスキャンすることです。 「私たちは、そのウイルスにどのような指紋が含まれているかを調べようとしています」と彼は言いました。 「ウイルスには、私たちがすでに知っている場所以外に、攻撃を試みることができる場所がいくつかあるようです。」 Correia は、SARS-CoV-2 に関するこの情報を使用して、抗ウイルスタンパク質をゼロから合成しています。彼は今年結果を発表したいと考えています。 「ウイルスが宿主細胞に侵入する方法を阻害するために、ウイルスタンパク質の表面フィンガープリントに基づいて新しいタンパク質を設計できれば、非常にエキサイティングです」と彼は言いました. 「それが私をベッドから起き上がらせます。」



  1. ゴナドトロピン放出ホルモンは何をしますか
  2. ハッピーホルモン:定義とFAQ
  3. カタツムリが這う場所に唾液線を残すのはなぜですか
  4. 髪は実際にどのくらいの速さで成長しますか?
  5. 心臓はなぜ鼓動し続けるのか?
  6. なぜカカオの木はソフトゴールドと呼ばれるのですか?