機械学習によって飼いならされた量子の複雑さ|物理

2018 年、米国の主要なスーパーコンピューティングクラスターでは、気候シミュレーションがコンピューティングサイクルの 3 番目に大きな用途でした。クォークやその他の亜原子粒子の研究は 2 位でした。

リストのトップは、物理科学で最も多く引用されたアイデアでしたが、聞いたことのある人はほとんどいません.

カリフォルニア大学アーバイン校の理論化学者であるキーロン・バークは、「これはとてつもなく重要です。「これは科学において最も重要なことの 1 つです。」

科学の最も重要な秘密は密度汎関数理論 (DFT) と呼ばれ、物理学者や化学者が水素原子よりも複雑なものを理解するために使用する主な方法です。何十年もの間、研究者は DFT の能力を利用して、コーヒーの味から木星のコアの一貫性まで、あらゆるものを予測してきました。

DFT は科学者に、電子がどこに行くかを予測するための強力な近道を提供します。ひいては、電子をまとった原子、分子、およびその他の物体がどのように行動するかを予測します。物理学者と化学者は長い間、深い物理的専門知識を利用して、すべての電子に共通する複雑なダンスをよりよく反映する方程式を作成してきました。しかし最近では、ニューラルネットワークによって設計された新しいツールが競合しており、ある意味では、手作りの先駆者を上回っています。一部の研究者は現在、機械学習が研究者が新薬、超伝導、およびエキゾチックな物質の秘密を解き明かすマスター電子方程式に向けてより大きく、より速いステップを踏むのに役立つと信じています.

ストーニーブルック大学の凝縮物質物理学者である Marivi Fernández-Serra は次のように述べています。

エレクトロンウィスパラーズ

電子を知ることは、それらが構成する原子、分子、および材料を知ることです。 Erwin Schrödinger が彼の名を冠した方程式を発表した 1920 年代以来、物理学者は電子を完全に理解してきました。しかし、電子の群れを分析することになると、その理解はほとんど役に立たないことが証明されました.

問題は、電子が粒子というより雲であるということです。それらは空間全体に広がり、他のすべての電子と重なり合い、さまざまな方法で衝突します。それらの数が増加するにつれて、すべての電子間の一定の接触を説明するためにシュレディンガーの波動方程式を使用することは指数関数的に難しくなります.

カリフォルニア大学バークレー校の凝縮物質物理学者であるジェフリー・ニートンは、次のように述べています。

1964 年、2 人の物理学者が回避策を見つけました。ピエール・ホーエンバーグとウォルター・コーンは、分子のあらゆる側面を完全に捉えることができることを証明しました。分子の電子を合わせて不自然な流体に塗りつぶすことで、ある場所ではより厚く、別の場所ではより薄い流体になります。この電子ジュースの密度には、分子の複雑な波動関数に関するすべての情報が含まれており、電子を個別に追跡するという不可能な作業から物理学者を解放することが示されました。

「それは大きな奇跡です」と、ライス大学の材料科学教授である Douglas Natelson は言いました。

Hohenberg と Kohn の研究は、強力なマスター方程式、つまり普遍密度汎関数の存在を証明しました。この方程式は、電子スープのいくつかのインスタンスを取り、そのエネルギーを計算して、物理学者を電子の最も自然な配置 (可能な限り低いエネルギーを持つもの) に導きます。汎関数は、原則として、シリコンレンガから水分子まで、あらゆるシステムを記述できるという意味で普遍的です。

唯一の問題は、方程式がどのようなものか誰も知らなかったということです。

すぐに、Kohn と別の物理学者、Lu Jeu Sham は、実用的な密度汎関数を書き留める最初のパスを作成しました。電子の振る舞いのすべての微妙な側面を捉える正確な汎関数は、言葉では言い表せないほど複雑になるはずなので、彼らはそれを 2 つに分割しました。前半は、彼らがやり方を知っていた部分でした。それは、平均的にしかお互いを感知できない電子グループのエネルギーを提供しました。他のすべて — ビザンチン量子効果と非局所相互作用からの余分なエネルギー — は後半に入りました:交換汎関数と相関汎関数として知られるファッジファクターです。

彼らは「機能について私たちが理解していないことをその小さな部分に減らしました」とニートンは言いました.

その後数十年にわたり、科学者たちはコーンとシャムの研究を基にファッジ係数を推定するますます巧妙な方法を構築し、密度汎関数は電子を理解するための事実上の方法になりました。研究者はそれらを使用して、原子が電子をつかんだり放出したりする可能性、分子が振動する方法 (キュリオシティローバーが火星で生命の兆候を探すために使用する情報)、結晶格子内の原子の配置、振動の速度を予測します。素材の音など。この理論の無限の応用の流れにより、コーンは 1998 年にノーベル賞を受賞しました。

機能のはしご

研究者が DFT にさらなる精度を求めるとき、汎関数の交換項と相関項に詰め込まれた無知を考慮する必要があり、スケッチの詳細を鋭くして、普遍密度汎関数とより一致させなければなりませんでした.

人工知能企業 DeepMind の理論化学者である Aron Cohen は、神話上の普遍方程式を探している人の 1 人です。理論的な量子化学の抽象的な風景に根ざしたままでいるため、彼は 3D プリントされた青い机のおもちゃを手元に置いています。それはプラスチック製のフォーチュンクッキーのように見え、その曲線は普遍的な汎関数の正確な形状をたどりますが、最も単純なシステムに対してのみ使用できます。任意の 2 つの間で共有される 2 つの電子について知りたいことを明らかにするために使用できます。原子。それでも、任意の数の電子と原子を処理できる汎関数が存在する可能性があることを彼に思い出させます。「私たちが探しているのはこのようなものです」と彼は言いました。それははるかに複雑です。「それは本物です。」

DFT 研究の主な目標は、その普遍汎関数のより正確な近似を見つけることです。テンプル大学の物理学者で機能開発の第一人者であるジョン・パーデューは、長い間この研究の先頭に立ってきました。彼は、はしごの段を登るようなものとして、普遍機能への道を説明しています。各ラングで、物理学者は汎関数に新しい要素を追加します。最も単純な成分は、各場所の電子シチューの厚さです。次のラングでは、ファンクショナルは場所ごとに厚さがどれだけ速く変化するかも考慮し、研究者に広い視野を与え、ファンクショナルをより正確にします。

Perdew の戦略の重要な部分は、物理的な推論を使用して、「正確な制約」として知られる、適切な近似が従わなければならない特定の数学的特性を特定することです。より高いラングはこれらの制約をより多く満たすため、研究者はそれらすべてに従う方程式を見つけるために、より懸命に検索する必要があります。

Perdew のグループは、1999 年に 6 つの成分をブレンドする第 3 段階の汎関数に取り組み始め、2015 年には SCAN と呼ばれる最先端の汎関数をリリースしました。これは彼の 8 回目の試みであり、3 番目のラングに関連する 17 の既知の制約すべてに従った最初の試みでした。分子と固体の両方に適用可能な SCAN は、これまでに発見された普遍汎関数の最も有能な近似の 1 つを証明しました。

「三段汎関数には非常に豊富な可能性があります」と Perdew 氏は言います。「何が重要で、何が機能するかを理解するには時間がかかります。」

マシンに入る

Perdew が物理的な直感で密度汎関数を改善する技術を洗練させたとき、革命が起きていました。アルゴリズムは、人間が数学的に書き留めるには微妙すぎる電子の振る舞いのパターンを突き止めることができるでしょうか?

2012 年、Burke と彼の共同研究者は、単純化された電子のセットに機械学習を適用する最初の最新の試みを行いました。彼の 1 次元のプロトタイプは、アルゴリズムが研究者をはしごの上に引き上げることができるかどうかを確認するために、彼と他のグループを動機付けました.

2021 年の初めに 1 つの突破口が訪れました。Burke と共同研究者がおもちゃの問題用にニューラルネットワークをセットアップしたときです。このニューラルネットワークは、これまでのほとんどの試みでは無視されていた方法で、密度エラーとエネルギーエラーを追跡できました。「密度とエネルギーの両方を与える汎関数を得るには、非常に柔軟なアーキテクチャが必要です」と、ルクセンブルグ大学の理論化学者、アレクサンドル・トカチェンコは述べています。「頭で機能的な形を書くのは簡単ではありません。」

Stony Brook の Fernández-Serra は、同様の戦略を使用して、さまざまな分子とエネルギーを研究し、ほとんどの既知の制約に従う第 3 段階の汎関数を検索するニューラルネットワークを設計しました。基本的には機械を使用して、Perdew の足跡をたどりました。

彼女と Sebastian Dick が Physical Review B で報告したように、得られた交換関数と相関関数は、未知の分子のエネルギーを予測する上で SCAN を約 10% 上回っています。 2021 年の秋に。しかし、ささやかな利益は、Perdew の研究がすでに第 3 段の天井を見つけるところまで来ていたことを示唆していました。

「物理的な直感は、あなたが到達できるほとんどすべてのものを何とか使い果たしてしまいました」とフェルナンデス・セラは言いました. 「Perdew の汎関数は、機械学習を使用せずに得られるものと同じくらい優れています。」

より高く登るには、より複雑な入力と、それらを理解するためのアルゴリズムが必要になります。

DeepMind ははしごをスケーリングします

パンデミックの少し前、ボードゲームの囲碁を制覇した DeepMind の研究者たちは、新たな課題を探していました。彼らは科学的な機械学習の問題に特に関心があり、コーエンは彼らに DFT を売り込みました。彼は何年もかけて、机の上に置いているような単純なシステムの正確な機能を研究してきました。しかし、それらは現実世界を説明するほど複雑ではありませんでした.

「化学に役立つ何かにたどり着くまでの道のりは長いように感じました」と彼は言いました。

DFT の中心にある 1 つの弱点が、特に Cohen を蝕みました。電流密度汎関数は、多くの場合、電子を過度に塗りつぶします。この問題は、電子が主に 1 つの分子に集まる偏ったシステムでは特に顕著です。 DFT は、電子スープを両方の分子に均等に分散させる傾向があります。水素原子のような単純な場合であっても、DFT が粒子の合体と引き離しに不正確なエネルギーを与える場合、関連する問題が化学反応に現れます。「これは主力製品です」と Cohen 氏は言います。

次世代の汎関数を設計するために、Cohen と DeepMind チームは、物理原則の長いリストを満たすことについてあまり心配しないことを選択しました。代わりに、彼らはデータ、つまり大量のデータに頼っていました。彼らは文献を精査して、既知のエネルギーを持つ数千の分子のデータベースを探しました (シュレディンガー方程式または同様の方法を使用して多大な費用をかけて計算しました)。さらに研究を進め、スーパーコンピューターを使用して数百の追加分子のエネルギーを処理しました。その多くは計算に数日かかりました。

チームがサンプル分子の網羅的なライブラリを組み立てる一方で、Cohen と他の化学者は機能をどのように構造化するかを決定しました。

彼らは、興味をそそるほど用途の広いアプローチにたどり着きました。何年にもわたる試行錯誤の末、研究者たちは交換汎関数と相関汎関数の一部を推定するための特別なレシピを見つけました。機能の 1 つの部分のエネルギーの 80% が 1 つの方法で計算され、20% が別の方法で計算されたときに、パフォーマンスにスイートスポットがありました。研究者たちは長い間、次のステップは分子の周囲で 80/20 比を変化させることだと考えていましたが、これを完全に成功させた人は誰もいませんでした.

1998 年にこのタイプの汎関数を導入した Burke 氏は、「おそらく 100 の論文で、人々がこの形式で遊んでいましたが、誰もが使用できるものを作成していませんでした。おそらく、それは人には難しすぎるでしょう」と述べています。 /P>

例となる分子の海と DeepMind チームの機械学習の専門知識により、グループのニューラルネットワークは、まさにそのタイプの柔軟な第 4 段汎関数をトレーニングすることができました。主に、電子をより正確に配置し、スピンをより適切に説明するため、SCAN や他の主要な競合他社よりも、幅広い分子のエネルギーを推定できます。 DM21 と呼ばれる官能基は、化学結合の切断と形成を処理できる最初の汎用官能基です。 12 月 9 日に、グループは Science で機能について説明しました。 .

「これは最初の合理的な汎用機能です」と、関与していない Burke 氏は述べています。「これが見た目と同じくらい優れていれば、1 年以内に何千人もの人々が使い始めるでしょう。」

ただし、バーク氏は、機能を完全にテストするには時間がかかると警告しています。この分野には、最初は有望に見えたが致命的な欠陥を隠していた機能の残骸が散らばっており、研究者は DM21 を分解し始めたばかりです。

弱点の 1 つは、DM21 がデータが豊富な周期表の最初の 3 行の分子でトレーニングされたことです。つまり、それが学んだ電子の挙動は、金属原子や固体材料に引き継がれない可能性があることを意味します。これらは両方とも、たとえば高温超伝導体の銅ベースのファミリを分析するために重要です。これらのシステムを表す普遍汎関数の詳細は、今のところ、SCAN および他の汎関数によってより適切に近似されたままです。

「予見可能な将来、すべてをこなせる機能は 1 つではないと思います」と Tkatchenko 氏は述べています。

ユニバーサルファンクショナルに向けて

Fernández-Serra や DeepMind のような新しい汎関数の開発は、機械学習が普遍密度汎関数の新しい領域、特に分子や化学に対応する領域を探索するための強力なツールになり得ることを示唆しています。

「対処したい化学空間の部分を実際に調整し、これを可能な限り効率的に機能させる」のに適しています. 「機械学習の技術は定着すると思います。」

しかし、改善された化学汎関数が、原子から材料まですべてに関連する一般的な特徴を明らかにするかどうかは、まだ分からない.たとえば、Perdew は、従来の方法で機能をさらに洗練できる、新しい直感的な性質を探し続けています。「私はおそらく機械学習の取り組みに多くの時間を費やすつもりはありません。なぜなら、機械は学習できますが、学習したことを私たちに説明することはまだできないからです.」

Cohen は、DM21 が、人間の心またはニューラルネットワークによって生成されるかどうかにかかわらず、将来の近似の永続的な要素になる可能性がある普遍的な機能を垣間見たことを望んでいます.

「汎関数は無限に複雑なので、それを攻撃するのは良いことです」と彼は言いました。「理想的には、それらすべてを統合したいと考えています。」

機械学習によって飼いならされた量子の複雑さ

エレクトロン ウィスパラーズ

機能のはしご

マシンに入る

DeepMind ははしごをスケーリングします

ユニバーサル ファンクショナルに向けて

エレクトロンウィスパラーズ

ユニバーサルファンクショナルに向けて