>> 自然の科学 >  >> 天文学

人工知能が科学を変える方法


今日の物理学や天文学の実験の多くによって生み出される情報のなだれに追いつくことは、人間、または人間のチームでは不可能です。それらのいくつかは、毎日テラバイトのデータを記録しており、トレントは増加の一途をたどっています。 2020 年代半ばにスイッチが入る予定の電波望遠鏡であるスクエア キロメートル アレイは、インターネット全体とほぼ同じ量のデータ トラフィックを毎年生成します。

大洪水により、多くの科学者が人工知能に助けを求めています。最小限の人間の入力で、人工ニューラル ネットワーク (脳の機能を模倣するニューロンのコンピューター シミュレーション ネットワーク) などの AI システムは、膨大な量のデータを調べて、異常を強調し、人間が発見できなかったパターンを検出することができます。

もちろん、科学研究を支援するためのコンピューターの使用は約 75 年前にさかのぼり、意味のあるパターンを探すために手動でデータを精査する方法は、何千年も前に始まりました。しかし、一部の科学者は、機械学習と AI の最新技術は、科学を行うための根本的に新しい方法であると主張しています。生成モデリングとして知られるそのようなアプローチの 1 つは、データのみに基づいて、観測データの競合する説明の中から最ももっともらしい理論を特定するのに役立ちます。 .ジェネレーティブ モデリングの支持者は、宇宙について学習するための潜在的な「第 3 の方法」と見なされるほど斬新であると考えています。

伝統的に、私たちは観察を通じて自然について学んできました。ヨハネス・ケプラーがティコ・ブラーエの惑星位置表を熟読し、根底にあるパターンを識別しようとしたことを考えてみてください。 (最終的に、彼は惑星が楕円軌道で動くと推測しました。) 科学もシミュレーションによって進歩しました。天文学者は、天の川銀河とその隣接銀河であるアンドロメダ銀河の動きをモデル化し、それらが数十億年以内に衝突すると予測するかもしれません。観察とシミュレーションの両方が、科学者が仮説を立て、それをさらに観察して検証するのに役立ちます。ジェネレーティブ モデリングは、これらのアプローチの両方とは異なります。

「これは基本的に、観測とシミュレーションの間の第 3 のアプローチです」と、天体物理学者であり、生成モデリングの最も熱心な支持者の 1 人であるケビン シャウィンスキーは言います。 「問題に取り組む別の方法です。」

一部の科学者は、ジェネレーティブ モデリングやその他の新しい技術を、単に従来の科学を行うための強力なツールと見なしています。しかし、ほとんどの人は、AI が多大な影響を与えており、科学における AI の役割は拡大する一方であることには同意しています。 Fermi National Accelerator Laboratory の天体物理学者で、人工ニューラル ネットワークを使用して宇宙を研究している Brian Nord 氏は、人間の科学者が行う自動化が不可能なことは何もないのではないかと恐れている人々の 1 人です。 「ちょっと身も凍るような考えです」と彼は言いました。

世代別発見

大学院時代から、Schawinski はデータ駆動型科学の分野で名を馳せてきました。博士号の取得に取り組んでいる間、彼は何千もの銀河をその外観に基づいて分類するという課題に直面しました。この仕事のためにすぐに利用できるソフトウェアが存在しなかったため、彼はそれをクラウドソーシングすることに決めました。そして、Galaxy Zoo の市民科学プロジェクトが生まれました。 2007 年から、通常のコンピューター ユーザーは、どの銀河がどのカテゴリに属しているかについての最善の推測を記録することで、天文学者を支援しました。通常、多数決は正しい分類につながります。このプロジェクトは成功しましたが、Schawinski 氏が指摘するように、AI によって時代遅れになりました。「今日、機械学習のバックグラウンドとクラウド コンピューティングへのアクセス権を持つ才能のある科学者は、午後にすべてを行うことができます。」

Schawinski は 2016 年にジェネレーティブ モデリングの強力な新しいツールに目を向けました。基本的に、ジェネレーティブ モデリングは、条件 X が与えられた場合に、結果 Y が観察される可能性がどのくらいあるかを尋ねます。このアプローチは、信じられないほど強力で用途が広いことが証明されています。例として、生成モデルに一連の人間の顔の画像を入力し、各顔にその人の年齢のラベルを付けるとします。コンピューター プログラムがこれらの「トレーニング データ」をくまなく調べると、顔の老化とシワの増加の可能性との関係が明らかになり始めます。最終的には、与えられた顔を「老化」させることができます。つまり、年齢に関係なく、与えられた顔が受ける可能性のある身体的変化を予測できます。



最もよく知られている生成モデリング システムは、「敵対的生成ネットワーク」(GAN) です。トレーニング データに十分にさらされた後、GAN は、ピクセルが破損または欠落している画像を修復したり、ぼやけた写真を鮮明にすることができます。彼らは、競争によって欠落している情報を推測することを学びます (そのため、「敵対的」という用語が使われます)。ジェネレーターとして知られるネットワークの一部は、偽のデータを生成し、2 番目の部分である弁別子は、偽のデータと偽のデータを区別しようとします。実際のデータ。プログラムが実行されるにつれて、両方の半分が徐々に良くなります。最近出回っている超現実的な GAN 生成の「顔」のいくつかを見たことがあるかもしれません — ある見出しが言うように、「実際には存在しない非常に現実的な人々」の画像です。

より広い意味で、ジェネレーティブ モデリングは一連のデータ (通常は画像ですが、常にではありません) を取り、それぞれを一連の基本的で抽象的なビルディング ブロックに分解します。科学者はこれをデータの「潜在空間」と呼んでいます。アルゴリズムは、潜在空間の要素を操作して、これが元のデータにどのように影響するかを確認します。これにより、システム内で機能している物理プロセスを明らかにすることができます。

潜在空間の概念は抽象的で視覚化するのが難しいですが、大まかな類推として、人間の顔の性別を判断しようとするときに脳が何をしているのか考えてみてください。髪型や鼻の形など、なかなか言葉にできないパターンに気がつくこともあるでしょう。コンピューター プログラムは、同様にデータの中から顕著な特徴を探します。口ひげが何か、性別が何かはわかりませんが、一部の画像に「男性」または「女性」のタグが付けられたデータ セットでトレーニングされた場合、 「口ひげ」タグが付いているものもあれば、すぐにつながりを推測できます。

12 月に Astronomy &Astrophysics に掲載された論文で 、Schawinski と彼の ETH チューリッヒの同僚である Dennis Turp と Ce Zhang は、生成モデリングを使用して、銀河が進化するにつれて受ける物理的変化を調査しました。 (彼らが使用したソフトウェアは、敵対的生成ネットワークがそれを処理する方法とは多少異なる方法で潜在空間を処理するため、類似していますが、技術的には GAN ではありません。) 彼らのモデルは、物理プロセスに関する仮説をテストする方法として人工データセットを作成しました。彼らは、例えば、星形成の「クエンチング」 — 形成速度の急激な減少 — が、銀河の環境の密度の増加とどのように関連しているかを尋ねました.

Schawinski にとって重要な問題は、恒星と銀河のプロセスに関する情報を、データだけからどれだけ引き出すことができるかということです。 「天体物理学について私たちが知っていることをすべて消去しましょう」と彼は言いました。 「データ自体を使用するだけで、その知識をどの程度再発見できるでしょうか?」

まず、銀河の画像は潜在空間に縮小されました。次に、Schawinski は、銀河の環境の特定の変化 (周囲の密度など) に対応する方法で、その空間の 1 つの要素を微調整することができました。その後、彼は銀河を再生成し、どのような違いが生じるかを確認することができました. 「だから今、私は仮説生成マシンを手に入れました」と彼は説明しました。 「このプロセスによって、もともと密度の低い環境にある銀河を大量に集めて、高密度の環境にあるように見せることができます。」 Schawinski、Turp、Zhang は、銀河が低密度環境から高密度環境に移行するにつれて、色が赤くなり、星がより中心に集中することを発見しました。これは、銀河に関する既存の観測結果と一致する、と Schawinski 氏は述べた。問題は、なぜそうなのかということです。

次のステップはまだ自動化されていないと Schawinski は言います。説明:おそらく銀河は高密度の環境でより多くの塵を含んでいるためより赤くなるか、あるいは星の形成が減少するためにより赤くなる (つまり、それらの星はより古い傾向がある)。生成モデルを使用すると、両方のアイデアをテストすることができます。ほこりや星形成率に関連する潜在空間の要素を変更して、銀河の色にどのように影響するかを確認します。 「答えは明らかです」とシャウィンスキーは言いました。より赤い銀河は、「塵が変化した場所ではなく、星形成が落ちた場所です。したがって、その説明を支持する必要があります。」



このアプローチは従来のシミュレーションに関連していますが、重要な違いがあります。シミュレーションは「本質的に仮定に基づいている」と Schawinski 氏は述べています。 「そのアプローチは、『私がシステムで見ているすべてのものを生み出す根底にある物理法則が何であるかを知っていると思います』と言うことです。したがって、私は星形成のレシピを持っています。等々。すべての仮説をそこに入れ、シミュレーションを実行しました。それから私は尋ねます:それは現実のように見えますか?」彼がジェネレーティブ モデリングで行ったことは、「ある意味で、シミュレーションとは正反対です。私たちは何も知りません。私たちは何も仮定したくありません。私たちは、何が起こっているのかをデータそのものから教えてもらいたいのです。」

このような研究における生成モデリングの明らかな成功は、明らかに天文学者や大学院生が不要になったことを意味するものではありません。電子的な指先で操作できるのは、膨大な量のデータ プールにほかなりません。 「これは完全に自動化された科学ではありませんが、科学のプロセスを自動化するツールを少なくとも部分的に構築できることを示しています」と Schawinski 氏は述べています。

ジェネレーティブ モデリングは明らかに強力ですが、それが本当に科学への新しいアプローチを表しているかどうかは議論の余地があります。ニューヨーク大学とフラットアイアン研究所 (Quanta など) の宇宙学者である David Hogg の場合 、シモンズ財団によって資金提供されています)、この手法は印象的ですが、最終的には、データからパターンを抽出する非常に洗練された方法にすぎません。これは、天文学者が何世紀にもわたって行ってきたことです.つまり、観察と分析の高度な形です。 Hogg 自身の作品は、Schawinski の作品と同様、AI に大きく依存しています。彼は、ニューラル ネットワークを使用して星をスペクトルに従って分類し、データ駆動型モデルを使用して星の他の物理的属性を推測しています。しかし、彼は自分の研究とシャウィンスキーの研究を実証済みの科学と見なしています。 「私はそれが第三の道だとは思わない」と彼は最近言った. 「コミュニティとしての私たちは、データの使用方法についてはるかに洗練されてきていると思います。特に、データとデータの比較が大幅に改善されています。しかし、私の見解では、私の仕事はまだ観察モードです。」

勤勉なアシスタント

それらが概念的に斬新であるかどうかにかかわらず、AI とニューラル ネットワークが現代の天文学と物理学の研究において重要な役割を果たすようになったことは明らかです。ハイデルベルク理論研究所では、物理学者のカイ ポルステラーがアストロインフォマティクス グループを率いています。このグループは、天体物理学を行う新しいデータ中心の方法に焦点を当てた研究者チームです。最近では、機械学習アルゴリズムを使用して銀河のデータ セットから赤方偏移情報を抽出していますが、これは以前は困難な作業でした。

ポルステラーは、これらの新しい AI ベースのシステムを、退屈したり、労働条件について不満を言ったりすることなく、何時間も続けてデータをくまなく調べることができる「勤勉なアシスタント」と見なしています。これらのシステムは退屈で単調な作業をすべて行うことができるため、「クールで興味深い科学を自分で行う必要があります」と彼は言いました。

しかし、それらは完璧ではありません。特に、Polsterer 氏は、アルゴリズムは訓練されたものしか実行できないと警告しています。システムは、入力に関して「不可知論的」です。銀河を与えると、ソフトウェアはその赤方偏移と年齢を推定できますが、同じシステムにセルフィーや腐った魚の写真を入力すると、(非常に間違った) 年齢も出力されます。最終的には、人間の科学者による監視が依然として不可欠である、と彼は述べた。 「それは研究者であるあなたに返ってきます。通訳を担当するのはあなたです。」

Fermilab の Nord 氏は、ニューラル ネットワークが結果だけでなく、結果に沿ったエラー バーも提供することが重要であると警告しています。科学では、測定を行い、関連するエラーの見積もりを報告しない場合、誰もその結果を真剣に受け止めないだろう.

多くの AI 研究者と同様に、Nord もニューラル ネットワークによって生成された結果が不可解であることを懸念しています。多くの場合、システムは、その結果がどのように得られたかを明確に示すことなく回答を提供します。

しかし、透明性の欠如が必ずしも問題であると誰もが感じているわけではありません。フランスのCEA Saclayにある理論物理学研究所の研究者であるLenka Zdeborováは、人間の直感も同様に理解できないことが多いと指摘しています。写真を見て、すぐに猫を認識します。 「あなた自身の脳は、ある意味でブラック ボックスです。」

AI を活用したデータ駆動型の科学に移行しているのは、天体物理学者や宇宙学者だけではありません。 Perimeter Institute for Theoretical Physics の Roger Melko とオンタリオ州のウォータールー大学のような量子物理学者は、ニューラル ネットワークを使用して、その分野で最も困難で最も重要な問題のいくつかを解決しました。多粒子系。メルコが「次元の指数関数的な呪い」と呼んでいるもののために、AI は不可欠です。つまり、波動関数の形式の可能性は、それが記述するシステム内の粒子の数に応じて指数関数的に増加します。その難しさは、チェスや囲碁のようなゲームで最善の手を見つけようとすることに似ています。対戦相手が何をプレイするかを想像して、次の手をじっと見つめ、最善の対応を選択しようとしますが、一手ごとに、可能性の数が増えます。

もちろん、AI システムはこれらのゲームの両方をマスターしています。チェスは数十年前、囲碁は 2016 年に AlphaGo と呼ばれる AI システムが人間のトップ プレーヤーを倒したときです。それらは量子物理学の問題にも同様に適している、と Melko は言います。

機械の心

シャウィンスキーが科学を行う「第 3 の方法」を発見したと主張するのが正しいのか、それともホッグが言うように、それが単なる伝統的な観察とデータ分析の「ステロイドによる」ものなのかにかかわらず、AI が科学的発見の趣を変えていることは明らかです。確実に加速します。 AI 革命は科学分野でどこまで進むのでしょうか?

時折、「ロボット科学者」の功績について壮大な主張がなされます。 10 年前、Adam という名前の AI ロボット化学者が、パン酵母のゲノムを調査し、どの遺伝子が特定のアミノ酸の生成に関与しているかを解明しました。 (Adam は、特定の遺伝子が欠落している酵母菌株を観察し、その結果をその遺伝子を持つ菌株の挙動と比較することでこれを行いました。)Wired の見出しには、「ロボットが科学的発見をすべて自力で行う」と書かれていました。

最近では、グラスゴー大学の化学者である Lee Cronin が、ロボットを使用して化学物質をランダムに混合し、どのような種類の新しい化合物が形成されるかを調べています。質量分析計、核磁気共鳴装置、赤外線分光計を使って反応をリアルタイムで監視することで、システムは最終的に、どの組み合わせが最も反応性が高いかを予測することを学習しました。さらなる発見につながらない場合でも、Cronin 氏によると、このロボット システムにより、化学者は研究を約 90% スピードアップできる可能性があります。

昨年、ETH チューリッヒの別の科学者チームは、ニューラル ネットワークを使用して一連のデータから物理法則を推測しました。彼らのシステムは一種のロボケプラーであり、地球から見た空の太陽と火星の位置の記録から太陽系の太陽中心モデルを再発見し、衝突するボールを観察することで運動量保存則を見つけました。 .多くの場合、物理法則は複数の方法で表現できるため、研究者は、システムが既知の法則について考える新しい方法 (おそらくより単純な方法) を提供するのではないかと考えています.

これらはすべて、AI が科学的発見のプロセスを開始した例ですが、いずれの場合も、新しいアプローチがどれほど革新的であるかについて議論することができます。おそらく最も物議をかもしているのは、データだけからどれだけの情報を収集できるかという問題です。これは、途方もなく大量の (そして増加している) データの山の時代における差し迫った問題です。 理由の本 (2018) で、コンピューター科学者の Judea Pearl とサイエンス ライターの Dana Mackenzie は、データは「非常に馬鹿げている」と主張しています。因果関係に関する質問は「データだけでは決して答えられない」と彼らは書いています。 「モデルを使わない方法でデータを分析する論文や研究を見るときはいつでも、その研究の結果が単なる要約であり、おそらくデータを変換するだけで、データを解釈するものではないことを確信できます。」 Schawinski は、Pearl の立場に同情していますが、「データのみ」で作業するという考えを「ちょっとしたわらの男」と表現しています。彼はそのように原因と結果を推測すると主張したことは一度もない、と彼は言った. 「データを使って、従来よりも多くのことができると言っているだけです。」

もう 1 つのよく耳にする議論は、科学には創造性が必要であり、少なくともこれまでのところ、それを機械にプログラムする方法がわからないというものです。 (クローニンのロボケミストのように、単純にすべてを試すことは、特に創造的ではないようです。) 「創造性が必要になるたびに、人間が必要になります。」そして、創造性はどこから来るのでしょうか?ポルステラーは、それが退屈に関係しているのではないかと疑っている。機械には経験できないことだ、と彼は言う。 「創造的であるためには、退屈を嫌う必要があります。そして、コンピューターが退屈に感じることはないと思います。」一方、Deep Blue や AlphaGo などのプログラムを説明するために、「クリエイティブ」や「インスパイアされた」などの言葉がよく使われてきました。そして、機械の「心」の内部で何が起こっているかを説明するのに苦労していることは、私たちが自分の思考プロセスを精査するのが難しいことに反映されています.

Schawinski は最近、学界を離れて民間部門に移りました。彼は現在、多くの ETH 科学者を雇用している Modulos というスタートアップを運営しており、そのウェブサイトによると、「AI と機械学習の開発の嵐の中で」働いています。現在の AI 技術と本格的な人工知能との間にどんな障害が存在するとしても、彼と他の専門家は、機械が人間の科学者の仕事をますます行う準備ができていると感じています。限界があるかどうかはまだわかりません.

「生物のハードウェアを使用して、生きている最も優秀な人間が自力で行うことができない物理学や数学を発見できる機械を近い将来に構築することは可能でしょうか?」シャウィンスキーの不思議。 「科学の未来は最終的に、私たちが決して到達できないレベルで動作する機械によって動かされるのでしょうか?知らない。良い質問です。」

この記事はに転載されました Wired.com .



  1. 読者はおさるのジョージが大好きです。私は著者の天文学の本に恋をしました。
  2. 今日NASAが宇宙船を小惑星に衝突させることについて知っておくべきことすべて
  3. 「事故」と呼ばれる奇妙な物体は、異常な星の新しい人口を明らかにします
  4. 火星を再び偉大にする
  5. ゼロGでどうやっておしっこするの?
  6. ブラジル出身の8歳の小惑星ハンターは世界最年少の天文学者です