研究を強化する機械学習

Jan 18, 2024

人工知能 (機械学習) は、慎重に使用した場合にのみ、複雑な分析をサポートし、質の高い研究を進めることができます。 John F. Wu が、機械学習が研究者にどのように力を与えるかについてアドバイスを共有します

あなたも好きかも

人気のリソース

人工知能 (AI)、つまり機械学習は、最近どこにでも使われているようです。あなたが研究者であれば、おそらく、これらの用語が自分の分野の学術文献で頻繁に登場するのを見たことがあるでしょう。しかし、このうちどれだけが実際に役立つのでしょうか? 機械学習も活用すべきでしょうか?

この記事では、私自身の天文学分野からインスピレーションを得て、機械学習が研究に役立つ場合とそうでない場合のいくつかのケースについて説明します。

機械学習は、「データ駆動型」の研究課題、つまりデータが多すぎて手動で検査できない場合に最も価値をもたらします。このようなシナリオでは、機械学習により作業負荷が軽減され、研究分野に集中できるようになります。ただし、機械学習の導入には落とし穴や隠れたコストがないわけではありません。

懐疑的な目を通して慎重に適用すると、機械学習は他の方法では実行不可能な研究プログラムを可能にすることができます。大まかに言うと、機械学習は 4 つの方法で研究者に力を与えることができます。

データセットを使用して何か他のことを判断できるかどうかを知りたい場合があります。たとえば、医学における機械学習が医師のがんのスクリーニングにどのように役立つかについて聞いたことがあるかもしれません。私の天文学分野では、何百万もの銀河の画像を撮影するのは非常に簡単ですが、銀河がどのように進化するかの詳細を理解するには、従来、特殊な観測を行って分析する必要がありました。機械学習を使用することで、私の共同研究者と私は、実際に画像のみを使用してこれらの銀河を研究できることを発見しました。

物事がどのように動作するかについての新しいモデルを作成するのは簡単ですが、モデルの本当のテストは、そのモデルに予測能力があるかどうかです。データ内のつながりを特定することで、モデルを定式化できます。機械学習も同様です。科学者たちは機械学習を利用してこれらの関係を数学の言語に要約し、宇宙規模での物質の分布を説明する新しい公式を発見しました。

機械学習を使用して典型的な傾向を見つけることができるのであれば、おそらく、機械学習が同様の傾向を見つけることも驚くべきことではありません。異常なものを検知するのが得意。多くの研究分野は徹底的な研究から恩恵を受けることができます。珍しい現象の調査と機械学習は、「干し草の山の中の針」を見つけるのに役立ちます。天文学では、重力波などの珍しい現象を検出するために機械学習も使用されています。出来事、超新星、重力レンズ銀河、誤って処理されたデータ、もっとずっと。外れ値銀河に関するある分析では、多くの興味深い現象が発見されました(まったく銀河ではない多くの「銀河」を含む)。

正直に言うと、研究には退屈で時間がかかる側面もあります。電波天文学では、人工信号や破損したデータを除去するために膨大な計算リソースと多くの時間が必要です。機械学習は、これらのタスクをわずかなコストと時間で実行できます。

研究の退屈な部分をスピードアップすることで、機械学習を実現します。また、他の方法では不可能な新しい種類の分析も可能になります。多くの研究課題は次の問題に対処しようとします: 観察された結果が与えられた場合、そのような結果を生み出したモデルのパラメータは何ですか? これらのいわゆる逆問題は、機械学習を使用して効率的に取り組むことができます。詳細については、シミュレーションベースの推論を参照してください。

データセットはますます大きくなっていますが、特徴を組み合わせて圧縮バージョンを作成する方法はたくさんあります。次元削減手法には、主成分分析 (PCA)、t 分布確率的近傍埋め込み (t-SNE)、均一多様体近似および射影 (UMAP) などの古典的なアプローチ、または事前トレーニングされたニューラルネットワークなどを使用する機械学習手法が含まれます。データを要約バージョンに変換するためのアルゴリズム。

また、予測を行うためにどの入力 (または特徴) が最も重要であるかを理解することも役立ちます。機械学習アルゴリズムが異なれば、最も重要な機能がさまざまな方法で明らかになります。たとえば、ランダムフォレストは、重要度に基づいて特徴を自動的にランク付けできます。ニューラルネットワークモデルの場合、顕著性マッピングを使用すると、予測を行うために画像内のどのピクセルが最も重要であるかを正確に特定できます (たとえば、勾配加重クラスアクティベーションマッピング (Grad-CAM))。これらのアルゴリズムは、研究プログラムに利益をもたらす、ある程度の機械学習の解釈可能性を提供します。

すべての問題が機械学習を使用して対処できるわけではない、または取り組む必要があるわけではないことに注意してください。方法。機械学習は、ツールキットに追加できるさまざまなツールのセットを提供するだけです。これらの新しいツールとドメイン固有の専門知識を組み合わせることで、解決しようとしている問題にどのツールが最適かを見極められるようになれば幸いです。機械学習は、大量のデータがあり、傾向や外れ値の発見、機械学習の高速化、データの視覚化や特徴の重要度ランキングから研究が恩恵を受ける場合に特に役立ちます。今後数年間で、機械学習の賢明な応用により、研究の方法が変わる可能性があります。

John F. Wu は、宇宙望遠鏡科学研究所の天文学者助手であり、ジョンズホプキンス大学の准研究員です。

これが興味深いと思われ、学者や大学スタッフからのアドバイスや洞察を毎週あなたの受信箱に直接届けたい場合は、THE Campus ニュースレターにサインアップしてください。

何も考えずに機械学習を適用すると、危険な分析が生じる可能性があります。一部の機械学習アルゴリズムは、学習曲線が急峻です。機械学習で実行できるからといって、そうすべきであるというわけではありません。 1. 傾向に基づいて予測を行う 2. 外れ値を特定する 3. 時間を節約する 4. 複雑なデータを視覚化して優先順位を付ける John F. Wu は、宇宙望遠鏡科学研究所の天文学者助手であり、ジョンズホプキンス大学の准研究員です。これが興味深いと思われ、学者や大学スタッフからのアドバイスや洞察を毎週あなたの受信箱に直接届けたい場合は、THE Campus ニュースレターにサインアップしてください。

前: 機械学習を使用して学生の社会的定着を予測する次: 遠い

お問い合わせを送信

送信