AI は歴史家が私たちの過去をより深く理解するのにどのように役立っているか
未来の歴史家は、コンピューターサイエンスを利用して、何世紀も前の人々がどのように暮らしていたかを分析しています。
1531年のあるヴェネツィアの街の夜。 印刷所の作業場では、見習いが天文学の教科書用のページのレイアウトに苦労している。活字の密集した線と、月食を表す、宇宙の中を移動する形状を観察する天使の頭の木版画である。
16 世紀の書籍制作のあらゆる側面と同様、これは時間のかかるプロセスですが、前例のないスピードで知識を広めることができます。
500 年後、情報の生成はまったく異なったものになっています。デジタル データの急流に含まれる数テラバイトの画像、ビデオ、テキストがほぼ瞬時に流通し、ほぼ同時に分析する必要があるため、機械のトレーニングが可能になり、また必要になります。 - フローを整理するための学習モデル。 情報生産におけるこの変化は、芸術の創造から医薬品開発に至るまで、あらゆるものの将来に影響を及ぼします。
しかし、こうした進歩により、データを過去とは異なる見方で見ることも可能になりました。 歴史家は機械学習、特にディープ ニューラル ネットワークを使用して、ヴェネツィアやその他の近世都市で作成されたような、カビの生えたアーカイブで何世紀も過ごしたことで汚れたり、印刷業者の手の滑りによって歪んだりした天文表を含む歴史文書を調査し始めています。
歴史家らは、現代のコンピューターサイエンスを遠い過去に適用することで、他の方法よりも広範囲にわたる歴史記録のつながりを引き出すことができ、歴史を文書ごとに分析することで生じる歪みを修正できると述べている。 しかし、機械学習によってバイアスや完全な改ざんが歴史記録に紛れ込んでしまうリスクなど、それ自体に歪みが生じます。 こうしたことすべてが、歴史家や、歴史を調べることで現在を理解しようとしている人たちにとって、しばしば議論される疑問になります。「将来、機械がより大きな役割を果たすようになっている中、私たちは過去の機械にどれだけ譲るべきだろうか?」
米国議会図書館の何百万もの新聞ページのコレクションや、19 世紀に遡るフィンランド公文書館の法廷記録など、ますます多くの歴史文書をデジタル化する取り組みを通じて、ビッグデータが人文科学にもたらされています。 研究者にとって、これは問題であると同時にチャンスでもあります。はるかに多くの情報が存在し、多くの場合、それをふるいにかけるための既存の方法が存在しませんでした。
医薬品開発パイプライン全体にわたる AI 自動化により、より速く、より安価な医薬品の可能性が開かれています。
この課題は、学者が複雑さを解析するのに役立つ計算ツールの開発によって解決されました。 2009年、オーストリア科学アカデミーのヨハネス・プライザー・カペラ教授は、14世紀のビザンチン教会の決定の記録を調べていた。 何百もの文書を理解するには、司教たちの関係を体系的にデジタル調査する必要があることに気づいたプライザー=カペラ氏は、個人のデータベースを構築し、ネットワーク分析ソフトウェアを使用して関係を再構築しました。
この再構築により隠れた影響力のパターンが明らかになり、プライザー=カペラは会議で最も発言した司教が最も影響力があるわけではないと主張した。 それ以来、彼はこの技術を 14 世紀のビザンツのエリート層を含む他のネットワークに適用し、その社会構造が女性の隠れた貢献によってどのように維持されていたかを明らかにしました。 「私たちは、公式の物語の外で何が起こっているのかをある程度特定することができました」と彼は言います。
プライザー=カペラの研究は、学問におけるこの傾向の一例にすぎません。 しかし、最近まで、機械学習は、これまで以上に大規模なテキストのコレクションから結論を導き出すことができないことがよくありました。特に、歴史文書の特定の側面(プライザー・カペラ氏の場合は、下手に手書きされたギリシャ語)が機械にとって解読不可能だったためです。 現在、深層学習の進歩により、人間の脳を模倣したネットワークを使用して、大規模で複雑なデータセットからパターンを抽出することで、これらの制限に対処し始めています。
ほぼ 800 年前、13 世紀の天文学者ヨハネス デ サクロボスコは、地球中心の宇宙に関する入門論文である『Tractatus de sphaera』を出版しました。 その論文は近世の大学生の必読書となった。 これは天動説の宇宙論について最も広く配布された教科書であり、16 世紀にコペルニクス革命によって天動説の宇宙観が覆された後も存続しました。
この論文は、1472 年から 1650 年の間に出版された 359 冊の天文学教科書のデジタル化コレクションの主役でもあり、その数は 76,000 ページに達し、数万点の科学図や天文表が含まれています。 マックス・プランク科学史研究所の教授であるマッテオ・ヴァレリアーニは、その包括的なデータセットに、共通の科学的世界観に向けたヨーロッパの知識の進化を追跡する機会があると考えました。 しかし、パターンを識別するには人間の能力以上のものが必要であることに彼は気づきました。 そこで、ヴァレリアーニ氏とベルリン学習データ基礎研究所(BIFOLD)の研究者チームは、機械学習に目を向けました。
そのためには、コレクションを 3 つのカテゴリに分割する必要がありました。テキスト部分 (明確な始まりと終わりのある、特定の主題に関する文章のセクション)。 月食などの概念を説明するのに役立つ科学的なイラスト。 天文学の数学的側面を教えるために使用された数値表。
これらすべてを総合すると、歴史家にとっては次のような疑問が生じます。「将来、機械がより大きな役割を果たせるようになる中、私たちは過去の機械にどれだけ譲るべきでしょうか?」
ヴァレリアーニ氏は、冒頭で、文章はアルゴリズムによる解釈を無視していると述べた。 まず、書体は多種多様でした。 近世の印刷所は、書籍用に独自の印刷物を開発し、文字を鋳造するための独自の冶金工房を持っていることがよくありました。 これは、自然言語処理 (NLP) を使用してテキストを読み取るモデルを書籍ごとに再トレーニングする必要があることを意味します。
言語にも問題がありました。 多くのテキストは地域固有のラテン語方言で書かれており、歴史的な言語で訓練されていない機械では認識できないことがよくあります。 「バックグラウンドでトレーニングするための語彙がない場合、これは一般に自然言語処理にとって大きな制限になります」とヴァレリアーニ氏は言います。 これが、NLP が英語などの主要な言語ではうまく機能するが、たとえば古代ヘブライ語では効果が低い理由の 1 つです。
代わりに、研究者はソース資料からテキストを手動で抽出し、たとえばテキストが別の本で模倣または翻訳された場合など、一連の文書間の単一のリンクを特定しました。 このデータはグラフに配置され、すべてのレコードを含むネットワークにこれらの単一リンクが自動的に埋め込まれました (その後、研究者はグラフを使用して、テキスト間のつながりを提案できる機械学習手法をトレーニングしました)。 これにより、テキストの視覚要素、つまり研究者がニューラル ネットワークを使用して研究した 20,000 点のイラストと 10,000 点の表が残りました。
歴史的画像のコンピューター ビジョンは、NLP と同様の課題に直面しています。 リッチモンド大学のデジタル人文科学のローレン・ティルトン准教授が言うところの「現在主義者」バイアスがそこにはある。 ティルトン氏によると、多くの AI モデルは過去 15 年間のデータセットに基づいてトレーニングされており、AI モデルがリスト化して識別することを学習した物体は、携帯電話や自動車などの現代生活の特徴である傾向があるという。 コンピュータは多くの場合、配電盤や Model T ではなく、iPhone や Teslas など、より長い歴史を持つオブジェクトの現代版のみを認識します。 さらに、モデルは通常、過去の粒子の粗い白黒写真 (または外観に一貫性がなく、時間の経過によって劣化した近世の宇宙の描写) ではなく、高解像度のカラー画像でトレーニングされます。 これらすべてにより、コンピュータ ビジョンを過去の画像に適用すると精度が低下します。
「コンピューター サイエンスの人々と話をすると、彼らは『物体検出を解決しました』と言うでしょう」と彼女は言います。 「実際、1930 年代の一連の写真を撮ってみると、私たちが思っているほど問題は完全に解決されていないことがわかるでしょう。」 大量のデータのパターンを識別できる深層学習モデルは、より抽象化できるため役立ちます。
Sphaera プロジェクトの場合、BIFOLD の研究者は、近世のテキストからイラストを検出、分類、(類似性に基づいて) クラスター化するようにニューラル ネットワークをトレーニングしました。 そのモデルは現在、CorDeep と呼ばれるパブリック Web サービスを介して他の歴史家にアクセス可能です。 彼らはまた、他のデータを分析するために新しいアプローチを採用しました。 たとえば、コレクション内の数百冊の本にあるさまざまな表は、「同じ表を 1,000 通りの異なる方法で印刷できる」ため、視覚的に比較することはできませんとヴァレリアーニ氏は説明します。 そこで研究者らは、レイアウトを無視して、含まれる数値に基づいて類似のテーブルを検出してクラスタリングするニューラル ネットワーク アーキテクチャを開発しました。
これまでのところ、このプロジェクトはいくつかの驚くべき結果をもたらしています。 データで見つかったあるパターンにより、研究者らは、宗教改革後にヨーロッパが宗教的路線に沿って分裂しつつある一方で、科学的知識が融合しつつあることを確認することができた。 改革派学者の働きのおかげで学術革新の中心地となったプロテスタントの都市ヴィッテンベルクなどで印刷されている科学書は、大陸中に広がる前にパリやヴェネツィアなどの中心地で模倣されるようになった。 ヴァレリアーニ氏は、プロテスタントの宗教改革は必ずしも研究が進んでいない主題ではないが、機械を介した視点によって研究者らは新たな発見をすることができた、「これは以前はまったく明らかではなかった」と語る。 テーブルと画像に適用されたモデルは、同様のパターンを返し始めました。
コンピュータは多くの場合、配電盤や Model T ではなく、iPhone や Teslas など、より長い歴史を持つオブジェクトの現代版のみを認識します。
これらのツールは、単に 10,000 のテーブルを追跡するよりも重要な可能性を提供すると、Valleriani 氏は言います。 その代わりに、研究者が実際に少数の文書しか調べていない場合でも、記録のクラスターのパターンから知識の進化について推論を導き出すことができます。 「2 つの表を見れば、200 年についてすでに大きな結論を下すことができます」と彼は言います。
ディープ ニューラル ネットワークは、さらに古い歴史を調べる役割も果たしています。 碑文 (エピグラフィーとして知られる) を解読し、損傷した例を復元することは、特に刻まれたオブジェクトが移動されたり、文脈上の手がかりが失われた場合に、骨の折れる作業です。 専門の歴史家は知識に基づいた推測を行う必要があります。 これを支援するために、DeepMind の研究科学者である Yanis Assael 氏と、ヴェネチアのカフォスカリ大学の博士研究員である Thea Sommerschield 氏は、碑文の欠落部分を再構築し、日付と場所をテキストに関連付けることができる Ithaca と呼ばれるニューラル ネットワークを開発しました。 研究者らによると、7万8000件以上の碑文からなるデータセットでのトレーニングを伴う深層学習アプローチは、大量のデータから学習することで修復と帰属に共同で取り組む初めてのアプローチだという。
アサエル氏とサマーシルト氏によると、これまでのところ、このアプローチにより、古代アテネの重要な時期の法令の碑文が解明されつつあるが、その年代は紀元前446年と紀元前445年と長い間考えられてきたが、この日付については一部の歴史家が異論を唱えている。 研究者らはテストとして、問題の碑文が含まれていないデータセットでモデルをトレーニングし、法令の本文を分析するよう依頼した。 これにより、異なる日付が生成されました。 「イサカの法令の平均予測日付は紀元前421年で、これは最新の年代測定の画期的な進歩と一致しており、ギリシャの歴史の中で最も重要な瞬間の1つをめぐる議論に機械学習がどのように貢献できるかを示している」と彼らは電子メールで述べた。
他のプロジェクトでは、機械学習を使用して過去についてさらに広範な推論を引き出すことを提案しています。 これは、デジタル化された記録から地元の歴史を再構築するために現在確立されているヨーロッパ各地のいくつかのローカル「タイムマシン」の 1 つであるヴェネツィア タイム マシンの背後にある動機でした。 ヴェネツィアの州立文書館は、80 キロメートルの棚にまたがる 1,000 年の歴史を網羅しています。 研究者の目的はこれらの記録をデジタル化することであり、その多くは現代の歴史家によって一度も調査されていなかった。 彼らは深層学習ネットワークを使用して情報を抽出し、同じ文書に登場する名前を他の文書にわたって追跡することで、かつてベネチア人を結びつけていた絆を再構築します。
タイムマシン機構の会長フレデリック・カプラン氏は、このプロジェクトにより市の行政文書が十分にデジタル化され、数世紀にわたる過去の都市の雰囲気を捉えることができ、建物ごとに調査して、異なる時代にそこに住んでいた家族を特定できるようになったと述べた。時間内のポイント。 「このような柔軟性を実現するには、何十万もの文書をデジタル化する必要があります」とカプラン氏は言います。 「これは今までに一度も行われたことがありません。」
それでも、人工知能によって再構築されたネットワークを通じて、中世のヴェネツィアを近隣レベルまでデジタルシミュレーションするというこのプロジェクトの究極の約束に関して言えば、この研究を主導したオーストリア科学アカデミーのヨハネス・プライザー=カペラ教授のような歴史家はこう語る。ビザンチンの司教たちの意見では、モデルがどのつながりに意味があるのかを理解できないため、プロジェクトは成果を上げることができなかったと述べています。
WHO: マックス・プランク科学史研究所
内容: 数値表や英数字表を含む歴史文書のコンテンツを分類するための Web ベースのアプリケーション。 ソフトウェアは、「コンテンツのイラスト」、「イニシャル」、「装飾」、「印刷マーク」などの視覚要素を検索、抽出、分類できます。
人物: ディープマインド
内容: 以前はエピグラファーによって実行されていた、テキストの復元、地理的帰属、および年代順の帰属のタスクを同時に実行するように訓練されたディープ ニューラル ネットワーク。
担当者:ローザンヌ連邦工科大学エコール・ポリテクニック、カ・フォスカリ、ヴェネツィア国立公文書館
内容: 1,000 年の歴史を網羅する、ヴェネツィア州のアーカイブのデジタル化されたコレクション。 完成したら、研究者らはディープラーニングを利用して歴史的なソーシャルネットワークを再構築する予定だ。
プライザー=カペラ氏は、自動検出を使用して文書からネットワークを開発する独自の実験を行った。司教に関する研究のように専門家にネットワークに送り込む情報を抽出させるのではなく、アルゴリズムを使用してネットワーク情報を抽出し、それによって多くの成果が得られたと述べている。 「人工的な複雑さ」については説明されていますが、歴史的解釈に役立つものは何もありません。 このアルゴリズムは、同じ納税者名簿に 2 人の名前が記載されている場合と、結婚証明書に記載されている場合を区別できなかったため、プライザーカペラ氏が言うように、「実際に得られるものには何の説明価値もありません」。 これは歴史家が機械学習の限界を強調している点で、ChatGPT のような大規模な言語モデルについて人々が指摘した点と同様です。つまり、モデルは最終的に何を読んでいるのか理解できないため、不合理な結論に達する可能性があります。
現在入手可能な情報源では、文脈を提供するために人間による解釈が必要であるのは事実だが、十分な数の歴史文書が機械可読になれば状況は変わる可能性があるとカプラン氏は言う。
しかし、彼は、より変革的な、そして潜在的により問題を伴う機械学習の応用を想像しています。 生成 AI を使用すると、不正確または不完全な可能性がある個々の記録ではなく、集計されたデータに基づいて、歴史的記録の空白部分 (たとえば、ヴェネツィアの職人の工房の見習いの数) を具体化する予測を行うことができます。 これは、より多くの非エリートの視点を全体像にもたらす可能性がありますが、入手可能な証拠に基づいて結論を下すという標準的な歴史慣行に反します。
それでも、より差し迫った懸念は、虚偽の記録を作成するニューラル ネットワークによってもたらされています。
現在、視聴者は YouTube で、1969 年の月面着陸が大惨事に終わった場合に備えて書かれたが、幸いにも配信される必要がなかったリチャード・ニクソンの演説を見ることができる。 研究者らは、AIが私たちの共通の歴史認識にどのような影響を与えるかを示すためにディープフェイクを作成した。 北東部史のダン・コーエン教授が最近、デジタルメディアとテクノロジーが歴史研究を形作る方法を探求することに特化したクラスで学生たちと議論したように、Dデイ上陸作戦のような主要な歴史的出来事の誤ったイメージを数秒で生み出すことができる。 「(写真は)完全に説得力があります」と彼は言う。 「戦車と機関銃を持って、大勢の人をビーチに立たせることができます。それは完璧に見えます。」
同社の大規模な言語モデルの新バージョンはでっち上げですが、間違っている場合にはそれを認めることもあります。
偽りの歴史は何も目新しいものではなく、コーエン氏はヨシフ・スターリンが歴史書から敵を消すように命令した方法を例として挙げるが、偽りが作成される規模とスピードは驚くべきもので、問題は画像だけに留まらない。 コーエン氏が学生たちと行ったように、生成 AI は、ビクトリア朝時代の議会演説のようなテキストを作成できます。 歴史的な手書き文字や書体を生成することで、書かれた歴史的記録のように見えるものを作成することもできます。
一方、Character.ai や Historical Figures Chat などの AI チャットボットを使用すると、ユーザーは歴史上の人物とのやり取りをシミュレートできます。 歴史家はこれらのチャットボットについて懸念を表明しており、これにより、たとえば、一部の個人が実際よりも人種差別主義者でなく、より反省しているように見える可能性があります。
言い換えれば、歴史的なチャットボットから歴史的記録に基づいて予測を行うモデルに至るまで、人工知能が物事を大きく誤るリスクがあるということです。 これらの間違いの中には、良性の時代錯誤も含まれます。チャットボット Character.ai でアリストテレスに女性 (女性を劣っていると見なしている) についての見解を質問したところ、女性は「ソーシャル メディアを持つべきではない」という回答が返されました。 しかし、その他の文書は、特に歴史家が個別にチェックするには大きすぎる文書コレクションに混在している場合や、歴史の特定の解釈に関心を持つ誰かによって回覧されている場合には、より重大な影響を与える可能性があります。
たとえ意図的な欺瞞がなかったとしても、歴史家が理解する訓練を受けていないツールを使用するのではないかと懸念する学者もいます。 テキサス大学サンアントニオ校の歴史学教授エイブラハム・ギブソン氏は、「これには大きなリスクがあると思う。なぜなら、人文主義者や歴史家である私たちは、事実上、分析を別の分野、あるいはおそらく機械に委託していることになるからだ」と語る。 ギブソン氏は、彼が話を聞いた歴史家仲間たちはつい最近まで人工知能が自分たちの研究に関連しているとは考えていなかったが、人工知能が最終的には歴史の解釈の一部をブラックボックスに委ねてしまう可能性があることにますます目覚め始めていると語る。
この「ブラック ボックス」問題は歴史上特有のものではありません。機械学習システムの開発者でさえ、それがどのように機能するかを理解するのに苦労することがあります。 幸いなことに、歴史家を念頭に置いて設計されたいくつかの手法は、より高い透明性を提供するように構成されています。 Ithaca は確率によってランク付けされたさまざまな仮説を生成しており、BIFOLD の研究者は、どの入力が予測に最も貢献しているかを明らかにすることを目的とした説明可能な AI を使用したモデルの解釈に取り組んでいます。 歴史家たちは、機械学習を批判的な立場から切り離して人々に見るよう奨励することで透明性を促進している、つまり便利なツールであるが、人間と同じように間違いやすいツールであると主張しています。
このような新しいテクノロジーに対する懐疑的な見方は根強いものの、この分野では徐々にそれを受け入れ始めており、やがて計算手法を拒否する歴史家の数は減るだろうとヴァレリアーニ氏は考えている。 AIの倫理に対する学者たちの懸念は、機械学習を利用しない理由というよりは、人文科学が機械学習の発展に貢献する機会である、と同氏は言う。
フランスの歴史家エマニュエル・ル・ロワ・ラデュリが1968年に書いたように、1840年代の英国議会の投票パターンなどの問題を調査するために計算歴史の実験を始めた歴史家の研究に応えて、「明日の歴史家はプログラマーになるだろう」そうでないと彼は存在しないでしょう。」
モイラ・ドノバンは、ノバスコシア州ハリファックスに拠点を置く独立科学ジャーナリストです。
この記事は、2023 年 5 月/6 月号の一部です。
「これらの生物が私たちよりも賢くなるのではないかということで、突然考え方を切り替えました。」
学生のカンニングに関する物語だけでは、すべてが語られるわけではありません。 生成 AI が実際に学習を改善できると考える教師たちを紹介します。
ヒントン氏は水曜日に EmTech Digital で講演します。
ChatGPT は汎用人工知能に関する憶測を引き起こしました。 しかし、AI の次の本当の段階は、特定のドメインとコンテキストで行われることになります。
特別オファー、トップ記事、今後のイベントなどをご覧ください。
メールを送信していただきありがとうございます。
何か問題があったようです。
設定を保存できません。 このページを更新して、もう一度更新してみてください。 このメッセージが引き続き表示される場合は、受信を希望するニュースレターのリストを添えて、[email protected] までご連絡ください。
これらすべてを総合すると、歴史家にとって次のような疑問が生じます。将来、機械がより大きな役割を果たすようになっている中、私たちは過去の機械にどれだけ譲るべきでしょうか? コンピュータは多くの場合、配電盤や Model T ではなく、iPhone や Teslas など、より長い歴史を持つオブジェクトの現代版のみを認識します。