2024 年に人工知能が予期せぬ事態を明らかにした 4 つの方法

CNN の Wonder Theory 科学ニュースレターに登録してください。 興味深い発見や科学の進歩などに関するニュースで宇宙を探検しましょう



CNN

カリカリに焦げた数百冊の脆い古代の巻物は、広げようとすると崩れてしまい、文字の痕跡はほとんど判読できなくなる。ヘルクラネウムの巻物として知られるこの文書は、まだ未開封のままですが、人工知能という強力なツールのおかげで、その内容は今や手の届くところにあります。

AI と高解像度 X 線を使用して、3 人の研究者が 2023 年に巻物から 2,000 文字を超える文字を解読しました。その驚くべき偉業が明らかになりました。 最初の完全なパッセージ 西暦 79 年のヴェスヴィオ山の噴火にも生き残ったパピルスから採取されました。

ジュリアス・シーザーの義父の家であったと考えられる建物から回収されたこれらの遺物は、古代ローマとギリシャに関する前例のない情報の宝庫となっている。

解読プロセスを加速することを目的としたコンテストであるベスビオチャレンジを立ち上げたコンピューター科学者らは、2024年末までに4巻の巻物の90%が解錠されることを期待している。重要な課題は、文書を事実上平らにし、黒インクと文書を区別することであった。パピルスを炭化してギリシャ文字とラテン文字を読めるようにした。

「AI は、インクの証拠の可読性を高めるのに役立っています」と、10 年以上巻物の解読に取り組んでいるケンタッキー大学のコンピューターサイエンス教授ブレント・シールズは言う。 「インクの証拠はあります。それは、AI が蒸留し凝縮するこの複雑さの中に埋もれ、カモフラージュされています。」

このプロジェクトは、人工知能の有用性が高まっていることを示す説得力のある例の 1 つであり、2024 年にノーベル委員会が科学における AI の開発と応用を初めて認めたことにより、人工知能は成熟しました。 物理学賞 ジョン・ホップフィールドとジェフリー・ヒントンは、機械学習における基礎的な発見を行い、今日の人工知能の使用方法への道を切り開いたとして評価されました。

AI は曖昧で誇張されがちな用語ですが、人間の認知機能を模倣して問題を解決し、タスクを完了することを目的としています。人工知能には、データセットを使用して機械学習アルゴリズムをトレーニングおよび改善し、パターンを特定して予測を知らせることができるようにするなど、さまざまな計算技術が含まれます。

一部の AI ツール リスクを引き起こす可能性がありますが、 たとえば、性別や人種など、最終的には差別につながる偏見のある考えを反映した過去のデータに基づいてトレーニングされている可能性があるため、偏見を再現する雇用、警察、ローン申請に使用されるシステムなどです。

AI は科学的発見の状況を一変させ、2015 年以降、AI ツールを使用した査読論文の数と AI 手法を使用した論文の数が急増しました。 最も引用される可能性が高くなります。 半分以上 Nature が 1,600 人の科学者を対象に調査 AI ツールは研究の実践にとって「非常に重要」または「不可欠」であると期待されています。しかし、世界最古の科学アカデミーである英国王立協会は、多くの AI ツールのブラックボックス的な性質が、 AIベースの研究の再現性。しかし、シールズにとって、これは賢明に導入され、劇的な結果をもたらした強力な手段です。

「AI は、人間だけが問題を解決できると考えられていた方法で問題を解決しようと設計されたコンピューター サイエンスの分野です」とシールズ氏は述べています。 「私たちが使用している AI は、人間の目では見えないものをデータ内で見ることができるようにする一種の超能力だと考えています。」

ベスビオチャレンジは、この急速に変化する分野が科学を揺るがし、2024 年に予期せぬ事態を明らかにした方法の 1 つにすぎません。AI はまた、動物が深海でどのようにコミュニケーションするかについての科学者の理解を促進し、考古学者が人里離れた不毛な地形で新たな遺跡を発見するのを助けています。そして生物学の最大の課題のいくつかを解決します。

クジラの言葉やその他の動物の言語を解読する

研究者らは、マッコウクジラが発する謎のクリック音はテンポ、リズム、長さが異なることを知っているが、球根状の頭の鯨器官を通して発せられるこの音で彼らが何を言っているのかは、人間の耳には依然として謎のままである。

しかし、機械学習は、カリブ海の約 60 頭のマッコウクジラの声を表す、コーダと呼ばれる録音されたクリック シーケンス約 9,000 件を科学者が分析するのに役立ちました。この研究により、いつか人間と海洋動物とのコミュニケーションが可能になるかもしれません。

研究者らは、単独で行動するクジラの発声、合唱、海の巨人同士のコールアンドレスポンスのやりとりにおけるコーダのタイミングと頻度を調べた。人工知能で視覚化すると、人間のコミュニケーションにおける音声学に似ていると研究者らは説明する、これまで見たことのないコーダパターンが現れた。

機械学習は、科学者がマッコウクジラが作るクリックシーケンスを解読するのに役立っています。

プログラムは合計で 18 種類のリズム (クリック間の間隔のシーケンス)、5 種類のテンポ (コーダ全体の長さ)、3 種類のルバート (長さの変化)、および 2 種類の装飾音を検出しました。 「余分なクリック」は、短いコーダのグループのコーダの終わりに追加されます。

これらの機能をすべて組み合わせて、フレーズの「膨大なレパートリー」を形成することができます。 科学者らが5月に報告した。ただし、このアプローチには限界があります。機械学習はパターンを識別することに長けていますが、その意味を解明することはできません。

研究によれば、次のステップはクジラを使ったインタラクティブな実験と、クジラの行動の観察であり、これはマッコウクジラのクリックシーケンスの構文を解明する上で重要な部分となる可能性がある。

同博士によると、このアプローチは他の動物の発声にも応用できる可能性があるという。
カリフォルニア大学デービス校獣医学部教授ブレンダ・マッコーワン氏は以前CNNに語った。彼女はその研究には関与していませんでした。

一方、陸上では、考古学者たちがほぼ一世紀をかけて発見し記録してきた、ペルーのナスカ砂漠の埃っぽい地面に刻まれた神秘的な線やシンボルの探索を人工知能が加速させている。

多くの場合、上からしか見えない不規則な絵文字には、幾何学模様、人間のような人物、さらにはナイフを振り回すシャチが描かれています。

日本の山形大学の考古学教授、酒井正人氏が率いる研究者グループは、2020年時点でマッピングされた430のナスカのシンボルの高解像度画像を使用して物体検出AIモデルをトレーニングした。チームにはIBMのトーマス・J・ワトソンの研究者も含まれていたニューヨーク州ヨークタウンハイツにある研究センター。

2022年9月から2023年2月にかけて、チームはナスカ砂漠でモデルの精度をテストし、徒歩とドローンを使用して有望な場所を測量した。研究者らは最終的に、既知の地上絵の数のほぼ2倍となる303個の比喩地上絵を「地上真実化」した。数か月以内に。

AI ベースのモデルは、考古学者がペルーのナスカ砂漠に刻まれたさらに多くの神秘的なシンボルを発見するのに役立ちました。

モデルは完璧とは程遠いものでした。それは、629平方キロメートル(243平方マイル)をカバーする砂漠地帯から、驚異的な47,000の候補地を示唆しました。考古学者のチームはこれらの候補を選別してランク付けし、「可能性の高い」1,309 の候補地を特定しました。研究によれば、AIモデルによって行われた36の提案ごとに、研究者らは「有望な候補を1つ」特定したという。

それにもかかわらず、AI は考古学、特に遠隔地や考古学に多大な貢献をする可能性を秘めています。 砂漠などの険しい地形モデルはまだ完全に正確ではないが、ドイツのイエナにあるマックス・プランク地人類学研究所考古学部門の研究者兼データサイエンティストであるアミナ・ジャンバジャンサン氏は述べた。

ジャンバジャンサン氏はナスカの調査には関与していなかったが、AI モデルを使用して衛星画像に基づいてモンゴルの古墳を特定した。

「問題は、考古学者が機械学習モデルの構築方法を知らないことと、データサイエンティストは通常​​、他の場所でもっと多くのお金が得られるため、考古学にはあまり興味がないことです」とジャンバジャンサン氏は付け加えた。

人生の構成要素を理解する

AI モデルは、研究者が生命を最小スケールで理解するのにも役立ちます。つまり、生命の構成要素であるタンパク質を形成する一連の分子です。

タンパク質はわずか約 20 個のアミノ酸から構築されていますが、これらはほぼ無限の方法で組み合わせることができ、三次元空間で非常に複雑なパターンに折り畳まれます。これらの物質は、毛髪、皮膚、組織細胞の形成を助けます。 DNAを読み取り、コピーし、修復します。そして血液中に酸素を運ぶのを助けます。

何十年もの間、これらの 3D 構造の解読は、複雑な実験室実験と X 線結晶構造解析として知られる技術の使用を伴う、困難で時間のかかる取り組みでした。

しかし、2018 年に、状況を一変させる AI ベースのツールが登場しました。ロンドンの Google DeepMind の Demis Hassabis と John Jumper によって開発された AlphaFold タンパク質構造データベースの最新版は、アミノ酸配列から 2 億個の既知のタンパク質のほぼすべての構造を予測します。

すべての既知のアミノ酸配列と実験的に決定されたタンパク質構造に基づいてトレーニングされたデータベースは、「Google 検索」として機能します。ボタンを押すだけでタンパク質の予測モデルにアクセスできるようになり、基礎生物学や医学を含むその他の関連分野の進歩が加速します。このツールは世界中で少なくとも 200 万人の研究者によって使用されています。

スウェーデンのカロリンスカ研究所の医学遺伝学教授でスウェーデン王立科学アカデミー会員のアンナ・ウェデル氏は、ハサビス氏とジャンパー氏が参加した後、「これはまさに物理化学における伝統的な聖杯を解決する単独の画期的な進歩だ」とCNNに語った。 2024年のノーベル化学賞の受賞者3人。

このツールにはいくつかの制限があります。早期乳がんに関連する配列を含む、変異配列に基づくタンパク質に AlphaFold を適用する試みにより、このソフトウェアにはタンパク質の新たな変異の結果を予測する機能が備わっていないことが確認されました。

AlphaFold は、生物医学分野で導入されている多数の AI ツールの中で最も注目を集めているツールにすぎません。機械学習は、 人体のあらゆる種類の細胞のアトラス に作用する可能性のあるある種の抗生物質を含む、新薬となる分子の発見 特に恐ろしい薬剤耐性菌

Mindy Weisberger と Taylor Nicioli がこのレポートに寄稿しました

出典