研究論文はあまりにも速いペースで発表されるため、全てを読むことは不可能です。特に機械学習の分野は、今や事実上あらゆる業界や企業に影響を与え(論文も発表されています)、その勢いは止まりません。このコラムでは、特に人工知能(AI)に限らず、近年の最も関連性の高い発見や論文を収集し、それらがなぜ重要なのかを説明します。
今週のディープサイエンスコラムのトピックは、惑星科学からクジラの追跡まで、実に多岐にわたります。ソーシャルメディアの利用状況を追跡することで得られた興味深い知見や、コンピュータービジョンシステムを人間の知覚に近づけようとする研究(うまくいくといいですね)も取り上げています。
MLモデルが関節炎を早期に検出

機械学習の最も信頼性の高いユースケースの一つは、特定の形状や無線信号といったターゲットパターンを用いてモデルを学習させ、膨大なノイズデータに当てはめて、人間が認識しにくい可能性のあるヒットを見つけるというものです。これは医療分野で有用であることが証明されており、深刻な疾患の早期兆候を十分な確信を持って発見し、さらなる検査を推奨することが可能になります。
この関節炎検出モデルは、医師が行うのと同じようにX線画像を使用します。しかし、人間の視覚で確認できる頃には、すでに損傷が進行しています。7年間にわたり数千人を追跡した長期プロジェクトによって、優れたトレーニングセットが構築され、AIモデルは、ほとんど知覚できない変形性関節症の初期症状を可視化できるようになりました。その結果、3年後の症状を78%の精度で予測することができました。
残念なことに、早期発見が必ずしも予防につながるとは限らない。効果的な治療法がないからだ。しかし、その知識は他の用途に活用できる。例えば、潜在的治療法のより効果的な試験などだ。「1万人を募集して10年間追跡調査する代わりに、変形性関節症を発症する可能性が高い50人を登録するだけで済むのです。そして、彼らに試験薬を投与し、それが病気の進行を阻止できるかどうかを調べるのです」と、共著者のケネス・ウリッシュ氏は述べた。この研究はPNAS誌に掲載された。
音響監視を利用してクジラを予防的に救う
船舶が大型クジラと衝突し、命を落とすケースが今でも頻繁に発生しているというのは驚きですが、事実です。自主的な減速措置はあまり効果がありませんが、「ホエールセーフ」と呼ばれるスマートなマルチソースシステムがサンタバーバラ海峡で稼働しており、これにより、クジラのリアルタイムの位置をより正確に把握できるようになることが期待されます。

このシステムは、水中音響モニタリング、ほぼリアルタイムの採食場所予測、実際の目撃情報、そして少量の機械学習(クジラの鳴き声を迅速に識別するため)を活用し、特定の航路におけるクジラの存在を予測します。これにより、大型コンテナ船は、直前になってクジラの群れを避けようとするのではなく、事前に十分な調整を行うことができます。
テッククランチイベント
サンフランシスコ | 2025年10月27日~29日
「このような予測モデルは、毎日の天気予報のように、未来の出来事を予測する手がかりを与えてくれます」と、ワシントン大学でこの研究を率いたブリアナ・エイブラムズ氏は述べています。「私たちは、最高かつ最新のデータを活用して、クジラが海でどのような生息地を利用しているかを理解しています。そして、生息地が日々変化する中で、クジラが最も居る可能性が高い場所はどこなのかを解明しようとしています。」
ちなみに、Salesforce の創設者である Marc Benioff 氏と妻の Lynne 氏は、これを可能にしたカリフォルニア大学サンタバーバラ校のセンターの設立に協力しました。
巨大ガス惑星の中心への最速の道
巨大ガス惑星と呼ばれる惑星は、主に水素でできており、大部分は液体ですが、核の奥深くまで進むにつれて金属に変化します。その仕組みは正確には分かっていません。もちろん、そこに行った人は誰もいませんし、地球上でそのような圧力と温度を実現するのはかなり難しいからです(ダイヤモンドアンビルと呼ばれるものを使って試みたようですが、かなり本格的なようです)。そのため、私たちは理論とシミュレーションに頼るしかありません。しかし、これらの条件を正確にシミュレーションするのは非常に困難であるため、これまでは数ナノ秒で数個の原子しか実現できませんでした。

最新のスーパーコンピュータと機械学習技術は、より優れた結果をもたらす可能性があります。ネイチャー誌に掲載されたEPFL、ケンブリッジ大学、IBMの共同研究は、量子力学の直接シミュレーションの代わりに機械学習予測を用いることで、計算を簡素化しながらも(研究者たちは)正確なモデルを構築しました。この結果は、水素は水の沸騰のように、ある時点で相転移を起こすという従来の理論に反し、突然の転移ではなく、緩やかな転移を示唆しています。
EPFL のスーパーコンピューターでの計算には数週間かかったが、同研究室の責任者であるミシェル・セリオッティ氏は「従来の方法で開発されたモデルを実行しようとしたら、何億年もかかっただろう」と述べている。
小鳥が教えてくれた(CDCのガイダンスを悪く言っている)

Twitterは繰り返し情報の「ファイアホース」に例えられてきた。ほとんどは無価値だが、それでも確かにファイアホースだ。これをどう理解すればいいのだろうか?多くの企業がTwitterで生計を立てており、パシフィック・ノースウエスト国立研究所(PNNL)も新型コロナウイルスへの対応を追跡するためにTwitterを活用している。「Twitterは国民の意見を代表しているわけではないが、それでも様々な政策に対する国民の見方について貴重な洞察を提供してくれる」とPNNLのマリア・グレンスキー氏は述べた。そこで同研究所は、パンデミックに関する1日あたり数百万件のツイートを特定・分析するために、「WatchOwl」というツールを活用している。
これは何かのライブ指標ではありません。データは数ヶ月前のものですが、自然言語分析によって、肯定的か否定的か、感情や考えが広がる方向、そしてそれらが発表や大規模集会といった現実世界の出来事とどのように相互作用するかなどが明らかになります。ジョージ・フロイド氏の死に抗議するデモは、マスク着用に関する全国的な議論にどのような影響を与えたのでしょうか?共和党全国大会でのマスク不足は非難を招いたのでしょうか?もしそうなら、それはどこで起きたのでしょうか?こうしたことは(ある意味悲しいことですが)後から振り返ってみることでしか観察できません。PNNLチームは、実際の出来事を見ることで、人々の反応に関するより良いモデルが生まれることを期待しています。
人間の知覚(それが何であれ)に近い
コンピュータービジョンシステムは驚くほど進化していますが、人間の視覚システムと比べるとまだ未熟です。その理由の一つは、人間の目と脳が、暗すぎる、明るすぎる、動いている、遠いなど、ほぼあらゆる入力を非常に効率的かつ堅牢に認識できることです。陸軍研究所は、AIシステムの視覚におけるある欠点、つまり極端なコントラストへの対応能力の欠如を軽減したいと考えています。

森の中を飛行するドローンを想像してみてください。ドローンは、木々の陰に隠れた深い影や、明るい日差しの中にある遮蔽物が切れた場所など、様々な特徴を素早く認識し、反応する必要があります。光量の桁違いの差(ハイダイナミックレンジとも呼ばれます)があるため、カメラが両方を同時に認識したり、適切な設定に切り替えるのに十分な速さで調整したりすることは困難です。
彼らが行った研究は、実際には人間の脳が急激な照明変化にどのように反応するかに関するものでしたが、その結果は視覚野やその処理経路に馴染みのない人にとってはおそらく興味深いものではないでしょう。私がこの研究を選んだのは、研究結果ではなく、自然を模倣しようとする際には自然を理解する必要があることを強調するためです。同様の障壁はAI研究のあらゆる分野に存在し、最先端の研究を進歩させるための基礎研究の重要性を浮き彫りにしています。
もう一つの考慮すべき点は、動いている物体を認識し、分類する速度です。時には、何が起こっているのか理解する前に反応してしまうほど速く、誰かに騙された時にひるんでしまうこともあります。なぜなら、視界の中で物体が急速に拡大していくという認識は、生理的反応と直接結びついているからです。自動運転車も同様の判断と反応を行う必要がありますが、様々な点で不十分な点があり、例えば、全く認識できなかったり、認識が遅すぎたりすることがあります。

CMUの研究者たちは、AIシステムがどれだけうまく、あるいは少なくともどれだけ速くこれを実現するかを示す新たな指標を提案した。彼らが「ストリーミング認識精度」と呼ぶこの指標は、基本的に、そのようなシステムが物体や行動を認識するのにかかる時間を指す。「センサーからの入力処理が終わる頃には、世界はすでに変化している」と、先月ECCVで発表された論文でこの測定基準を定式化した大学院生のメンティアン・リー氏は説明した。
革命的なアイデアではありませんが、振り返ってみると、このようなシステムが現実からどれだけ遅れているかを継続的に推定できるというのは、明らかに有用です。それを知ることで、リソースをいつ再配分するか、あるいは「追いつく」ためにいつ手抜きをするかを判断できる、あるいは特定のオブジェクトに関する判断が下されるまでにどれくらいの時間がかかるかを予測できるなど、より高度な改善につながる可能性があります。
オンラインでのエンゲージメントはまちまち
最新の研究は、ソーシャルメディアと、それらのプラットフォーム上で科学論文がどのように拡散するかに関するものです。ワシントン大学(Whale Safeとは無関係)に所属する研究者たちは、通常の学術関係者以外から多くのソーシャルエンゲージメントを獲得したプレプリント論文(つまり、ジャーナルに掲載されていないがオンラインで公開されている論文)1,800件のリツイートを調査しました。
研究者たちは、論文への関心度を「メンタルヘルス支持者、愛犬家、ビデオゲーム開発者、ビーガン、ビットコイン投資家、陰謀論者、ジャーナリスト、宗教団体、政治的支持層」といった様々なコミュニティ間で分類できることを発見しました。時には、間違いなく、これらすべてを一度に分析できたのです!
しかし、彼らはさらに、より不快な発見をした。「驚くべきことに、分析したプレプリントの10%には、右翼白人至上主義コミュニティに関連する相当な規模(5%超)の読者層が存在することも判明した。これらのプレプリントはどれも意図的に右翼過激派のメッセージを支持しているようには見えないものの、特定のプレプリントを参照するツイートの50%以上が過激派による流用となっているケースも存在する。」
これは科学者への警告であり、論文そのものはコントロールできるものの、それがどのように使用され、悪用されるかはコントロールできないというものです。優れた科学研究が悪意を持って転用されることのないよう、注意が必要です。