研究論文はあまりにも頻繁に発表されるため、全てを読むのは容易ではありません。特に機械学習の分野では顕著で、現在ではほぼあらゆる業界や企業に影響を与え、論文も発表されています。このコラムでは、特に人工知能(AI)に限らず、近年の興味深い発見や論文をいくつか取り上げ、それらがなぜ重要なのかを説明します。
今週は、機械学習システムにおけるバイアスや不正行為、あるいはそれらを裏付けるデータの欠陥を特定・確認することを目的としたエントリーをいくつかご紹介します。まずは、ワシントン大学がコンピュータービジョンとパターン認識に関する会議で発表した、視覚的にも魅力的なプロジェクトをご紹介します。
彼らは、写真に写っている水、雲、煙などの流体の特徴を認識・予測し、一枚の静止画からアニメーション化するシステムを訓練しました。その結果は非常に興味深いものとなっています。

なぜでしょうか?まず、写真の未来はコードにあり、カメラが向けられた世界をより深く理解すればするほど、より正確に世界に対応したり再現したりできるようになります。偽の川の流れはそれほど需要がありませんが、一般的な写真の特徴の動きや挙動を正確に予測することは求められています。
機械学習システムの開発と応用において、答えなければならない重要な問いは、それが実際に期待通りの動作をしているかどうかです。「AI」の歴史には、実際にはタスクを実行していないにもかかわらず、実行しているように見せかける方法を見つけたモデルの例が数多くあります。まるで、部屋を掃除するはずなのにベッドの下の物を蹴り飛ばしてしまう子供のようなものです。
これは医療分野における深刻な問題であり、偽装するシステムは悲惨な結果を招く可能性があります。同じくワシントン大学の研究では、文献で提案されているモデルには、研究者が「近道学習」と呼ぶ、このような傾向が見られることが示されています。これらの近道は、例えばX線写真のリスクを画像のデータではなく患者の人口統計情報に基づいて判断するといった単純なものもあれば、データの元となる病院の状況に大きく依存し、他の病院への一般化を不可能にするといった、より特異なものも考えられます。
研究チームは、多くのモデルが、学習用データセットとは異なるデータセットで使用された場合、基本的に失敗する可能性があることを発見しました。機械学習の透明性の向上(「ブラックボックス」の開示)により、これらのシステムがルールを回避しているかどうかを容易に判断できるようになることを期待しています。
テッククランチイベント
サンフランシスコ | 2025年10月27日~29日

逆の例としては、気候モデリングが挙げられます。気候モデリングは非常に複雑なシステムを扱うため、スーパーコンピューターは微小な空間における空気と水の動きをシミュレートするためだけに、数ヶ月かけて計算を繰り返す必要があります。適切なデータを機械学習システムに入力することで、簡略化されたモデルを作成できます。例えば、23時間分のデータに基づいて24日の天気を予測するといった具合です。しかし、このシステムは実際に気候要因をモデル化しているのでしょうか?それとも、統計的に確率の高い推測を行っているだけなのでしょうか?
レディング大学で開始された研究は、これらのシステムを非常に注意深く調査した結果、実際に主張通りの働きをしているという嬉しい発見に至りました。「ある意味で、これはデータ駆動型の手法がインテリジェントであることを意味します。データのエミュレーターではなく、動的なプロセスを捉えるモデルなのです。データの背後にあるものを再構築できるのです」と、共著者のヴァレリオ・ルカリーニ氏は述べています。
企業が気候関連の大災害に取り組む中、Atmo によって天気予報が AI で更新される
こうした確信は、ランカスター大学の洪水予測プロジェクトのような用途で役立つでしょう。以前のバージョンでは、同様の確信の欠如に悩まされていました。プラメン・アンジェロフ教授は、より高速で正確であるだけでなく、説明可能な改良型洪水モデルの開発に着手しています。AIシステムが危害を及ぼす可能性のある場所では、このような「私たちがどのように知っているか、それがなぜわかるのか」というアップグレードがますます一般的になってくると予想されます。
学生が大学を中退する可能性が高いかどうかを検知するアルゴリズムなど、状況によっては容易に定量化できない場合があります。システムが意味のない相関関係を拾ってしまう場合、ここでも近道となる可能性があります。コーネル大学の研究者たちは、人種、性別、収入といった保護対象の人口統計情報を含めることがこれらのモデルに影響を与えるかどうかを調査しましたが、幸いなことに、推定値に何らかの影響は及ばないことが分かりました。実際、研究チームはこれらの要因を網羅したより包括的な視点が得られるため、これらのデータを含めることを推奨しました。
ニューラルネットワーク(つまり、私たちの頭の中にあるもの)のシミュレーションは、コンピューター上のニューラルネットワークの応用として当然のことのように思えるかもしれませんが、実際にはそれほど単純ではありません。コンピューターは脳のニューラルネットワークにヒントを得ていますが、だからといってコンピューターが脳のニューラルネットワークのシミュレーションに優れているわけではありません。

とはいえ、脳内のニューロンネットワークは、他の複雑なシステムと同様に、監視と予測が可能です。EPFLの研究者たちは、視覚障害者の視覚皮質が特定の刺激にどのように反応するかをモデル化することで、視覚補助器具の基礎を構築することを目指す新たなプロジェクトに、まさにその期待を抱いています。もし正確に予測できれば、潜在的なユーザーは、早期の兆候から、今後どのように適応していくかをシミュレートできるため、それほど頻繁かつ侵襲的な検査を受ける必要がなくなります。
認知症などの症状を抱える高齢者には、多くの見守りが必要ですが、それを提供できる介護者が十分にいるとは限りません。しかし、カリフォルニア大学バークレー校の研究者による最近の研究によると、スマートホームデバイスと機械学習の活用が、その助けになる可能性があるとのことです。

認知症などの症状を持つ人の家には、蛇口の出しっぱなし、誰かが寝ている、ドアが開けっ放しになっているなど、様々な情報を検出するセンサーが設置され、これらの情報が綿密に監視され、活動の基準値が算出されました。そして、その人が基準値から逸脱し、混乱や身体的苦痛の兆候が見られた場合、介護者に警告が送られます。これにより介護者の不安が軽減され、状況に応じて柔軟に対応できるテクノロジーが活用できるようになりました。少量の低データストリームの処理は、AIが得意とする分野ではありませんが、機械学習を活用することで、これらのシステムを標準的な方法で導入・監視することが可能になります。
Googleの大規模画像データセットをチームが再調査し、公平性の指標を検証したところ、高齢者をはじめとする様々な人物がより適切に表現されていることが分かりました。このデータセットは900万枚の画像で構成され、そのうち10万枚には人物が写っていました。そのため、ラベルとバウンディングボックスが公平かつ一貫して適用されているかどうかを検討する必要がありました。ところが、実際にはそうではなかったのです。

これらのラベルを再度検証した結果、チームは写真に写っている何万人もの新たな人物を特定し、年齢と性別の表現方法を更新しました。以前は、ラベル作成者に「男の子」や「女性」を囲むように依頼していましたが、今では「人物」を囲み、その人物の性別と年齢の表現をラベル付けしています。このより包括的なプロセスは、システムが特定の性別の表現を持つ人物だけでなく、「人」を探す可能性がはるかに高いため、より実用的です。人物が特定された後、何らかの理由で年齢、性別、または外見が重要になる場合、そのデータは人格とは関係ありません。
研究者らが指摘するように、結果として得られるデータセットはより包括的で、プロセスが合理化され、人間の偏見が ML システムに吸い上げられるリスクが軽減されるため、はるかに優れています。
ディープサイエンス:ロボットと世界