機械学習とAIは、今やほぼあらゆる業界や企業にとって重要な技術となっていますが、その研究は膨大で、全てを読むのは容易ではありません。このコラム「パーセプトロン」では、特に人工知能(AIに限らず)分野において、近年の最も関連性の高い発見や論文をいくつか集め、それらがなぜ重要なのかを説明することを目指しています。
ここ数週間、私たちの注目を集めたプロジェクトの一つに、ソナーを使って表情を読み取る「イヤラブル」があります。アレンAI研究所(AI2)のフレームワーク「ProcTHOR」も同様で、現実世界のロボットの訓練に使用できる環境を手続き的に生成します。その他の注目すべきプロジェクトとしては、Metaが単一のアミノ酸配列からタンパク質の構造を予測できるAIシステムを開発したことが挙げられます。また、MITの研究者たちは、AIの計算をより少ないエネルギーで高速化すると主張する新しいハードウェアを開発しました。
コーネル大学のチームが開発したこの「イヤラブル」は、かさばるヘッドホンのような形をしています。スピーカーから装着者の顔の側面に音響信号が送られ、マイクが鼻、唇、目といった顔の特徴から生じる、かすかに聞こえるエコーを拾います。これらの「エコープロファイル」により、イヤラブルは眉を上げる、目を素早く動かすといった動きを捉え、AIアルゴリズムがそれを表情に変換します。

このイヤラブルにはいくつかの制限がある。バッテリー駆動時間はわずか3時間で、処理はスマートフォンにオフロードする必要がある。また、エコー翻訳AIアルゴリズムは表情認識を開始する前に32分間の顔データでトレーニングする必要がある。しかし、研究者たちは、映画、テレビ、ビデオゲームのアニメーションで従来使用されてきたレコーダーよりもはるかに洗練された体験になると主張している。例えば、ミステリーゲーム「L.A.ノワール」では、ロックスターゲームズは各俳優の顔に32台のカメラを向けたリグを構築した。
いつかコーネル大学のイヤー型ロボットがヒューマノイドロボットのアニメーション作成に使われる日が来るかもしれません。しかし、そうしたロボットはまず部屋の中を移動する方法を学ぶ必要があります。幸いなことに、AI2のProcTHORは(しゃれではありませんが)この方向への第一歩を踏み出しました。教室、図書館、オフィスなどを含む数千ものカスタムシーンを作成し、シミュレーションロボットが物を拾ったり家具の周りを移動したりするタスクを実行できるようにしています。
照明をシミュレートし、木材、タイルなど、膨大な種類の表面素材や家庭用品のサブセットを含むこれらのシーンの背後にある考え方は、シミュレートされたロボットを可能な限り多様な環境にさらすことです。シミュレートされた環境でのパフォーマンスが現実世界のシステムのパフォーマンスを向上させることは、AIの世界では確立された理論です。Alphabet傘下のWaymoのような自動運転車メーカーは、現実世界の車両の動作を微調整するために、地域全体をシミュレートしています。

ProcTHORに関しては、AI2は論文の中で、トレーニング環境の数を増やすことでパフォーマンスが着実に向上すると主張しています。これは、家庭や職場など、あらゆる場所で活躍するロボットにとって明るい兆しです。
テッククランチイベント
サンフランシスコ | 2025年10月27日~29日
もちろん、こうしたシステムの学習には膨大な計算能力が必要です。しかし、それは永遠に続くとは限りません。MITの研究者たちは、「ニューロン」と「シナプス」の超高速ネットワークを構築できる「アナログ」プロセッサを開発したと発表しました。このプロセッサは、画像認識や言語翻訳などのタスクを実行できるようになります。
研究者らのプロセッサは、配列された「プロトン性プログラマブル抵抗器」を用いてスキルを「学習」する。抵抗器の電気伝導率を増減させることで、学習プロセスの一部である脳内のニューロン間のシナプスの強化と弱化を模倣する。
伝導性は、プロトンの動きを制御する電解質によって制御されます。抵抗器内のチャネルにプロトンが押し込まれると、伝導性は増加します。プロトンが減少すると、伝導性は減少します。

MITチームのプロセッサは、無機材料であるリンケイ酸ガラスによって極めて高速化されています。これは、ガラス表面にナノメートルサイズの細孔があり、その表面がタンパク質の拡散に最適な経路となるためです。さらに、このガラスは室温で動作し、細孔に沿って移動するタンパク質によって損傷を受けることもありません。
「アナログプロセッサが実現すれば、誰もが取り組んでいるネットワークを訓練する必要はなくなります」と、筆頭著者でMITのポスドク研究員であるムラト・オネン氏はプレスリリースで述べている。「誰も手がけられないような前例のない複雑なネットワークを訓練することで、他の誰よりもはるかに優れたパフォーマンスを実現できるようになります。言い換えれば、これはより速い車ではなく、宇宙船なのです。」
加速といえば、機械学習は現在、少なくとも実験的な形態では、粒子加速器の管理に活用されています。ローレンス・バークレー国立研究所では、2つのチームが、装置全体とビームの機械学習ベースのシミュレーションにより、通常の統計分析よりも最大10倍も精度の高い予測が得られることを実証しました。

「ビーム特性をその変動を上回る精度で予測できれば、その予測値を用いて加速器の性能を向上させることができます」と、同研究所のダニエレ・フィリペット氏は述べた。関連する物理特性と機器のすべてをシミュレーションするのは容易なことではないが、驚くべきことに、様々なチームが初期の段階でこのシミュレーションに取り組んだ結果、有望な結果が得られた。
そしてオークリッジ国立研究所では、AI 搭載プラットフォームで中性子散乱を使用したハイパースペクトル コンピューター断層撮影を行い、最適なものを見つけています… おそらく、彼らに説明してもらうしかないでしょう。
医療の世界では、神経学の分野で機械学習ベースの画像分析が新たに応用され、ロンドン大学ユニバーシティ・カレッジの研究者らがてんかんを引き起こす脳病変の初期兆候を検出するためのモデルを訓練した。

薬剤抵抗性てんかんのよくある原因の一つに、局所性皮質異形成症と呼ばれるものがあります。これは、脳の一部が異常に発達しているにもかかわらず、何らかの理由でMRIでは明らかな異常が見られない状態です。早期発見は非常に有効であるため、UCLの研究チームは、数千例の健康な脳領域と局所性皮質異形成症に罹患した脳領域を用いて、「Multicentre Epilepsy Lesion Detection(多施設てんかん病変検出)」と呼ばれるMRI検査モデルを訓練しました。
このモデルは、提示されたFCDの3分の2を検出できました。FCDの兆候は非常に微妙であるため、これはかなり優れた結果です。実際、医師がFCDを発見できなかったのに、このモデルは発見できたケースが178件もありました。もちろん最終判断は専門医に委ねられますが、コンピューターが何かがおかしいと示唆するだけで、より詳しく調べて確信を持って診断を下すことができる場合もあります。
「私たちは、解釈可能で医師の意思決定を支援できるAIアルゴリズムの開発に重点を置きました。MELDアルゴリズムがどのように予測を行ったかを医師に示すことは、このプロセスの重要な部分でした」と、UCLのマチルデ・リパート氏は述べています。