GoogleのAI研究開発ラボDeepMindは、「機械でグレード化可能な」ソリューションで問題に対処するための新しいAIシステムを開発したと発表した。
DeepMindによると、実験では「AlphaEvolve」と呼ばれるこのシステムは、GoogleがAIモデルの学習に使用しているインフラの一部を最適化するのに役立つ可能性があるという。同社は現在、AlphaEvolveを操作するためのユーザーインターフェースを開発しており、より広範な展開に先立ち、選ばれた研究者を対象とした早期アクセスプログラムを開始する予定だという。
ほとんどのAIモデルは幻覚を起こします。確率的なアーキテクチャのため、時には自信過剰に事実を捏造してしまうことがあります。実際、OpenAIのo3のような新しいAIモデルは、以前のモデルよりも幻覚を起こしやすく、この問題の難しさを物語っています。
AlphaEvolveは、幻覚を減らすための巧妙な仕組み、自動評価システムを導入しています。このシステムは、モデルを用いて質問に対する回答の候補を生成、批評し、導き出し、その正確性を自動的に評価して採点します。

AlphaEvolveは、このようなアプローチを採用した最初のシステムではありません。数年前のDeepMindのチームを含む研究者たちは、様々な数学分野で同様の技術を適用してきました。しかしDeepMindは、AlphaEvolveが「最先端」のモデル、具体的にはGeminiモデルを使用していることで、従来のAIよりもはるかに優れた性能を発揮していると主張しています。
AlphaEvolveを使用するには、ユーザーはシステムに問題を提示する必要があります。オプションで、指示、方程式、コードスニペット、関連文献などの詳細も含めることができます。また、システムの回答を数式形式で自動的に評価するメカニズムも提供する必要があります。
AlphaEvolveは自己評価可能な問題しか解けないため、特定の種類の問題、具体的にはコンピュータサイエンスやシステム最適化といった分野の問題にしか対応できません。もう一つの大きな制約として、AlphaEvolveは解をアルゴリズムとしてしか記述できないため、数値計算以外の問題には適していません。
テッククランチイベント
サンフランシスコ | 2025年10月27日~29日
DeepMindは、AlphaEvolveのベンチマークテストとして、幾何学から組合せ論まで幅広い分野にわたる約50問の厳選された数学問題をシステムに解かせました。DeepMindによると、AlphaEvolveは75%の確率で問題に対する最もよく知られた解答を「再発見」し、20%の確率で改善された解答を発見することに成功しました。
DeepMindは、Googleのデータセンターの効率向上やモデルトレーニングの高速化といった実用的な問題においてもAlphaEvolveを評価しました。DeepMindによると、AlphaEvolveはGoogleの全世界のコンピューティングリソースの平均0.7%を継続的に回復するアルゴリズムを生成しました。また、このシステムはGoogleのGeminiモデルのトレーニングにかかる時間を全体で1%短縮する最適化を提案しました。
誤解のないよう申し上げますが、AlphaEvolveは画期的な発見をしているわけではありません。ある実験では、このシステムは、以前に他のツールによって指摘されていたGoogleのTPU AIアクセラレータチップ設計の改善点を発見することができました。
しかし、DeepMind は、多くの AI 研究所が自社のシステムに対して行っているのと同じことを主張している。つまり、AlphaEvolve によって時間を節約し、専門家が他のより重要な作業に集中できるようになる、というものだ。
カイル・ウィガーズは2025年6月までTechCrunchのAIエディターを務めていました。VentureBeatやDigital Trendsに加え、Android Police、Android Authority、Droid-Life、XDA-Developersといった様々なガジェットブログにも記事を寄稿しています。音楽療法士のパートナーとマンハッタンに在住。
バイオを見る