ベンチマークは、ソフトウェア業界全体と同様に、AIの進歩を測る重要な指標です。しかし、ベンチマーク結果が企業から提供される場合、秘密主義のため、コミュニティによる検証が困難な場合が多くあります。
「これは、業界の優れたオープンソースの慣行に代わる十分な選択肢ではありません」と、ハーバード大学コンピュータサイエンスの博士課程候補者であるグスタフ・アードリッツ氏はTechCrunchへのメールで述べた。アードリッツ氏は、ディープマインドが開発したタンパク質構造予測システム「AlphaFold 2」のオープンソース版であるOpenFoldの主要開発者の一人である。「ディープマインドが実際にリリースしたコードでは、やりたいと思う科学研究のすべてを実現するのは難しいのです。」
一部の研究者は、システムのコードを非公開にすることは「科学的価値を損なう」とさえ主張しています。2020年10月、ネイチャー誌に掲載された反論記事は、Googleの健康関連研究に特化した部門であるGoogle Healthが訓練したがん予測システムに異議を唱えました。共著者らは、Googleがシステムの開発方法を含む重要な技術的詳細を非公開にしており、それがシステムの性能に重大な影響を与える可能性があると指摘しました。

変化に代わる手段として、AhdritzのようなAIコミュニティのメンバーの中には、システム自体をオープンソース化することを使命とする人もいます。彼らは技術論文を参考にしながら、ゼロから、あるいは公開されている仕様の断片を基に、システムを丹念に再構築しようと試みています。
OpenFoldはそうした取り組みの一つです。DeepMindがAlphaFold 2を発表した直後に開始されたこの取り組みの目的は、AlphaFold 2をゼロから再現できることを検証し、他の用途にも役立つ可能性のあるシステムコンポーネントを提供することだとAhdritz氏は言います。
「DeepMindが必要な詳細情報をすべて提供してくれたと信じていますが…(具体的な)証拠はありません。そのため、今回の取り組みは、その証跡を提供し、他者がそれに基づいて開発を進めるための鍵となります」とアードリッツ氏は述べた。「さらに、当初、AlphaFoldの一部のコンポーネントは非商用ライセンスでした。DeepMindはまだ完全なトレーニングデータを公開していませんが、私たちのコンポーネントとデータは完全にオープンソース化され、業界での採用が可能になります。」
テッククランチイベント
サンフランシスコ | 2025年10月27日~29日
OpenFoldは、この種の唯一のプロジェクトではありません。AIコミュニティ内の緩やかな連携を持つグループでは、OpenAIのコード生成ツールCodexやアート制作ツールDALL-E、DeepMindのチェス用AlphaZero、さらにはリアルタイムストラテジーゲーム「StarCraft 2」をプレイするために設計されたDeepMindのシステムAlphaStarの実装に取り組んでいます。中でも成功しているプロジェクトとしては、EleutherAIとAIスタートアップHugging FaceのBigScienceが挙げられます。これらは、GPT-3と同等(ただし同一ではない)のモデルを実行するために必要なコードとデータセットの提供を目指すオープンリサーチプロジェクトです。
AI コミュニティの主要メンバーであり、OpenAI の DALL-E を含む多数のオープンソース実装を GitHub で管理している Philip Wang 氏は、これらのシステムをオープンソース化することで、研究者が作業を重複して行う必要性が減ると主張しています。
「世界中の他の研究者と同じように、私たちは最新のAI研究を読んでいます。しかし、論文をサイロ内で複製するのではなく、オープンソースとして実装しています」とワン氏は述べた。「私たちは情報科学と産業の交差点という興味深い場所にいます。オープンソースは一方的なものではなく、最終的にはすべての人に利益をもたらすと考えています。また、株主に縛られない真に民主化されたAIという、より広範なビジョンにも訴えかけています。」
Google社員のブライアン・リーとアンドリュー・ジャクソンは、AlphaZeroの複製であるMiniGoの開発に協力しました。リーとジャクソンは公式プロジェクトには関わっていませんでしたが、DeepMindの当初の親会社であるGoogleに在籍していたため、特定の独自リソースにアクセスできるという利点がありました。

「(論文から逆算するのは)GPSが登場する前のナビゲーションのようなものです」と、Google Brainのリサーチエンジニアであるリー氏はTechCrunchへのメールで語った。「指示書には、見るべきランドマーク、特定の方向にどれくらい進むべきか、重要な分岐点でどの道を選ぶべきかなどが記載されています。経験豊富なナビゲーターなら道を見つけるのに十分な詳細がありますが、コンパスの読み方を知らないと、途方に暮れてしまいます。同じ道をたどることはできませんが、結局は同じ場所にたどり着くことになります。」
これらの取り組みの背後にいる開発者たち(アフドリッツ氏とジャクソン氏を含む)は、システムが宣伝どおりに動作するかどうかを実証するだけでなく、新しいアプリケーションやより優れたハードウェアサポートの実現にも役立つと述べています。DeepMind、OpenAI、Microsoft、Amazon、Metaといった大規模な研究所や企業のシステムは、通常、平均的なワークステーションよりもはるかに高い計算能力を持つ高価な独自仕様のデータセンターサーバーでトレーニングされており、オープンソース化のハードルをさらに高めています。
「AlphaFoldの新しいバリアントを学習させることで、タンパク質構造予測を超えた新たなアプリケーションの開発につながる可能性があります。DeepMindの元のコードリリースでは、学習コードが不足していたため、これは不可能でした。例えば、薬剤がタンパク質に結合する仕組み、タンパク質が移動する仕組み、タンパク質が他の生体分子と相互作用する仕組みを予測することなどです」とAhdritz氏は述べた。「AlphaFoldの新しいバリアントを学習させたり、AlphaFoldの一部をより大きなモデルに統合したりする必要がある、影響力の大きいアプリケーションは数多くありますが、学習コードの不足により、それらすべてが実現できていません。」
「こうしたオープンソースの取り組みは、これらのシステムが学術以外の環境でどのように動作するかについての『実用的な知識』を広めるのに大きく貢献しています」とジャクソン氏は付け加えた。「[AlphaZeroの]オリジナルの結果を再現するために必要な計算量はかなり膨大です。正確な数字は思い出せませんが、約1000台のGPUを1週間稼働させる必要がありました。私たちは、まだ一般公開されていなかったGoogle Cloud PlatformのTPU製品への早期アクセスを通じて、コミュニティがこれらのモデルを試すのを支援できるという、非常にユニークな立場にありました。」
オープンソースでプロプライエタリシステムを実装することは、特に公開情報がほとんどない場合は困難を伴います。理想的には、システムの学習に使用したデータセットと、システムに入力されたデータを予測値に変換する役割を担う重みに加えて、コードも公開されていることが望ましいですが、実際にはそうではありません。
例えば、OpenFoldの開発において、アフリッツ氏とチームは公式資料から情報を収集し、ソースコード、補足コード、そしてDeepMindの研究者が初期に発表したプレゼンテーション資料など、様々な情報源間の差異を調整する必要がありました。データ準備やトレーニングコードといったステップにおける曖昧さが開発の失敗につながり、ハードウェアリソースの不足は設計上の妥協を余儀なくさせました。
「これを正しく実行できるのはほんの数回だけです。そうしないと、いつまでも延々と続くことになります。こうしたシステムには膨大な計算量を要する段階が数多くあるため、小さなバグでも大きな遅れにつながる可能性があります。そのため、モデルの再トレーニングと大量のトレーニングデータの再生成が必要になったのです」とアードリッツ氏は述べた。「[DeepMind]では非常にうまく機能する技術的な詳細が、私たちのハードウェアが異なるため、簡単には機能しません。…さらに、どの詳細が極めて重要で、どの詳細があまり考えずに選択されたのかが曖昧なため、最適化や微調整が難しく、元のシステムで行われた(時には厄介な)選択に縛られてしまいます。」
では、OpenAIのような独自システムを開発する研究室は、自分たちの研究成果がリバースエンジニアリングされ、スタートアップ企業によって競合サービスの立ち上げに利用されることを気にしているのだろうか?明らかにそうではない。アードリッツ氏は、特にDeepMindが自社のシステムに関する詳細情報をこれほど多く公開しているという事実は、たとえ公言していなくても、同社が暗黙のうちにこうした取り組みを支持していることを示唆していると指摘する。
「ディープマインドがこの取り組みを承認あるいは反対しているという明確な兆候は受け取っていません」とアードリッツ氏は述べた。「しかし、確かに誰も私たちを止めようとはしていません。」