OpenAIは、先月発表したAI搭載コーディングアシスタント「Codex」に既に大きな変更を加えています。このシステムは平易な英語でコマンドを受け付け、実際に動作するコードを出力するようになったため、変数名さえ指定せずにゲームやウェブアプリを開発できます。幸運な数名のプログラマー(そしておそらくプログラマー以外の人も)は、無料のプライベートベータ版でこの新しいCodex APIを試すことができます。
Codexは、OpenAIの多機能言語エンジンGPT-3をベースに、通常の文章ではなくコードのみで学習させたものと考えるのが妥当でしょう。そのため、コード行全体やセクション全体といった処理が可能ですが、発表当初は、コーディングをしない人が簡単に扱えるようなものではありませんでした。
それがこの新しい API によって変わりました。この API は、「ボールを画面の端で跳ね返らせる」や「パブリック API を使用してデータをダウンロードし、日付順に並べ替える」といった通常の日常的なリクエストを解釈し、12 の言語のいずれかで動作するコードを生成します。
私はライブデモを体験し、OpenAI の共同設立者である Greg Brockman (CTO) と Wojciech Zaremba (Codex リーダー) がシンプルなゲームをゼロから構築し、その舞台裏で何が起こっているかを説明しました。
「プログラミングとは、ビジョンを描き、それをチャンクに分割し、実際にそれぞれの部分にコードを書くことです」とブロックマン氏は説明した。Codexの狙いは、コーダーが後者よりも前者に多くの時間を費やせるようにすることだ。結局のところ、膨大な量のコードは、他者が以前に作ったものを複製、あるいは完全にコピーしている。もちろん、創造性を発揮することはできるが、ちょっとしたコードをテストするためにWebサーバーを展開するような基本的な作業に、想像力を働かせる人はいないだろう。ブロックマン氏はまさにそれを、「~という内容のWebページを作成してください」といったシンプルな一文で実現した。

1 秒後には、完全に標準的な方法でまさにそれを実行する 12 行の JavaScript が表示されました。
「これがプログラミングの一番厄介な部分です」とブロックマン氏は言う。「こういうコードはおそらく数十回は書いたことがあるのですが、いつもどう動くのか正確には忘れてしまいます。APIのことは知らないし、知る必要もありません。同じことをもっと簡単に、キー入力やインタラクションを少なくして実行できるんです。」
テッククランチイベント
サンフランシスコ | 2025年10月27日~29日
CodexはGitHubをはじめとするリポジトリ上のほぼすべての公開コードで学習されているため、標準的な手法、例えばコード内にWebサーバー、キーボードコントロール、オブジェクト操作、アニメーションが50回、あるいは100回も組み込まれていることを理解しています。また、自然言語処理側はGPT-3の通常の理解機能をすべて備えているため、「小さくしてトリミングする」という指示と「左右の矢印キーで水平位置を調整する」という指示が同じ「それ」を指していることを理解します。
また、自身の作業、つまり数キロバイトに相当する自身のコーディングコンテキストも念頭に置いているので、従うべき命名規則、既存の境界と要求、およびユーザーの入力によって暗示されるその他の情報も把握しています。
また、システムはコードコーパスに埋め込まれた一般性も認識しています。例えば、ブロックマン氏が「空から岩を落とせ」と指示したとき、システムは「空」が何であるかを尋ねませんでした。ほとんど空白のキャンバス上では「空」が定義されていなかったにもかかわらずです。岩が画面の上から落ちてくるだけでなく、落下速度も通常の物体のように加速しました。これは、「落ちる」と「空」の意味を他の用法や文脈から推測したためです。

「これは既存のソフトウェアとやりとりする新しい方法を提供すると考えています」とザレンバ氏は語る。彼は数年前、博士論文用にこの機能の限定版を開発し、Microsoft Word用のCodexプラグインのデモも行っていた。ワードプロセッサには自動化機能が数多く存在するが、奇妙な書式設定の問題が発生し、100箇所すべてを修正したい場合はどうすればいいだろうか?「すべてのテキストを同じサイズとフォントにし、ダブルスペースをシングルスペースにする」と入力すれば、不要なスタイルを取り除いて「標準」とみなされる最も適切なサイズとフォントを選んで実行してくれる。さらに「すべての見出しを24ポイントで太字にする」と入力すれば、その通りに処理を進め、さらにそれを繰り返す。
ここで注目すべきは、こうした機能は多くの人にとって便利である一方、障害などによりこれらの機能を実行できない人にとっては極めて重要であるということです。音声コマンドやジョイスティックを使ってワープロを操作している場合、上記のような複雑なタスクを実行できることは非常に役立ちます。視覚障碍のあるプログラマーは、他の人と同様に、標準的な公開テストサーバーをパッチで修正することはできますが、Stack Overflowをざっと見て最適なスニペットを拾い出し、構文をチェックし、関連する変数を変更するといった作業は、間違いなくより長い時間がかかるでしょう。
上層部から受け継がれた構文や慣習の制約の中で作業する人にとって、Codex はモデルをドキュメントに公開することで、それらを簡単に反映させることができます。また、Codex はコードをある言語から別の言語に変換・移植することも可能です。これは、翻訳エンジンがスペイン語をフランス語に変換するのとほぼ同じです。
ブロックマン氏は、GPT-3と同様に、まだ可能性の表面に触れたに過ぎず、開発者がどのような成果を生み出せるかに驚かされることを期待していると述べた(OpenAIはAI Dungeonを予測していなかった)。ベータ版はGPT-3と同様に非公開だが、開発者はプロジェクトの詳細を申請することができ、Codexチームが審査して掲載の可否を判断する。APIは最終的に有料のパブリックAPIとなる予定だが、時期と価格はまだ未定だ。
具現化されたAI、超知能、そしてマスターアルゴリズム