MetaはCopilotに似たコード生成AIモデルを構築した

MetaはCopilotに似たコード生成AIモデルを構築した

Metaは、GitHubのCopilotに似たコーディング用の生成AIツールを開発したという。

同社は、AIインフラストラクチャへの取り組みに焦点を当てたイベントでこの発表を行いました。この取り組みには、Metaが生成AIモデルのトレーニングを加速するために開発しているカスタムチップも含まれています。CodeComposeと呼ばれるこのコーディングツールは、少なくとも現時点では一般公開されていません。しかしMetaによると、社内のチームはVS CodeなどのIDEで入力する際に​​、Pythonなどの言語のコード候補を表示するためにCodeComposeを使っているとのことです。

「基盤となるモデルは、[Meta]の公開研究に基づいて構築されており、社内のユースケースとコードベースに合わせて調整されています」と、Metaのソフトウェアエンジニアであるマイケル・ボリン氏は、事前に録画されたビデオで述べています。「製品面では、開発者やデータサイエンティストがコードを扱うあらゆる環境にCodeComposeを統合できます。」

メタトレーニングされたCodeComposeモデルの中で最大のモデルは67億個のパラメータを持ち、これはCopilotのベースとなるモデルのパラメータ数の半分強に相当します。パラメータとは、過去のトレーニングデータから学習したモデルの部分であり、テキスト生成などの問題に対するモデルのスキルを本質的に定義します。

CodeComposeは、Metaが開発したプログラミング言語Hackで書かれた内部ライブラリやフレームワークを含むMetaのファーストパーティコードに基づいて微調整されており、それらをプログラミング提案に組み込むことができます。また、ベースとなるトレーニングデータセットは、非推奨のAPIなどの不適切なコーディング手法やエラーを除外することで、モデルが問題のあるコード片を推奨する可能性を低減しています。

画像クレジット: Meta

実際には、CodeCompose はユーザーの入力に合わせてアノテーションやインポートステートメントなどの候補を表示します。システムは 1 行のコードから複数行のコードまで補完でき、オプションで大きなコード全体を補完することも可能です。 

「CodeComposeは周囲のコードを活用して、より優れた提案を提供します」とボリン氏は続けた。「また、コードコメントをコード生成の合図として利用することもできます。」

テッククランチイベント

サンフランシスコ | 2025年10月27日~29日

Meta は、毎週何千人もの従業員が CodeCompose からの提案を受け入れており、その受け入れ率は 20% を超えていると主張しています。

しかし同社は、コード生成AIをめぐる論争については触れなかった。

CodeComposeは、MetaのAI研究部門がリリースしたInCoderで学習しました。InCoderの詳細を記した論文では、InCoderの学習にあたり、「(1) GitHubとGitLabから、コピーレフトではない許容型のオープンソースライセンスを持つ公開コードと、(2) StackOverflowの質問、回答、コメントのコーパスを収集する」と述べています。CodeComposeに追加で学習させるのは、Metaの内部コードのみです。

生成コーディングツールは、安全でないコードを生成する可能性があります。スタンフォード大学の最近の研究によると、コード生成AIシステムを使用するソフトウェアエンジニアは、開発するアプリにセキュリティ上の脆弱性をもたらす可能性が高くなります。この研究ではCodeComposeを具体的に調査していませんが、CodeComposeを使用する開発者が同じ被害に遭うのは当然のことです。

ボリン氏は、開発者がCodeComposeの提案に従う必要はなく、モデル作成においてセキュリティが「主要な考慮事項」であったことを強調した。「私たちはCodeComposeのこれまでの進捗に非常に満足しており、この作業を社内で行うことで開発者にとって最善の利益が得られると考えています」と付け加えた。

カイル・ウィガーズは2025年6月までTechCrunchのAIエディターを務めていました。VentureBeatやDigital Trendsに加え、Android Police、Android Authority、Droid-Life、XDA-Developersといった様々なガジェットブログにも記事を寄稿しています。音楽療法士のパートナーとマンハッタンに在住。

バイオを見る