
JavaおよびKotlin向けのIntelliJ IDE(そしてKotlin言語自体)などのコーディングツールを開発するJetBrainsは、木曜日に新しいAIコーディングエージェント「Junie」をリリースしました。同社によると、このエージェントは、新しいアプリケーションを作成する際に必要な日常的な開発タスクを処理できるだけでなく、新機能を追加したい既存プロジェクトのコンテキストも理解できるとのことです。
500種類の一般的な開発タスクを対象とした、評価の高いSWE-Bench Verifiedベンチマークを使用した結果、Junieは1回の実行で53.6%のタスクを解決できました。少し前であれば、このスコアは最高だったでしょう。しかし、現時点ではトップクラスのモデルは60%以上のスコアを獲得しており、Weights & Biasesの「Programmer O1 crosscheck5」が64.6%のスコアでトップに立っていることは注目に値します。JetBrains自身も、Junieのスコアを「有望」と評しています。
しかし、スコアは低かったものの、JetBrainsのサービスはJetBrains IDEの他の部分と緊密に統合されているため、優位性があると言えるでしょう。Junieは開発者の作業を支援しますが、タスクをエージェントに委任する場合でも、常に人間が主導権を握っていると同社は指摘しています。
「AIが生成したコードは、開発者が書いたコードと同じくらい欠陥がある可能性があります」と、同社は発表の中で述べています。「最終的には、Junieは開発をスピードアップするだけでなく、コード品質の水準も引き上げるでしょう。JetBrainsのIDEとLLMのパワーを組み合わせることで、Junieはコードを生成し、検査を実行し、テストを記述し、そしてそれらが合格したことを検証することができます。」
ただし、実際に試せるようになるまでにはもう少し時間がかかるかもしれません。このサービスは、順番待ちリストに登録された早期アクセスプログラムを通じてのみ利用可能です。また、現時点ではLinuxとMac、IntelliJ IDEA UltimateとPyCharm Professional IDEでのみ利用可能ですが、WebStormも近日中に利用可能になります。
トピック
フレデリックは2012年から2025年までTechCrunchに在籍していました。また、SiliconFilterを設立し、ReadWriteWeb(現ReadWrite)にも寄稿しています。フレデリックは、エンタープライズ、クラウド、開発者ツール、Google、Microsoft、ガジェット、交通機関など、興味のあるあらゆる分野をカバーしています。
バイオを見る