AnthropicのClaudeがAIアプリを素早く改善するためのプロンプトプレイグラウンドを追加

AnthropicのClaudeがAIアプリを素早く改善するためのプロンプトプレイグラウンドを追加

プロンプトエンジニアリングは昨年、AI業界で注目の仕事となったが、Anthropicは現在、それを少なくとも部分的に自動化するツールを開発しているようだ。

アンスロピックは火曜日、同社の言語モデル「Claude」を用いて開発者がより便利なアプリケーションを開発できるよう支援するいくつかの新機能をリリースしたと、同社のブログ記事で発表した。開発者はClaude 3.5 Sonnetを使用してプロンプトを生成、テスト、評価できるようになり、プロンプトエンジニアリング技術を用いてより優れた入力を作成し、特定のタスクに対するClaudeの回答を改善できる。

言語モデルは、特定のタスクを実行する際にはかなり寛容ですが、プロンプトの文言を少し変更するだけで、結果が大きく改善されることがあります。通常は、その文言を自分で考え出すか、プロンプトエンジニアを雇う必要がありますが、この新機能は迅速なフィードバックを提供し、改善点を見つけやすくします。

これらの機能は、Anthropic Console 内の新しい「評価」タブに搭載されています。Console は、Claude を活用した製品開発を検討している企業を惹きつけるために開発された、開発者向けのテストキッチンです。5 月に発表された機能の一つは、Anthropic の組み込みプロンプトジェネレーターです。これは、タスクの短い説明を入力すると、Anthropic 独自のプロンプトエンジニアリング技術を用いて、より長く、より詳細なプロンプトを作成します。Anthropic のツールがプロンプトエンジニアを完全に置き換えるわけではないものの、同社は新規ユーザーを支援し、経験豊富なプロンプトエンジニアの時間を節約できると述べています。

Evaluateでは、開発者はAIアプリケーションのプロンプトが様々なシナリオにおいてどれほど効果的かをテストできます。開発者は、実際の例をテストスイートにアップロードしたり、ClaudeにAI生成のテストケースを複数生成させたりすることができます。その後、開発者は様々なプロンプトの有効性を並べて比較し、サンプル回答を5段階評価で評価できます。

入力されたプロンプトは、良い回答と悪い回答を見つけるためのデータを生成しました。画像クレジット: Anthropic

Anthropicのブログ投稿の例では、ある開発者が、複数のテストケースにおいてアプリケーションの回答が短すぎることに気づきました。開発者はプロンプト内の1行を調整して回答を長くし、それをすべてのテストケースに同時に適用することができました。これにより、特にプロンプ​​トエンジニアリングの経験がほとんどない、あるいは全くない開発者の時間と労力を大幅に節約できます。

アンスロピックのCEO兼共同創業者であるダリオ・アモデイ氏は、今年初めに行われたGoogle Cloud Nextのインタビューで、企業における生成AIの広範な導入において、迅速なエンジニアリングが最も重要な要素の一つであると述べました。「単純な話に聞こえますが、迅速なエンジニアと30分ほど作業するだけで、以前は動作しなかったアプリケーションが動作するようになることがよくあります」とアモデイ氏は述べています。

テッククランチイベント

サンフランシスコ | 2025年10月27日~29日

マックスウェル・ゼフは、TechCrunchのAI専門シニアレポーターです。以前はGizmodo、Bloomberg、MSNBCでAIの台頭やシリコンバレーの銀行危機などを取材してきました。サンフランシスコを拠点としています。取材以外の時間は、ハイキング、サイクリング、ベイエリアのグルメ巡りを楽しんでいます。

Maxwell からの連絡を確認したり連絡を受けたりする場合は、[email protected]にメールを送信するか、Signal の mzeff.88 に暗号化されたメッセージを送信してください。

バイオを見る