Meta Llama: オープン生成AIモデルについて知っておくべきことすべて

Meta Llama: オープン生成AIモデルについて知っておくべきことすべて

昨今の大手テック企業と同様に、MetaもLlamaと呼ばれる独自の主力生成AIモデルを保有しています。Llamaは主要なモデルの中ではやや独特で、「オープン」であること、つまり開発者が自由にダウンロードして使用できるという点で独特です(ただし、一定の制限はあります)。これは、AnthropicのClaude、GoogleのGemini、xAIのGrok、そしてOpenAIのChatGPTモデルのほとんどといった、API経由でしかアクセスできないモデルとは対照的です。 

開発者に選択肢を提供するため、MetaはAWS、Google Cloud、Microsoft Azureなどのベンダーと提携し、Llamaのクラウドホスト版も提供しています。さらに、MetaはLlamaクックブックでツール、ライブラリ、レシピを公開しており、開発者がモデルを微調整、評価し、それぞれの分野に適応させるのを支援しています。Llama  3やLlama 4といった新世代では、これらの機能が拡張され、ネイティブのマルチモーダルサポートやより広範なクラウド展開も可能になっています。 

MetaのLlamaについて、その機能やエディション、そして活用できる場所まで、知っておくべきことをすべてご紹介します。Metaがアップグレードをリリースしたり、モデルの利用をサポートする新しい開発ツールを導入したりするたびに、この記事は更新されていきます。

ラマとは何ですか?

Llamaは1つのモデルだけでなく、複数のモデルからなるファミリーです。最新バージョンはLlama 4で、2025年4月にリリースされ、以下の3つのモデルが含まれています。  

  • スカウト:  170 億のアクティブ パラメータ、合計 1,090 億のパラメータ、および 1,000 万トークンのコンテキスト ウィンドウ。 
  • Maverick:  170 億のアクティブ パラメータ、4000 億の合計パラメータ、および 100 万トークンのコンテキスト ウィンドウ。 
  • ベヒーモス: まだリリースされていませんが、2,880 億のアクティブ パラメータと 2 兆個の合計パラメータを持つ予定です。  

(データ サイエンスでは、トークンは「fantastic」という単語の「fan」、「tas」、「tic」という音節のように、生のデータを細分化したビットです。)  

モデルのコンテキスト、またはコンテキストウィンドウとは、モデルが出力(追加テキストなど)を生成する前に考慮する入力データ(テキストなど)を指します。コンテキストウィンドウが長いと、モデルが最近のドキュメントやデータの内容を「忘れる」ことや、話題から逸れて誤った推論を行うことを防ぐことができます。しかし、コンテキストウィンドウが長くなると、モデルが特定の安全対策を「忘れる」ことになり、会話に沿ったコンテンツを生成する傾向が強くなり、一部のユーザーが妄想的な思考に陥ることがあります。  

参考までに、Llama 4 Scoutが約束する1000万コンテキストウィンドウは、平均的な小説約80冊分のテキストに相当します。Llama 4 Maverickの100万コンテキストウィンドウは、小説約8冊分に相当します。  

テッククランチイベント

サンフランシスコ | 2025年10月27日~29日

Metaによると、Llama 4モデルはすべて、「広範な視覚的理解」を得るために「大量のラベルなしテキスト、画像、ビデオデータ」と200の言語でトレーニングされた。  

Llama 4 ScoutとMaverickは、Meta初のオープンウェイトネイティブマルチモーダルモデルです。これらは「Mixture-of-Experts(専門家の混合)」アーキテクチャを用いて構築されており、計算負荷を軽減し、学習と推論の効率を向上させます。例えば、Scoutは16人の専門家、Maverickは128人の専門家で構成されています。   

Llama 4 Behemoth には 16 人のエキスパートが含まれており、Meta はこれを小型モデルの教師と呼んでいます。 

Llama 4 は、命令調整されたアプリケーションやクラウド展開に広く使用されている 3.1 および 3.2 モデルを含む Llama 3 シリーズをベースに構築されています。 

ラマは何ができるのでしょうか?

他の生成AIモデルと同様に、Llamaはコーディングや基本的な数学問題の解答、そして少なくとも12言語(アラビア語、英語、ドイツ語、フランス語、ヒンディー語、インドネシア語、イタリア語、ポルトガル語、ヒンディー語、スペイン語、タガログ語、タイ語、ベトナム語)での文書の要約など、様々な支援タスクを実行できます。PDFやスプレッドシートなどの大容量ファイルの解析など、ほとんどのテキストベースのワークロードに対応しており、Llama 4のすべてのモデルはテキスト、画像、動画の入力をサポートしています。 

Llama 4 Scoutは、より長いワークフローと大規模なデータ分析向けに設計されています。Maverickは、推論能力と応答速度のバランスに優れたジェネラリストモデルで、コーディング、チャットボット、技術アシスタントに適しています。Behemothは、高度な研究、モデルの蒸留、STEMタスク向けに設計されています。  

Llama 3.1を含むLlamaモデルは、サードパーティ製のアプリケーション、ツール、APIを活用してタスクを実行するように設定できます。これらのモデルは、最近の出来事に関する質問に答えるためにBrave Search、数学および科学関連のクエリにはWolfram Alpha API、そしてコードの検証にはPythonインタープリタを使用するように学習されています。ただし、これらのツールは適切な設定が必要であり、すぐに自動的に有効になるわけではありません。 

Llamaはどこで使えますか?

Llamaとチャットしたいだけなら、Llamaは40か国でFacebook Messenger、WhatsApp、Instagram、Oculus、Meta.aiの​​Meta AIチャットボット体験を支えています。Llamaの微調整バージョンは、200以上の国と地域でMeta AI体験に使用されています。  

Llama 4のモデルであるScoutとMaverickは、Llama.comとMetaのパートナー(AI開発プラットフォームHugging Faceを含む)で利用可能です。Behemothはまだトレーニング中です。Llamaで開発を行う開発者は、ほとんどの主要クラウドプラットフォームでモデルをダウンロード、使用、または微調整できます。Metaは、Nvidia、Databricks、Groq、Dell、Snowflakeなど、25社以上のパートナーがLlamaをホスティングしていると主張しています。Metaの公開モデルへの「アクセス販売」はMetaのビジネスモデルではありませんが、同社はモデルホストとの収益分配契約を通じて収益を得ています。 

これらのパートナーの中には、モデルが独自のデータを参照し、より低いレイテンシで実行できるようにするツールなど、Llama 上に追加のツールとサービスを構築している企業もあります。 

重要なのは、Llama ライセンスによって開発者がモデルを展開する方法が制限されることです。月間ユーザー数が 7 億人を超えるアプリ開発者は、Meta が独自の裁量で付与する特別なライセンスを Meta に申請する必要があります。 

2025年5月、Metaはスタートアップ企業によるLlamaモデルの導入を促進するための新しいプログラムを開始しました。Llama for Startupsは、MetaのLlamaチームによるサポートと潜在的な資金調達へのアクセスを企業に提供します。  

Llama に加えて、Meta はモデルをより「安全に」使用するためのツールを提供します。  

  • モデレーション フレームワークであるLlama Guard。 
  • プロンプトガードは、プロンプトインジェクション攻撃から保護するためのツールです。 
  • サイバーセキュリティリスク評価スイート、  Cyber​​SecEval 。
  • Llama Firewall は、安全な AI システムの構築を可能にするために設計されたセキュリティ ガードレールです。 
  • Code Shieldは、LLM によって生成された安全でないコードの推論時のフィルタリングをサポートします。  

とはいえ、Metaの以前のガイドラインでは、チャットボットが未成年者と官能的またはロマンチックなチャットを行うことが許可されており、一部の報告ではそれが性的な会話に発展したとされているため、これは明らかに万能薬ではありません。開発者はブロックするコンテンツのカテゴリーをカスタマイズし、Llamaがサポートするすべての言語にブロックを適用できます。 

Llama Guardと同様に、Prompt GuardはLlama向けのテキストをブロックできますが、モデルを「攻撃」して望ましくない動作をさせることを意図したテキストのみをブロックします。Metaによると、Llama Guardは「注入された入力」を含むプロンプトに加えて、明らかに悪意のあるプロンプト(Llamaの組み込み安全フィルターを回避しようとするジェイルブレイクなど)からも防御できるとのことです。Llama Firewallは、プロンプト注入、安全でないコード、危険なツールとのやり取りなどのリスクを検出し、防止します。また、Code Shieldは安全でないコードの提案を軽減し、7つのプログラミング言語で安全なコマンド実行を提供します。 

Cyber​​SecEvalは、ツールというよりは、モデルのセキュリティを測定するためのベンチマーク集です。Cyber​​SecEvalは、Llamaモデルが(少なくともMetaの基準に基づいて)アプリ開発者やエンドユーザーに及ぼすリスクを、「自動化されたソーシャルエンジニアリング」や「攻撃的なサイバーオペレーションの拡張」といった分野において評価できます。 

ラマの限界

画像クレジット: Artificial Analysis

Llamaには、他の生成AIモデルと同様に、一定のリスクと制限が伴います。例えば、最新モデルはマルチモーダル機能を備えていますが、現時点では主に英語のみに対応しています。 

Metaはまた、InstagramやFacebookの投稿、写真、キャプションに基づいてAIをトレーニングしており、ユーザーがオプトアウトすることを困難にしていることでも物議を醸している。  

プログラミングもまた、Llamaの使用において慎重に扱うべき分野です。Llamaは、他の生成AIよりもバグや安全性の低いコードを生成する可能性があるためです。AIモデルを競合コーディング問題でテストするベンチマークであるLiveCodeBenchでは、MetaのLlama 4 Maverickモデルは40%のスコアを達成しました。これは、OpenAIのGPT-5 highが85%、xAIのGrok 4 Fastが83%という結果と比較すると、かなり高い数値です。 

いつものように、AI によって生成されたコードをサービスやソフトウェアに組み込む前に、人間の専門家にレビューしてもらうのが最善です。 

最後に、他の AI モデルと同様に、Llama モデルも、コーディング、法的ガイダンス、AI ペルソナとの感情的な会話など、もっともらしく聞こえるが誤った情報や誤解を招く情報を生成するという欠点があります。  

これはもともと 2024 年 9 月 8 日に公開され、新しい情報で定期的に更新されています。