概要
投稿日:

Financial Times の報道によると、Meta の次の主要な「オープン」 AI モデルは音声に重点を置く可能性があるとのことです。
記事によると、MetaはLlamaモデルファミリーの次期フラッグシップモデルであるLlama 4で、音声機能の改良を計画しており、数週間以内に発売される予定だという。報道によると、Metaは特に、OpenAIのChatGPT向け音声モードやGoogleのGemini Liveエクスペリエンスと同様に、ユーザーがモデルの発話を途中で中断できるようにすることに重点を置いているという。
今週のモルガン・スタンレーのカンファレンスでのコメントで、Metaの最高製品責任者であるクリス・コックス氏は、Llama 4は「オムニ」モデルとなり、音声だけでなくテキストやその他の種類のデータをネイティブに解釈して出力できると述べた。
中国のAI研究機関DeepSeekのオープンモデルがMetaのLlamaモデルと同等かそれ以上の性能を発揮し、Llamaの開発は急速に加速している。Metaは、DeepSeekがモデルの実行と展開のコストをどのように削減したかを解明するため、急いで戦略会議を開いたと言われている。
トピック
業界最大のテクノロジーニュースを購読する