OpenAI以外のAI スタートアップ各社 は今週も懸命に取り組んでいるようだ。OpenAI の混乱に関する報道がテレビで大きく取り上げられる中、各社は自社の製品ロードマップを忠実に守っている。
Stability AIは本日午後、既存の画像をアニメーション化することで動画を生成するAIモデル「Stable Video Diffusion」を発表しました。Stability AIの既存のテキスト画像変換モデル「Stable Diffusion」をベースにしたStable Video Diffusionは、オープンソースで、あるいは商用でも利用可能な数少ない動画生成モデルの一つです。
しかし、すべての人に当てはまるわけではありません。
Stable Video Diffusionは現在、Stability社が「研究プレビュー」と呼んでいる段階にあります。このモデルを実行するには、Stable Video Diffusionの想定される用途(例:「教育または創造ツール」、「デザインおよびその他の芸術的プロセス」など)と想定外の用途(「人物または出来事の事実または真実の表現」)を規定した特定の利用規約に同意する必要があります。
Stability社自身のものも含め、他のAI研究プレビューのこれまでの展開を考えると、このモデルが短期間でダークウェブで流通し始めても筆者としては驚かないだろう。もしそうなれば、Stable Videoにはコンテンツフィルターが組み込まれていないように見えることから、悪用される可能性を懸念する。Stable Diffusionがリリースされると、疑わしい意図を持つ人物がそれを利用し、合意のないディープフェイクポルノ、さらにはもっとひどいものを作成するのにそれほど時間はかからなかった。
しかし、話が逸れてしまいました。
テッククランチイベント
サンフランシスコ | 2025年10月27日~29日
Stable Video Diffusionには、SVDとSVD-XTという2つのモデルがあります。SVDは静止画像を14フレームで576×1024の動画に変換します。SVD-XTは同じアーキテクチャを採用していますが、フレーム数を24に増やしています。どちらも毎秒3~30フレームの動画を生成できます。

トレーニングデータのソースが何であれ、SVDとSVD-XTの両方のモデルは、かなり高品質な4秒間の動画を生成します。筆者の推測では、Stabilityのブログに掲載されている厳選されたサンプルは、Metaの最新の動画生成モデルの出力や、GoogleやAIスタートアップのRunway、Pika Labsが作成したAI生成例と遜色ない性能を発揮する可能性があります。
しかし、Stable Video Diffusionには限界がある。Stability社はこの点について透明性を保っており、モデルのHugging Faceページ(研究者がStable Video Diffusionへのアクセスを申請できるページ)では、モデルは動きのない動画やゆっくりとしたカメラパンを生成できないこと、テキストによる制御ができないこと、テキストを(少なくとも判読できない形で)レンダリングできないこと、そして顔や人物を一貫して「適切に」生成できないことを明記している。
まだ初期段階ではあるものの、Stability はモデルが非常に拡張可能であり、オブジェクトの 360 度ビューを生成するなどのユースケースに適応できることを指摘しています。
では、Stable Video Diffusion はどのように進化するのでしょうか?Stability 社によると、SVD と SVD-XT を「基盤として拡張する」「多様な」モデルと、Web 上のモデルにテキストプロンプト機能を追加する「テキストから動画へ」ツールを計画しているとのことです。最終的な目標は商業化のようです。Stability 社は、Stable Video Diffusion が「広告、教育、エンターテイメントなど」の分野で応用できる可能性があると正しく指摘しています。
確かに、スタートアップ企業への投資家らが圧力を強める中、スタビリティ社はヒットを狙っている。
セマフォーは4月、スタビリティAIが資金繰りに苦しんでいると報じ、売上拡大のため幹部の採用を急ぐことになった。フォーブスによると、同社は賃金と給与税の支払いを繰り返し遅らせたり、全く支払わなかったりしており、スタビリティがモデルの学習にコンピューティングリソースとして利用しているAWSは、同社のGPUインスタンスへのアクセスを剥奪すると警告している。

Stability AIは最近、転換社債(株式に転換される負債)を通じて2,500万ドルを調達し、累計調達額は1億2,500万ドルを超えました。しかし、より高い評価額での新たな資金調達は完了しておらず、同社の直近の評価額は10億ドルでした。Stabilityは、低迷する収益と高いバーンレートにもかかわらず、今後数ヶ月以内にその4倍の資金調達を目指すと報じられています。
カイル・ウィガーズは2025年6月までTechCrunchのAIエディターを務めていました。VentureBeatやDigital Trendsに加え、Android Police、Android Authority、Droid-Life、XDA-Developersといった様々なガジェットブログにも記事を寄稿しています。音楽療法士のパートナーとマンハッタンに在住。
バイオを見る