OpenAIは数ヶ月前、シーンの描写からオリジナル動画を生成する生成AIモデル「Sora」を発表し、テクノロジー界を魅了した。カメラや撮影クルーは不要だ。しかし、Soraは今のところ厳しい制限を設けており、OpenAIは趣味で制作する人や小規模なマーケターではなく、資金力のあるハリウッド映画監督のようなクリエイターをターゲットにしているようだ。
Snapで生成AI部門の元責任者を務めていたアレックス・マシュラボフ氏は、このチャンスを察知し、よりパーソナライズされたアプリケーション向けに設計されたAI搭載の動画作成・編集プラットフォーム「Higgsfield AI」を立ち上げました。
Higgsfield 氏の最初のアプリである Diffuse は、カスタムのテキストからビデオへの変換モデルを搭載しており、ゼロからビデオを生成したり、自撮り写真を撮ってその人物が主役のクリップを生成したりすることができます。
「私たちのターゲットオーディエンスは、あらゆるタイプのクリエイターです」とマシュラボフ氏はTechCrunchのインタビューで語った。「友人と楽しいコンテンツを作りたい一般ユーザーから、新しいコンテンツ形式を試してみたいソーシャルコンテンツクリエイター、自分のブランドを目立たせたいソーシャルメディアマーケターまでです。」
マシュラボフ氏は、以前勤めていたスタートアップ企業AI Factoryを経てSnap社に入社した。同社は2020年にSnap社に1億6600万ドルで買収された。Snap社在籍中、マシュラボフ氏はSnapchat向けのARエフェクトやフィルター(Cameosを含む)といった製品の開発に携わったほか、物議を醸したチャットボット「MyAI」の開発にも携わった。
Higgsfieldは、マシュラボフ氏が数ヶ月前にジェネレーティブビデオを専門とするAI研究者のイェルザット・デュラット氏と共同で立ち上げたプラットフォームで、事前に生成された厳選されたクリップセット、参照メディア(画像や動画など)をアップロードするためのツール、そしてユーザーが描写したいキャラクター、アクション、シーンを説明できるプロンプトエディターを提供しています。Diffuseを使えば、ユーザーはAIが生成したシーンに自分自身を直接挿入したり、他の動画で撮影されたダンスの動きなどを自分のデジタル画像で模倣したりすることができます。

「私たちのモデルは、非常にリアルな動きと表情をサポートします」とマシュラボフ氏は述べた。「私たちは消費者向けの『ワールドモデル』の先駆者であり、これにより、高度な制御を備えたクラス最高のビデオ生成・編集技術を構築できるようになります。」
テッククランチイベント
サンフランシスコ | 2025年10月27日~29日
OpenAIと真っ向から競合するジェネレーティブビデオのスタートアップは、Higgsfieldだけではありません。Runwayはいち早くこの分野に参入したスタートアップの一つで、そのツールは進化を続けています。また、DeepMind出身者2名と1,300万ドル以上のベンチャーキャピタルから資金提供を受けているHaiperもあります。
マシュラボフ氏は、モバイルファースト、ソーシャル重視の市場開拓戦略によって、Diffuse が目立つようになると主張している。
「デスクトップのワークフローではなく、iOSとAndroidアプリを優先することで、クリエイターがいつでもどこでも魅力的なソーシャルメディアコンテンツを作成できるようになります」とマシュラボフ氏は述べた。「実際、モバイルを基盤とすることで、初日から使いやすさと消費者に優しい機能を優先することができます。」
ヒッグスフィールドは、資金面でもスリムな運営を行っている。マシュラボフ氏によると、プラットフォームの基盤となる生成モデルは、16人のチームによって9ヶ月足らずで開発され、32基のGPUを搭載したクラスターでトレーニングされたという(32基というと多いように思えるかもしれないが、OpenAIが数万基のGPUを使用していることを考えると、それほど多くはない)。また、ヒッグスフィールドはこれまでに800万ドルしか調達しておらず、その大部分はメンロ・ベンチャーズが主導した最近のシードラウンドからの調達である。

ライバルに一歩先んじるために、ヒッグスフィールドはシード資金を、動画内のキャラクターやオブジェクトを編集できる改良型動画エディターの開発と、ソーシャルメディアのユースケースに特化したより強力な動画生成モデルのトレーニングに投入する予定です。実際、マシュラボフ氏はソーシャルメディア、そしてソーシャルメディアマーケティングをヒッグスフィールドの主要な収益源と見ています。
Diffuse は現在無料で使用できますが、マシュラボフ氏は、将来的にはマーケターがプレミアム機能や大量または大規模なキャンペーンに対して何らかの料金やサブスクリプションを支払うようになると考えています。
「Higgsfieldは、ソーシャルメディアマーケターにとって、驚異的なレベルのリアリティとコンテンツ制作のユースケースを実現すると確信しています」と彼は述べています。「CMOやクリエイティブディレクターからは、コンテンツ制作予算を最適化し、制作期間を短縮しながらも、インパクトのあるコンテンツを提供したいという声が常に寄せられています。そのため、動画生成AIソリューションは、彼らの目標達成を支援するための中核的なソリューションとなると考えています。」
もちろん、ヒッグスフィールド氏は、生成 AI スタートアップ企業が直面しているより広範な課題から免れているわけではない。

マシュラボフ氏は、ヒッグスフィールド氏のトレーニングデータの出所については明らかにしなかった(「複数の公開されている」場所から取得しているという点のみ)。また、ヒッグスフィールド氏が将来のモデルのトレーニングのためにユーザーデータを保持するかどうかについても言及しなかった。これは一部の企業顧客にとって受け入れ難いものかもしれない。ただし、Diffuseユーザーはアプリを通じていつでもデータの削除をリクエストできることは言及した。
ヒッグスフィールドのようなデジタル「クローン」プラットフォームも、ここ数カ月のソーシャルメディア上でのディープフェイクの猛烈な拡散が示すように、悪用される危険性が高い。
同様に、ヒッグスフィールドはクリエイターのコンテンツの盗用を容易にする可能性があります。例えば、誰かの振り付けの動画をアップロードするだけで、同じ振り付けを自分で演奏する動画を生成できるようになります。
私はマシュラボフ氏に、ヒッグスフィールド氏が不正使用を防ぐためにどのような安全策や保護策を講じているのか尋ねたところ、同氏は詳細には触れなかったものの、プラットフォームでは自動と手動のモデレーションを組み合わせて採用していると主張した。
「私たちは、悪用の可能性がある場所を監視し、必要に応じて製品を進化させることができるように、製品を段階的に展開し、まずは特定の市場でテストすることに決めました」とマシュラボフ氏は付け加えた。
それが実際にどの程度うまく機能するかは、待って見なければなりません。