動画では、満員の夏の音楽フェスティバルで観客が熱狂している。スピーカーからビートが流れ始めると、ついにパフォーマーがステージに登場。ジョーカーだ。赤いスーツに緑の髪、そしてトレードマークのフェイスペイントを身にまとったジョーカーは、拳を振り上げ、ステージを踊り、ランウェイを飛び降りてファンの海へとさらに近づいた。ラップが始まると、ジョーカーは膝を曲げて地面から飛び上がり、上下に跳ねた後、片足で360度回転する。楽々としているように見えるが、もし実際に同じ動きをすれば、顔から転げ落ちるだろう。ジョーカーがこれほどクールだったことはかつてなかった。
それから、NBAオールスターのジョエル・エンビードがバックステージから颯爽と登場し、観客に挨拶をした後、同じダンスを披露する動画もあります。そして、「Curb Your Enthusiasm」のスター、ラリー・デヴィッドが登場します。しかし、どのシーンにもどこか違和感があります。ジョーカーであれ、ジョエル・エンビードであれ、ラリー・デヴィッドであれ、パフォーマーの体は震えているのに、表情は全く変わりません。
もちろん、これはすべて、Viggle という会社のおかげで AI によって生成されたものです。
オリジナル動画は、ラッパーのリル・ヨッティが2021年のサマー・スマッシュ・フェスティバルのステージに上がる様子を捉えたもので、再生回数が650万回を超えたYouTube動画のタイトルにあるように、この入場シーンは「史上最もハードな退場シーン」とされています。4月には、リル・ヨッティがステージに上がる動画に、お気に入りのセレブやサム・バンクマン=フリードのような悪役を挿入する人が続出し、ミームとしてトレンド入りしました。
テキストを動画に変換するAIサービスは驚くほど進化していますが、「2021年夏の大ヒット曲「リル・ヨッティ」でサム・バンクマン・フライド」と入力しただけで、Soraがあなたの意図を正確に理解してくれるとは期待できません。Viggleは違います。
ViggleのDiscordサーバーでは、ユーザーが何らかの動き(多くの場合、TikTokのダンス)をしている動画と人物の写真をアップロードします。するとViggleは、その人物が動画の動きを真似している動画を作成します。これらの動画は明らかに本物ではありませんが、それでも面白いです。しかし、Lil Yachtyのミームが話題になって以来、Viggleは人気が高まり、その熱狂は今も衰えていません。
「私たちは、いわゆる『制御可能な動画生成モデル』の構築に注力しています」と、Viggleの創業者ハン・チュー氏はTechCrunchに語った。「コンテンツを生成する際には、キャラクターの動きやシーンの見え方を正確に制御したいと考えています。しかし、現在のツールはテキストを動画に変換するという側面にのみ焦点を当てており、テキストだけでは視覚的な微妙なニュアンスをすべて表現するには不十分なのです。」
テッククランチイベント
サンフランシスコ | 2025年10月27日~29日
チュー氏によると、Viggle のユーザーには主に 2 つのタイプがあり、ミームを作成する人もいれば、ゲーム デザインや VFX の制作プロセスのツールとして製品を使用する人もいます。
「例えば、アニメーションエンジニアのチームは、いくつかのコンセプトデザインを、ラフながらも素早いアニメーションアセットに素早く変換することができます」とChu氏は言います。「その目的は、最終プランのラフスケッチで、それらの見た目や感触を確認することです。通常、手作業で設定するには数日、あるいは数週間かかりますが、Viggleを使えば、ほぼ瞬時に自動で完了します。これにより、面倒で反復的なモデリング作業を大幅に削減できます。」
3月にはViggleのDiscordのメンバーは数千人程度でした。5月中旬には180万人に達し、6月を数日後に控えた現在、Viggleのサーバーは300万人以上のメンバーを抱えています。これは、ValorantやGenshin Impactなどのゲームのサーバーを合わせたよりも規模が大きいと言えます。
Viggleの成長は鈍化する兆しを見せていないが、動画生成の需要の高まりにより、せっかちなユーザーにとっては待ち時間がやや長すぎるという状況が見られる。しかし、ViggleはDiscord中心のサービスであるため、Discordの開発チームはViggleと直接協力し、設立2年のスタートアップ企業の急速な成長を支援してきた。
Viggleにとって幸いなことに、Discordは以前にも同様の経験をしています。同じくDiscord上で運営されているMidjourneyは、サーバー上に2,030万人のメンバーを抱え、プラットフォーム上で最大の単一コミュニティとなっています。Discord全体の月間ユーザー数は約2億人です。

「誰もそのような成長に対応できる準備ができていません。ですから、そのバイラル化の段階で、私たちは彼らと協力し始めます。なぜなら、彼らはまだ準備ができていないからです」と、Discordのプロダクト担当副社長ベン・シャンケン氏はTechCrunchに語った。「私たちは準備を整えていなければなりません。なぜなら、現在送信されているメッセージの大部分はViggleとMidjourneyであり、Discordにおける消費と利用の多くは、実際には生成AIだからです。」
ViggleやMidjourneyのようなスタートアップにとって、Discord上でアプリを開発することは、ユーザーのためにプラットフォーム全体を構築する必要がないことを意味します。その代わりに、既にテクノロジーに精通したユーザー層とコンテンツモデレーションツールを備えたプラットフォーム上でアプリをホストできるのです。従業員わずか15名のViggleにとって、Discordのサポートは不可欠です。
「我々はバックエンドサービスとしてモデルを構築することに集中でき、その間に Discord はフロントエンドで自社のインフラストラクチャを活用でき、基本的に我々はより速く反復処理を行うことができます」と Chu 氏は語った。
Viggle入社以前、チュー氏は3Dツール大手のAutodeskでAI研究者として勤務していました。また、Facebook、Nvidia、Googleといった企業でも研究を行っていました。
Discordにとって、AIスタートアップのためのSaaS企業という偶発的な存在になることは、コストを伴う可能性があります。これらのアプリはDiscordに新たなユーザー層をもたらし、ユーザー指標の向上にも寄与するでしょう。しかし、これほど多くの動画をホスティングすることは、特にプラットフォーム上の他のユーザーがライブゲーム配信、ビデオチャット、音声通話を行っている場合、技術面で困難とコストの増大を招く可能性があります。しかし、Discordのようなプラットフォームがなければ、これらのスタートアップは同等の速度で成長できないかもしれません。
「どんなタイプの企業にとっても規模を拡大するのは簡単ではありませんが、Discord はそのような規模に合わせて構築されており、私たちは企業がその規模をうまく吸収できるよう支援することができます」とシャンケン氏は語った。
これらの企業はDiscord独自のコンテンツガイドラインを採用し、コンテンツモデレーションアプリを利用するだけで済むかもしれませんが、300万人のユーザーのマナーを守るのは常に困難です。リル・ヨッティの退場ミームでさえ、Viggleのルールに厳密に違反しています。Viggleは、著名人を含む実在の人物の画像を本人の同意なしに作成しないようユーザーに推奨しています。
今のところ、Viggleの救いは、その出力がまだ100%リアルではないということかもしれない。技術は本当に素晴らしいが、私たちはそれをよく分かっている。あのぎこちないジョーカーのアニメーションは明らかにリアルではないが、確かに面白い。
AIニュースレターを始めます! 6月5日から受信ボックスに配信を開始するには、こちらからご登録ください。