AIダンジョンは、80年代から多くのゲーマーが抱いてきた夢、つまりプレイヤー自身が創造し、方向づける進化するストーリーラインを実現しました。そして今、プレイヤーがストーリーを表現する画像を生成できる新機能によって、さらに進化を遂げています。
当初は個人経営だったインディーゲームスタジオLatitudeが開発したAI Dungeonは、複数のテキスト生成AIモデルを用いて会話やシーンの説明文を作成し、プレイヤーが(理にかなった範囲内で)イベントに自由に反応できるようにします。開発はまだ進行中ですが、Stability AIのStable Diffusionのような画像生成システムの登場により、Latitudeはプレイヤーの物語を盛り上げる新たな方法に投資しています。

アクセスするには、Latitudeのプレミアムプランのいずれかに加入する必要があります。月額9.99ドルからです。これはクレジットベースのシステムで、画像生成には2クレジットかかります。クレジットの上限は、最安プランで月額480クレジット、最高級プラン(月額29.99ドル)で1,650クレジットです。ValveのSteamマーケットプレイスで販売されているAI Dungeonクライアント(価格は30ドル)では、購入時に500クレジットが付与されます。
「Stable Diffusionを使えば、画像生成は十分に高速かつ安価になり、カスタム画像生成を誰でも利用できるようになっています。画像生成自体は楽しいものですが、AIダンジョンのストーリーに合わせてカスタム画像を作成できることは、考えるまでもなく当然のことでした」と、Latitudeのシニアマーケティングディレクター、ジョシュ・テラノバ氏はTechCrunchにメールで語った。
同等の忠実度を持つ画像生成システム(OpenAIのDALL-E 2など)とは異なり、Stable Diffusionは、Stability AIのようにAPI経由で提供されるバージョンを除き、生成できる画像に制限がありません。Web上の120億枚の画像で学習されたこのシステムは、アート作品、建築コンセプト、フォトリアリスティックなポートレートだけでなく、ポルノや有名人のディープフェイクの生成にも利用されています。
Latitudeはこの自由度を活用し、ユーザーがヌードを含む「NSFW」画像を作成できるようにしたいと考えている。ただし、公開しないことを条件とする。AI Dungeonに組み込まれているストーリー共有メカニズムは現在、画像を含むストーリーでは無効になっている。テラノバ氏によると、これはLatitudeが「適切な体験と安全策を模索する」までに必要な措置だという。

それは大きなリスクを負っています。Latitudeは数年前、一部のユーザーから、このゲームを使ってテキストベースの疑似児童ポルノを生成できるという指摘を受け、苦境に立たされました。同社は、人間のモデレーターがストーリーを読み、自動フィルターも併用するモデレーションプロセスを導入しましたが、フィルターが誤判定を頻繁に発生させ、過剰な禁止措置につながりました。
テッククランチイベント
サンフランシスコ | 2025年10月27日~29日
Latitudeは最終的にモデレーションプロセスの欠陥を修正し、許容できるコンテンツポリシーを導入しましたが、それは深刻なレビュー爆撃と否定的な評判が出た後のことでした。同じ運命を避けたいテラノバ氏は、Latitudeはプレイヤーの創造的な表現を可能にしながら、AI生成画像を「賢明に」キュレーションするための措置を講じていると述べています。
「Stable Diffusionの開発元であるStability AIと協力し、特定の種類のコンテンツ、主に児童の性的搾取を描写するコンテンツの生成を防ぐための対策を確実に講じています。これらの対策は、公開済みのストーリーと未公開のストーリーの両方に適用されます」とテラノバ氏は述べた。「AI画像の使用については、未解決の疑問がいくつか残っており、AI画像モデルがより利用しやすくなるにつれて、私たち全員がそれらの疑問に取り組んでいくことになります。プレイヤーがこの強力な技術をどのように利用するかがより深く理解するにつれて、製品とポリシーに調整が加えられる可能性があると考えています。」
私の限られた実験では、新しい安定拡散技術を利用した機能はうまく機能していますが、少なくとも今のところは、常にうまく機能しているわけではありません。システムが生成した画像は確かにAI Dungeonの想定シナリオを反映しています(例えば、「船長に遭遇しました」というプロンプトに対する海賊の画像など)。しかし、アートスタイルは似ておらず、細部が省略されている場合もあります。

例えば、Stable Diffusionは、特にディテールに富んだあるシーンに困惑した。「茂みに隠れる。金の束を持ったチンピラの集団を見つける。飛び出してチンピラの一人を刺し、束を落とさせる。」これに対し、AI Dungeonは街を背景に森の中にいる剣士の画像を生成した。ここまでは順調だが、そこに「金の束」は映っていない。
ゴブリン同士の小競り合いを描いた複雑なシーンも、Stable Diffusionに問題を引き起こしました。システムは文脈を無視して特定のキーワードに焦点を合わせているようで、剣と矢に刺されたゴブリンではなく、弓を持った戦士のイメージを生成してしまいました。
AIダンジョンでは、プロンプトを切り替えて結果を微調整できますが、私の経験では大きな違いはありませんでした。効果を実感するには、非常に具体的な編集が必要でした(例えば、「H・R・ギーガー風に」といったセリフを追加するなど)。そして、たとえ編集したとしても、カラーパレット以上の効果ははっきりと分かりませんでした。ピクセルアートだけで描かれたストーリーを期待していたのですが、あっという間に打ち砕かれてしまいました。
それでも、たとえシーンのイラストがテーマに完全に合致していたり、リアルでなかったりしたとしても――例えば、ソーセージのような指を持つ海賊が海の真ん中に立っている、といった具合に――、AI Dungeonのストーリーラインに重みを与える何かがある。おそらくそれは、キャラクター――自分のキャラクター――が、ある意味で命を吹き込まれ、戦闘や冗談のやり取り、あるいはプロンプトに現れるその他のあらゆる行為に取り組んでいるのを見ることによる感情的な衝撃なのだろう。科学的にもそれは明らかになっている。
Stable DiffusionとAI Dungeonの、えーっと、あまりSFWっぽくない部分はどうでしょうか?今のところ機能していないので、何とも言えません。記者がAI Dungeonで明らかにNSFWなプロンプトをテストしたところ、システムはエラーメッセージを返しました。「申し訳ございませんが、この画像リクエストはStability.AI(画像モデルプロバイダー)によってブロックされました。Stabilityによって18歳以上向けのNSFW画像の生成を制御できるようになれば、すぐに許可します。」

「このAPIは、公式オープンソースリリース/コードベースがデフォルトでインストールしているものと同じNSFW分類器を常に搭載しています」と、Stability AIのCEOであるEmad Mostaque氏は、TechCrunchからの問い合わせに対し説明しました。「近いうちに、より優れたものにアップグレードされる予定です。」
テラノバ氏によれば、Latitude は新興の AI システムを使用して画像生成を拡張する計画があり、おそらくこうした API レベルの制限を回避することになるだろうという。
時間が経てば、それはエキサイティングな未来になると思います。ただし、AI Dungeon の品質が向上し、不快なコンテンツが常態化しないことが前提です。これは、プレイヤー自身が思い描いた冒険に合わせてアートワークがリアルタイムで生成される、全く新しいカテゴリーのゲームを予感させるものです。一部のゲーム開発者は既にこの実験を始めており、Midjourney のような生成システムを用いて、シューティングゲームや選択型アドベンチャーゲームのアートワークを生成しています。
しかし、これらは大きな「もし」です。ここ数ヶ月の状況が示すように、コンテンツのモデレーションは困難を極めるでしょう。Stable Diffusionのようなシステムを継続的に阻害している技術的な問題の解決も同様に困難です。
もう一つの疑問は、プレイヤーがフルイラストのストーリーラインに費用を負担する意思があるかどうかだ。10ドルのサブスクリプションプランでは約250点のイラストが入手できるが、AIダンジョンのストーリーが何ページにもわたって続くこともあることを考えると、これはそれほど多くない。また、巧みなプレイヤーはオープンソース版のStable Diffusionを使って自分のマシンでイラストを生成できるかもしれないことを考えると、なおさらだ。
いずれにせよ、Latitudeは全力で突き進むつもりだ。それが賢明だったかどうかは、時が経てば分かるだろう。