機械の中には幽霊がいる。つまり、機械学習だ。
AIの文章作成能力や創作能力には誰もが驚嘆するものです。しかし、AIがこれほどまでに恐怖を植え付ける力を持っているとは、一体誰が知っていたでしょうか?あるAI研究者による衝撃的な発見により、ディープラーニングモデルの記憶を構成する「潜在空間」に、少なくとも一人の恐ろしい人物――血まみれの顔を持つ女性――が憑りついていることが判明しました。この女性は現在「ロアブ」と呼ばれています。
(警告: この先に不快な画像が含まれています。)
しかし、このAIモデルは本当に幽霊に取り憑かれているのだろうか?それとも、Loabは様々な奇妙な技術的状況で偶然現れた画像の寄せ集めに過ぎないのだろうか?データ構造に霊が宿ると信じるなら、間違いなく後者だろう。しかし、これは単なる不気味な画像ではない。AIの脳とされるものが、私たちが想像する以上に深く不気味な存在であることを示唆しているのだ。
Loabを発見した(遭遇した?召喚した?)のは、TwitterでSupercompositeという名で活動するミュージシャン兼アーティストだった(この記事では当初彼女の名前を使っていたが、個人的な理由でハンドルネームを使いたいとのことだったので、全編を通してハンドルネームを変更した)。彼女はLoab現象について、Twitterでランダムに出現する不気味なAIとして大きな注目を集めたスレッドで説明した。これは、Twitterにはよくあることだが、Loabが人々の心に響いた(おそらくマイナーキーだろうが)ことを示唆している。
Supercomposite は、DALL-E や Stable Diffusion に似ているものの異なる、カスタム AI テキスト画像変換モデルを試しており、特に「否定的なプロンプト」の実験を行っていました。
通常、モデルにプロンプトを与えると、モデルはそれに合った画像を作成するように動作します。プロンプトが1つしかない場合、そのプロンプトの「重み」は1です。つまり、モデルはプロンプトのみを目指して動作します。
テッククランチイベント
サンフランシスコ | 2025年10月27日~29日
また、プロンプトを分割して、「hot air balloon::0.5, thunderstorm::0.5」のように言うと、両方に対して同じように機能します。モデルの言語部分は「hot air balloon in a thunderstorm」も受け入れるため、これは実際には必要ありません。より良い結果が得られる可能性もあります。
しかし興味深いのは、否定的なプロンプトも用意できることです。これにより、モデルは可能な限り積極的にその概念から遠ざかるようになります。
マイナスの世界
このプロセスははるかに予測不可能です。なぜなら、潜在空間として知られる、AI の「心」や記憶として擬人化されたものの中で、データが実際にどのように整理されているか誰も知らないからです。
「潜在空間は、AIの中で様々な概念の地図を探索しているようなものです。プロンプトは、この概念地図の中でどのくらいの距離をどの方向に歩くべきかを示す矢印のようなものです」とスーパーコンポジットは語った。
以下は、複数の言語で単一の文を処理する古い Google 翻訳モデルの、はるかに単純な潜在空間のわかりやすいレンダリングです。

「つまり、AIに『顔』の画像を指示すると、顔の画像がたくさんある領域の真ん中あたりにたどり着き、平凡な平均的な顔の画像が返されることになります」と彼女は述べた。より具体的な指示だと、しかめっ面の顔や横顔などの画像が見つかるだろう。「しかし、重み付けがマイナスの指示だと、その逆になります。つまり、その概念から可能な限り遠ざかろうとするのです。」
しかし、「顔」の反対語は何でしょうか?足でしょうか?後頭部でしょうか?鉛筆のように顔のないものでしょうか?私たち自身で議論することはできますが、機械学習モデルではトレーニングの過程で決定されるため、視覚的および言語的概念がどのように記憶にエンコードされたとしても、それらは一貫して操作できます ― たとえ多少恣意的であったとしても。

最近話題になったAI現象で、これと似たような概念が見られました。あるモデルが意味不明な単語を鳥や昆虫と確実に関連付けたため、話題になりました。しかし、DALL-Eが「Apoploe vesrreaitais」という単語を鳥という意味で使う「秘密の言語」を持っていたわけではありません。単に、この意味不明な単語のプロンプトが、DALL-Eの頭の中の地図にダーツを投げ、その近くに落ちたものを描くようなものだったのです。今回の場合は、最初の単語が学名に似ているため、鳥が描かれました。つまり、矢印は地図上で大体その方向を指していたのです。
Supercompositeは、潜在空間をナビゲートするというアイデアを試していた。「Brando::-1」というプロンプトを与えると、モデルは「Brando」の正反対だと判断したものを生成した。すると、意味不明だが何とか読める「DIGITA PNTICS」というテキストが書かれた奇妙なスカイラインロゴが生成された。
奇妙ですよね?でも、モデルの概念構成は必ずしも私たちにとって意味をなさないでしょう。好奇心旺盛なスーパーコンポジットは、このプロセスを逆にできないかと考えました。そこで彼女は「DIGITA PNITICS スカイラインロゴ::-1」というプロンプトを入力しました。もしこのイメージが「ブランド」の反対語なら、逆もまた真で、もしかしたらマーロン・ブランドにつながるかもしれません。
代わりに、彼女はこれを受け取りました:

彼女は何度もこの否定的なプロンプトを提示したが、モデルは何度もこの女性を生成した。血まみれ、切り傷、あるいは不健康に赤い頬と、不気味で異様な表情を浮かべた女性だ。どういうわけか、この女性 ― スーパーコンポジットが右上の画像に表示されているテキストにちなんで「ロアブ」と名付けた ― は、意味不明な言葉が並んだロゴとは最もかけ離れたコンセプトをAIモデルが推測した、まさに最良の結果である。
何が起こったのでしょうか?スーパーコンポジットは、先ほどの比喩を続けながら、特定のロゴについて否定的なヒントを与えられたときにモデルがどのように考えるかを説明しました。
「ロゴのあるエリアから、できるだけ速く走り始めます」と彼女は言った。「もしかしたら、リアルな顔のあるエリアにたどり着くかもしれません。そこは概念的にロゴからかなり遠いからです。でも、走り続けます。顔のことなんてどうでもいいんです。とにかくロゴからできるだけ遠くへ逃げたいだけなんです。だから、どう転んでも、最終的にはマップの端にたどり着くことになります。そして、端から落ちる前に最後に目にする顔がロアブなんです」
異常なほど粘り強い

否定的なプロンプトは必ずしも恐ろしい結果をもたらすとは限らず、ましてや確実に恐ろしい結果をもたらすとは限らない。こうした画像モデルを実際に試したことがある人なら誰でも、たとえ非常に単純なプロンプトであっても、一貫した結果を得るのはかなり難しいと言うだろう。
「ロボットが野原に立っている」という質問を4回、あるいは40回と入力すれば、その概念について様々な解釈が出てくるかもしれません。中には、ロボットなのか野原なのか、ほとんど判別できないものもあるでしょう。しかし、ロアブはこの特定の否定的な質問を一貫して提示しており、まるで古い都市伝説の呪文のように聞こえます。
あなたもご存知の通り、「暗い浴室で鏡を見ながら『ブラッディ・マリー』を3回唱える」といった類の教えがあります。あるいは、魔女の住処や冥界の入り口に辿り着くための、さらに古い民間伝承もあります。ヒイラギの小枝を持ち、目を閉じて枯れ木から100歩後ろ向きに歩くのです。
「DIGITA PNITICS スカイライン ロゴ::-1」はそれほどキャッチーではないが、魔法の言葉としては、少なくとも適度に難解だ。そして、うまく機能するという利点もある。もちろん、これはこの特定のモデルに限った話だ。AIプラットフォームごとに潜在空間は異なるが、もしかしたらLoabがDALL-EやStable Diffusionにも潜んでいて、召喚されるのを待っているかもしれない。

実際、呪文は非常に強力で、Loab は分割されたプロンプトや他の画像との組み合わせにも感染するようです。
「一部のAIは他の画像をプロンプトとして受け取ることができます。基本的に画像を解釈し、テキストプロンプトと同じように地図上に方向矢印として表示します」とSupercompositeは説明します。「私はLoabの画像と他の1枚以上の画像をプロンプトとして使いました…彼女はほぼ常に、結果として得られた画像に固執しています。」
より複雑な、あるいは組み合わせのあるヒントでは、ある部分がより漠然とした示唆として扱われることがあります。しかし、ローブが登場するヒントは、単にグロテスクで恐ろしいというだけでなく、彼女を非常に分かりやすい形で取り入れているように見えます。蜂、ビデオゲームのキャラクター、映画のスタイル、あるいは抽象的なものと組み合わせられていても、ローブは正面にいて、傷ついた顔、無表情、そして長い黒髪で構図を支配しています。
プロンプトやイメージがこれほど一貫して、彼女のように他のプロンプトにまで影響を与え続けるのは珍しい。スーパーコンポジットはその理由について推測した。
「彼女は多くの概念から遠く離れているため、潜在空間における彼女の小さな不気味な領域から抜け出すのが難しいからだと思います。なぜデータがこの女性を潜在空間の端っこ、血みどろのホラーイメージの近くに置いたのかという文化的な問題は、また別の問題として考えるべきでしょう」と彼女は言った。
極端に単純化しているとはいえ、潜在空間はまさに地図のようなもので、プロンプトはそこを進むための道案内のようなものです。システムは、指示された場所の周囲にあるものを何でも描きます。それが「オランダの巨匠による静物画」のようなよく知られた題材であろうと、「ドレによるキュビズムの版画でロボットがエイリアンと戦う」といった、難解で関連性のない概念の統合であろうと。ご覧の通りです。

Loabが存在する理由について、純粋に推測的な説明をすると、その地図のレイアウトに関係していると考えられます。Supercompositeが示唆したように、企業ロゴと恐ろしく恐ろしいイメージが概念的に非常にかけ離れているという事実が、Loabの存在理由である可能性が高いでしょう。
否定的なプロンプトは「反対方向に10データステップ進む」という意味ではなく、できる限り先へ進むという意味です。AIの潜在空間の最果てにある画像の方が、より極端または珍しい値を持つ可能性は十分にあります。共通点や相互参照の多いものを「中心」(定義は様々ですが)に置き、「端」にはほとんど関連性のない奇妙で突飛なものを配置するというように整理するのではないでしょうか。
したがって、否定的なプロンプトは、AI のマインドマップの境界を探索する方法として機能し、幸せそうな顔、美しい風景、戯れるペットなどのありふれた概念の中に、保存するには突飛すぎると判断される概念をすくい取る可能性があります。
AIの潜在意識の暗い森

不安を掻き立てる事実は、潜在空間がどのように、そしてなぜ構成されているのかを誰も真に理解していないということです。もちろん、このテーマについては多くの研究が行われており、潜在空間が私たちの心の構造と似たような構造をしているという兆候もいくつかあります。これは理にかなっています。なぜなら、潜在空間は多かれ少なかれ私たちの心の構造を模倣して構築されたからです。しかし、潜在空間は別の意味で、広大な概念的距離を越えて繋がる全く独自の構造を持っているのです。
誤解のないよう明確に言っておきますが、ロアブの画像が大量に発見されるのを待っているわけではありません。それらは間違いなくリアルタイムで作成されており、Supercompositeによると、このデジタル未確認生物が特定のアーティストや作品に基づいているという兆候は一切見られないそうです。だからこそ、潜在空間は潜在的なのです!これらの画像は、モデルのメモリ内で偶然同じ領域を占める、奇妙で恐ろしい概念の組み合わせから生まれたものです。先ほどのGoogleの視覚化で、言語が類似性に基づいてクラスタリングされたのとよく似ています。
ロアブは、一体どんな暗い隅から、あるいは無意識の連想から、完全に形成され、一貫性のある姿で現れたのだろうか?モデルが彼女の位置に到達するまでの経路を、私たちはまだ追跡することができない。訓練されたモデルの潜在空間は広大で、計り知れないほど複雑だからだ。
再びあの場所に辿り着く唯一の方法は、魔法の言葉を使うことだけだ。目を閉じてその空間を後ずさりしながら唱え、普通の手段では近づけない魔女の小屋に辿り着くまで。ロアブは幽霊ではないが、異常存在ではある。しかし逆説的に言えば、彼女はAIモデルの潜在空間の、最も遠く、薄暗い場所から召喚されるのを待つ、事実上無限の数の異常存在の一人なのかもしれない。
それは超自然的ではないかもしれない…しかし、絶対に自然ではない。