実験により、AIは個々人の創造性を高めるが、集団では創造性を低下させることが判明

実験により、AIは個々人の創造性を高めるが、集団では創造性を低下させることが判明

新たな研究では、AIが創造的なタスクにおいて自動化された補助ツールとなり得るかどうかを検証したが、結果はまちまちだった。AIは、生まれつき創造性がそれほど高くない人々がより独創的な短編小説を書くのを手助けしたようだが、グループ全体の創造性は低下した。これは、AIツールが創造的な取り組みに影響を与えるにつれて、ますます一般的になるかもしれないトレードオフである。

この研究は、ロンドン大学ユニバーシティ・カレッジのアニル・ドーシ氏とエクセター大学のオリバー・ハウザー氏によるもので、Science Advances誌に掲載されました。短編小説に焦点を当てているため、研究内容は限定的ですが、多くの人が抱いている意見、つまりAIは役に立つものの、創造的な取り組みにおいて真に新しいものは何も提供しないという意見を裏付けているようです。

「私たちの研究は、大規模言語モデルや生成AIが、創造性を含む人間の活動にどのような影響を与えるかという、非常に大きな問いに対する初期の見解を示しています」とハウザー氏はTechCrunchへのメールで述べた。「この技術がメディアや創造性全般に大きな影響を与える可能性は非常に大きく(そして間違いなく、大きな期待も寄せられています)、AIが実際に厳密に評価されることが重要になります。肯定的な結果をもたらすという前提で広く導入されるのではなく、です。」

この実験では、数百人の被験者に、幅広い読者層に適した、テーマは問わない非常に短い物語(8文程度)を書いてもらいました。1つ目のグループはただ書き、2つ目のグループはGPT-4を使って数文の物語のアイデアを1つ(好きなだけ使っても、使わなくても構いません)作成してもらいました。3つ目のグループは、最大5つの物語の始まりを得ることができました。

画像クレジット:アニル・ドシとオリバー・ハウザー

物語が書き上げられると、それぞれの作家と、生成AIの要素について何も知らない別のグループの両方から評価を受けました。評価者は、物語の斬新さ、有用性(つまり出版の可能性)、そして感情的な楽しさについて評価しました。

創造性が低いと利益は高くなる…創造性が高いと利益はなくなる

物語を書く前に、参加者は創造性の代理指標となる語彙生産課題も行いました。これは直接測定できる概念ではありませんが、この課題では、少なくとも文章における創造性を概算することができます(ただし、誰もが生まれながらの作家、あるいは熟練した作家であるわけではないので、批判は控えましょう)。

「創造性という豊かで複雑なものを、何らかの尺度で捉えるのは、困難を伴うように思えます」とハウザー氏は記している。「しかしながら、人間の創造性については豊富な研究があり、創造性という概念を尺度で捉える最良の方法については、活発な議論が交わされています。」

テッククランチイベント

サンフランシスコ | 2025年10月27日~29日

彼らのアプローチは学界で広く使用されており、他の研究でも十分に裏付けられていると述べた。

研究者たちは、創造性指標が低い人はストーリーの評価で最低点を取ったことを発見しました。これは、このアプローチの有効性を裏付けると言えるでしょう。また、彼らは生成されたストーリーのアイデアを使用する機会を与えられた際に、最大の成果を上げました(注目すべきは、実験全体で大多数の人が実際に使用したことです)。

創造性スコアが低い人が書いたばかりのストーリーは、文章の質、楽しさ、斬新さにおいて、他の人よりも確実に低い評価を受けました。AIが生成したアイデアを1つ与えた場合には、すべての指標で高い評価を得ました。5つの中からアイデアを選んだ場合には、さらに高い評価を得ました。

文章作成の創造的な側面に苦労している人々にとって(少なくともこの文脈と定義においては)、AIヘルパーは真に作品の質を向上させているように思われます。これは、文章を書くのが苦手な多くの人にとって共感できるでしょう。彼らにとって、「ねえ、これを試してみて」という言語モデルは、段落を書き終えたり、新しい章を始めたりするのに必要なきっかけとなるのです。

画像クレジット:ハウザー、ジョシ

しかし、創造性指標で高得点を獲得した人たちはどうだったでしょうか?彼らの文章力は新たな高みに到達したのでしょうか?残念ながら、いいえ。実際、これらの参加者はほとんど、あるいは全く向上しなかったか、あるいは(非常に僅差で、おそらく有意ではないものの)評価が悪化したのです。創造性に優れた人たちは、AIの助けを全く受けなかった時に最高の作品を生み出したようです。

なぜそうなるのか、その理由はいくつも想像できるが、数字は、この状況では、生来の創造力を持つ作家に対して AI がまったく影響を及ぼさなかったか、マイナスの影響を与えたことを示唆している。

平らにした

しかし、研究者たちが心配していたのは、その部分ではない。

参加者による物語の主観的な評価に加え、研究者たちは独自の分析も行いました。OpenAIの埋め込みAPIを用いて、各物語が同カテゴリー内の他の物語(人間のみ、AIが1つの選択肢、AIが5つの選択肢)とどの程度類似しているかを評価しました。

結果、生成AIを利用することで、結果として得られたストーリーは、そのカテゴリーの平均に近づくことが分かりました。言い換えれば、グループとしてより類似性が高く、多様性に欠けるということになります。全体の差異は9%から10%程度だったので、すべてのストーリーが互いにクローン化されたわけではありません。そして、この類似性は、経験の浅い作家が提案されたストーリーを完成させるのに対し、より創造力豊かな作家がゼロからストーリーを創作するのと対照的な結果なのかもしれません。

それでも、この発見は結論の中で警告を述べるには十分であったが、私はそれを要約して全文引用することはできない。

これらの結果は個人の創造性の向上を示唆している一方で、集団としての斬新さが失われるリスクもあります。一般均衡において、AIによって強化され、インスピレーションを受けた物語が、そこから生み出される成果物に十分なバリエーションを生み出すことができるかどうかは興味深い疑問です。具体的には、出版業界(および自費出版業界)が生成AIに触発された物語をより多く取り入れるようになれば、私たちの調査結果は、生み出された物語は全体として独自性を失い、互いに似通ったものになることを示唆しています。この下降スパイラルは、新たな社会的ジレンマとの類似点を示しています。個々の作家が、生成AIに触発された自分の作品がより創造的であると評価されることを知れば、将来的には生成AIをより多く使用するインセンティブが生まれますが、そうすることで物語の集団としての斬新さがさらに低下する可能性があります。つまり、私たちの結果は、生成AIが個人の創造性に及ぼした強化効果にもかかわらず、生成AIが創造的なタスクに広く採用された場合、警告となる可能性があることを示唆しています。

これは、視覚芸術やウェブコンテンツにおける懸念を反映しています。AIがさらなるAIを生み出し、AIが学習する対象がAIそのものに過ぎない場合、平凡さの自己永続的なサイクルに陥ってしまう可能性があるのです。生成型AIがあらゆるメディアに浸透し始める中、こうした研究こそが、無限の創造性やAI生成の映画や楽曲の新時代といった主張に対するカウンターウェイトとして機能しているのです。

ハウザー氏とドシ氏は、自分たちの研究はまだ始まったばかりだと認めている。この分野はまったく新しいものであり、自分たちの研究も含め、すべての研究には限界がある。

「今後の研究で取り上げられるであろう道筋はいくつかあります。例えば、生成AIの『野外』実装は、私たちが管理している環境とは大きく異なるものになるでしょう」とハウザー氏は記している。「理想的には、私たちの研究が、文章、芸術、音楽など、あらゆる分野における創造的なアイデアの多様性を継続的に確保するために、テクノロジーと、私たちがそれとどのように関わっていくかという両方の指針となることを願っています。」