AIが生み出したアートにアーティストたちがプレッシャーを感じ、夜明けに絵筆を振るう

Cemubo vgnpne 0

Watch

最近インターネットを少しでも触ったことがあるなら、DALL-EとMidjourneyについて聞いたことがあるでしょう。ニューラルネットワークが生成できるアートの種類、そしてこの技術の長所と短所への深い理解は、私たちが全く新しい苦境に直面することを意味します。コンピューター生成アートは、しばしば下品なジョークのネタ（ウェイターの注意を引くにはどうすればいい？「ヘイ、アーティスト！」と声をかければいいのに）として扱われますが、人間対機械の「私たちの仕事を奪った」という物語の新たなオチとなっています。

私にとって興味深いのは、ロボットや機械が特定の仕事を担うことが、単調で退屈、危険、あるいは単にひどいという理由で、渋々ながら受け入れられてきたことです。車のシャーシを溶接する機械は、人間よりもはるかに優れた仕事を、より速く、より安全にこなします。しかし、芸術となると話は別です。

最近の映画『エルヴィス・プレスリー』で、バズ・ラーマン監督はトム・パーカー大佐の口から「素晴らしい演技とは、観客に、彼らが楽しめるかどうか確信が持てない感情を与えるもの」というセリフを引用しています。私にとって、これは芸術について最近聞いた最高のセリフの一つです。

商業芸術は目新しいものではありません。ピクサー映画、音楽、あるいはイケアの額縁に付いているプリントなど、芸術は長きにわたり大規模に流通してきました。しかし、概して共通しているのは、ある種の創造的なビジョンを持った人間によって創造されたということです。

この記事の冒頭の画像は、MidJourney を使用して、アルゴリズムに少し滑稽なプロンプト「プロザックが笑いの雲であるかのように男性が踊る」を入力したときに生成されました。やや重度のうつ病と不安を含む精神的な健康の不安定さを生涯にわたって経験してきた人として、機械が何を考え出すのか興味がありました。そして、なんと、これらの生成されたグラフィックはどれも、私が概念的に思いついたものではありません。しかし、嘘をつくつもりはありません。これまで見てきたほとんどのものよりも、これらの機械生成アート作品によってグラフィックが表現されていると感じています。そして奇妙なことに、それをしたのは私です。これらのイラストは、私が描いたり概念化したりしたものではありません。Discord に奇妙なプロンプトを入力しただけですが、私の突飛なアイデアがなければこれらの画像は存在しなかったでしょう。この記事の冒頭にある画像が生成されただけでなく、理解しにくい概念を表す 4 つのまったく異なる (そして奇妙なほど完璧な) イラストも出力されました。

世界中のコンセプチュアルイラストレーターにとって、それが何を意味するのかを言葉で正確に表現するのは難しい。ボタンをクリックするだけで、どんなものでも、どんなスタイルでも、思いつく限りのあらゆるものを数分で生み出せるようになったら――アーティストであるということは、一体何を意味するのだろうか？

テッククランチイベント

サンフランシスコ | 2025年10月27日～29日

ここ1週間ほど、ちょっとやり過ぎたかもしれません。バットマンの画像を何百枚も生成してしまいました。なぜバットマンなのか？理由は分かりませんが、MidJourneyが生成できる様々なスタイルを比較するためのテーマが欲しかったのです。もっと深く知りたい方は、Twitterで「AI Dark Knight Rises」をチェックしてみてください。そこでは、私がこれまでに出会った最高の生成画像をいくつかシェアしています。候補は何百枚もありますが、ここでは幅広いスタイルが揃っていることを示すためにいくつかご紹介します。

もしヴァニラ・アイスがバットマンだったら — バットマン vs ヴァニラ・アイス

上記すべて、そしてさらに何百ものデザインを生成する上でのボトルネックは 3 つだけでした。Midjourney サブスクリプションに支払える金額、プロンプトに対して考え出せる創造力の深さ、そして同時に生成できるデザインが 10 個だけであるという事実です。

私には視覚的な思考力はありますが、芸術的な才能は皆無です。でも、芸術的な才能は必要ありません。例えば、バットマンとドワイト・シュルートが殴り合っている場面など、何かのテーマを考え出すと、アルゴリズムが4つのバージョンを吐き出します。そこから、リロール（つまり、同じテーマから4つの新しい画像を生成すること）したり、いずれかの画像の高解像度バージョンをレンダリングしたり、あるいはいずれかのバージョンに基づいて反復処理を行ったりできます。

このアルゴリズムの唯一の欠点は、「与えられたものを受け入れる」というアプローチを優先していることです。もちろん、プロンプトをより詳細に指定することで、画像内で何が起こっているか、スタイル、その他のパラメータなど、最終的な画像をより細かく制御できます。私のようなビジュアルディレクターにとって、このアルゴリズムはしばしばフラストレーションを感じさせます。なぜなら、私の創造的なビジョンは言葉で表現するのが難しく、AIにとって解釈とレンダリングはさらに困難だからです。しかし、アーティストにとって恐ろしいことであり、アーティスト以外の人にとってエキサイティングなことは、この技術がまだ初期段階にあり、画像の生成方法をより細かく制御できるようになるということです。

例えば、次のようなプロンプトを試してみました。バットマン（左）とドワイト・シュルート（右）がペンシルベニア州スクラントンの駐車場で殴り合いをしている。ドラマチックな照明。写真のようにリアル。モノクロ。細部まで緻密。もし人間にこのプロンプトを与えたら、「まるで機械のように話しかけているから出て行け」と言われるでしょう。しかし、絵を描くのであれば、人間はこのプロンプトを概念的に理解できるだろうと思います。何度も試してみましたが、「まさにこれだ」と思えるイラストはあまりありませんでした。

反復1：ペンシルベニア州スクラントンの駐車場で、バットマン（左）とドワイト・シュルート（右）が殴り合いをしている。ドラマチックな照明。写真のようにリアル。モノクロ。細部まで緻密に描かれている。

イテレーション2：バットマン（左）とドワイト・シュルート（右）がペンシルベニア州スクラントンの駐車場で殴り合いをしている。ドラマチックな照明。写真のようにリアル。モノクロ。細部まで緻密に描かれている。

反復3：ペンシルベニア州スクラントンの駐車場で、バットマン（左）とドワイト・シュルート（右）が殴り合いをしている。ドラマチックな照明。写真のようにリアル。モノクロ。細部まで緻密に描かれている。

イテレーション4：バットマン（左）とドワイト・シュルート（右）がペンシルベニア州スクラントンの駐車場で殴り合いをしている。ドラマチックな照明。写真のようにリアル。モノクロ。細部まで緻密に描かれている。

反復5：バットマン（左）とドワイト・シュルート（右）がペンシルベニア州スクラントンの駐車場で殴り合いをしている。ドラマチックな照明。写真のようにリアル。モノクロ。細部まで精細に描かれている。

著作権はどうですか?

もう一つ面白い点があります。多くのスタイルが見分けがつくもので、中には見分けがつく顔もあります。例えば、これはAIにバットマンをヒュー・ローリーとして想像させているところです。皆さんはどう思われるか分かりませんが、私は本当に感心しました。バットマンのスタイルが再現されていて、ローリーも絵の中で見分けがつきます。ただ、このAIが他のアーティストの絵を丸ごと盗用したのかどうかは分かりません。法廷でMidJourneyやTechCrunchのように、なぜこんなひどいことになったのか説明されたくはありません。

バットマン役のヒュー・ローリー**画像クレジット:** BY-NC-40 ライセンスに基づき、Haje Kamps によるプロンプト付きの『Midjourney』。

この種の問題は、アートの世界ではあなたが思う以上に頻繁に起きている。一例として、シェパード・フェアリー事件が挙げられる。この事件では、アーティストがバラク・オバマの有名な「HOPE」ポスターを、AP通信のフリーランス写真家マニー・ガルシアの写真に基づいて制作したとされている。この事件は、特に他のアーティストたちが同じスタイルでアートを制作し始めたことで、とんでもない大混乱に陥った。今や、フェアリーは他者の作品を盗作したとされる一方で、逆に盗作されているという、多層的な盗作サンドイッチ状態になっている。そしてもちろん、フェアリーのスタイルでAIアートを生成することも可能であり、これが事態をさらに極めて複雑にしている。私は試さずにはいられなかった。シェパード・フェアリー風のバットマンで、下部にHOPEというテキストがある作品だ。

彼は希望する — 希望。AIがこの画像に込めた具体的なビジョンに近づくことはできるものの、残念ながら及ばないという素晴らしい例です。それでも、スタイルはフェアリーの作品に十分近いので、見分けがつきます。**画像クレジット：** Haje Kamps （新しいウィンドウで開きます） / Midjourney （新しいウィンドウで開きます）

カイルは、この技術の法的将来がどうなるかについてさらに多くの考えを持っています。

商用画像生成AIは、さまざまな厄介な法的問題を引き起こす

それでアーティストはどうなるのでしょうか?

この発展において最も恐ろしいのは、写真、絵画、執筆といった創造的な行為が機械の手から守られていた世界から、もはや機械の手から守られなくなった世界へと、急速に移行してしまったことです。しかし、あらゆるテクノロジーと同様に、自分の目や耳を信頼できなくなる時代が間もなく到来します。機械は猛スピードで学習し、進化していくのです。

もちろん、すべてが悲観的というわけではありません。もし私がグラフィックアーティストだったら、インスピレーションを得るために最新世代のツールを使い始めるでしょう。作品の出来栄えに驚きながらも、「でも、もう少し[クリエイティブなビジョンを挿入]だったらよかったのに」と思ったことが何度もありました。もしグラフィックデザインのスキルがあれば、今あるものを活かして、自分のビジョンに近いものに仕上げることができるはずです。

アートの世界ではそれほど一般的ではないかもしれませんが、製品デザインの世界では、こうした技術は古くから存在しています。プリント基板（PCB）では、機械が長年かけて配線設計の初期バージョンを作成してきました。もちろん、エンジニアによる微調整もしばしば行われます。製品デザインでも同じことが言えます。オートデスクは5年前にも遡り、ジェネレーティブデザインの優れた能力を披露していました。

Autodesk Generative Designは制約を取り入れて独自の3Dモデルを作成します

ニューラルネットワークがますます賢くなり、扱えるデータセットがますます包括的になるにつれ、あらゆる仕事にとって素晴らしい新世界が到来しています (私自身の仕事も含みます。昨年、私は AI に TechCrunch の記事の大部分を書かせました)。

この極めて不快な画像について最後に述べておきたいと思います。AI が画像内に配置した人物の中には、私や TechCrunch スタッフの他のメンバーが認識できる人物が数人います。

この投稿で使用されているMidjourneyの画像はすべて、クリエイティブ・コモンズ非営利表示ライセンスの下で提供されています。Midjourneyチームの明示的な許可を得て使用しています。

Posted by Cemubo