DALL-E 2は、インターネットから収集した約6億5000万点の画像とテキストのペアで「トレーニング」を行い、そのデータセットから画像と画像を説明する言葉の関係性を学習しました。OpenAIは特定のコンテンツ(ポルノや重複画像など)を含む画像をフィルタリングし、著名人などを対象としたAPIレベルの追加フィルターを実装しましたが、商標登録されたロゴやキャラクターを含む作品が作成される場合があることを同社は認めています。参照:
スポンジ・ボブがベスト・バイでテレビを買い物中 pic.twitter.com/9TMUhVAllU
— ブライアン・クロニン(@briangcronin)2022年7月12日
これはDALL-E 2だけの問題ではありません。AIコミュニティがDALL-E 2とその前身であるDALL-Eのオープンソース実装を作成するにつれ、フィルタリングが不十分なデータセットでトレーニングされたモデルをベースにした無料・有料のサービスが次々と登場しています。その一つであるPixelz.aiは、今週、カスタムDALL-Eモデルを搭載した画像生成アプリをリリースしました。このアプリを使えば、『ガーディアンズ・オブ・ギャラクシー』や『アナと雪の女王』といった映画の様々なポケモンやディズニーキャラクターの写真を簡単に作成できます。
テッククランチイベント
サンフランシスコ | 2025年10月27日~29日
Pixelz.aiチームはTechCrunchに対し、コメントを求められた際、モデルのトレーニングデータに卑猥な表現、ヘイトスピーチ、そして「違法行為」が含まれていないかフィルタリングし、生成時にユーザーがそのような画像をリクエストできないようにしていると述べた。同社はまた、利用規約に違反する画像を人間のモデレーターチームに報告できる機能を追加する予定だとも述べた。しかし、知的財産権(IP)に関わる問題に関しては、Pixelz.aiは、グレーゾーンであろうとなかろうと、生成した画像の使用または配布における「責任」をユーザーに委ねている。

もちろん、知的財産権保有者と侵害者とされる者との間の争いは今に始まったことではなく、インターネットはそれを加速させる役割を果たしたに過ぎません。2020年には、ハリー・ポッターの世界を映画化する権利を保有するワーナー・ブラザース・エンターテイメントが、InstagramやEtsyなどのソーシャルメディアプラットフォームから特定のファンアートを削除しました。その1年前には、ディズニーとルーカスフィルムがGiphyに対し、「ベビーヨーダ」のGIF画像を削除するよう申し立てていました。
しかし、画像生成AIは参入障壁を低下させることで、問題を大幅に拡大させる恐れがあります。大企業の苦境は同情を得られそうになく(そもそも同情されるべきでもありません)、知的財産権の保護を求める彼らの努力は、世論の法廷でしばしば裏目に出ます。一方で、例えば独立系アーティストのキャラクターを侵害するAI生成アート作品は、生計を脅かす可能性があります。
皆さん、Dall-E 2への招待状をいただきました!😁😁 素晴らしいツイートをする前に、ストレンジャー・シングスのホーマー・シンプソンの静止画をいくつか載せておきます #dalle2 pic.twitter.com/PHPI6n9yJk
— limb0wl 🦉👾 | 動画編集者&3Dアーティスト (@limb0wl) 2022年7月5日
Dave Gershgorn 氏が The Verge の最近の記事で指摘しているように、米国には公開されているトレーニング データを公正使用として認める直接的な法的な先例はありません。
関連性のありそうな事例の一つに、リトアニアのPlanner 5D社があります。同社は2020年、Planner 5D社のソフトウェアから数千ものファイルが盗まれたとして、Meta社(当時Facebook社)を提訴しました。これらのファイルは、Meta社が2019年に開催したコンピュータービジョン研究者向けのシーン理解とモデリングコンテストの参加者に、プリンストン大学との提携を通じて提供されていました。Planner 5D社は、プリンストン大学、Meta社、そしてMeta社のVRに特化したハードウェア・ソフトウェア部門であるOculus社が、Planner 5D社から取得したトレーニングデータから商業的に利益を得ることができたと主張しました。
この事件の裁判は2023年3月まで予定されていない。しかし昨年4月、この事件を担当する米国地方判事は、当時Facebook社とプリンストン大学がPlanner 5Gの申し立てを却下するよう申し立てた申し立てを却下した。
当然のことながら、権利者はフェアユースの議論に動揺していない。ゲッティイメージズの広報担当者はIEEE Spectrumの記事の中で、「DALL-E 2のようなモデルが学習に使用した画像、そして画像内に登場する人物、場所、物体の権利について」答えるべき「大きな疑問」があると述べた。記事でも引用されているイラストレーター協会のCEO、レイチェル・ヒル氏は、学習データに含まれる画像に対する報酬の問題を提起した。
https://twitter.com/dananthonykelly/status/1550277441721012224?s=21&t=rkD_pYze_IGYFB52YNB-EQ
米国における知的財産権保有者のロビー活動の力を考えると、米国がこれに追随する可能性は低いだろう。この問題は将来の訴訟で争われる可能性が高いだろう。しかし、時が経てば分かるだろう。