OpenAIが、同社の非常に強力なAIテキスト画像変換システムであるDALL-E 2で作成された画像を顧客に商用利用させてから、わずか数週間しか経っていません。しかし、現状の技術的な制限やボリュームライセンス、そしてAPIの欠如にもかかわらず、一部の先駆者たちは既に様々なビジネスユースケースに向けてこのシステムをテストしており、DALL-E 2が実稼働環境に導入できるほど安定する日を待ち望んでいます。
アパレルのパーソナライズにレコメンデーションアルゴリズムを活用するオンラインサービス「Stitch Fix」は、DALL-E 2を用いて、色、素材、スタイルといった特定の特性に基づいて商品を視覚化する実験を行っていると発表しました。例えば、パイロットプログラム中にStitch Fixの顧客が「ハイライズ、赤、ストレッチ、スキニージーンズ」をリクエストすると、DALL-E 2がその商品の画像を生成し、スタイリストはStitch Fixの在庫にある類似商品とマッチングさせることができます。
「DALL-E 2は、製品の最も有益な特性を視覚的に明らかにするのに役立ち、最終的にはスタイリストがクライアントの書面によるフィードバックで要求されたものに一致する完璧なアイテムを見つけるのに役立ちます」と広報担当者はTechCrunchにメールで語った。

もちろん、DALL-E 2には癖があり、初期の企業ユーザーを躊躇させるものもあります。eコマーススタートアップKlaviyoのデータサイエンス担当副社長、エリック・シルバースタイン氏は、ブログ記事で、このシステムをマーケティングツールとして活用した際の複雑な印象を述べています。
シルバースタイン氏は、DALL-E 2によって生成された人体モデルの表情は不適切になりがちで、筋肉や関節のバランスが崩れていること、そしてシステムが指示を常に完璧に理解しているわけではないことを指摘する。シルバースタイン氏がDALL-E 2に、灰色の背景に木製のテーブルの上のろうそくの画像を作成するように指示したところ、DALL-E 2はろうそくの蓋を消して机に溶け込ませたり、ろうそくの周りに不自然な縁を追加したりすることがあった。

「人物が写っている写真や、人物が商品をモデルにしている写真には、そのままでは使えません」とシルバースタイン氏は記している。それでも、編集の出発点を示したり、グラフィックアーティストにアイデアを伝えたりする用途には、DALL-E 2の使用を検討すると述べた。「人物が写っていないストックフォトや、具体的なブランディングガイドラインのないイラストの場合、専門家ではない私の目には、DALL-E 2は今すぐにでも『従来の方法』に取って代わることができるように思えます」とシルバースタイン氏は続けた。
コスモポリタンの編集者たちは、デジタルアーティストのカレン・X・チェン氏と協力し、DALL-E 2を使用して雑誌の表紙を制作した際にも、同様の結論に達しました。最終的な表紙が完成するまでには、チェン氏からの非常に具体的な提案が必要でしたが、これはアートジェネレーターとしてのDALL-E 2の限界を示すものだと編集者たちは語っています。
テッククランチイベント
サンフランシスコ | 2025年10月27日~29日
しかし、AIの奇妙な動作は、バグではなく機能として機能を果たすこともあります。ハインツは「Draw Ketchup」キャンペーンで、DALL-E 2に「ケチャップ」「ケチャップアート」「ファジーケチャップ」「宇宙のケチャップ」「ケチャップルネッサンス」といった自然言語を使ったケチャップボトルの画像を生成させました。同社はファンに独自のヒントを募集し、ハインツはそれらを編集してソーシャルメディアで共有しました。

「AI画像がニュースやソーシャルフィードを席巻する中、ハインツといえばケチャップという言葉が同義語であるという洞察に基づき、当社の「ケチャップを描く」キャンペーンを拡大する自然な機会を見出し、この理論をAIの分野でテストしました」とハインツのシニアブランドマネージャー、ジャクリーン・チャオ氏はプレスリリースで述べた。
DALL-E 2を活用したキャンペーンは、AIをテーマとすれば効果を発揮することは明らかです。しかし、DALL-E 2のビジネスユーザーの中には、AIの制約を如実に表さないアセットを生成するためにこのシステムを活用したという人もいます。
ソフトウェアエンジニアのジェイコブ・マーティン氏は、DALL-E 2を使って、自身が開発中のオープンソースプロジェクト「OctoSQL」のロゴを作成しました。Fiverrのロゴデザインサービスとほぼ同じ30ドルほどで、マーティン氏は肉眼では人間に見えるタコの漫画風イラストを完成させました。
「最終結果は理想的ではありませんが、とても満足しています」とマーティン氏はブログに書いています。「DALL-E 2に関しては、今のところほとんどの部分と用途においてまだ『最初の反復』段階にあると考えています。主な例外は鉛筆スケッチです。これは驚くほど優れています…真のブレークスルーは、DALL-E 2が10倍から100倍安価になり、高速になったときに起こると思います。」

DALL-E 2のユーザーの一人、開発スタートアップ企業Deeprenのデザイン責任者であるドン・マッケンジー氏は、このアイデアをさらに一歩進めました。彼は、画像付きの投稿は画像なしの投稿よりもはるかに多くのエンゲージメントを獲得するというアイデアに基づき、このシステムを同社のブログのサムネイル生成に適用するテストを行いました。
「エンジニアが中心の小さなチームなので、ブログ記事ごとにカスタムアートワークを依頼する時間も予算もありません」とマッケンジー氏はブログ記事に記している。「これまでの私たちのアプローチは、ストックフォトサイトから関連性は薄いものの、結局は場違いな画像を10分かけてスクロールし、まずまずのものをダウンロードして、フロントマターに貼り付けて公開するというものでした。」
マッケンジー氏は、週末を費やし45ドルのクレジットを費やした結果、約100件のブログ記事をDALL-E 2で生成された画像に置き換えることができたと語っています。最良の結果を得るにはプロンプトを微調整する必要がありましたが、その努力は十分に報われたとマッケンジー氏は語っています。
「満足のいくものになるまで、ブログ記事1つにつき平均2分ほど、4~5回ほどの提案が必要でした」と彼は書いている。「ストック画像に毎月多くのお金と時間を費やしていたのに、結果はもっと悪かったのです。」
ブレインストーミングのプロンプトに時間をかけられない企業のために、DALL-E 2のアセット生成機能を商用化しようとしているスタートアップが既に存在します。DALL-E 2をベースに構築されたUnstock.aiは、「オンデマンドで高品質な画像とイラスト」を約束しており、現時点では無料で提供しています。ユーザーはプロンプト(例:「ボウルに入った3匹の金魚を上から見た図」)を入力し、好みのスタイル(ベクターアート、フォトリアリスティック、鉛筆画)を選択することで画像を作成できます。画像は切り抜きやサイズ変更が可能です。
Unstock.aiは、本質的にプロンプトエンジニアリングを自動化します。これは、タスクの説明をテキストに埋め込むAIの概念です。AIシステムに詳細な指示を与えることで、要求されたタスクを確実に達成できるようにするという考え方です。一般的に、「コーヒーを飲みながら職場へ歩いている女性の静止画、望遠」のようなプロンプトに対する結果は、「女性が歩いている」という結果よりもはるかに一貫性があります。
これは、今後の応用例の前兆となる可能性が高い。コメントを求めたOpenAIは、DALL-E 2のビジネスユーザー数に関する数字の開示を拒んだ。しかし、情報筋によると、需要は確かにあるようだ。DALL-E 2のAPI不足に対する非公式な回避策がウェブ上に次々と登場し、このシステムをアプリ、サービス、ウェブサイト、さらにはビデオゲームに組み込みたいと願う開発者たちによってまとめられている。