画像に透かしを入れることは、数え切れないほど多くの分野で価値のある手法ですが、昨今では単に隅にロゴを追加するよりも難しくなっています。Steg.AIは、ディープラーニングを用いて、クリエイターがほぼ目に見えない透かしを埋め込むことを可能にし、従来の「サイズを変更して再保存する」という対策を回避します。
デジタル資産の所有権はここ数年、複雑な状況にあります。NFTやAIの台頭により、以前は比較的低調だった分野が揺さぶられています。メディアの出所を本当に証明する必要がある場合、そのデータを画像や音声にエンコードする方法はこれまでもありましたが、PNGをJPEGとして保存するといった些細な変更で簡単に破られてしまう傾向があります。より堅牢な透かしは、画像上にはっきりと見えるパターンやコードのように、目に見えるか聞こえるかで識別される傾向があります。
簡単に適用でき、検出も容易で、変換や再エンコードに対して堅牢な目に見えない透かしは、多くのクリエイターにとってメリットとなるでしょう。意図的か偶発的かを問わず、知的財産の盗難はオンライン上で蔓延しており、「これは私が作ったものだと証明できます」、あるいは「AIが作ったものだと証明できます」と言える能力はますます重要になっています。
Steg.AIは、2019年のCVPR論文や、SBIRフェーズIおよびIIの政府助成金の獲得からもわかるように、長年にわたりこの問題に対するディープラーニングアプローチに取り組んできました。共同創設者(兼共著者)のEric Wengrowski氏とKristin Dana氏は、それ以前から長年学術研究に携わっており、Dana氏はWengrowski氏の博士課程の指導教官でした。
ウェングロウスキー氏は、2019年以降多くの進歩を遂げてきたものの、この論文は彼らのアプローチの一般的な形を示しているだけだと指摘した。
「生成AI企業が画像を作成し、Stegがそれをエンドユーザーに配信する前に透かしを入れることを想像してみてください」と彼はTechCrunchへのメールで述べています。「エンドユーザーはAIが生成した画像をソーシャルメディアに投稿するかもしれません。展開された画像のコピーには、たとえ画像がサイズ変更、圧縮、スクリーンショット、あるいは従来のメタデータの削除などが施されたとしても、Steg.AIの透かしが残ります。Steg.AIの透かしは非常に堅牢であるため、電子ディスプレイやiPhoneのカメラを使った印刷物からスキャンすることも可能です。」
当然ながら、彼らはプロセスの正確な詳細を明らかにしようとはしませんでしたが、大まかには次のような仕組みです。メディアに不自然に重ねる静的な透かしの代わりに、同社は画像に合わせて透かしをカスタマイズする2つの機械学習モデルをマッチングさせています。エンコードアルゴリズムは、人間には認識されないものの、デコードアルゴリズムは容易に見つけ出せるように、画像を変更するのに最適な箇所を特定します。同じプロセスを使用しているため、どこを見ればよいかが分かっているのです。
テッククランチイベント
サンフランシスコ | 2025年10月27日~29日
同社はこれを、目に見えず、ほぼ変更不可能なQRコードのようなものだと説明しましたが、実際にメディアにどれだけのデータを埋め込めるかは明らかにしませんでした。もし本当にQRコードのようなものだとすれば、1キロバイトか3キロバイト程度でしょう。それほど多くないように思えますが、URL、ハッシュ、その他のプレーンテキストデータを埋め込むには十分な容量です。複数ページの文書や動画のフレームにはそれぞれ固有のコードが付与されている可能性があり、その場合はこの容量はさらに増えるでしょう。ただし、これはあくまで私の推測に過ぎません。
Steg.AIは、透かし入りの画像を複数提供してくれました。そのうちのいくつかは、ここに埋め込まれています。また、透かしを入れる前の画像も提供されました(ただし、共有はしないようお願いしました)。よく見ると、いくつかの異常が目立ちましたが、もし私がそれらの見分け方を知らなかったら、おそらく見逃していたか、普通のJPEGのアーティファクトとして片付けていたでしょう。

次は、北斎の最も有名な作品の1つです。

このようなさりげないマークが、ストックフォトプロバイダー、Instagramに画像を投稿するクリエイター、映画のプレリリース版を配布する映画スタジオ、機密文書にマークを付けたい企業などにとってどれほど役立つかは想像に難くありません。そして、これらはすべてSteg.AIが検討しているユースケースです。
最初から大成功だったわけではありません。初期段階で潜在顧客と話し合った結果、「当初の製品アイデアの多くが良くなかったことに気づきました」とウェングロウスキー氏は振り返ります。しかし、彼らのアプローチの重要な差別化要因である堅牢性が間違いなく価値あるものであることに気づき、それ以来、家電ブランドなど「消費者が漏洩情報に強い関心を持つ企業」の間で支持を得ています。
「当社の製品に深い価値を見出してくださるお客様の声に、本当に驚いています」と彼は書いている。彼らのアプローチは、例えばデジタルアセット管理プラットフォームなどとのエンタープライズレベルのSaaS統合を提供することで、送信前に透かしを入れる必要がなくなり、すべてのメディアは通常の取り扱いプロセスの一環としてマークされ、追跡される。

画像の出所を遡って追跡し、その過程で行われた変更も検出できるようになるかもしれません。あるいは、アプリやAPIが、画像が改ざんされていないという信頼性を提供することも可能でしょう。これは、多くの編集写真マネージャーにとって喜ばしいことでしょう。
こうした技術は業界標準となる可能性を秘めています。業界がそれを望んでいるからという理由だけでなく、将来的に必要になる可能性もあるからです。AI企業は最近、AIコンテンツへの透かし入れに関する研究を進めることに合意しました。このような技術は、生成されたメディアをより深く検出する手法が検討されるまでの一時的な対策として役立つでしょう。
Steg.AI はこれまで NSF 助成金とエンジェル投資総額 120 万ドルで事業を展開してきましたが、Paladin Capital Group が主導し、Washington Square Angels、NYU Innovation Venture Fund、エンジェル投資家の Alexander Lavin、Eli Adler、Brian Early、Chen-Ping Yu が参加した 500 万ドルのシードラウンドを発表したばかりです。
大手AI企業がホワイトハウスを訪問し、「自主的な」安全対策を約束