Googleは、動画を別の言語に吹き替えると同時に、話者の唇の動きを実際に話していない言葉と同期させる強力な新翻訳サービスをテストしています。これは多くの点で非常に役立つ可能性がありますが、同社は悪用される可能性と、その防止策について率直に説明しました。
「ユニバーサル・トランスレーター」は、Google I/Oで、同社の新設部門「テクノロジーと社会」を率いるジェームズ・マニカ氏によるプレゼンテーションで披露されました。これは、AIの進歩によって最近になってようやく実現可能になったものの、同時に、当初から考慮しなければならない深刻なリスクをはらんでいる例として提示されました。
この「実験的」サービスは、入力ビデオ(この場合は元々英語で録画されたオンライン コースの講義)を受け取り、そのスピーチを書き起こし、翻訳し、その言語でスピーチ(スタイルとトーンを一致させて)を再生成し、その後、話者の唇が新しいオーディオにより近くなるようにビデオを編集します。
つまり、これは基本的にディープフェイクジェネレーターですよね?確かにそうですが、他の場所で悪意のある目的で使用されているこの技術には、真の有用性があります。実際、メディア業界では今まさにこのようなことを行っている企業が存在します。ポストプロダクションでセリフを吹き替える理由は様々ですが、どれもこれもです。(デモは素晴らしかったですが、この技術はまだ発展途上だと言わざるを得ません。)
しかし、これらのツールは厳格なメディアワークフローの中で提供されるプロフェッショナルツールであり、YouTubeのアップロードページにあるチェックボックスのようなものではありません。ユニバーサル翻訳ツールも今のところはそうではありませんが、もし将来的にそうなるのであれば、Googleはそれが偽情報の発信やその他の予期せぬ危険に利用される可能性を考慮に入れる必要があります。
マニカ氏はこれを「大胆さと安全性の間の緊張関係」と呼び、そのバランスを取るのは難しい場合がある。しかし、誰もが制限なく利用できるように広く公開することはできないのは明らかだ。しかし、例えばオンラインコースを字幕や再収録なしで20言語で提供できるなど、そのメリットは否定できない。
テッククランチイベント
サンフランシスコ | 2025年10月27日~29日
「これは学習理解にとって大きな前進であり、コース修了率にも有望な結果が出ています」とマニカ氏は述べた。「しかし、ここには本質的な懸念があります。同じ基盤技術の一部が、悪意のある人物によってディープフェイクの作成に悪用される可能性があるのです。そのため、私たちは悪用を防ぐためのガードレールを設けたサービスを構築し、承認されたパートナーのみが利用できるようにしています。近々、最新の生成モデルに透かし技術の新たなイノベーションを統合し、誤情報対策にも貢献する予定です。」
Google I/O 2023が終了しました。発表されたすべてのリストはこちらです。
確かにこれは第一歩ですが、悪質な行為者たちが、こうした障害を巧みに回避する能力に長けていることを私たちは目の当たりにしてきました。こうした「ガードレール」はやや曖昧で、パートナーとの共有は、モデルが漏洩しない限りは有効ですが、実際には漏洩してしまう傾向があります。もちろん、透かしを入れることも有効な手段ですが、これまでのところ、透かしを入れたメディアにトリミングやサイズ変更、その他の軽微な操作を加えるといった些細な編集によって、ほとんどのアプローチは失敗に終わっています。
Googleは本日、新しいものから馴染みのあるものまで、多くのAI機能を実演しましたが、それらが有用かつ安全であるかどうか、またどのように実現されるのかは、いまだに謎に包まれています。しかし、Manyika氏(自身も研究者)のような人物に、Google最大のイベントで「これは危険かもしれないので、あれこれやっています。うまくいくかどうかは誰にもわかりません」と発言する機会を与えることは、少なくとも問題への真摯なアプローチと言えるでしょう。
デヴィン・コールドウェイはシアトルを拠点とする作家兼写真家です。
彼の個人ウェブサイトは coldewey.cc です。
バイオを見る