GoogleはImagenを含む新しい生成モデルをVertex AIに導入

GoogleはImagenを含む新しい生成モデルをVertex AIに導入

アンドリーセン・ホロウィッツの言葉を引用すると、生成型AI、特にテキストからアートを生成するAIが世界を席巻していると言えるでしょう。少なくとも、投資家たちはそう確信しています。プロンプトからテキストや画像を生成するAIを開発するスタートアップ企業に、投資家たちが数十億ドルもの資金を注ぎ込んでいるのを見れば、そのことがわかります。

大手テック企業は、後れを取るまいと、前述のスタートアップ企業との提携や社内研究開発を通じて、独自の生成AIアートソリューションに投資している。(参考:MicrosoftがOpenAIと提携しImage Creatorを開発)Googleは、強力な研究開発部門を活用し、後者の道を進むことを決定し、生成AI分野の成果を商業化することで、既存のプラットフォームに対抗しようとしている。

Googleは本日、年次開発者会議I/Oにおいて、同社のフルマネージドAIサービスであるVertex AIに搭載される新しいAIモデルを発表しました。その中には、テキストを画像に変換するモデル「Imagen」も含まれています。昨年11月にAI Test Kitchenアプリでプレビュー公開されたImagenは、画像の生成と編集に加え、既存の画像にキャプションを追加することも可能です。

「Google Cloudを使えば、どんな開発者でもこの技術を利用できます」と、Google CloudのVertex AIディレクター、ネンシャド・バルドリワラ氏はTechCrunchとの電話インタビューで語った。「データサイエンティストや開発者である必要はありません。」

頂点の画像

VertexでImagenを使い始めるのは、実に比較的簡単です。モデルのUIは、Googleが「Model Garden」と呼ぶものからアクセスできます。これは、Googleが開発したモデルと厳選されたオープンソースのモデルを組み合わせたものです。このUIでは、MidjourneyやNightCafeといったジェネレーティブアートプラットフォームと同様に、ユーザーがプロンプト(例えば「紫色のハンドバッグ」)を入力すると、Imagenが候補となる画像をいくつか生成します。

編集ツールとフォローアッププロンプトにより、Imagen で生成された画像をさらに洗練させることができます。例えば、画像に描かれているオブジェクトの色を調整できます。Vertex は、画像をシャープにするアップスケーリング機能に加え、ユーザーが特定のスタイルや好みに合わせて Imagen を調整できる微調整機能も提供しています。

先ほど触れたように、Imagenは画像にキャプションを生成し、オプションでGoogle翻訳を利用してキャプションを翻訳することもできます。Bardoliwalla氏によると、GDPRなどのプライバシー規制を遵守するため、生成された画像は保存されずに24時間以内に削除されるとのことです。

テッククランチイベント

サンフランシスコ | 2025年10月27日~29日

「私たちは、人々が生成AIと画像を使って作業を始めることを非常に簡単にしています」と彼は付け加えた。

Google I/O 2023 Vertex AI
Vertex AIで動作するGoogleのImagenモデル。画像クレジット: Google

人気のAIアートツールを開発するMidjourneyとStability AIという2社は、ウェブスクレイピングした画像を使ってツールを学習させたことで、数百万人のアーティストの権利を侵害したとして、訴訟の標的となっている。一方、ストック画像サプライヤーのGetty Imagesは、Stability AIが自社サイトから無断で数百万枚の画像を使用し、アート生成モデル「Stable Diffusion」の学習に使用したとして、別途訴訟を起こしている。

Google I/O 2023 Vertex AI
画像クレジット: Google

Googleはオプトアウトのオプションを提供していない(公平を期すために言えば、主要なライバルの一つであるOpenAIも同様だ)。バルドリワラ氏は、この状況が将来変わるかどうかについては言及しなかったが、Googleは「倫理的かつ責任ある」方法でモデルをトレーニングすることに「並々ならぬ関心」を抱いているとだけ述べた。

外部のAI倫理委員会を解散し、著名なAI倫理研究者を追放し、「競争と知識の社内維持」​​のためにAI研究の出版を抑制している企業からこのような発言が出るとは、少々無理があるように思います。しかし、バルドリワラ氏の言葉は、皆さんの解釈次第です。

また、バルドリワラ氏に、Imagenが生成する有害または偏向したコンテンツの量を制限するためにGoogleが何らかの対策を講じているかどうかについても尋ねました。これは生成AIシステムのもう一つの問題です。つい最近、AIスタートアップのHugging Faceとライプツィヒ大学の研究者が、Stable DiffusionやOpenAIのDALL-E 2といったモデルは、特に権威ある地位にある人物を描くように指示された場合、白人男性に見える人物画像を生成する傾向があることを実証するツールを公開しました。

バルドリワラ氏はこの質問に対してより詳細な回答を用意しており、Vertexがホストする生成モデルへのすべてのAPI呼び出しは、毒性、暴力、わいせつ性などの「安全属性」について評価されていると主張した。Vertexはこれらの属性に基づいてモデルを評価し、特定のカテゴリについては応答をブロックするか、顧客に処理方法を選択させるとバルドリワラ氏は述べた。 

「消費者向けプロパティから、お客様が生成型AIモデルに求めているコンテンツとは異なる種類のコンテンツがどのようなものか、私たちは非常に正確に把握しています」と彼は続けた。「これはGoogleにとって、多大な投資と市場リーダーシップが必要な分野です。お客様がブランド価値を損なうことなく、求めている結果を確実に生み出せるようにするためです。」

Googleは、Vertexのマネージドサービスとして、人間からのフィードバックによる強化学習(RLHF)を提供する。RLHFは、組織がモデルのパフォーマンスを長期にわたって維持し、より安全で、かつ測定可能な精度を備えたモデルを本番環境に導入するのに役立つとGoogleは主張している。機械学習で人気の高い手法であるRLHFは、契約社員にAIチャットボットの応答を評価するように依頼するなど、人間からのフィードバックから直接「報酬モデル」を学習する。そして、この報酬モデルを用いて、Imagenのような生成AIモデルを最適化する。

Google I/O 2023 Vertex AI
画像クレジット: Google

バルドリワラ氏は、RLHFでどの程度の微調整が必​​要かは、顧客が解決しようとしている問題の範囲によって決まると述べています。学界では、RLHFが常に正しいアプローチであるかどうかについて議論があります。例えば、AIスタートアップのAnthropicは、RLHFでは低賃金の契約社員を多数雇用し、極めて有害なコンテンツの評価を強いられる可能性があるため、正しいアプローチではないと主張しています。しかし、Googleは異なる見解を持っています。

「当社のRLHFサービスでは、お客様はモダリティとモデルを選択し、モデルから返される応答を評価できます」とバルドリワラ氏は述べた。「お客様が それらの応答を強化学習サービスに送信すると、サービスがモデルを調整し、組織が求めているものに沿った、より優れた応答を生成します。」

新しいモデルとツール

Google は本日、Imagen 以外にも、Codey と Chirp など、いくつかの生成 AI モデルが Vertex の一部顧客に提供されるようになったと発表した。

GitHubのCopilotに対するGoogleの回答であるCodeyは、Go、Java、JavaScript、Python、TypeScriptなど20以上の言語でコードを生成できます。Codeyは、プロンプトに入力されたコードの文脈に基づいて次の数行を提案したり、OpenAIのChatGPTのように、デバッグ、ドキュメント作成、高レベルのコーディング概念に関する質問に答えたりすることができます。

Google I/O 2023 Vertex AI
画像クレジット: Google

Chirp は、何百万時間もの音声でトレーニングされた音声モデルで、100 以上の言語をサポートし、ビデオの字幕作成、音声アシスタントの提供、さまざまな音声タスクやアプリの強化に使用できます。

I/Oでの関連発表で、GoogleはVertex向けのEmbeddings APIのプレビュー版をリリースしました。このAPIは、テキストや画像データを、特定の意味的関係をマッピングするベクトルと呼ばれる表現に変換できます。Googleによると、このAPIは、組織のデータ、感情分析、異常検出に基づいたQ&Aチャットボットなどのセマンティック検索やテキスト分類機能の構築に使用されるとのことです。

Googleによると、Codey、Imagen、画像用Embeddings API、RLHFはVertex AIで「信頼できるテスター」に利用可能となっている。一方、Chirp、Embeddings API、そしてAIモデルとのインタラクションとデプロイのためのスイートであるGenerative AI Studioは、Google Cloudアカウントを持つすべてのユーザーがVertexでプレビュー版として利用できる。

Google I/O 2023の詳細については、TechCrunchをご覧ください。