Googleが音楽制作のためのGenAIツールをリリース

Googleが音楽制作のためのGenAIツールをリリース

GenAIツールが音楽業界を驚くべき(そして場合によっては倫理的に問題のある)方法で変革し始める中、Googleは新しい曲や歌詞を作成するためのAI技術への投資を強化している。

Googleは本日、昨年リリースされた音楽生成ツール「MusicLM」のアップグレード版となる「MusicFX」を発表しました。MusicFXは、最大70秒の楽曲やループ音楽の作成が可能で、Googleが「より高品質」かつ「より高速」な音楽生成を実現すると謳っています。

MusicFXは、GoogleのAI Test Kitchenで利用可能です。このアプリでは、Googleの研究所で開発された実験的なAI搭載システムを試すことができます。MusicFXは12月に一部ユーザー向けにリリースされましたが、現在は一般公開されています。

Google ミュージックFX
画像クレジット: Google

そしてそれはひどいことではないと言わざるを得ません。

MusicFXは、前身と同様に、ユーザーがテキストプロンプト(「フラメンコ風のナイロン弦ギター2本」)を入力して、作成したい曲の説明を入力することで楽曲を作成できます。このツールはデフォルトで30秒のバージョンを2つ生成しますが、オプションでトラックを延長(50秒または70秒)したり、先頭と末尾を自動的につなぎ合わせてループさせたりすることもできます。

新しく追加されたのは、プロンプトに代替の説明語の候補が表示される機能です。例えば、「カントリースタイル」と入力すると、「ロカビリースタイル」や「ブルーグラススタイル」といったジャンルのドロップダウンが表示されることがあります。「キャッチー」という単語を入力すると、「チル」や「メロディック」といったジャンルのドロップダウンが表示されることがあります。

Google ミュージックFX
画像クレジット: Google

プロンプトのフィールドの下に、MusicFX は、追加する関連する説明、楽器、テンポ (例:「アバンギャルド」、「速い」、「エキサイティング」、「808 ドラム」) に関する追加の推奨事項のワード クラウドを提供します。

テッククランチイベント

サンフランシスコ | 2025年10月27日~29日

では、音はどうでしょうか? うーん、ちょっと試してみた限りでは、MusicFXのサンプルは…まあまあといったところでしょうか。正直に言うと、音楽生成ツールは、筆者には出力の違いを判別するのが難しいレベルに達しつつあります。現状の最先端技術は、驚くほどクリーンで鮮明なサウンドのトラックを生成しますが、その一方で、退屈で、刺激がなく、メロディー的にも焦点が定まっていないトラックになりがちです。

もしかしたらSAD(悲しみ)のせいかもしれないけど、私が選んだテーマの一つは「夏の屋上のような雰囲気で、ダンスにピッタリで気分が高揚するファンキーなビートのハウスミュージック」だった。MusicFXは期待通りの曲を選曲してくれたし、曲も悪くはなかった。でも、最近聴いたDJセットの中で一番良かった曲には遠く及ばない。

自分で聞いてみてください:

弦楽器を使ったものはどれも、まるで安っぽいMIDIサンプルのように、音質が悪くなってしまいます。これはMusicFXの学習データが限られていることが原因かもしれません。以下は、「弦楽器で演奏されたソウルフルなメロディー、オーケストラ、力強いメロディーの核」というプロンプトで生成された2つのトラックです。

気分を変えて、MusicFX による「月明かりの夜に歌う、メランコリックでスローテンポなギターの泣き歌」の解釈をご紹介します。(スペルミスはご容赦ください。)

Googleがアーティスト名や曲名をフィルタリングするのにどのようなマスターリストを使っているのかは分かりませんが、それほど難しくはなかったと思います。MusicFXはSZAやビートルズ風の曲を生成することは拒否しましたが、Lake Street Diveを参考にした曲は快く受け入れてくれました。もっとも、曲自体はそれほど素晴らしいものではありませんでしたが。

歌詞生成

GoogleはAI Test Kitchenで、MusicFXの補助機能として開発された新しい歌詞生成ツール「TextFX」をリリースしました。MusicFXと同様に、TextFXもこれまでは一部のユーザー向けに提供されていましたが、Googleによると、より幅広いユーザー層に提供され、「ユーザーエクスペリエンスとナビゲーション」の面でアップグレードされたとのことです。

GoogleのAI Test Kitchenアプリの説明によると、TextFXはラップアーティスト兼レコードプロデューサーのルーペ・フィアスコ氏とのコラボレーションによって開発されました。Googleのテキスト生成AIモデルの一つであるPaLM 2を搭載し、「フィアスコ氏がキャリアを通じて培ってきた作詞・作曲技術や言語技法からインスピレーションを得ています」。

Google TextFX
画像クレジット: Google

記者はTextFXがほぼ自動で歌詞を生成するツールだと期待していましたが、実際は全く違いました。TextFXは歌詞作成プロセスを支援するために設計されたモジュール群で、選択した文字で始まるカテゴリ内の単語を検索するモジュールや、無関係な2つのものの類似点を見つけるモジュールなどが含まれています。

Google TextFX
画像クレジット: Google

TextFXは使いこなすのに少し時間がかかります。でも、作詞家、そして率直に言って、作家全般にとって便利なリソースになると思います。

ただし、出力結果をよく確認した方がいいでしょう。GoogleはTextFXが「人物情報など、不正確な情報を表示する可能性がある」と警告しており、実際、私は「気候変動はアメリカ企業に打撃を与えるために中国政府が仕掛けた作り話だ」という提案を表示させてしまいました。ひどい話です。

Google TextFX
画像クレジット: Google

疑問は残る

MusicFXとTextFXによって、GoogleはGenAI音楽技術に多額の投資をしていることを示しています。しかし、GenAI音楽を取り巻く難題に取り組むよりも、競合他社に追いつくことばかりに気を取られていることが、最終的に良い結果をもたらすかどうかは疑問です。

Googleは、YouTube事業においてGenAI音楽ツールの導入に向けて慎重に検討を進めている。YouTubeでは、アレック・ベンジャミン、チャーリー・プース、チャーリー・エックスシーエックス、デミ・ロヴァート、ジョン・レジェンド、シーア、Tペインといったアーティストと提携し、DeepMindが開発したAIモデルをテストしている。これは、クリエイターの許可なくコンテンツを用いてトレーニングを行うことは「フェアユース」の原則に則っているStability AIなど、GoogleのGenAI競合企業とは一線を画すものだ。