音声クローンには多額のお金が動いています。
一例として、合成音声を作成および編集するための AI 搭載ツールを開発しているスタートアップ企業 ElevenLabs は本日、Andreessen Horowitz 氏、GitHub 元 CEO の Nat Friedman 氏、起業家の Daniel Gross 氏を含む著名な投資家が共同で主導した 8,000 万ドルのシリーズ B 資金調達ラウンドを完了したことを発表しました。
セコイア・キャピタル、スマッシュ・キャピタル、SVエンジェル、ブロードライト・キャピタル、クレド・ベンチャーズも参加したこのラウンドにより、ElevenLabsの調達総額は1億100万ドルとなり、企業価値は10億ドルを超えました(昨年6月の約1億ドルから増加)。CEOのマティ・スタニシェフスキー氏は、新たに調達した資金は製品開発、ElevenLabsのインフラとチームの拡大、AI研究、そして「AI技術の責任ある倫理的開発を確保するための安全対策の強化」に充てられると述べています。
「ElevenLabsが音声AIの研究と製品展開における世界的リーダーとしての地位を確固たるものにするために、新たな資金を調達しました」とスタニシェフスキー氏はTechCrunchとのメールインタビューで語った。
ElevenLabsは、元Googleの機械学習エンジニアであるピオトル・ダブコウスキー氏と、元Palantirの導入戦略担当者であるスタニシェフスキー氏によって2022年に共同設立され、約1年前にベータ版としてローンチされました。ポーランドで育ったスタニシェフスキー氏とダブコウスキー氏は、アメリカ映画の吹き替えの質の悪さに触発されて、音声複製ツールの開発に着想を得たと語っています。AIならもっとうまくできるはずだと考えたのです。
ElevenLabsは現在、ブラウザベースの音声生成アプリで最もよく知られています。このアプリは、イントネーション、感情、抑揚など、主要な音声特性を調整できるトグルボタンを備え、まるで本物のような音声を作成できます。無料版では、テキストを入力すると、複数のデフォルト音声から1つを選んで音声を録音できます。有料版では、音声サンプルをアップロードすることで、ElevenLabsの音声複製機能を使って新しいスタイルを作成できます。
ElevenLabs は、オーディオブックの作成や映画やテレビ番組の吹き替え、ゲームやマーケティング活動のためのキャラクターの音声生成を目的とした音声生成技術のバージョンへの投資を増やしている。
テッククランチイベント
サンフランシスコ | 2025年10月27日~29日
同社は昨年、「音声合成」ツールをリリースしました。このツールは、話者の声、韻律、イントネーションを維持しながら背景ノイズを自動的に除去し、映画やテレビ番組の場合は、音声を翻訳して元の素材と同期させます。今後数週間のロードマップには、トランスクリプトと翻訳を生成・編集するためのツールを備えた新しい吹き替えスタジオワークフローと、ElevenLabsの音声を使用してウェブページやテキストをナレーションするサブスクリプションベースのモバイルアプリが含まれています。
ElevenLabsの革新的な技術は、Paradox Interactive(ゲーム開発会社で、近年はCities: Skylines IIやStellarisなどを手掛けている)やワシントン・ポストといったスタートアップ企業をはじめ、出版、メディア、エンターテインメント企業を顧客として獲得しています。スタニシェフスキー氏によると、ElevenLabのユーザーは100年分以上の音声データを生み出しており、フォーチュン500企業の41%の従業員がElevenLabsのプラットフォームを利用しているとのことです。
しかし、宣伝は必ずしも好意的なものではなかった。
陰謀論的なコンテンツで知られる悪名高い掲示板「4chan」は、ElevenLabsのツールを使って、女優エマ・ワトソンなどの有名人を模倣したヘイトメッセージを拡散していました。The Vergeのジェームズ・ヴィンセント氏は、ElevenLabsを利用して悪意のあるクローン音声を数秒で作成し、暴力の脅迫から人種差別的、トランスフォビア的な発言まで、あらゆる内容のサンプルを生成しました。また、Viceの記者ジョセフ・コックス氏は、銀行の認証システムを欺くほど説得力のあるクローン音声の作成方法を解説しました。
これに対し、ElevenLabsは、悪用を禁止する利用規約を繰り返し違反するユーザーを排除しようと努め、プラットフォームで作成された音声を検出するツールを導入しました。スタニシェフスキー氏によると、ElevenLabsは今年、この検出ツールを改良し、他の音声生成AIモデルの音声も検出できるようにするとともに、匿名の「配信事業者」と提携してサードパーティプラットフォームでもツールを利用できるようにする予定です。

ElevenLabsは、声優たちからも批判を受けています。彼らは、ElevenLabsが彼らの同意なしに声のサンプルを使用していると主張しています。これらのサンプルは、彼らが支持していないコンテンツの宣伝や、誤情報や偽情報の拡散に利用される可能性があります。最近のViceの記事では、被害者たちがElevenLabsが嫌がらせキャンペーンに利用された経緯を詳しく述べています。例えば、ある声優の個人情報(自宅住所)をクローン音声で共有されたケースなどが挙げられます。
さらに、無視できない問題があります。それは、ElevenLabs のようなプラットフォームが声優業界に及ぼす実存的脅威です。
マザーボードは、声優がAIを使って合成音声を生成することで、最終的に声優の代替となる可能性がある声の権利を放棄するよう求められるケースが増えていると報じている。しかも、その際に相応の報酬が支払われない場合もある。懸念されるのは、音声合成の仕事、特に安価な初心者レベルの仕事が、最終的にはAI生成の音声に置き換えられ、声優が救済措置を得られなくなるのではないかという点だ。
一部のプラットフォームはバランスを取ろうとしている。今月初め、ElevenLabsの競合であるReplica Studiosは、メディアアーティスト組合(SAG-AFTRA)の組合員の声のデジタルレプリカを作成し、ライセンス供与する契約をSAG-AFTRAと締結した。両団体はプレスリリースで、この契約はパフォーマーの同意を得るための「公正」かつ「倫理的」な条件を確立し、新作におけるデジタル音声のダブル使用に関する条件交渉も可能にすると述べた。
しかし、SAG-AFTRA のメンバーを含む一部の声優はこれにも満足しなかった。
ElevenLabsのソリューションは、音声のためのマーケットプレイスです。現在アルファ版で、今後数週間でより広く利用可能になる予定のこのマーケットプレイスでは、ユーザーが音声を作成し、検証し、共有することができます。他のユーザーが音声を使用すると、元のクリエイターに報酬が支払われるとスタニシェフスキー氏は述べています。
「ユーザーは、自分の声の利用可能性と報酬条件を常にコントロールできます」と彼は付け加えた。「このマーケットプレイスは、AIの進歩と既存の業界慣行を調和させ、ElevenLabsのプラットフォームに多様な声をもたらすための一歩として設計されています。」
声優陣は、ElevenLabsが現金で報酬を支払っていないことに不満を抱くかもしれない。少なくとも現時点では。現状では、クリエイターはElevenLabsのプレミアムサービスへのクレジットを受け取ることになっている(皮肉だと感じる人もいるだろう)。
おそらく、この状況は将来変わるだろう。ElevenLabsは、現在最も資金力のある合成音声スタートアップ企業の一つであり、Papercup、Deepdub、Acapela、Respeecher、Voice.aiといった新興企業や、Amazon、Microsoft、Googleといった大手テック企業に対抗しようとしている。いずれにせよ、年末までに従業員数を40人から100人に増やす計画を持つElevenLabsは、急成長する合成音声市場に留まり、波を起こし続けるつもりだ。