音声生成プラットフォームElevenLabsが1900万ドルを調達、検出ツールをリリース

音声生成プラットフォームElevenLabsが1900万ドルを調達、検出ツールをリリース

AIを活用した合成音声作成プラットフォームとして話題のElevenLabsが、新たな資金調達ラウンドを実施した。

本日、このスタートアップは、起業家のナット・フリードマン氏とダニエル・グロス氏、そしてアンドリーセン・ホロウィッツ氏が共同リードした1,900万ドルのシリーズA資金調達ラウンドを完了したことを発表しました。他の参加者には、Creator Ventures、SV Angel、Instagram共同創業者のマイク・クリーガー氏、Oculus共同創業者のブレンダン・アイリブ氏、DeepmindおよびInflection AI共同創業者のムスタファ・スレイマン氏、そしてO'Reilly Media創業者のティム・オライリー氏など、大手企業が含まれています。

事情に詳しい情報筋がTechCrunchに語ったところによると、このトランシェによりElevenLabsのポストマネー評価額は9,900万ドルになるという。このスタートアップが設立されてからわずか1年ちょっとであることを考えると、これは立派な数字だ。

「今回の投資は、ElevenLabの最先端の音声AI研究拠点の構築を継続し、出版、ゲーム、エンターテインメント、会話型アプリケーションなどの特定の市場分野をサポートするさまざまな追加製品を発売するために使用されます」と共同創業者兼CEOのマティ・スタニシェフスキー氏はメールでTechCrunchに語った。

ここ数ヶ月、良い意味でも悪い意味でも話題をさらってきたElevenLabsは、かつてパランティアで働いていたスタニシェフスキー氏と、幼なじみで元Google社員のピオトル・ダブコウスキー氏によって設立されました。母国ポーランドで育った二人は、アメリカ映画の平凡な吹き替えに刺激を受け、AIを活用しつつ、より優れたプラットフォームの設計に着手しました。

ElevenLabsは、合成音声、クローン音声、あるいは様々な性別、年齢、民族の人々の音声を模倣した全く新しい「人工」音声を用いて、テキストを音声に変換することができます。同社のAIテキスト読み上げモデルは言語に依存しないため、企業顧客はモデルを微調整し、独自の音声モデルを構築することができます。

シリーズAの資金調達に合わせて、ElevenLabs(現在15名の従業員)は、長編音声コンテンツの編集・作成ワークフロー「Projects」をリリースします。Projectsを使用すると、ユーザーはプラットフォームを離れることなく、会話セグメントやオーディオブックを作成できます。

テッククランチイベント

サンフランシスコ | 2025年10月27日~29日

「企業間パートナーにとって、当社の技術は、スケーラブルで多言語対応のオーディオブック作成、ビデオゲームのキャラクターの音声化、デジタル記事の音声化、視覚障害者のオンラインコンテンツへのアクセス支援、AIラジオの強化などの分野で活用できます」とスタニシェフスキ氏は述べた。

1月下旬にベータ版としてローンチしたElevenLabsは、生成される音声の極めて高い品質、高速な生成時間、そして充実した無料枠のおかげで、急速に人気を博しました。しかし、前述の通り、評判は必ずしも好意的なものばかりではありませんでした。特に、悪意のある人物がプラットフォームを悪用し始めてからは、その傾向が顕著になりました。

イレブンラボ
ElevenLabsは、AIを活用してリアルな音声を複製(またはゼロから生成)するツールを提供しています。画像クレジット: ElevenLabs

陰謀論的なコンテンツで知られる悪名高い掲示板「4chan」は、ElevenLabsのツールを使って、女優エマ・ワトソンなどの有名人を模倣した憎悪的なメッセージを拡散しました。また、The Vergeのジェームズ・ヴィンセントはElevenLabsを利用して、わずか数秒で標的の声を複製し、暴力の脅迫から人種差別やトランスフォビアの表現まで、あらゆる音声サンプルを生成しました。

これに対し、ElevenLabsは、音声複製を有料アカウントに限定し、利用規約に繰り返し違反するユーザーを追放し、新たなAI検出ツールを提供するなど、一連の新たな安全策を導入すると述べた。

この検出ツールは本日リリースされます。「AI音声分類器」と呼ばれるこのツールは、一部のパートナーにAPIとして提供され、アップロードされた音声サンプルにElevenLabsのAI生成コンテンツが含まれているかどうかを検出するように設計されています。

「生成AIプラットフォームが安全に利用できるようにすることは、テキスト、画像、音声プラットフォームを含むAI生成セクター全体にとって重要な課題です」とスタニシェフスキ氏は述べた。「生成メディア環境の性質について人々に理解を深めてもらい、そのようなコンテンツが存在することを認識してもらう必要があります。透明性を確保するため、AI生成コンテンツを検知するためのツールの構築に尽力しています。」

自主的な検出ツールは、たとえ宣伝通りに機能したとしても、必ずしも悪質な行為を抑止できるわけではない。しかし、ElevenLabsがまだ触れていないもう一つの問題がある。それは、同社の技術が声優たちに及ぼす実存的な脅威だ。

マザーボードは、クライアントがAIを活用して合成音声を生成し、最終的には声優の代わりとなる可能性もあるため、声の権利を放棄するよう求められるケースが増えていると報じている。しかも、その際には追加の報酬も発生しない。一方、ニューヨーク・タイムズが入手した社内メールによると、世界最大級のゲームパブリッシャーであるアクティビジョン・ブリザードは、AIを活用した「音声クローン」ツールの開発に取り組んでいるという。

ElevenLabsはこれを自然な流れと捉えているようで、Storytelのような出版社や、TheSoul Publishing、MNTNのようなメディアプラットフォームとオーディオブック、ビデオゲーム、ラジオコンテンツ分野での提携を積極的に推進している(StorytelとTheSoul Publishingは戦略的投資家である)。同社は、クリエイティブ、エンターテイメント、出版の分野に100万人以上の登録ユーザーがおり、10年分のオーディオコンテンツを制作してきたと主張している。

ElevenLabsは、PapercupやDeepdubなどのスタートアップの後を追って、最終的にはAIモデルを音声吹き替えにまで拡張し、「感情やイントネーションをある言語から別の言語に転送できる基盤」を構築する計画だ。

「これにより、あらゆる動画を魅力的で効果的、かつスケーラブルな方法であらゆる言語に吹き替えることができ、しかも元の話し手の声はそのままに、そのままの形で再現できるようになります」とElevenLabsはプレスリリースで述べています。「(私たちは)業界パートナーと共同で、大規模なAI吹き替えを実現するためのテストを既に複数実施しています。」

2100万ドル(うち200万ドルは1月のプレシードラウンドによるもの)の資金を保有するElevenLabsは、結果を気にせず、急成長中のジェネレーティブ・ボイス分野におけるライバル企業を打ち負かすことに全力を注いでいる。ライバル企業には、Amazon、Google、Microsoftといった既存企業に加え、Murf、Tavus、Resemble AI、Respeecher、PlayHT、Lovoといったスタートアップ企業も含まれる。