注目のAIオーディオスタートアップElevenLabsが、シリーズCで33億ドルの評価額で1億8000万ドルの資金調達を確認

注目のAIオーディオスタートアップElevenLabsが、シリーズCで33億ドルの評価額で1億8000万ドルの資金調達を確認

AIオーディオ分野で活動する人気のスタートアップ企業の一つ、ElevenLabsは木曜日、シリーズCラウンドで1億8000万ドルを調達し、資金調達後の企業価値が33億ドルになったと発表した。a16zとICONIQ Growthが共同でこの投資を主導している。

この資金調達の噂はTechCrunchが最初に報じました。最終的な数字は、以前お伝えした内容の一部(ただし全てではない)を裏付けるものとなっています(具体的には、ラウンド全体の規模は当初の報道よりも小さく、評価額とリード投資家は以前と同じ)。

この資金は、ElevenLabs のオーディオ ツールの構築と事業開発の継続に使用されます。

幼なじみのピオトル・ダブコウスキー氏と共に同社を共同設立したCEO、マティ・スタニシェフスキー氏はインタビューで、同社はより表現力豊かで制御性の高い音声AIモデルの構築に研究の重点を置いていると述べた。スタニシェフスキー氏はさらに、同社は「オムニモデル」、つまりテキストベースのモデルと音声モデルを組み合わせたマルチモーダルインタラクションの開発にも注力していると付け加えた。

ElevenLabsは、数ヶ月前から投資家の関心を集めており、その背景には2つの重要な潮流があります。1つ目は、生成AIをめぐる大きな盛り上がりが、多くの企業を巻き込んでいることです。2つ目は、ElevenLabsが合成音声技術を提供する主要プレーヤーとして台頭していることです。メディアやゲームなどの業界の大手出版社やコンテンツ制作会社、そして数多くのテクノロジー系スタートアップ企業が、ElevenLabsの技術を自社の音声・オーディオ機能に活用しています。

当然のことながら、これは多くの著名人が参加する非常に混雑した資金調達ラウンドにつながりました。

このシリーズCの新規投資家には、NEA、World Innovation Lab(WiL)、Valor、Endeavor Catalyst Fund、アブダビの投資会社Lunateが含まれます。過去の投資家には、Sequoia Capital、Salesforce Ventures、Smash Capital、SV Angel、NFDG、BroadLight Capitalが含まれます。

テッククランチイベント

サンフランシスコ | 2025年10月27日~29日

これらに加え、ElevenLabsは新たな戦略的投資家を複数獲得しています。つまり、同社の技術を活用し、同社への投資も開始している企業です。これらの企業には、ドイツテレコム、LGテクノロジーベンチャーズ、HubSpotベンチャーズ、NTTドコモベンチャーズ、RingCentralベンチャーズなどが含まれます。

ICONIQのパートナーであるセス・ピエールポント氏は、既存の取締役であるa16zのジェニファー・リー氏および同社の共同創設者とともに、同社の取締役会に加わる予定だ。

ICONIQは、生成AIスタートアップへの取り組みを強化しています。同社は文章作成にも力を入れており、昨年11月にはWriterの2億ドルの資金調達ラウンドを共同リードしました。

「オーディオは非常に重要なモダリティだと常に感じており、この分野で非常に大きな企業が生まれるだろうと考えていました」と、ピエールポント氏はTechCrunchに語った。「ElevenLabsは設立当初から注目しており、その技術力の高さ、シェアと勢いの急速な高まり、そして創業者の専門知識の深さに感銘を受けました。」

ピエールポント氏は、取締役として同社と交わす会話の多くは、オーディオの新たな使用例の創出と、それに適した市場の発見に関するものになるだろうと付け加えた。

スタートアップ企業が成長ラウンドの締結に依然として苦労している中、ElevenLabsがわずか1年前にシリーズBラウンドで8,000万ドルを調達し、評価額が10億ドルに達したことは注目に値します。ElevenLabsはこれまでに総額2億8,100万ドルを調達しています。

製品ロードマップ

同社は、AI モデルの改善に重点を置くことに加え、直接およびパートナーシップを通じてより多くの消費者にリーチするという野心を持って、この資金を会話型 AI ビルダーの成長に活用する予定です。

共同創設者のピョートル・ダブコウスキー氏とマティ・スタニシェフスキー氏。画像クレジット:イレブンラボ

同社は昨年、AI会話エージェントプラットフォームを発表しましたが、その製品の主要部分は音声テキスト変換コンポーネントの開発でした。スタニシェフスキー氏は、同社がこの分野でさらなる改善を目指していると述べました。

「会話の中であなたが何を言っているのかをより深く理解したいと考えています。コンテンツ生成だけでなく、音声の理解と書き起こしにも取り組んでいます」とスタニシェフスキー氏は述べた。「音声テキスト変換は解決済みの問題だと多くの人が言いますが、多くの言語ではまだかなり不十分です。社内にデータに注釈を付け、迅速なフィードバックを提供するチームがあるため、より優れた音声検出モデルを構築できると考えています。」

同社はまた、電話などの従来の通信手段をサポートし、様々な知識源をより適切に統合することで、AIを活用した会話型エージェントの開発に注力したいと考えています。これが、今回の資金調達ラウンドで通信事業者と提携する理由の一つです。

また、顧客は自社のアーカイブにアクセスするためにもこのツールを活用しています。昨年、ElevenLabsはTIME誌と提携し、ユーザーがTIME誌の「パーソン・オブ・ザ・イヤー」について質問できる会話型ボットを導入しました。

スタニシェフスキー氏は、同社ではサイト上での会話型AIエージェントの増加を想定していると述べた。例えば、ニュースサイトでは、ユーザーはニュース記事について質問したり、ボットに記事の要約を依頼したりできるようになる。

CEOはまた、AI搭載の音声ボットの品質は向上しているものの、人間のさまざまな話し方や感情表現に反応しながら自然な音声を出すという問題はまだ解決されていないと指摘した。

「私があなたに話しかける方法は、あなたの反応や返答に影響を与えます。時には興奮し、時には冷静になり、時にはあなたの言葉を遮ります。あなたはそれに応じて私に反応するでしょう。現世代のAIソリューションは優れたものになりつつありますが、人間ほど優れているわけではありません」とスタニシェフスキー氏は述べた。

ICONIQのピエールポント氏はまた、ユーザーが話しているときにAIがユーザーをうまく理解できない場合、機械によるコミュニケーションは途絶え、ユーザーはすぐに興味を失ってしまうとも強調した。

ElevenLabsは、主にB2Bパートナーシップを通じてリーチ(そして収益源)を拡大してきました。しかし、直接的な事業展開も行っています。

2024年、このスタートアップは初の純粋に消費者向け製品となるElevenLabs Readerをリリースしました。これは、記事、テキスト、文書を読み上げるアプリです。その後、文書やウェブページからAI音声を生成してポッドキャストを作成する機能を追加しました。これは、GoogleのNotebookLMでできることと似ています。スタニシェフスキー氏は、より多くの消費者体験を提供したいと述べています。

実は、すでにそうしているのかもしれません。TechCrunchは、同社がElevenLabs Readerアプリ上で、ユーザーにプラットフォーム上でオーディオブックを公開するプログラムをテストしていることを報じました。同社はまた、将来的にはクリエイター向けに、複数の声でオーディオブックを読み上げられるツールを提供し、ローカライズの精度向上も図りたいと考えています。

スタニシェフスキー氏は、同社がユーザーや企業が自社アプリを含め、コンテンツをより効果的に配信できる方法を模索していると述べた。それが顧客との直接的な競合に発展するかどうかは、今後の注目点となるだろう(多くのB2Bテクノロジー企業がD2Cビジネスを避ける理由の一つはここにある)。注目すべきは、ElevenLabsがLightspeedの支援を受けるPocket FMやGoogleの支援を受けるKuku FMといったオーディオコンテンツプラットフォームの音声技術を支えていることである。

ElevenLabsは既に、Perplexity、Rabbit R1、Chess.com、ESPN、Lex Fridmanポッドキャスト、The Atlantic、Synthesiaなどの製品やプラットフォームでAI生成音声を提供しています。同社の目標は、より多くの場所に展開し、エンドツーエンドの会話スタックを所有することで、顧客により多くの体験と洞察を提供することです。

安全性

ElevenLabsの明るい兆しは、必ずしも曇り空ではなかった。同社の技術は、いくつかの注目すべき誤情報キャンペーンに関与していたことが示唆されている。脅威インテリジェンス企業Recorded Futureの最近の報告書によると、同社の製品がロシアのプロパガンダ活動に利用されていたことが明らかになった。昨年には、同社の音声プラットフォームを利用してジョー・バイデンの音声ディープフェイクが作成された事件が発生した。2023年には、Motherboardが4chanのメンバーがAI音声生成ツールを使ってジョー・ローガン、ベン・シャピロ、エマ・ワトソンに似た声を作り、問題のあるコンテンツを拡散したと報じた。

しかし、同社は迅速に対応してきました。現在、同社は「無許可、有害、または欺瞞的ななりすまし」を禁止するポリシーを策定しています。さらに、機械主導と人間によるモデレーションを組み合わせて、そのようなコンテンツを排除しています。しかし、同社がツール群を拡充し、消費者との直接的な接点が増えるにつれて、悪意のある行為者が悪用方法を探す機会が増えています。

「AIオーディオ分野の先駆者として、私たちは技術開発を進める中で適切な安全メカニズムを構築する責任を負っています。導入のスピードや商業的利益よりも安全性を優先する判断を頻繁に下すことになります」とスタニシェフスキー氏は述べた。

スタニシェフスキー氏はさらに、同社はメタデータを用いてコンテンツを追跡する標準規格であるC2PAに準拠しているものの、音声生成時に付与されるデジタル署名を用いて、ElevenLabsの技術によって生成された音声かどうかを誰でも確認できる公開ツールも提供していると付け加えた。これは、悪用手法がより巧妙化するにつれて、今後も進化し続ける追跡手段となる可能性がある。

TechCrunchではAIに特化したニュースレターを配信しています!毎週水曜日に受信ボックスに配信されますので、こちらからご登録ください。