音声クローンプラットフォームResemble AIが800万ドルを調達

音声クローンプラットフォームResemble AIが800万ドルを調達

生成AIを使用してリアルな音声を複製するプラットフォームであるResemble AIは本日、Javelin Venture Partnersが主導し、Craft VenturesとUbiquity Venturesが参加したシリーズAラウンドで800万ドルを調達したことを発表した。

この調達により、このスタートアップは総額1200万ドルを調達し、Resembleのエンタープライズ向け製品の開発をさらに進め、年末までにチーム規模を倍増して40人以上に増やす予定だと共同創業者兼CEOのゾハイブ・アーメド氏は語る。

「Resembleの技術は、これまでは不可能だったコンテンツを作成するために、世界最大級のメディア企業によって使用されています」とアハメド氏はTechCrunchとの電子メールインタビューで語った。

Resembleは、ビデオゲームの音声がゲーム自体の頻繁なバージョンアップに追いついていないことに気づいたアハメド・ムハンマド氏とサキブ・ムハンマド氏によって2019年に設立されました。アハメド氏は、BlackBerryとHipmunkでの勤務を経て、Magic Leapでリードソフトウェアエンジニアとして勤務していました。

Resembleは小規模なスタートで、主にゲーム用途に特化していました。しかし、プラットフォームは成長を続け、音声を他の言語に「転送」したり、声優によるパーソナライズされたメッセージを生成したり、リアルタイムの会話エージェントを作成したりできるAI技術を提供するようになりました。

Resembleは、急成長を遂げている音声生成AI市場における一角に過ぎません。Papercup、Deepdub、ElevenLabs、Respeecher、Acapela、Voice.aiなどは、音声の複製や生成を行うAIツールを提供する注目すべきスタートアップベンダーであり、AWS、Azure、Google Cloudといった大手IT企業もその筆頭です。

しかし、これは議論の余地のある技術であり、それには十分な理由がある。

テッククランチイベント

サンフランシスコ | 2025年10月27日~29日

マザーボードは、クライアントが AI を活用して合成バージョンを生成し、最終的には声優に代わる可能性がある (場合によっては無償で) ように、声優が自分の声の権利を放棄するよう求められるケースが増えていると報じています。

AIに似ている
画像クレジット: Resemble AI

ディープフェイクは別の問題です。

悪意のある人物がAIを使って人の声を複製し、被害者を親戚や顧客と話しているように思わせています。そして、警鐘を鳴らしているのは犯罪の可能性だけではありません。2021年には、あるドキュメンタリー制作者が、アンソニー・ボーディン氏の死後、遺産管理団体の同意を得て、彼の声を複製するために企業を雇ったことで非難を浴びました。それから数年の間に、音声ディープフェイクはソーシャルメディアを席巻しましたが、そのほとんどは無害なものでしたが、時にはそうでないものもあります。

しかし、アハメド氏は、倫理の分野ではResembleが傑出していると主張する。

「音声を複製するにはユーザーの明示的な同意が必要であることに加え、悪意のある使用を防ぐために厳格な使用ガイドラインが施行されている」と彼は述べた。

そのため、Resembleはユーザーに、複製しようとしている音声の「同意クリップ」の録音の提供を求めています。クリップ内の音声が他のクリップと一致しない場合、ResembleはユーザーによるAI音声の作成をブロックします。

さらに、録音時の不正使用を防ぐため、Resembleはユーザーに特定の文章を自分の声で発音するよう強制します。ユーザーが台本から逸脱した場合、Resembleは録音を不正使用の可能性があるものとしてフラグ付けします。

「音声が作成されると、その音声に関するすべての権利はユーザーが所有します」とアハメド氏は述べた。「その音声データを他のモデルの学習に使用したり、サードパーティ企業に再販したりすることはありません。…カスタマイズされたソリューションについては、企業と厳格なプロセスを通じて協力し、複製する音声が企業にとって使用可能であり、声優から適切な同意を得ていることを確認しています。」

Resembleは、偽造音声と本物の音声を区別するように訓練されたAIモデルを用いて音声データの真正性を検証する製品「Resemble Detect」も開発しました。このモデルは、音声の編集や操作によって生じたアーティファクトが含まれる可能性のある周波数帯を「視覚化」し、クリップの「真正性」を0%から100%の信頼度で予測します。

Detectは、Resembleの音声透かし技術「PerTh Watermarker」を補完するものとして開発されました。PerTh WatermarkerはAIモデルを用いて、人間の耳には聞こえない識別情報を含んだ音声トーンを生成・挿入します。(PerTh Watermarkerはプラットフォーム依存の技術であることに留意してください。Resembleが独自に生成した音声のみをマーク・検出でき、他の商用またはオープンソースの音声生成AIツールとは互換性がありません。)

アハメド氏は、これらのツールがResembleの成功に大きく貢献していると考えている。同プラットフォームには100万人以上のユーザーがおり、過去12ヶ月間で35年分の音声が生成されたという。

「政府関係者にとってAI規制が最優先事項となっている中、Resembleは生成音声の責任ある利用に関する知見と提言を提供しています」とアハメド氏は述べた。「Resembleを活用することで、魅力的で高品質な音声コンテンツの作成がこれまで以上に容易になり、コンテンツ制作者は作品に全く新しいレベルのリアリティを加え、視聴者に新たな没入感を与えることができます。」

カイル・ウィガーズは2025年6月までTechCrunchのAIエディターを務めていました。VentureBeatやDigital Trendsに加え、Android Police、Android Authority、Droid-Life、XDA-Developersといった様々なガジェットブログにも記事を寄稿しています。音楽療法士のパートナーとマンハッタンに在住。

バイオを見る