AI搭載メディア編集アプリ「Descript」がOpenAIから新たな資金を獲得

AI搭載メディア編集アプリ「Descript」がOpenAIから新たな資金を獲得

2017年にグルーポンの元CEOアンドリュー・メイソン氏によって設立された音声・動画編集プラットフォーム「Descript」は、OpenAI Startup Fundが主導するシリーズCラウンドで5,000万ドルを調達しました。このラウンドを通じて、OpenAIとマイクロソフトを含むパートナー企業は、アーリーステージの企業に投資しています。Descriptは、AIメモアプリ「Mem」に続き、同ファンドから資金注入を受けた2番目のスタートアップ企業です。メイソン氏は、これはOpenAIがDescriptのAI活用機能の将来性に自信を持っていることを反映していると述べています。

「Descriptを設立したのは、シンプルで直感的、そしてフル機能を備えた動画・音声編集ツール、つまりAI時代を見据えた編集ツールを開発するというアイデアからです」とメイソン氏はTechCrunchのメールインタビューで語った。「私たちは今、AIによってコンテンツ制作の方法が世代交代を迎えようとしています。これには、クリエイターがDescriptで既に使用しているようなツールや、生成AIのような新しい技術も含まれます。私たちのような企業にとっての課題は、こうした技術をいかに使いやすく、アクセスしやすいものにするかということです。」

メイソン氏は、資金調達後のDescriptの評価額を明らかにしなかったが、アンドリーセン・ホロウィッツ、レッドポイント・ベンチャーズ、スパーク・キャピタル、そして元Yコンビネーターのパートナーであるダニエル・グロスも参加した 今回の資金調達により、同社の調達総額は1億ドルに達したと述べた。The Informationの10月の報道によると、OpenAIはDescriptの評価額を約5億5000万ドルとする資金調達を主導することに合意しており、これは2021年1月時点の同社の評価額(2億6000万ドル)の2倍以上となる。

「私たちは、強力なAIを基盤とする企業が世界に与える影響を加速させるためにOpenAIスタートアップファンドを設立しました。特に、人々の創造性を高めるツールに期待しています」と、OpenAIスタートアップファンドを管理するOpenAIのCOO、ブラッド・ライトキャップ氏はプレスリリースで述べています。「Descriptの活用や顧客との対話から、Descriptが動画編集機能を全く新しいレベルのクリエイターに拡張することで、アイデアと創作の間の障壁を打ち破っていることは明らかです。」

Descriptは、2018年にボーズ社が買収したメイソン氏の音声ガイド事業Detourのスピンオフとして作られた。プロレベルの編集ツールに馴染みのないポッドキャスターやビデオグラファー向けのこのプラットフォームでは、ユーザーは音声や動画の文字起こしを即座に作成でき、その後ドラッグアンドドロップツールを使って切り取って音楽や写真などのコンテンツと組み合わせることができる。

新たな資金調達と同時に、Descriptは本日、AIを活用した編集機能を含む多数の機能と、メイソン氏の言葉を借りれば「ドキュメントやスライドの編集と同じくらい簡単に」ビデオ編集を行えるようにする再設計を発表しました。少し大げさすぎるかもしれませんが、これらの新機能は、これまで困難だったコンテンツ制作のプロセスを確かに効率化します。

例えば、Descriptは現在、背景削除機能を提供しており、ユーザーは動画を好きな設定にすることができます。また、書き込みモードでは、ユーザーはDescript内でスクリプトを編集し、プラットフォームのOverdub音声複製技術を利用してナレーションを作成できます。

テッククランチイベント

サンフランシスコ | 2025年10月27日~29日

説明
Descriptの再設計された編集インターフェースが本日公開され、テンプレートや動画の背景削除などの機能が追加されました。画像クレジット: Descript

Descriptの最新リリース「Descript Storyboard」のその他のハイライトには、マルチトラック画面録画機能(レコーダーはエディターに統合され、画面とカメラのトラックを個別に記録可能)と、ストックサウンドエフェクト、動画、画像、音楽トラックへの無料アクセスが含まれます。また、Descriptでは新しい動画トランジションとアニメーション、レイアウト、タイトルシーケンス、ソーシャルクリップなどの様々なテンプレートに加え、カスタムプロジェクトテンプレートの作成機能も提供されます。

メイソン氏によると、今回の再設計では、コア機能はそのままに、Descriptのトランスクリプトベースのエディタを補完・拡張することが目標だったという。「Scenes」と呼ばれる新しい機能では、ユーザーは書き込みモードで作成したスクリプトをシーンに分割し、デッキ内のスライドと同じようにビジュアルを配置できる。Scenesはオーバーダブによるナレーションをスクリプトと整合させ、例えばスクラッチクリップと最終録音を入れ替える際に、トラックのずれを心配する必要がなくなる。

「動画は、ドキュメントやスライドと同じくらい、あらゆるコミュニケーションツールキットに欠かせない存在であるべきだと私たちは考えています。それを阻んでいるのはツールだけであり、私たちはそれを変えたいと思っています」とメイソン氏は述べた。「私たちの最大の競合相手は、動画編集をしない人々、つまりツールが複雑すぎて時間がかかりすぎるという理由で動画制作をしていない人々だと考えています。」

オーディオビジュアルコンテンツ編集分野で競合しているのはDescriptだけではありません。Adobeのような既存企業に加え、AI、自然言語処理、その他の技術を駆使して編集可能なトランスクリプトを自動作成するReduct.Videoのようなスタートアップ企業も存在します。

サンフランシスコに拠点を置き、約100人の従業員を擁するDescriptは、2019年にAI企業Lyrebirdを買収し、Overdub機能を強化するなど、積極的な事業拡大を続けています。当初はオーディオ編集に特化していましたが、2年前には初のビデオ編集機能をリリースし、200億ドル以上の市場規模を持つと推定されるデジタルビデオ市場への参入を目指しています。

この戦略は今のところDescriptにとって功を奏しているようだ。2021年時点で、同社の顧客にはNPR、VICE、ワシントン・ポスト、ニューヨーク・タイムズなどが含まれる。メイソン氏は収益に関する質問には答えなかったが、Descriptの顧客基盤はここ数カ月で「主要な大学や非営利団体」、さらには公共部門の組織にまで拡大しているという。

「パンデミックは私たちの創作活動やコラボレーションのあり方を大きく変えました。自宅に閉じこもった多くの人々が動画への関心を高め、クリエイター経済を探求し始めました」とメイソン氏は述べた。「企業は非同期コミュニケーションに動画をより多く活用し始めました。同じ頃、個人クリエイターはメディア間の境界線を意識するのをやめ、YouTuberはポッドキャストを始め、ポッドキャスターはTikTokに殺到するようになりました。新たな資金調達に加え、先ほど述べたようなことがますます活発化していることから、私たちはどんな逆風にも耐えられる絶好の立場にあると言えるでしょう。」