イタリアに拠点を置くMusixmatchは、Spotify、Apple Music、YouTube Music、Amazon Music、Tidalなどの主要な音楽ストリーミングプラットフォームに、コミュニティ主導の歌詞を提供することで知られています。同社は現在、AIによる書き起こしとコミュニティによる検証済みの編集を組み合わせた、ポッドキャスト向けの新しいプラットフォームを立ち上げています。
リスナー向けに数百万ものポッドキャスト番組やエピソードが提供されているにもかかわらず、Musixmatchはポッドキャスト検索が機能していないと主張しています。その結果、多くの優れたポッドキャストが潜在的なファンに届いていないと指摘しています。そこでMusixmatchは、歌詞を用いたAIモデルの学習経験とNLP(自然言語処理)の専門知識を活用し、ポッドキャストの書き起こし、検索、発見、共有の改善に取り組んでいます。
Musixmatchのポッドキャストプラットフォームは、様々なトピックやチャートで人気のポッドキャストエピソードの一部を毎日自動で書き起こししています。NLPベースモデルアーキテクチャ「Umberto」を用いて、場所、人物、トピックなどのキーワードにWikipedia ID(Wikipediaのトピックにリンクされた英数字のID)をタグ付けしています。(例えば、このリンクはTechCrunchに関連するWikipedia IDを示しています。)
このアプローチにより、どの言語でこれらのトピックを検索しても正確な結果が得られるとのこと。
このスタートアップはTechCrunchに対し、これらのIDに基づいてTopicRankと呼ばれるトピックグラフを作成し、エピソード内での言及数やプレゼンターのトピックに関する専門知識などの要素に基づいてポッドキャストをランク付けすることで、ユーザーが関連トピックを探しているときにポッドキャストの検索結果を強化すると説明した。

「この分類のおかげで、ユーザーは特定のキーワードで検索するだけで、検索クエリに一致するトランスクリプトされたポッドキャストを、関連性の高い順に見つけることができるようになりました。当社の検索インデックスは、標準的なRSSメタデータや事前定義されたジャンルやカテゴリーに依存する他の聴取サービスよりもはるかに詳細で奥深い検索結果を提供します」と同社は主張している。
Musixmatchのポッドキャストプラットフォームでユーザーが検索すると、検索したフレーズが言及されているトランスクリプトのスニペットが表示されます。結果をクリックすると、そのフレーズが言及されているスニペットのタイムスタンプから直接ポッドキャストが再生されます。これは、何かを調べている間に数分間の音声を聞きたいときに非常に便利です。
テッククランチイベント
サンフランシスコ | 2025年10月27日~29日
Musixmatchは長年、歌詞の正確な編集をコミュニティに頼ってきましたが、今回、ポッドキャストでも同様のことをユーザーに求めています。同社の新しいポッドキャストポータルには、「Podcast Studio」というツールも搭載されており、編集者やポッドキャスト制作者はAIが生成した書き起こしを修正できます。特に人物やブランド名、文化的な言及などを編集する際に便利です。
特定のエピソードにトランスクリプトがない場合、オーナーまたはコミュニティメンバーはPodcast Studioを使ってトランスクリプトを作成できます。Musixmatchによると、AIがエピソードのトランスクリプトを生成するのには約5分かかります。また、常連リスナーはトランスクリプト作成の対象となるエピソードに投票することで、コミュニティがそれらのエピソードを優先的に処理できるようにすることもできます。

Musixmatch のプラットフォームでは、AI が生成した文字起こしには「Speaker 1」や「Speaker 2」などのタグが付けられ、コミュニティ編集されたエピソードには「検証済み」ラベルとともに話者の名前のラベルが付けられることに注意することが重要です。

同社はまた、ポッドキャストのテキストスニペットと共有可能なリンクをカードに表示することで、共有を容易にしています。さらに、ポッドキャストの音声とスクロールするテキストスニペットを含む、共有可能な短い動画「オーディオグラム」機能の開発にも取り組んでいます。

Musixmatchは、こうしたデータをすべて自社で保有するつもりはありません。ポッドキャストの所有者が、ウェブフィードやアプリにトランスクリプトをエクスポートできるようにしています。また、これらのテキストはSEO対策済みであるため、リスナーが検索しやすくなると主張しています。
Musixmatchのパートナー企業で同社のツールを文字起こしに利用しているものには、FT Talentの「The Talent Show」、Red Bullの「Beyond the Ordinary」と「Why I Run」、Chora Mediaの全作品などがあるという。
Musixmatchのポッドキャストプラットフォームはリスナー向けの機能を提供していますが、単なるポッドキャストプレイヤーを目指しているわけではありません。このスタートアップは、競合は音声分析分野の企業であり、文字起こしサービスを提供するアプリ(Podcastleなど)も含まれると主張しています。
「音声分析(AI、セマンティックなど)は、近い将来、様々なユースケースにおいて必須になると考えています。AIを活用したコンテンツ分析技術、熱心なコミュニティ、そして既にサードパーティコンテンツを配信しているDSP(デジタルストリーミングプラットフォーム)における役割により、ポッドキャスト向けにこのサービスを提供できる当社は独自の立場にあります」と、同社の最高製品責任者であるマルコ・パグリア氏はTechCrunchへのメールで述べた。
同氏は、同社の目標の一つは、歌詞分野でのサービスと同様に、他のサービスでも認定された文字起こしプロバイダーになることだと付け加えた。
IvanはTechCrunchで世界の消費者向けテクノロジーの動向をカバーしています。インドを拠点とし、以前はHuffington PostやThe Next Webなどの出版物で勤務していました。
Ivan からの連絡を確認したり連絡を受けたりする場合は、[email protected]にメールを送信するか、Signal の ivan.42 に暗号化されたメッセージを送信してください。
バイオを見る