ChatGPT SearchやPerplexityを使ったことがある方なら、ウェブ検索で引用文献をインラインで表示できることが、これらのAIチャットボットの性能を大幅に向上させることをご存知でしょう。タイムリーな情報が含まれている場合、検索結果はより良くなり、ウェブ検索によっていわゆる幻覚(生成AIが誤った情報を出力すること)が軽減される可能性があります。
そのため、フランスのスタートアップ企業Linkupは、開発者がプレミアムで信頼できるソースのウェブコンテンツにアクセスし、その結果を大規模言語モデル(LLM)に渡して回答を拡充できるAPIを構築しています。多くのAI開発者はこのワークフローを「検索拡張生成(Retrieval-Augmented Generation、RAG)」と呼んでいます。
さらに重要なのは、スクレイピングボットの将来が不透明であるということです。コンテンツパブリッシャーとウェブページをスクレイピングする主体との間に事前に金銭的な契約がない場合、これらのボットはオープンウェブからコンテンツを無償で盗用することになり、多くの人々がこの取引に不満を抱いています。そのため、AIトレーニングに関する規制当局の監視が強化されています。
ChatGPTの開発元であるOpenAIとニューヨーク・タイムズの間で係争中の訴訟など、注目を集める訴訟も進行中であるため、ウェブスクレイピングをめぐる状況は近い将来変化する可能性があります。そのため、OpenAIはAP通信、アクセル・シュプリンガー、コンデ・ナスト、エル・パイス、フィナンシャル・タイムズ、ル・モンドなどの大手出版社と複数年にわたるコンテンツライセンス契約を締結しています。
「OpenAIがニュースソースと契約を結び、トレーニングや推論の目的でOpenAIモデルとその製品からの回答を補強しようとしていた頃、私たちは会社を設立しました。『よし、ついに情報源に報酬を支払うAI企業ができた。これは素晴らしい』と思ったのです」と、Linkupの共同創業者兼CEOであるフィリップ・ミズラヒ氏はTechCrunchに語り、AI開発者とコンテンツプロバイダーを結びつけ、願わくば双方の利益のために事業を立ち上げた創業者の原動力を説明した。
しかし、OpenAIほどの規模とリーチを持たないAI活用のテクノロジー企業は数千社存在します。同時に、ウェブの優れた点は、コンテンツパブリッシャーのロングテールです。しかし、これは小規模なコンテンツパブリッシャーが訴訟を起こすための十分な資金を持っていないことを意味します。また、数百万のウェブサイトをスクレイピングモデルからライセンスモデルに移行することは困難です。
テッククランチイベント
サンフランシスコ | 2025年10月27日~29日
だからこそ、Linkupは単なる技術的なソリューションではありません。コンテンツパブリッシャーと、LLMの回答をWebコンテンツで補強したい企業を仲介するマーケットプレイスなのです。
Linkupはパブリッシャーとコンテンツライセンス契約を締結し、パブリッシャーのCMSと連携することで、スクレイピングなしでパブリッシャーからコンテンツを取得できます。Linkupは、コンテンツパートナーに対し、Linkupクライアントによるコンテンツへのアクセス頻度に基づいて報酬を支払います。

「私たちがターゲットとしているのは、自社製品にAIを実装しているアプリケーションです」とミズラヒ氏は述べた。「典型的なユースケースとしては、MistralやOpenAIのモデルを使ってAIアプリケーションを作成するというものです。独自のパイプラインを構築しますが、そのパイプラインを外部情報で強化する必要があります。」
ちなみに、ChatGPTはウェブを閲覧できますが、GPTモデルは閲覧できません。OpenAIは、非常に人気のあるアプリケーション(ChatGPT)と、開発者がAPI(GPT)で利用できるLLMの両方を提供しています。ただし、ウェブ検索はChatGPTの機能です。
「私が気に入っている事例があります。それは、あるお客様が営業担当者向けの社内アプリケーションを構築した事例です」とミズラヒ氏は語りました。「まず、自社製品のメリットをすべてリストアップしました。そして、私たちのソリューションのおかげで、見込み客に関する最新かつ質の高い情報を入手し、それをミストラルのLLMに入力できるようになりました。そして、ミストラルのLLMは営業担当者向けの一種のセールスプレゼンテーション資料を作成し、顧客リードに電話をかける際に目の前に提示することになります。」
Linkupは当初、企業情報やビジネス情報に重点を置くことを決定しました。ニュースサイトに加えて、このスタートアップはStatista、Xerfi、その他同様のリソースといった知識データベースも活用しています。
ライセンス契約を結びつつ、LLMにプレミアムコンテンツを提供しようと取り組んでいるスタートアップは、ScalePostだけではありません。最も目立つ競合は、Perplexityと提携して出版社とのライセンス契約を迅速化しているスタートアップ、ScalePostです。
Linkupは数ヶ月前、Axeleo Capital、Motier Ventures、Seedcamp、そして100人のエンジェル投資家から300万ユーロ(現在の為替レートで320万ドル)のシードラウンドを調達しました。現在、このスタートアップには約10人が勤務しており、今後1年間でさらに10人のスタッフを採用する予定です。
ロマン・ディレットは2025年4月までTechCrunchのシニアレポーターを務めていました。テクノロジーとテクノロジー系スタートアップに関する3,500本以上の記事を執筆し、ヨーロッパのテクノロジーシーンで影響力のある人物としての地位を確立しています。スタートアップ、AI、フィンテック、プライバシー、セキュリティ、ブロックチェーン、モバイル、ソーシャルメディア、メディアにおいて深い知識を持っています。TechCrunchで13年の経験を持つ彼は、シリコンバレーとテクノロジー業界を熱心に取材する同誌のお馴染みの顔です。彼のキャリアは21歳のときからTechCrunchでスタートしています。パリを拠点とする彼は、テクノロジー業界の多くの人々から、街で最も知識豊富なテクノロジージャーナリストとみなされています。ロマンは、誰よりも早く重要なスタートアップを見つけるのを好みます。Revolut、Alan、N26を取材した最初の人物でもあります。Apple、Microsoft、Snapによる大型買収に関するスクープ記事も執筆しています。執筆活動をしていない時は、開発者としても活動しており、テクノロジーの背後にある仕組みを理解しています。彼は過去50年間のコンピュータ業界に関する深い歴史的知識も有しています。イノベーションと社会構造への影響を結びつける方法を熟知しています。ロマンは、起業家精神を専門とするフランスの名門ビジネススクール、エムリヨン・ビジネススクールを卒業しています。テクノロジー分野で女性の教育とエンパワーメントを推進するStartHerや、テクノロジーで難民のエンパワーメントを支援するTechfugeesなど、複数の非営利団体を支援してきました。
バイオを見る