2016年のアメリカ大統領選挙後、私はオンラインにおけるフェイクニュースの蔓延に対抗できる製品の開発に着手しました。当初の仮説はシンプルでした。虚偽または疑わしい主張を自動的にハイライトし、それに対応する最適な文脈上の事実を提案する、半自動のファクトチェックアルゴリズムを構築するというものでした。私たちの構想は明確で、ユートピア的かもしれないものの、その通りでした。テクノロジーによって人々が真実、事実、統計、データを求めて意思決定を行うよう促すことができれば、誇張ではなく理性と合理性に基づいたオンラインの議論を構築できる、というものでした。
5年間の努力を経て、Factmataはいくつかの成功を収めました。しかし、この分野が真に発展するためには、経済面から技術面まで、克服すべき障壁がまだ数多くあります。
主な課題
自動ファクトチェックは非常に難しい研究課題であることにすぐに気づきました。最初の課題は、チェック対象となる事実を正確に定義することでした。次に、与えられた主張の正確性を評価できるように、最新の事実データベースをどのように構築・維持するかを検討しました。例えば、広く利用されているWikidataナレッジベースは当然の選択肢でしたが、急速に変化する出来事に関する主張をチェックするには更新が遅すぎました。
また、営利目的のファクトチェック会社であることが障害となっていることも分かりました。ジャーナリズムやファクトチェックを行うネットワークのほとんどは非営利団体であり、ソーシャルメディアプラットフォームは偏見の非難を避けるため、非営利団体との連携を優先しています。
これらの要素に加え、「良い」ものを評価できるビジネスを構築することは、本質的に複雑で微妙な問題です。定義は果てしなく議論の的となります。例えば、「フェイクニュース」と呼ばれたものは往々にして極端な党派主義であり、「誤情報」とされたものは実際には反対意見であったことが判明します。
そのため、ビジネスの観点からは、「有害」(有害、わいせつ、脅迫的、または憎悪的)なものを検出する方がはるかに容易であると結論付けました。具体的には、「グレーゾーン」の有害テキスト、つまりプラットフォームが削除すべきかどうか判断できないものの、追加のコンテキストが必要なコンテンツを検出することにしました。これを実現するために、コメント、投稿、ニュース記事の有害性を、極度の党派性、物議性、客観性、憎悪度、その他15の指標に基づいてスコアリングするAPIを構築しました。
関連する企業問題に関してオンライン上で展開されるあらゆる主張を追跡することに価値があることに気づきました。そこで、APIに加え、ブランドの製品、政府の政策、COVID-19ワクチンなど、あらゆるトピックに関する噂や「物語」を追跡できるSaaSプラットフォームを構築しました。
テッククランチイベント
サンフランシスコ | 2025年10月27日~29日
複雑に聞こえるかもしれませんが、実際複雑です。私たちが学んだ最大の教訓の一つは、シード資金100万ドルがいかに少ない資金でこの分野に投入されるかということです。検証済みのヘイトスピーチや虚偽の主張に関するトレーニングデータは、通常のラベリング作業とは異なります。専門知識と綿密な検討が必要であり、どちらも安価ではありません。
実際、複数のブラウザ拡張機能、ウェブサイトのデモ、データラベル付けプラットフォーム、ソーシャルニュースコメントプラットフォーム、AI の出力のライブリアルタイムダッシュボードなど、必要なツールを構築することは、同時に複数の新しいスタートアップを立ち上げるようなものでした。
さらに複雑なことに、製品と市場の適合性を見出すのは非常に困難な道のりでした。長年の構築を経て、Factmataはブランドセーフティとブランドレピュテーションに注力するようになりました。私たちは、広告在庫の整理を目指すオンライン広告プラットフォーム、レピュテーション管理と最適化を求めるブランド、そしてコンテンツモデレーションを求める小規模プラットフォームに、当社の技術を販売しています。このビジネスモデルに到達するまでには長い時間がかかりましたが、昨年はついに毎月複数のお客様がトライアルや契約に申し込んでくださるようになり、2022年半ばまでに100万ドルの経常収益を達成する目標を掲げています。
何をすべきか
私たちの歩みは、メディア業界で社会的に影響力のあるビジネスを構築するには、多くの障壁が存在することを示しています。オンライン広告、検索エンジン、ニュースフィードの指標がバイラル性と集客力である限り、変化は容易ではありません。そして、小規模な企業は自力でそれを実現することは不可能であり、規制と財政の両方の支援が必要になります。
規制当局はより積極的に行動し、強力な法律を制定する必要があります。FacebookとTwitterは大きな進歩を遂げましたが、オンライン広告システムは大きく遅れており、新興プラットフォームには異なる方法で進化するインセンティブがありません。現状では、企業が違法ではない言論をプラットフォーム上で抑制するインセンティブは存在しません。評判の失墜やユーザー離脱の懸念だけでは不十分です。私のように言論の自由を最も熱心に支持する者でさえ、プラットフォームが真に行動を起こし、有害コンテンツの削減とエコシステムの健全性向上に資金を投入するために、金銭的なインセンティブと禁止措置を講じる必要があることを認識しています。
代替案はどのようなものになるでしょうか?質の悪いコンテンツは常に存在しますが、より良いコンテンツを促進するシステムを構築することは可能です。
アルゴリズムには欠陥があるとはいえ、大きな役割を担っています。オンラインコンテンツの「良さ」、つまり質を自動的に評価する可能性を秘めているからです。こうした「品質スコア」は、広告ベースではなく、社会に有益なコンテンツを宣伝(そして有料化)するための新たなソーシャルメディアプラットフォームを生み出す基盤となる可能性があります。
問題の規模の大きさを考えると、これらの新しいスコアリングアルゴリズムの構築には莫大なリソースが必要になるでしょう。最も革新的なスタートアップ企業でさえ、数千万ドル、場合によっては数億ドルの資金がなければ苦戦するでしょう。複数の企業や非営利団体が協力し、それぞれが異なるバージョンを提供し、人々のニュースフィードに埋め込むことができるようになるでしょう。
政府はいくつかの方法で支援することができます。まず、「品質」に関するルールを定めるべきです。この問題を解決しようとする企業が独自の方針を策定することを期待すべきではありません。
政府も資金提供を行うべきです。政府からの資金提供があれば、これらの企業は目標を薄めてしまうことを避けることができます。また、企業が自社の技術を公衆の監視下に置き、欠陥や偏見に関する透明性を高めることも促進されます。さらには、これらの技術を一般向けに無料で公開し、自由に利用できるようにすることで、最終的には公共の利益のために提供されるように促すことも可能でしょう。
最後に、新興技術を受け入れる必要があります。プラットフォームは、コンテンツモデレーションを効果的かつ持続的に行うために必要なディープラーニング技術への投資を積極的に進めており、前向きな進歩を遂げています。広告業界も、4年を経て、Factmata、Global Disinformation Index、NewsGuardといった新しいブランドセーフティアルゴリズムの導入を進めています。
当初は懐疑的でしたが、暗号通貨とトークンエコノミクスが、良質でファクトチェック済みのメディアの普及と流通を促進する新たな資金調達方法を提示する可能性については、楽観視しています。例えば、トークン化されたシステムの「専門家」に、主張のファクトチェックを促し、AIコンテンツモデレーションシステムのためのデータラベリングを効率的に拡張することで、企業がラベリングに多額の先行投資をする必要がなくなります。
ファクトマタに私が当初掲げたビジョン、つまり事実に基づく世界を支えるテクノロジー要素が実現するかどうかは分かりません。しかし、私たちが挑戦したことを誇りに思います。そして、私たちの経験が、誤情報や偽情報との闘いにおいて、より健全な方向性を示す上で、他の人々の役に立つことを願っています。