Twitterは推奨アルゴリズムを含むソースコードの一部を公開した

Twitterは推奨アルゴリズムを含むソースコードの一部を公開した

Twitter CEO イーロン・マスク氏が繰り返し約束した通り、Twitter はユーザーのタイムラインでツイートを推奨するために使用するアルゴリズムを含むソースコードの一部を公開した。

TwitterはGitHubで、ソーシャルネットワークの仕組みを支える多くの部分のコードを含む2つのリポジトリを公開しました。これには、「おすすめ」タイムラインに表示されるツイートを制御するための仕組みも含まれています。Twitterはブログ投稿で、今回の変更は「透明性を高めるための第一歩」であると同時に、Twitter自身とプラットフォーム利用者への「リスクの防止」にもつながると述べました。

本日のTwitter Spacesセッションで、マスク氏は次のように明言した。

「いわゆるアルゴリズムの最初のリリースは非常に恥ずかしいものになるでしょうし、多くの間違いが見つかるでしょう。しかし、私たちはそれらを迅速に修正します」とマスク氏は述べた。「たとえ何かに同意できないとしても、少なくともそれがなぜそこにあるのか、そして密かに操作されていないことがわかるでしょう。…ここで私たちが目指しているのは、オープンソースのオペレーティングシステムであるLinuxの素晴らしい例です。…理論上は、Linuxの脆弱性を多数発見できます。実際には、コミュニティがそれらの脆弱性を特定し、修正するのです。」

リスク防止に関するブログ記事の2つ目のポイントについてですが、オープンソースリリースには、Twitterの広告推奨を実現するコードや、Twitterの推奨アルゴリズムの学習に使用されるデータは含まれていません。さらに、コードの検査方法や実際の使用方法に関する説明もほとんど含まれていないため、これらのリリースは開発者向けに限定されているという印象が強まっています。

Twitterは、「ユーザーの安全とプライバシーを侵害するコード、あるいは悪意のある行為者からプラットフォームを保護する能力を損なう可能性のあるコード、特に児童の性的搾取や操作に対抗する取り組みを損なう可能性のあるコードはすべて除外しました」と述べている。これは、コンテンツモデレーションをはじめとするユーザーセキュリティ関連業務を担当していた倫理AIおよびトラスト&セーフティ担当スタッフの多くを解雇してからわずか数週間後の発表であり、やや矛盾したメッセージと言える。しかし、同社は本日のコード公開によって「ユーザーの安全とプライバシーが確実に保護されるよう措置を講じた」と主張している。

ツイッター
Twitterのレコメンデーションパイプラインの仕組みを示す図。画像クレジット: Twitter

Twitterは、コミュニティからのコード提案を管理し、変更を社内リポジトリに同期するためのツールを開発中だと発表しています。おそらく将来的には利用可能になると思われますが、現時点ではそのような兆候は見られません。

テッククランチイベント

サンフランシスコ | 2025年10月27日~29日

「バグだけでなく、アルゴリズムの動作方法についても提案を求めていきます」とマスク氏はSpacesセッションで述べた。「これは進化のプロセスになるでしょう。ノンストップで向上していくとは期待していませんが…ユーザーエクスペリエンスを向上させるために、私たちは非常にオープンです。」

一見すると、このアルゴリズムはかなり複雑に見えますが、技術的な観点からは必ずしも驚くべきことではありません。複数のモデルで構成されており、「職場での使用に適さない」コンテンツや不適切なコンテンツを検出するモデル、Twitterユーザーが他のユーザーと交流する可能性を判断するモデル、Twitterユーザーの「評判」を計算するモデルなどが含まれています。(「評判」が具体的に何を指すのかは不明で、高レベルのドキュメントにも明確に記載されていません。)複数のニューラルネットワークがツイートのランク付けとフォローすべきアカウントの推奨を担当し、フィルタリングコンポーネントはツイートを非表示にします。専門用語を許してください。「法令遵守の支援、製品品質の向上、ユーザーの信頼の向上、ハードフィルタリング、目に見える製品処理、そして粗粒度のダウンランキングによる収益の保護」を目的としています。

あなたのためのTwitter
Twitterの「おすすめ」タイムライン。推奨アルゴリズムを搭載。 画像クレジット: Twitter

Twitter はエンジニアリング ブログの投稿で、1 日に約 50 億回実行されると主張する推奨パイプラインの詳細を明らかにしています。

Twitterは、「数億件のツイートの中から、最も優れた1,500件のツイートを抽出しようと努めています。現在、「おすすめ」タイムラインは平均して50%(フォローしていない人のツイート)と50%(フォローしている人のツイート)で構成されていますが、これはユーザーによって異なります」と説明しています。「ツイートのランキングは、約4,800万パラメータのニューラルネットワークによって実現されており、ツイートのインタラクションに基づいて継続的にトレーニングされ、肯定的なエンゲージメント(いいね、リツイート、返信など)が最適化されます。」

もちろん、Twitterユーザーが1,500件のツイートすべてを見るわけではありません。ツイートは、コンテンツ制限や、モデルが考慮するその他の基準や要素に基づいてフィルタリングされます。例えば、ツイートに「否定的なフィードバック」が含まれているかどうか、ツイートが主に同じTwitterユーザーからのものか、ブロックまたはミュートされているユーザーからのものかなどです。

Gizmodoは、TwitterがユーザーにプッシュするVIPリストが公開されていないようだと指摘しています。今週、Platformerは、TwitterがYouTuberのMr. BeastやDaily Wireの創設者ベン・シャピロなど、注目ユーザーのリストを定期的に更新しており、これらの「パワーユーザー」の露出度を意図的に高めることで、推奨アルゴリズムの変更を監視していると報じました。

アルゴリズムがツイートの扱いを情報源によって変える可能性があることを示す証拠がさらにあります。研究者のジェーン・マンチュン・ウォン氏は、Twitterのアルゴリズムはツイートの投稿者がイーロン・マスク氏であるかどうかを具体的にラベル付けするだけでなく、「パワーユーザー」であるかどうかや共和党支持者か民主党支持者かを示すラベルも備えていると指摘しました。

本日午後のSpacesセッションで、Twitterのエンジニアは、ラベルは指標としてのみ使用されていると述べた。しかし、マスク氏は今日までラベルの存在を知らなかったと述べ、ラベルは存在すべきではないと主張した。

Twitterのアルゴリズムはツイートの投稿者がイーロン・マスクであるかどうかを具体的にラベル付けする

「author_is_elon」

民主党、共和党、そして「パワーユーザー」のラベル以外にもhttps://t.co/fhpBjdfifX pic.twitter.com/orCPvfMTb9

— ジェーン・マンチュン・ウォン (@wongmjane) 2023 年 3 月 31 日

「人々を共和党と民主党に分けることは絶対にすべきではない。それは意味がない」とマスク氏は語った。

ソースコードの公開は、ここ数ヶ月、Twitterのレコメンデーションアルゴリズムの調整をめぐる数々の論争の後に行われた。Platformerによると、2月にマスク氏はTwitterのエンジニアに対し、自身のツイートがより広く見られるようアルゴリズムの再構成を依頼したという。(Twitterは後にこの変更を少なくともある程度撤回した。)11月には、Twitterはフォローしていないユーザーのツイートをより多く表示し始めた。これはマスク氏による買収前に試みられた措置だったが、ユーザーからの反発を受けて撤回された。