Petalsは、テキスト生成AIを実行するための無料の分散ネットワークを構築しています。

Petalsは、テキスト生成AIを実行するための無料の分散ネットワークを構築しています。

スタートアップ企業Hugging Faceが支援するコミュニティプロジェクトBigScienceは、テキスト生成AIを広く利用できるようにすることを目指しており、Petalsと呼ばれるシステムを開発しています。Petalsは、インターネット上の人々のリソースを統合することで、ChatGPTのようなAIを実行できます。先月コードが公開されたPetalsでは、ボランティアがハードウェアパワーを寄付してテキスト生成ワークロードの一部を処理し、他のボランティアと協力してFolding@homeなどの分散コンピューティング環境と同様に、より大きなタスクを完了することができます。

「Petalsは、Hugging Face、Yandex Research、ワシントン大学の研究者による継続的な共同プロジェクトです」と、Petalsの主任開発者でありYandexの研究エンジニアでもあるアレクサンダー・ボルズノフ氏は、TechCrunchのメールインタビューで語った。「一般的に柔軟性が低いAPIとは異なり、Petalsは完全にオープンソースなので、研究者はAPIにはまだ実装されていない最新のテキスト生成やシステム適応手法を統合したり、システムの内部状態にアクセスしてその機能を研究したりすることができます。」

オープンソースだが無料ではない

ChatGPTのようなテキスト生成AIは、欠点はあるものの、非常に有用です。少なくとも、ソーシャルメディアで話題になっているデモを見る限りでは。ChatGPTとその類似製品は、人間のようなコード、テキスト、数式を大規模に生成することで、プログラマー、ライター、さらにはデータサイエンティストを悩ませる単調な作業の一部を自動化することを約束しています。

しかし、運用コストは高額です。ある推計によると、ChatGPTは開発元であるOpenAIに1日あたり10万ドルの費用を負担させており、1ヶ月あたりでは驚異的な300万ドルに上ります。

最先端のテキスト生成AIの運用コストの高さから、このAIは潤沢な資金を持つスタートアップ企業やAIラボに限定されてきました。AI21 Labs、Cohere、そして前述のOpenAIなど、より高性能なテキスト生成システム技術を提供する企業が、ベンチャーキャピタルから数億ドル規模の資金を調達しているのは、決して偶然ではありません。

しかし、Petalsは理論上は物事を民主化します。ボルズノフ氏の以前の研究、インターネットを介したAIシステムのトレーニングに焦点を当てた研究に着想を得たPetalsは、テキスト生成AIの運用コストを大幅に削減することを目指しています。

「Petalsは、機械学習モデルの真に協調的で継続的な改善を可能にするための第一歩です」と、Hugging Faceの教員研究員であるコリン・ラフェル氏はTechCrunchへのメールで述べた。「これは…主にスーパーコンピューターに限定されていた大規模モデルから、より広くアクセス可能なものへと移行しつつあることを示しています。」

テッククランチイベント

サンフランシスコ | 2025年10月27日~29日

ラフェル氏は、オープンソースのテキスト生成コミュニティで過去1年間に起こった、いわばゴールドラッシュに言及しました。ボランティアの努力と大手IT企業の研究所の寛大な支援のおかげで、かつては小規模な開発者には手の届かなかった最先端のテキスト生成AIが、突如として利用可能になり、トレーニング済みで、すぐに導入できる状態になったのです。

BigScienceは、OpenAIのGPT-3(ChatGPTの祖先)と多くの点で同等の言語モデルであるBloomを発表しました。一方、MetaはOPTと呼ばれる同等に強力なAIシステムをオープンソース化しました。一方、MicrosoftとNvidiaは提携し、史上最大級の言語システムの一つであるMT-NLGを公開しました。

しかし、これらのシステムはすべて、強力なハードウェアを必要とします。例えば、Bloomをローカルマシンで実行するには、数百ドルから数千ドルもするGPUが必要です。そこで登場するのがPetalsネットワークです。Borzunov氏によると、十分な容量が確保されれば、チャットボットやその他の「インタラクティブ」アプリ向けのAIシステムを実行・微調整できるほど強力になるとのことです。Petalsを使用するには、ユーザーはオープンソースライブラリをインストールし、Petalsネットワークへの接続手順が記載されたウェブサイトにアクセスします。接続後、Petals上で実行されるBloomからテキストを生成したり、Petalsサーバーを構築してネットワークにコンピューティングを提供したりできるようになります。

サーバーの数が多ければ多いほど、ネットワークはより堅牢になります。1台のサーバーがダウンした場合、Petalsは自動的に代替サーバーを探します。サーバーはリソースを節約するため、約1.5秒間操作がないと接続を切断しますが、Borzunov氏によると、Petalsはセッションを迅速に再開できるため、エンドユーザーにかかる遅延はごくわずかです。

花びらテスト
Petalsネットワーク上で稼働するBloomテキスト生成AIシステムのテスト。画像クレジット: Kyle Wiggers / TechCrunch

私のテストでは、Petalsを使ったテキスト生成には、基本的なプロンプト(例:「『cat』という単語をスペイン語に翻訳してください」)では数秒、より複雑なリクエスト(例:「宇宙の性質についてディドロ風のエッセイを書いてください」)では20秒以上かかりました。あるプロンプト(「人生の意味を説明してください」)には3分近くかかりましたが、公平を期すために、以前のいくつかのプロンプトよりも長い回答(約75語)を返すようにシステムに指示しました。

花びらテスト
画像クレジット:カイル・ウィガース / TechCrunch

ChatGPTよりも明らかに遅いですが、無料です。ChatGPTは現在無料ですが、将来も無料になるという保証はありません。

ボルズノフ氏は、Petalsネットワークの現在の規模については明らかにしなかったが、12月初旬のローンチ以来、「異なる容量のGPU」を持つ「複数の」ユーザーが参加していることを明らかにした。目標は、人々がコンピューティングを寄付するインセンティブとなる報酬システムを導入することだ。寄付者は「ブルームポイント」を受け取ることができ、それを「優先度の高いサービスやセキュリティ強化」に使用したり、他の報酬と交換したりできる可能性があるとボルズノフ氏は述べた。

分散コンピューティングの限界

Petalsは、OpenAIなどのベンダーが提供する有料のテキスト生成サービスに代わる、完全に無料ではないにせよ低コストの代替手段を提供することを約束している。しかし、大きな技術的問題点はまだ解決されていない。

最も懸念されるのはセキュリティ上の欠陥です。PetalsプロジェクトのGitHubページには、Petalsの仕組み上、サーバーが入力テキスト(プライベートなテキストも含む)を復元し、悪意のある方法で記録・改変する可能性があると記載されています。具体的には、名前や電話番号といった機密データをネットワーク内の他のユーザーと共有したり、生成されたコードを意図的に改ざんしたりする可能性があります。

Petalsは、有害で偏ったテキストを生成する傾向など、今日の主要なテキスト生成システムに内在する欠陥を一切解決していません(Hugging FaceのリポジトリにあるBloomのエントリの「Limitations(限界)」セクションを参照)。Yandex ResearchのシニアリサーチサイエンティストであるMax Ryabinin氏は、メールインタビューで、Petalsは少なくとも現時点では研究および学術的な用途を目的としていることを明確にしました。

「Petalsは中間データをパブリックネットワーク経由で送信するため、機密データには使用しないでください。他のピアが(理論上は)中間データからデータを復元できるためです」とリャビニン氏は述べています。「機密データにPetalsを利用したい方は、信頼できる組織や、このデータを処理する権限を持つ人々がホストするプライベートスウォームを独自に構築することをお勧めします。例えば、複数の小規模なスタートアップ企業や研究所が協力してプライベートスウォームを構築し、Petalsのメリットを享受しながらも、他者からデータを保護することができます。」

他の分散システムと同様に、Petalsもエンドユーザーによって悪用される可能性があります。悪意のあるユーザー、例えば有害なテキスト(ヘイトスピーチなど)を生成しようとする悪意のあるユーザーや、特にリソースを大量に消費するアプリを開発する開発者などが悪用する可能性があります。Raffel氏は、Petalsが当初は「いくつかの問題に直面する」ことは避けられないと認めています。しかし、テキスト生成システムの運用ハードルを下げるというPetalsの使命は、当初の困難を乗り越えるだけの価値があると確信しています。

「機械学習における多くのコミュニティによる最近の取り組みの成功を考えると、これらのツールの開発を継続することが重要だと考えています。また、Petalsが他の分散型ディープラーニングプロジェクトに刺激を与えることを期待しています」とラフェル氏は述べた。