タンパク質プログラマーはクレイドルの生成AIの助けを借りる

タンパク質プログラマーはクレイドルの生成AIの助けを借りる

タンパク質は自然界で仕事を遂行する分子であり、様々な用途に合わせてタンパク質を改変・製造する産業が台頭しています。しかし、これは時間がかかり、場当たり的です。クレイドルは、科学者にタンパク質に期待通りの働きをさせる新しい構造と配列を教えてくれるAI搭載ツールで、この状況を変えようとしています。同社は本日、多額のシードラウンドを調達し、ステルス状態から脱しました。

AIとタンパク質は最近話題になっていますが、これは主にDeepMindやBaker Labといった研究機関の取り組みによるものです。彼らの機械学習モデルは、簡単に収集できるRNA配列データを取り込んで、タンパク質の構造を予測します。これはかつては数週間かかり、高価な特殊装置を必要としていた作業です。

しかし、その能力は一部の分野では驚異的なものですが、他の分野では単なる出発点に過ぎません。タンパク質をより安定させたり、特定の分子と結合させたりするためには、タンパク質の全体的な形状や大きさを理解するだけでは不十分です。

「タンパク質エンジニアとして、タンパク質に特定の特性や機能を設計したい場合、見た目を知っているだけでは役に立ちません。橋の写真を見ても、それが崩れるかどうかは分からないようなものです」と、クレイドルのCEO兼共同創業者であるステフ・ファン・グリーケン氏は説明した。

「Alphafoldは配列を受け取り、そのタンパク質がどのように見えるかを予測します」と彼は続けた。「私たちは、その生成的な兄弟分です。エンジニアリングしたい特性を選択すると、モデルが実験室でテストできる配列を生成します。」

タンパク質、特に科学的に新しいタンパク質が、その場でどのような行動をとるかを予測することは、様々な理由から困難な作業です。しかし、機械学習の文脈において最大の問題は、利用可能なデータが不十分であることです。そこでクレイドルは、ウェットラボで独自のデータセットの多くを作成し、次々とタンパク質をテストし、配列のどのような変化がどのような効果につながるかを調べました。

興味深いことに、このモデル自体はバイオテクノロジーに特化したものではなく、GPT-3のようなテキスト生成エンジンを生み出した「大規模言語モデル」の派生です。ヴァン・グリーケン氏は、これらのモデルはデータの理解と予測において言語に厳密に限定されていないと指摘しました。これは研究者が現在も探求している興味深い「一般化」特性です。

テッククランチイベント

サンフランシスコ | 2025年10月27日~29日

Cradle UI の動作例。画像クレジット: Cradle

クレイドルが取り込み、予測するタンパク質配列は、もちろん私たちが知っている言語ではありませんが、意味が関連付けられた比較的単純な線形テキスト配列です。「まるでエイリアンのプログラミング言語のようです」とヴァン・グリーケン氏は言います。

もちろん、タンパク質エンジニアは無力ではありませんが、彼らの仕事には必然的に多くの推測が伴います。改変する100個の配列の中に、望ましい効果を生み出す組み合わせがほぼ確実にあると確信できるかもしれませんが、それ以上は徹底的なテストにかかっています。ここでちょっとしたヒントがあれば、作業は大幅にスピードアップし、膨大な無駄な労力を省くことができるでしょう。

このモデルは3つの基本的なレイヤーで動作すると彼は説明した。まず、与えられた配列が「自然」かどうか、つまり意味のあるアミノ酸配列なのか、それとも単なるランダムな配列なのかを評価する。これは、言語モデルが99%の信頼度で、ある文が英語(またはファン・グリーケンの例ではスウェーデン語)で、単語の順序が正しいと断言できるのと似ている。このモデルは、実験室での分析によって決定された数百万ものそのような配列を「読み取る」ことで、このことを認識している。

Charm Therapeuticsは複雑なタンパク質相互作用にAIを適用し、5000万ドルの資金調達ラウンドを確定

次に、タンパク質の異質言語における実際の意味、あるいは潜在的な意味を調べます。「ある配列を与えて、この配列が分解される温度を想像してみてください」と彼は言います。「多くの配列に対してこれを行えば、『これは自然に見えます』だけでなく、『これは摂氏26度に見えます』と言えるようになります。これにより、モデルはタンパク質のどの領域に焦点を当てるべきかを判断するのに役立ちます。」

モデルは、組み込むべきシーケンスを提案します。これは基本的には知識に基づいた推測ですが、ゼロから始めるよりも強力な出発点となります。エンジニアや研究室は、それらのシーケンスを試し、そのデータをCradleプラットフォームに持ち帰り、再び取り込んで状況に合わせてモデルを微調整することができます。

クレイドル本社で過ごす天気の良い日(中央がヴァン・グリーケン氏)。画像提供:クレイドル

様々な目的のためにタンパク質を改変することは、医薬品設計からバイオ製造まで、バイオテクノロジーのあらゆる分野で有用です。しかし、バニラ分子からカスタマイズされた、効果的かつ効率的な分子へと至るまでの道のりは、長く費用がかかる場合があります。この道のりを短縮する方法は、少なくとも、良い結果を得るために何百もの実験をしなければならない研究室の技術者にとっては歓迎されるでしょう。

Cradle はこれまでステルスで運営されていたが、Index Ventures と Kindred Capital が共同でリードし、エンジェル投資家の John Zimmer、Feike Sijbesma、Emily Leproust が参加したシードラウンドで 550 万ドルを調達し、現在注目を集めている。

ヴァン・グリーケン氏は、この資金によってチームはデータ収集を拡大することができ(機械学習に関しては、多ければ多いほど良い)、製品を「よりセルフサービス」なものにするための取り組みができると述べた。

「私たちの目標は、バイオベースの製品を市場に出すコストと時間を桁違いに削減することです」とヴァン・グリーケン氏はプレスリリースで述べた。「そうすれば、誰でも、たとえ『ガレージにいる2人の子供』でも、バイオベースの製品を市場に出すことができるようになります。」

Generate Biomedicines、タンパク質ベースの医薬品に焦点を当ててシリーズBで3億7000万ドルを調達

デヴィン・コールドウェイはシアトルを拠点とする作家兼写真家です。

彼の個人ウェブサイトは coldewey.cc です。

バイオを見る