
OctoMLは2019年のサービス開始当初、機械学習(ML)モデルの最適化に注力していました。それ以来、同社はMLモデルの導入を容易にする機能を追加し、1億3,200万ドルを調達しました。本日、同社はサービスの最新版をリリースします。これは完全な方向転換ではありませんが、モデルの最適化から、企業が既存のオープンソースモデルを活用し、自社データで微調整したり、独自のカスタムモデルをホスティングしたりできるように支援することに重点を移しています。
OctoAI と呼ばれる新しい OctoML プラットフォームは、AI 向けの自己最適化コンピューティング サービスであり、特に生成 AI に重点を置いており、企業が基盤となるインフラストラクチャを気にすることなく ML ベースのアプリケーションを構築し、本番環境に導入するのに役立ちます。
「以前のプラットフォームはMLエンジニアに特化しており、モデルを最適化してコンテナにパッケージ化し、さまざまなハードウェアにデプロイできるようにしていました」と、OctoMLの共同創業者兼CEOであるLuis Ceze氏は説明します。「私たちはそこから多くのことを学びましたが、次の自然な進化は、それらすべてのMLインフラストラクチャを抽象化する、フルマネージドのコンピューティングサービスを提供することになるでしょう。」

OctoAIでは、ユーザーが何を優先したいか(レイテンシーとコスト)を決めるだけで、OctoAIが最適なハードウェアを自動的に選択します。また、このサービスはこれらのモデルを自動的に最適化し(さらなるコスト削減とパフォーマンス向上につながる)、Nvidia GPUで実行するかAWSのInferentiaマシンで実行するかを決定します。これにより、多くのMLプロジェクトで依然として障壁となっている、モデルを本番環境に導入する際の複雑さが大幅に軽減されます。もちろん、モデルの実行方法を完全に制御したいユーザーは、独自のパラメータを設定し、実行するハードウェアを選択することもできます。しかしCeze氏は、ほとんどのユーザーはOctoAIにこれらすべてを任せるだろうと考えています。

OctoMLは、Dolly 2、Whisper、FILM、FLAN-UL2、Stable Diffusionといった人気の基礎モデルの高速化バージョンを標準で提供しており、今後さらに多くのモデルが追加される予定です。OctoMLは、Stable Diffusionの実行速度をバニラモデルと比較して3倍に向上させ、コストを5分の1に削減することに成功しました。
OctoML は、モデルの最適化のためだけにサービスを利用したい既存の顧客とは引き続き協力しますが、今後の同社の焦点はこの新しいコンピューティング プラットフォームに置かれることになります。
OctoMLが機械学習アクセラレーションプラットフォーム向けに8500万ドルを調達
テッククランチイベント
サンフランシスコ | 2025年10月27日~29日
トピック
フレデリックは2012年から2025年までTechCrunchに在籍していました。また、SiliconFilterを設立し、ReadWriteWeb(現ReadWrite)にも寄稿しています。フレデリックは、エンタープライズ、クラウド、開発者ツール、Google、Microsoft、ガジェット、交通機関など、興味のあるあらゆる分野をカバーしています。
バイオを見る