クラウドHPCがスタートアップのゲームを変える | TechCrunch

クラウドHPCがスタートアップのゲームを変える | TechCrunch
Oracle Cloud EngineeringのグローバルHPC担当シニアマネージャー、Anup Ojah氏とOracle for Startupsのグローバルコミュニケーションディレクター、Amy Sorrells氏による

近年、レガシー アプリケーションとグリーンフィールド アプリケーションの両方がパブリック クラウドに急速に移行しているにもかかわらず、世界で最も要求の厳しいワークロードの一部は頑固にプライベート データ センターに留まっています。

ハイパフォーマンス コンピューティング (HPC) がクラウドに抵抗してきたのには、十分な理由があります。それは、汎用ハードウェアを拡張するだけでは実現できないデータ処理能力が求められるからです。 

そのため、世界のHPCジョブの99%は依然としてオンプレミスで実行されており、重要なシミュレーションやバッチ計算を実行する科学者、エンジニア、製品開発者は、限られたコンピューティングパワーへのアクセスを待つという困難な状況に陥っています。そして、管理が難しいシステムの高コストは、多くのスタートアップ企業を新興テクノロジー分野におけるイノベーションの場から締め出しています。

すべてが変わりつつあります。クラウド アーキテクチャにおける最近の進歩により、この分野はついに民主化されつつあります。

Oracleは、次世代のOracle Cloud Infrastructure(OCI)でこの取り組みをリードしています。OCIは、数百、数千ものCPUコアやGPUコアを強力なスーパーコンピュータとして同時に動作させることを可能にする最先端技術を活用するために、ゼロから構築されました。

OCI のネットワーク、メモリ、ストレージ、ソフトウェアの進歩により、HPC 実践者は、最高レベルのセキュリティの安心感とともに、クラウドの柔軟性、コスト効率、使いやすさのメリットを享受できるようになりました。

コンピューティング集約型のワークロードを抱える最先端のスタートアップ企業は、この機会を認識しています。昨年、  Oracle for Startupsプログラムに登録したAI、機械学習、ビッグデータ関連企業の数は136%以上増加しました。そして、 NVIDIA Inception とのパートナーシップの恩恵を受け、今年はさらに増加を見込んでいます

製薬やメディアなど多様な業界に HPC を活用したソリューションを提供している GridMarkets のような企業がこれに該当します。医薬品発見のための大規模なシミュレーションを実行するのと同じプラットフォームで、映画スタジオ向けのアニメーションをレンダリングできます。 

他のスタートアップ企業も、クラウドベースのHPCシステムを活用し、AIと高度なアナリティクスを駆使した難解なデータ分析問題に取り組んでいます。中でもKineticaは、サンフランシスコ湾で汚染対策のために収集されたドローンデータを含む膨大なデータセットの分析にOracle CloudのHPCキャパシティを活用しています。

スーパーコンピューティングクラウド

画像クレジット: Getty Images

HPC システムにより、エンジニアは飛行機やマイクロチップなどの新製品の動作をモデル化することができ、気象学者は天気を予測することができ、データ サイエンティストは人工知能をトレーニングすることができます。

これまで、超並列処理を必要とするジョブは、通常「スーパーコンピュータ」と呼ばれるもので実行されてきました。これは、エリートレベルでパフォーマンスを発揮するシステムを指すやや曖昧な呼び方です。 

オンプレミス システムの購入と維持には莫大な資本支出がかかりますが (また、数年後には以前ほど「優れている」ものではなくなります)、他のほとんどのエンタープライズ ソフトウェアが急速にクラウドに移行している中でも、オンプレミスのシステムは HPC ワークロードの大部分を占め続けています。

その理由は、HPC機能は、仮想マシンの大規模なクラスターをプロビジョニングするだけでは実現できないからです。ジョブにより多くのプロセッシングコアを投入しても、その効果は徐々に減少していきます。超並列クラスターを効果的に拡張するには、クラウドサーバー間の独自のネットワーク機能が必要です。 

この課題に対処するために第 2 世代のクラウドを構築するにあたり、Oracle は HPC ワークロードを可能にする最新のチップを搭載したベアメタル マシンから着手しました。 

次のステップは、高度なネットワークプロトコルであるInfiniBandを世界中のクラウドリージョンに導入することで、レイテンシを削減し、スループットを向上させることでした。さらにOracleは、オペレーティングシステムを介さずにサーバー同士が直接メモリにアクセスできるようにするテクノロジーであるRemote Direct Memory Access (RDMA) over Converged Ethernet (RoceV2) によって、これらの超高速ネットワークをさらに強化しました。 

OCIは、ネットワークとIOの仮想化をソフトウェアスタックからネットワーク上に分離し、「オフボックス」仮想化を実装した最初の主要クラウドでもあります。専用の物理ホストは、ハイパーバイザーを介さずに、完全なソフトウェア定義のレイヤー3ネットワークトポロジで接続されるため、共有リソースやノイジーネイバーは発生しません。 

ハイパーバイザ層を削除することで、Oracle は優れたネットワーク パフォーマンスだけでなく、分離によるセキュリティも向上させます。

これらのイノベーションにより、科学者、エンジニア、スタートアップ企業は必要なときにいつでも HPC ジョブを実行できるようになっただけでなく、より低価格で実行できるようになりました。 

Oracle for Startupsの参加者は、OCI上のHPCを活用し、価格性能比で40~70%のメリットを報告しています。そして、これらのスタートアップ企業の取り組みは驚くべきものです。 

NHSのパートナーであるSkin Analyticsは、皮膚がんの検出に活用する最先端のAIを構築するために、HPCシステムへの費用対効果の高いアクセスを必要としていました。オラクルのクラウドリソースを活用することで、同社は皮膚病変のマッピング、分析、管理のための高度な画像処理技術を開発しました。 

オラクル・プログラムに参加しているもう一つのスタートアップ企業、DeepZenは、オーディオブックやその他のテキスト音声変換製品を一般向けに普及させる取り組みを支援しています。同社は、ニューラルネットワークと自然言語処理によって「クローン」音声を訓練し、感情や表情を表現できる柔軟なHPCプラットフォームを必要としていました。

GridMarkets、Kinetica、Skin Analytics、DeepZen は、これまで世界で最も制限されていたコンピューティング リソースの 1 つに容易にアクセスできるようになったことで、イノベーションの波を起こそうとしているスタートアップ企業の先駆けです。