
Google Cloudは本日、年次ユーザーカンファレンス「Cloud Next」において、AIのトレーニングと推論向けテンソルプロセッシングユニット(TPU)の第5世代のリリースを発表しました。Googleは2021年にカスタムプロセッサの第4バージョンを発表しましたが、開発者向けに提供開始されたのは2022年になってからでした。
同社は、このチップのこのエディションは効率性に重点を置いて開発されたと述べています。前世代と比較して、このバージョンは1ドルあたりのトレーニング性能が2倍、推論性能が2.5倍向上すると謳っています。
「これはこれまでで最もコスト効率が高く、アクセスしやすいクラウドTPUです」と、Google CloudのコンピューティングおよびMLインフラストラクチャ担当副社長兼ゼネラルマネージャーであるマーク・ローメイヤー氏は、本日の発表に先立つ記者会見で述べた。
ローメイヤー氏はまた、同社がユーザーがこれまで可能だった以上にTPUクラスターを拡張できるようにしたと強調した。
「お客様がAIモデルを単一のTPUポッドや単一のTPUクラスターの物理的な境界を超えて容易に拡張できるようにしています」と氏は説明した。「言い換えれば、単一の大規模なAIワークロードを複数の物理TPUクラスターにまたがり、文字通り数万個のチップにまで拡張できるようになり、しかも非常にコスト効率の高い方法で実現できます。その結果、クラウドGPUとクラウドTPUを通じ、お客様に幅広い選択肢、柔軟性、そしてオプションを提供し、今後出現する幅広いAIワークロードのニーズに対応できるようになります。」
Googleは本日、次世代TPUに加え、来月にはNVIDIAのH100 GPUをA3シリーズの仮想マシンの一部として開発者向けに一般公開すると発表しました。詳細はこちらをご覧ください。
テッククランチイベント
サンフランシスコ | 2025年10月27日~29日
トピック
フレデリックは2012年から2025年までTechCrunchに在籍していました。また、SiliconFilterを設立し、ReadWriteWeb(現ReadWrite)にも寄稿しています。フレデリックは、エンタープライズ、クラウド、開発者ツール、Google、Microsoft、ガジェット、交通機関など、興味のあるあらゆる分野をカバーしています。
バイオを見る