GoogleのIronwood TPUは、Pod規模のFP8パワーでNvidiaの領域を狙う
Googleは、4月のGoogle Cloud Next ’25でIronwoodをプレビューし、現在アクセスを拡大しています。このチップは「推論の時代」に対応するようにカスタムシリコンとして位置付けられ、モデルが世界中のクラウドリージョンでリアルタイムに応答、推論、生成すると期待されています。
CNBCの報告によれば、この動きは、データセンターから開発ツールキットまでAIスタックを所有することを目指して競争しているハイパースケーラー間の広範な力の競争に強く関連しています。内部構造上、Ironwoodは3Dトーラスインターコネクト、持続的負荷に対する液体冷却、ランキング、推薦、金融、科学計算のための超大型埋め込みを加速するための改良されたSparsecoreに依存しています。
これは設計されており、データ移動と通信のボトルネックを最小限に抑えます—これらは多くの場合、マルチチップジョブでのスループットを制限する原因となります。生の数値データは注目を集めることを目的としています:チップあたり最大4,614 TFLOPs(FP8)、192 GBのHBMと7.37 TB/sの帯域幅、1.2 TB/sの双方向インターチップ帯域幅。Podは256チップから最大9,216チップの構成でスケールし、42.5エクサフロップス(FP8)の計算能力を提供します。全Podの消費電力は約10 MWで、液体冷却により空冷を上回る持続的性能を実現しています。
Googleによれば、Ironwoodは全体的なAIスループットで前世代のTrillium(TPU v6)より4倍高速で、1ワットあたりの性能が約2倍向上しており、2018年に発表された初代Cloud TPUのほぼ30倍の電力効率を有しています。最大限に使用した場合、同社はEl CapitanなどのトップスーパーコンピューターをFP8エクサフロップス単位で上回る計算能力を主張しています。いつものように、手法は重要ですが、意図は明白です。
訓練も可能である一方、Ironwoodの売り込みは大規模言語モデルやMixture-of-Expertsシステムの推論に焦点を当てています—これは今や北米からヨーロッパ、アジア太平洋までのデータセンターを洪水のように絶えず流れる高クエリー・パー・セカンド(QPS)、低遅延の作業です。チャットボット、エージェント、ジェミニクラスのモデル、高次元検索および推薦システムでは、高速メモリーと緊密なPodスケール同期が求められています。
統合は、数千のダイを分配計算するためにPathwaysなどのソフトウェアとハードウェアを組み合わせたGoogle CloudのAIハイパーコンピュータを通じて提供されます。このスタックはすでにSearchやGmailなどのコンシューマーおよびエンタープライズサービスを支えています。そしてIronwoodは、GPUと並んでTPUネイティブな管理ルートを望む顧客のためのアップグレード経路として配置されます。
市場メッセージには、ドメイン固有のTPUが、価格性能比とエネルギー消費の面で特定のAIタスクにおいて汎用GPUを上回ると主張することで、GoogleがNvidiaの支配に挑戦していることが盛り込まれています。CNBCの報告によると、早期導入者にはAnthropicが含まれ、Claudeに向けた百万TPU規模の展開を計画しており、推論のフットプリントがどれほど大きくなっているかについての眉をひそめるような信号を示しています。
AlphabetのCEOであるSundar Pichaiは、Google Cloudの収益が2025年第3四半期に34%増加して151.5億ドルに達し、AIの構築に関連する資本支出が930億ドルに達したことから、需要を主要な収益源と位置付けました。「AIインフラストラクチャ製品への大きな需要が見られ…これを満たすために投資しています」と彼は述べ、今年は過去2年間の合計よりも多くの10億ドル規模の契約が結ばれた点に言及しました。
Ironwoodのより広範な提供は2025年後半にGoogle Cloudを通じて予定されており、現在アクセスリクエストが開放されています。米国、ヨーロッパ、アジア太平洋地域の企業が電力予算、ラック密度、遅延目標を比較検討する場合、IronwoodのPodスケールのFP8計算能力と冷却プロファイルが彼らの生産負荷と一致するかどうかについての問題となります。
FAQ ❓
Ironwoodの提供場所はどこですか?北米、ヨーロッパ、アジア太平洋を含むグローバルリージョンのGoogle Cloudを通じて提供されます。
アクセスはいつ開始されますか?来週からの幅広い提供開始、2025年後半に更なる展開予定です。
Ironwoodはどのような負荷に対応していますか?LLM、MoE、検索、推薦、金融、科学計算のための高スループット推論に対応しています。
以前のTPUとの比較はどうですか?Googleは、容量が4倍高く、1ワットあたりの性能がTrilliumより2倍優れると引用しています。





