Google推第八代TPU 训练与推论分离今年稍晚上市挑战英伟达地位

作者：爱集微 04-23 07:49

来源：钜亨网 #TPU#

9139

Alphabet(GOOGL-US) 旗下 Google 宣布推出第八代张量处理单元 (TPU)，首度将人工智慧 (AI) 模型训练与推论运算拆分为两款专用芯片，借此提升效能并强化在 AI 硬件领域对英伟达 (NVDA-US) 的竞争力。两款新芯片预计将于今年稍晚上市。

Google 指出，随着 AI 代理 (AI agents) 需求快速成长，市场对训练与推论运算的差异化需求日益明显，因此决定将两者分离设计。Google 资深副总裁暨 AI 与基础设施首席技术长阿明・瓦赫达特表示，专用化芯片将更能满足不同工作负载需求并提升整体效率。

竞争对手英伟达亦持续推进新产品布局。该公司今年 3 月表示，其即将推出的芯片将结合以 200 亿美元收购 AI 芯片新创 Groq 的技术，使模型能更快速回应使用者问题。尽管 Google 本身仍是英伟达的重要客户之一，但同时也透过 TPU 向云端客户提供替代方案。

全球科技巨头正加速投入客制化 AI 芯片开发，以提升效率并满足特定应用场景需求。苹果 (AAPL-US) 多年来已在 iPhone 自研芯片中整合神经网路引擎；微软 (MSFT-US) 于今年 1 月推出第二代 AI 芯片；Meta Platforms(META-US) 则于上周宣布与博通 (AVGO-US) 合作开发多款 AI 处理器。

Google 在 AI 芯片领域布局较早，早在 2015 年即开始使用自研处理器运行 AI 模型，并于 2018 年对外提供云端租用服务。同年，亚马逊 AWS 推出用于 AI 推论的 Inferentia 芯片，并于 2020 年发布训练用 Trainium 处理器。市场研究机构 DA Davidson 分析师于去年 9 月估计，TPU 业务结合 Google DeepMind AI 部门的价值约达 9000 亿美元。

尽管竞争日趋激烈，目前仍无企业撼动英伟达在 AI 芯片市场的主导地位。Google 此次亦未直接与英伟达产品进行效能对比。不过公司表示，新一代训练芯片在相同价格下，效能较去年 11 月推出的第七代 Ironwood TPU 提升 2.8 倍，而推论芯片效能则提升约 80%。

在存储器架构方面，英伟达即将推出的 Groq 3 LPU 将大量采用静态随机存取存储器 (SRAM)，该技术亦被申请上市的 AI 芯片公司 Cerebras Systems 采用。Google 新推出的推论芯片 TPU 8i 同样导入 SRAM 设计，每颗芯片配备 384MB SRAM，为 Ironwood 的三倍容量。

桑达尔 · 皮查伊表示，此次新架构旨在提供高吞吐量与低延迟，以支援数百万个 AI 代理同时运行，并维持成本效益。

随着应用扩展，Google TPU 采用率持续攀升。公司指出，Citadel Securities 已利用 TPU 打造量化研究软体，美国能源部旗下 17 个国家实验室亦全面采用基于 TPU 的 AI 协同科学家系统。此外，AI 公司 Anthropic 已承诺采用数 GW 等级的 TPU 算力，显示市场需求持续升温。