Google推第八代TPU 训练与推论分离 今年稍晚上市 挑战英伟达地位

来源:钜亨网 #TPU#
1689

Alphabet(GOOGL-US) 旗下 Google 宣布推出第八代张量处理单元 (TPU),首度将人工智慧 (AI) 模型训练与推论运算拆分为两款专用芯片,借此提升效能并强化在 AI 硬件领域对英伟达 (NVDA-US) 的竞争力。两款新芯片预计将于今年稍晚上市。

Google 指出,随着 AI 代理 (AI agents) 需求快速成长,市场对训练与推论运算的差异化需求日益明显,因此决定将两者分离设计。Google 资深副总裁暨 AI 与基础设施首席技术长阿明・瓦赫达特表示,专用化芯片将更能满足不同工作负载需求并提升整体效率。

竞争对手英伟达亦持续推进新产品布局。该公司今年 3 月表示,其即将推出的芯片将结合以 200 亿美元收购 AI 芯片新创 Groq 的技术,使模型能更快速回应使用者问题。尽管 Google 本身仍是英伟达的重要客户之一,但同时也透过 TPU 向云端客户提供替代方案。

全球科技巨头正加速投入客制化 AI 芯片开发,以提升效率并满足特定应用场景需求。苹果 (AAPL-US) 多年来已在 iPhone 自研芯片中整合神经网路引擎;微软 (MSFT-US) 于今年 1 月推出第二代 AI 芯片;Meta Platforms(META-US) 则于上周宣布与博通 (AVGO-US) 合作开发多款 AI 处理器。

Google 在 AI 芯片领域布局较早,早在 2015 年即开始使用自研处理器运行 AI 模型,并于 2018 年对外提供云端租用服务。同年,亚马逊 AWS 推出用于 AI 推论的 Inferentia 芯片,并于 2020 年发布训练用 Trainium 处理器。市场研究机构 DA Davidson 分析师于去年 9 月估计,TPU 业务结合 Google DeepMind AI 部门的价值约达 9000 亿美元。

尽管竞争日趋激烈,目前仍无企业撼动英伟达在 AI 芯片市场的主导地位。Google 此次亦未直接与英伟达产品进行效能对比。不过公司表示,新一代训练芯片在相同价格下,效能较去年 11 月推出的第七代 Ironwood TPU 提升 2.8 倍,而推论芯片效能则提升约 80%。

在存储器架构方面,英伟达即将推出的 Groq 3 LPU 将大量采用静态随机存取存储器 (SRAM),该技术亦被申请上市的 AI 芯片公司 Cerebras Systems 采用。Google 新推出的推论芯片 TPU 8i 同样导入 SRAM 设计,每颗芯片配备 384MB SRAM,为 Ironwood 的三倍容量。

桑达尔 · 皮查伊表示,此次新架构旨在提供高吞吐量与低延迟,以支援数百万个 AI 代理同时运行,并维持成本效益。

随着应用扩展,Google TPU 采用率持续攀升。公司指出,Citadel Securities 已利用 TPU 打造量化研究软体,美国能源部旗下 17 个国家实验室亦全面采用基于 TPU 的 AI 协同科学家系统。此外,AI 公司 Anthropic 已承诺采用数 GW 等级的 TPU 算力,显示市场需求持续升温。

责编: 爱集微
来源:钜亨网 #TPU#
THE END
关闭
加载

PDF 加载中...