当地时间周三(4月22日),谷歌在拉斯维加斯举行的Cloud Next 2026大会上发布了两款
谷歌以往生产的芯片既能训练AI模型,也能执行推理任务,但该公司如今将这两类任务拆分为不同的处理器,并在第八代张量处理单元(TPU)中采用这一变化。
这两款芯片分别被命名为TPU 8t 和TPU 8i,都将在今年晚些时候推出。
“随着AI智能体(AI agents)的兴起,我们认为社区将受益于分别针对训练和服务需求进行优化的芯片,”谷歌高级副总裁兼AI与基础设施首席技术专家AminVahdat在一篇博客文章中表示。
据谷歌介绍,TPU 8t针对AI模型训练进行了优化,可将“前沿模型开发周期从数月缩短至数周”。
谷歌表示,TPU 8t的性价比比前代提升2.8倍,这对需要高性能芯片但又不希望承担高昂运行成本的客户来说至关重要。
以谷歌为首的超大规模云服务商(Hyperscalers)正在加码研发AI芯片,以挑战在该领域的统治地位。
作为先行者,谷歌早在2015年就开始使用自研处理器来运行AI模型,并在2018年开始向云客户出租这些芯片。
据DA Davidson的分析师在去年9月估计,TPU业务连同谷歌Deep Mind团队的估值约为9000亿美元。
亚马逊于2018年发布了用于处理AI请求的Inferentia芯片,并在2020年推出了用于训练AI模型的Trainium芯片。
尽管如此,这些科技巨头尚无法撼动英伟达的地位。谷歌甚至没有将其新芯片与英伟达的产品进行直接性能对比。
谷歌仅表示,其训练芯片在相同价格下性能是第七代Ironwood TPU(去年11月发布)的2.8倍,而推理芯片性能提升了80%。
今年3月,英伟达公布了即将推出的新一代芯片,该芯片可让模型更快响应用户提问,这得益于其以200亿美元收购芯片初创公司Groq所获得的技术。
英伟达当时表示,其即将推出的Groq 3 LPU芯片将大量采用静态随机存取存储器(SRAM),这一技术也被另一AI芯片制造商Cerebras使用。