亚马逊新款AI芯片登场!下一代芯片将与英伟达生态“合体”
2025-12-03 01:46:21 来源:财联社
北京时间周三凌晨,全球云计算“一哥”亚马逊AWS在re:Invent大会期间宣布,华尔街翘首以盼的新一代自研AI芯片Trainium3正式公开上市。
综合公司介绍,Trainium3是亚马逊首款3nm制程芯片。相较于上一代Trainium芯片,Trainium3计算性能最高提升4.4倍,能效提升4倍,内存带宽几乎提升4倍,主打AI算力竞争的性价比赛道。由Trainium3组成的UltraServer系统还可互联,每台可容纳144枚芯片,能为单个应用提供多达100万枚Trainium3芯片,是上一代的10倍。
公司称,与同样使用图形处理单元(GPU)的系统相比,训练和运行AI模型的成本最多能降低50%。
当然,期望亚马逊Trainium3与谷歌TPU竞争,甚至“挑战英伟达”的投资者可能会失望,毕竟没有资料显示这款芯片除“性价比”外有其他优势。
亚马逊拒绝透露新款AI芯片与谷歌、英伟达最新产品的基准性能对比,也未披露功耗参数。目前仅知每枚芯片集成144GB的高带宽内存,而谷歌最新的Ironwood TPU为192GB,英伟达的Blackwell GB300则最高可达288GB。
负责Trainium项目的AWS副总裁兼首席架构师Ron Diamant直言:“我不认为我们会试图取代英伟达”。
Diamant进一步表示,归根结底,这款自研芯片最大优势是性价比。其主要目标是为客户在不同计算工作负载上提供更多选择。
对于亚马逊的AI芯片而言,最大短板并非芯片本身,而是亚马逊缺乏足够有深度且易于使用的软件库。
除亚马逊自身及公司大力投资的AI初创企业Anthropic外,几乎找不到使用Trainium芯片的知名公司。
Anthropic在10月表示将采购最多100万块谷歌的TPU,11月又宣布与英伟达签署投资入股协议,并将进一步购买英伟达芯片的算力。不过Anthropic也强调,亚马逊仍是其“主要的训练合作伙伴和云服务提供商”,预计到年底将使用超过一百万颗Trainium 2芯片。
使用人工智能赋能施工设备自动化的Bedrock Robotics介绍称,公司基础设施运行在AWS服务器上,但为挖掘机构建引导模型时要用英伟达芯片。公司首席技术官Kevin Peterson总结:“我们需要它既高性能又易于使用,那就是英伟达。”
亚马逊似乎也意识到了这个问题。在Trainium3的公告中,公司特别强调Trainium4已在研发中,最大亮点是“能与英伟达芯片协同工作”。
公司表示,Trainium4将支持英伟达NVLink Fusion高速芯片互连技术,最终形成一种兼顾GPU与Trainium服务器的经济高效机架级AI基础设施。
英伟达介绍称,NVLink Fusion的核心是NVLink Fusion chiplet,超大规模云服务商可将该chiplet嵌入其定制ASIC设计中,以连接NVLink规模化互联和NVLink交换机。
(NVLink Fusion芯片组使72个定制ASIC以每个ASIC 3.6 TB/s的带宽实现全互联,来源:英伟达)
这意味着,基于Trainium4的系统将能与英伟达GPU互操作并提升整体性能,同时仍使用亚马逊自研的、低成本的服务器机柜技术。这也将使那些以英伟达GPU为核心构建的大型AI应用,更容易迁移到AWS。
(文章来源:财联社)
原标题:亚马逊新款AI芯片登场!下一代芯片将与英伟达生态“合体”
郑重声明:信查查发布此内容旨在传播更多信息,与本站立场无关,不构成投资建议。据此操作,风险自担。
相关企业
