埃隆·马斯克最近宣布,其人工智能初创公司xAI已启动了“世界上最强大的AI训练集群”,并计划在今年12月前创建“世界上最强大的人工智能”。这个集群位于田纳西州的孟菲斯,被称为孟菲斯超级集群,配备了10万个英伟达H100 GPU,采用液冷散热,并使用单一的RDMA网络互连架构。
这个集群的规模已经超越了最新Top500榜单上的任何一台超级计算机,包括世界上最强的Frontier(37888个AMD GPU)、Aurora(60000个Intel GPU)和微软Eagle(14400个Nvidia H100 GPU)。马斯克透露,其目标是“在今年12月前训练出世界上最强大的人工智能(Grok3)”,而孟菲斯超级计算机集群正是其实现这一目标的优势所在。
据报道,这个集群几乎立即开始了工作,并且得到了孟菲斯市的支持。xAI承诺将改善孟菲斯的公共基础设施,以支持数据中心的发展,包括兴建一个新的变电站和一个污水处理设施。孟菲斯超级集群的电力消耗预计将非常高,可能达到每小时150兆瓦,相当于10万户家庭所需的电量。
此外,xAI的Supercluster将全方位、深层次地参与并加速“世界上最强大人工智能”的培育过程。目前,xAI的10万个H100 GPU已全力投入到对Grok 3模型的专项训练中。这个项目原定于2025年秋季启动,但现在预计将提前近一年实现既定目标。
这个超级计算机集群的建设不仅是技术上的突破,也是对现有AI基础设施的一次巨大挑战。其成功与否将可能对未来的AI发展产生深远影响。