埃隆·馬斯克最近宣佈,其人工智能初創公司xAI已啟動了“世界上最強大的AI訓練集群”,並計劃在今年12月前創建“世界上最強大的人工智能”。這個集群位於田納西州的孟菲斯,被稱為孟菲斯超級集群,配備了10萬個英偉達H100 GPU,採用液冷散熱,並使用單一的RDMA網絡互連架構。
這個集群的規模已經超越了最新Top500榜單上的任何一臺超級計算機,包括世界上最強的Frontier(37888個AMD GPU)、Aurora(60000個Intel GPU)和微軟Eagle(14400個Nvidia H100 GPU)。馬斯克透露,其目標是“在今年12月前訓練出世界上最強大的人工智能(Grok3)”,而孟菲斯超級計算機集群正是其實現這一目標的優勢所在。
據報道,這個集群幾乎立即開始了工作,並且得到了孟菲斯市的支持。xAI承諾將改善孟菲斯的公共基礎設施,以支持數據中心的發展,包括興建一個新的變電站和一個汙水處理設施。孟菲斯超級集群的電力消耗預計將非常高,可能達到每小時150兆瓦,相當於10萬戶家庭所需的電量。
此外,xAI的Supercluster將全方位、深層次地參與並加速“世界上最強大人工智能”的培育過程。目前,xAI的10萬個H100 GPU已全力投入到對Grok 3模型的專項訓練中。這個項目原定於2025年秋季啟動,但現在預計將提前近一年實現既定目標。
這個超級計算機集群的建設不僅是技術上的突破,也是對現有AI基礎設施的一次巨大挑戰。其成功與否將可能對未來的AI發展產生深遠影響。