3月17日,聯想集團有限公司(以下簡稱“聯想”)宣布旗下首款AMD AI大模型訓練服務器聯想問天WA7785a G3在單機部署671B(滿血版)DeepSeek大模型,可實現極限吞吐量6708token/s,將單臺服務器運行大模型的性能推向了新高,展現了聯想在AI基礎設施領域技術的深厚積淀與研發的快速響應能力。在AI算力競爭日趨白熱化的今天,聯想再次以硬核技術實力樹立了行業新標桿。
依托聯想萬全異構智算平臺,聯想通過訪存優化、顯存優化等諸多創新方式,對大模型從預訓練、后訓練到推理的全流程進行持續優化。相關成績意味著單臺聯想問天WA7785a G3可以支撐1500人規模企業的正常使用,是繼聯想問天WA7780 G3服務器單機部署滿血版DeepSeek大模型總吞吐量突破2500 token/s之后,單機部署該大模型推理性能的又一次突破。
此次突破是聯想中國基礎設施業務群、聯想研究院ICI實驗室和AMD聯合設計、協同調優、共同實現的。據了解,聯想與AMD還在持續嘗試深度調優新方法,實現更高調優突破。
該款聯想問天服務器具有強大算力引擎、超大顯存、特有創新架構等優勢,為服務器的穩定性和可靠性提供了有力保障。
據了解,聯想將持續深化與產業伙伴的技術協作,通過架構創新、算法優化與硬件技術創新,不斷突破性能邊界,為各行業提供更高密度、更低能耗、更易部署的AI算力基礎設施,推動AI算力向更高效、更普惠、更可持續的方向演進,助力中國智算產業的持續發展。