在人工智能技術革命的浪潮中,圖形處理器(GPU)作為算力核心正成為全球科技競爭的戰略制高點。美國英偉達公司憑借其 CUDA 生態系統和先進制程工藝,長期主導全球 GPU 市場。而中國 GPU 產業在政策扶持與市場需求的雙重驅動下,正加速追趕步伐。2025 年開年,燧原科技、沐曦集成、壁仞科技、摩爾線程四大頭部企業同步沖刺 IPO,這場資本盛宴不僅折射出國產算力芯片的技術突破,更預示著全球算力格局的深刻變革。
燧原科技自 2018 年成立以來,專注于人工智能領域云端算力產品,其邃思 2.0 芯片采用 6 納米工藝和 chiplet 等先進技術,GCU-CARA 全域計算架構針對人工智能計算特性深度優化,支持從 FP32 到 INT8 的全面計算精度,單精度 FP32 峰值算力 40 TFLOPS,單精度張量 TF32 峰值算力 160 TFLOPS,均國內領先。基于該芯片打造的云燧 T20 訓練加速卡和云燧 T21 訓練 OAM 模組,性能強、覆蓋面廣、可擴展性強,還有全面升級的 “馭算 TopsRider” 軟件平臺,通過軟硬件協同架構設計,支持主流深度學習框架下的各類模型訓練,為超大規模集群高效運行提供解決方案。燧原科技憑借強大的技術實力和產品性能,在數據中心市場成績斐然,其產品廣泛應用于互聯網、政務、金融、制造和能源等領域,為眾多客戶提供強大算力支撐。
2024 年 12 月,全國首個國產萬卡推理集群在甘肅慶陽點亮,搭載其最新算力卡,供給超 2500P 算力服務,Deepseek 的全量模型在多智算中心完成數萬卡快速部署,展現出強大市場競爭力。預計 2025 年二季度末至三季度初上市。
沐曦集成電路秉持打造全棧 GPU 生態理念,采用自主研發 GPU IP,擁有自主知識產權指令集和架構,配兼容主流 GPU 生態完整軟件棧(MXMACA)。其產品線豐富,曦思 N 系列 GPU 用于智算推理,曦云 C 系列 GPU 面向通用計算,曦彩 G 系列 GPU 專注圖形渲染,MXC500 系列采用 7nm 制程工藝,目標 FP32 算力 15TFLOPS,可兼容英偉達 CUDA。自主研發的 GPU IP 和指令集架構使產品在性能、功耗和靈活性上具獨特優勢,通過優化軟件棧和算法,能更好支持主流深度學習框架和應用場景,為用戶帶來便捷高效開發體驗。沐曦集成積極與產業鏈上下游企業合作,2025 年與聯想集團聯合推出基于 Deepseek 大模型的國產一體機解決方案,為企業提供從千億參數大模型訓練到場景化推理落地的全鏈條覆蓋。預計 2025 年四季度上市。
壁仞科技創立于 2019 年,其核心產品 BR100 系列通用 GPU 芯片基于自主原創架構開發,采用 7 納米工藝制程和 Chiplet 等前沿技術,集成 770 億晶體管,可搭配 64GB HBM2E 顯存,超 300MB 片上緩存,支持 PCIe 5.0、CXL 互聯協議等先進技術。算力性能突出,1024 TOPS INT8、512 TFLOPS BF16、256 TFLOPS TF32+、128 TFLOPS FP32,在 FP32、INT8 等維度超越國際廠商最新旗艦,單芯片峰值算力達 PFLOPS 級別。2024 年公布的異構 GPU 協同訓練方案 HGCT,是中國首個三種異構芯片混訓技術,突破大模型異構算力孤島難題,可靠性高。其 BR100 芯片性能卓越,直接對標國際廠商最新旗艦產品,異構協同訓練方案 HGCT 具有創新性和領先性,為其在市場中競爭提供有力技術支撐。
壁仞科技的合作客戶覆蓋通信運營商、人工智能等領域龍頭,如為中國移動智算中心(呼和浩特)提供算力支撐,與軟通動力聯合發布 AIPC 產品,推出 BIRENSUPA 生態方案,賦能多領域客戶和開發者。
摩爾線程致力于打造全功能 GPU,實現消費與 AI 雙輪驅動發展。其推出的 MTT S80 消費顯卡是國內唯一支持 DirectX 12 的消費級顯卡,采用 “春曉” GPU 芯片,性能不錯,經過驅動優化,在游戲場景中幀率提升顯著,已適配多款游戲。在 AI 領域,軟硬一體的夸娥 KUAE 智算集群成功將集群規模從千卡級別擴展至萬卡規模,具備萬 P 級浮點運算能力,專為處理萬億參數級別復雜大模型訓練設計,平均無故障運行時間長,周均訓練有效率高,通過系統優化實現高效訓練,截至 2024 年 10 月已獲 425 項授權專利,位居國內 GPU 企業專利授權數量前列。其在全功能 GPU 和智算集群技術上有獨特優勢,能夠在消費和 AI 市場雙線發展,滿足不同應用場景需求。MTT S80 消費顯卡在國內市場有一定知名度,隨著驅動優化和游戲適配增加,市場份額有望進一步擴大。
夸娥智算集群落地貴安 AI 項目,并獲中國移動、浦發銀行訂單,在數據中心市場占據一席之地,為公司發展提供新動力。2024 年 11 月,摩爾線程啟動 A 股輔導,預計 2025 年 5 月上市。
盡管國產 GPU 四巨頭在技術、市場等方面的顯著進展,預示著國產 GPU 產業正處于快速發展的黃金時期,但不可忽視的是,與國際巨頭英偉達相比,國產 GPU 仍面臨諸多挑戰。在技術層面,英偉達在 GPU 架構、制程工藝、算力性能等方面一直處于領先地位,其 H100 和 H200 芯片采用 4 納米工藝,算力性能和能效比卓越,而國產 GPU 芯片在制程工藝和算力性能上與之相比仍有追趕空間。例如,壁仞科技的 BR100 系列采用 7 納米工藝,在晶體管集成度和性能表現上與英偉達 4 納米工藝的芯片存在一定差距。在軟件生態方面,英偉達經過多年發展,構建了龐大完善的 CUDA 生態系統,擁有豐富開發工具、庫和大量開發者社區支持,使其 GPU 在深度學習、科學計算等領域開發便利性高、應用基礎廣泛。
國產 GPU 企業在軟件生態建設上雖積極努力,但在工具豐富度、開發者認可度和應用廣泛性上與英偉達差距較大,如燧原科技的 “馭算 TopsRider” 軟件平臺、沐曦集成的 MXMACA 軟件棧等,還需要進一步完善和推廣,以吸引更多開發者和用戶
2025 年極有可能成為國產 GPU 上市元年,四巨頭的 IPO 競速不僅是企業個體的資本博弈,更是國產算力產業崛起的關鍵戰役。燧原科技憑借騰訊背書與商業化能力暫處優勢,摩爾線程的消費級市場突破開辟新賽道,壁仞科技的技術突破與沐曦集成的生態布局各具特色。然而,技術迭代壓力、供應鏈安全等挑戰仍需長期應對。隨著國產 GPU 在制程工藝、生態構建與場景化創新的持續突破,有望為全球算力格局重構注入中國力量。