摩爾線程或成為上市速度最快的半導(dǎo)體企業(yè)之一。
2020年10月成立,2024年11月啟動(dòng)上市,這一過(guò)程摩爾線程僅用了4年的時(shí)間。
2024年11月12日,證監(jiān)會(huì)網(wǎng)站顯示,摩爾線程在北京證監(jiān)局辦理輔導(dǎo)備案登記,正式啟動(dòng)A股上市進(jìn)程,輔導(dǎo)機(jī)構(gòu)為中信證券。此外,還有消息表示,該公司將在科創(chuàng)板上市。
提到摩爾線程,業(yè)內(nèi)都將其作為英偉達(dá)的平替看待,不僅是因?yàn)楫a(chǎn)品對(duì)標(biāo),更是因?yàn)槠渚邆溆ミ_(dá)的深厚基因。
01.
中國(guó)的“英偉達(dá)”
創(chuàng)始人來(lái)自英偉達(dá)。
摩爾線程的創(chuàng)始人——張建中是英偉達(dá)原全球副總裁、中國(guó)區(qū)總經(jīng)理,英偉達(dá)中國(guó)公司創(chuàng)始人。
張建中深耕GPU行業(yè)超過(guò)15年,覆蓋產(chǎn)品研發(fā)、市場(chǎng)生態(tài)及營(yíng)銷領(lǐng)域;帶領(lǐng)英偉達(dá)開(kāi)拓中國(guó)GPU市場(chǎng),建立生態(tài)系統(tǒng);并推動(dòng)中國(guó)市場(chǎng)成為英偉達(dá)全球最重要的市場(chǎng)。數(shù)據(jù)顯示,2008年英偉達(dá)在中國(guó)的GPU市場(chǎng)占有率不到50%,2020年的市占率已經(jīng)超過(guò)80%。
可見(jiàn),張建中在為英偉達(dá)開(kāi)拓中國(guó)市場(chǎng)方面,居功至偉。
2020年9月,張建中離開(kāi)英偉達(dá),同年10月創(chuàng)立摩爾線程。公司結(jié)構(gòu)設(shè)計(jì)思路與英偉達(dá)也頗為相似,摩爾線程成立了AISG和MCSG兩個(gè)戰(zhàn)略部門(mén),分別專注于AI芯片和消費(fèi)級(jí)顯卡的研發(fā)。
離開(kāi)英偉達(dá),短短19個(gè)月后,張建中便率隊(duì)交付了一塊國(guó)產(chǎn)全功能GPU—蘇堤。它采用先進(jìn)的公司架構(gòu)集成、AI計(jì)算、加速、圖形渲染、視頻編解碼、物理仿真和科學(xué)計(jì)算四大引擎。
2022年11月,摩爾線程推出了國(guó)產(chǎn)游戲顯卡MTT S80,被譽(yù)為“國(guó)產(chǎn)游戲第一卡”,并且是國(guó)內(nèi)唯一可以支持DX12的消費(fèi)級(jí)顯卡。至此,摩爾線程成為國(guó)產(chǎn)第一家消費(fèi)級(jí)游戲顯卡公司。
摩爾線程的這一成就在全世界范圍內(nèi)都不容小覷。要知道圖形處理是GPU領(lǐng)域的珠峰,摩爾線程能以全功能GPU實(shí)現(xiàn)消費(fèi)級(jí)圖形處理,成為繼英偉達(dá)、AMD、英特爾后第四家能創(chuàng)造出獨(dú)立顯卡的科技公司。
當(dāng)然,摩爾線程全面對(duì)比哦啊英偉達(dá)。除了顯卡之外,英偉達(dá)在數(shù)據(jù)中心、人工智能等領(lǐng)域都有布局。摩爾線程也有對(duì)應(yīng)的產(chǎn)品布局,TO C端的桌面顯卡,摩爾線程現(xiàn)有產(chǎn)品包括MTT S80、S70、S50、S30、S10。TO B端的AI大模型,摩爾線程產(chǎn)品包括訓(xùn)推一體機(jī)MCCX D800、AI超融合一體機(jī)KUAE FUSION,用于部署服務(wù)器推理、訓(xùn)練。且支持LLaMA、GLM、Aquila、Baichuan、GPT、Bloom、玉言等各類主流大模型的開(kāi)源。摩爾線程的布局,已經(jīng)形成從芯片到板卡到服務(wù)器到集群,再到軟件的全棧式的人工智能的產(chǎn)品線。
摩爾線程能夠取得這樣的成績(jī),得益于技術(shù)能力強(qiáng)大的團(tuán)隊(duì),他們多來(lái)自于英偉達(dá)、微軟、英特爾、AMD、ARM等國(guó)際大企業(yè),技術(shù)實(shí)力不容小覷。
根據(jù)國(guó)家知識(shí)產(chǎn)權(quán)局的數(shù)據(jù),截至2024年10月,摩爾線程獲得425項(xiàng)授權(quán)專利,穩(wěn)居國(guó)內(nèi)GPU企業(yè)中專利授權(quán)數(shù)量首位。這些專利主要覆蓋了處理器架構(gòu)設(shè)計(jì)、AI應(yīng)用、驅(qū)動(dòng)軟件設(shè)計(jì)、GPU算力集群等關(guān)鍵技術(shù)領(lǐng)域。
02 .
用MUSA兼容CUDA
英偉達(dá)耗費(fèi)多年構(gòu)建的完整CUDA生態(tài)系統(tǒng)可以說(shuō)是其最重要的護(hù)城河之一,鞏固了其作為領(lǐng)先GPU計(jì)算和人工智能(AI)制造商的地位。
正因此,GPU企業(yè)要生存就要先兼容CUDA。
什么是CUDA?
CUDA(Compute Unified Device Architecture),是NVIDIA推出的運(yùn)算平臺(tái)。CUD是一種NVIDIA推出的通用并行計(jì)算架構(gòu),該架構(gòu)使GPU能夠解決復(fù)雜的計(jì)算問(wèn)題。它包含了CUDA指令集架構(gòu)(ISA)以及GPU內(nèi)部的并行計(jì)算引擎。開(kāi)發(fā)人員可以使用C語(yǔ)言來(lái)為CUDA"架構(gòu)編寫(xiě)程序,所編寫(xiě)出的程序可以在支持CUDA的處理器上以超高性能運(yùn)行。
用戶一旦習(xí)慣了CUDA,就很難再遷移出去。因?yàn)檫w移意味著代碼完全重寫(xiě),工作繁重耗時(shí)且不產(chǎn)生經(jīng)濟(jì)效益。
競(jìng)爭(zhēng)對(duì)手們要挖英偉達(dá)的墻角就要采用盡量不改變用戶習(xí)慣的方式,例如,在自己的GPU芯片上兼容CUDA。AMD和英特爾一直試圖通過(guò)自己的開(kāi)放API產(chǎn)品,包括ROCm和oneAPI進(jìn)入計(jì)算領(lǐng)域。其想法是提供翻譯層的開(kāi)放訪問(wèn),開(kāi)發(fā)人員可以更容易地在非英偉達(dá)GPU上運(yùn)行現(xiàn)有的CUDA代碼,例如,開(kāi)源的ZLUDA項(xiàng)目,可以使CUDA應(yīng)用程序在AMD GPU上以接近原生性能運(yùn)行,而且無(wú)需重新編碼。
高通、英特爾和谷歌聯(lián)手還建立UXL基金會(huì),是以oneAPI構(gòu)建的開(kāi)源項(xiàng)目,為使用CUDA生態(tài)系統(tǒng)的用戶提供新選擇,最終目標(biāo)就是要推翻英偉達(dá)的統(tǒng)治。
國(guó)內(nèi)其他GPU企業(yè)也選擇了兼容,例如壁仞科技的 BIRENSUPA 平臺(tái)、沐曦科技的 MXMACA平臺(tái)也都在通過(guò)兼容來(lái)化解英偉達(dá)CUDA帶來(lái)的壁壘。
摩爾線程要生存也要采取類似手段,因此,摩爾線程自主研發(fā)了MUSA統(tǒng)一系統(tǒng)架構(gòu),包括統(tǒng)一的GPU編程模型、軟件運(yùn)行庫(kù)、驅(qū)動(dòng)程序框架、指令集架構(gòu)和芯片架構(gòu)。簡(jiǎn)單來(lái)說(shuō),只要通過(guò)一些代碼自動(dòng)轉(zhuǎn)換的工具,用戶就可以快捷的把原有的基于英偉達(dá),生態(tài)的擴(kuò)大代碼牽引到MUSA平臺(tái),實(shí)現(xiàn)替代。
不過(guò),今年3月份,市場(chǎng)上傳出英偉達(dá)試圖在CUDA軟件中封殺第三方GPU公司的消息。
針對(duì)市場(chǎng)上的消息,摩爾線程迅速表態(tài),其MUSA / MUSIFY不涉及英偉達(dá)EULA相關(guān)條款,開(kāi)發(fā)者可以放心使用。
聲明指出,摩爾線程研發(fā)的MUSA系統(tǒng),與CUDA無(wú)任何依賴關(guān)系。MUSIFY則是其面向廣大MUSA開(kāi)發(fā)者提供的開(kāi)發(fā)工具,方便用戶在MUSA計(jì)算平臺(tái)上進(jìn)行應(yīng)用移植與開(kāi)發(fā),可以讓開(kāi)發(fā)者將自己的C++源代碼,轉(zhuǎn)換成MUSA C++源代碼,再通過(guò)MUSA編譯器MCC編譯生成基于MUSA指令集的二進(jìn)制代碼,最終運(yùn)行在摩爾線程全功能GPU上。
當(dāng)然也可以看出,兼容CUDA是其他GPU企業(yè)發(fā)展必須要走的路,因?yàn)橹挥屑嫒軨UDA,企業(yè)發(fā)展的商業(yè)壁壘才能大幅降低。
03 .
“集群化”應(yīng)對(duì)算力瓶頸
除了以MUSA應(yīng)對(duì)CUDA,摩爾線程試圖用“集群化”的解決方案,來(lái)解決國(guó)產(chǎn)GPU突破算力瓶頸。例如,以摩爾線程、華為為代表的少數(shù)廠商,選擇從千卡向萬(wàn)卡進(jìn)發(fā),著重訓(xùn)練場(chǎng)景,直接硬剛英偉達(dá)。
7月3日,在2024世界人工智能大會(huì)召開(kāi)前夕,摩爾線程宣布其夸娥(KUAE)智算集群解決方案實(shí)現(xiàn)重大升級(jí),從千卡級(jí)別大幅擴(kuò)展至萬(wàn)卡規(guī)模,以此來(lái)完成對(duì)大模型的托舉,為萬(wàn)億參數(shù)級(jí)別的大模型訓(xùn)練提供持續(xù)高效、穩(wěn)定、且廣泛適用的通用算力支持。
張建中表示,夸娥萬(wàn)卡智算集群作為摩爾線程全棧AI戰(zhàn)略的一塊重要拼圖,可為各行各業(yè)數(shù)智化轉(zhuǎn)型提供澎湃算力。
具體來(lái)看,摩爾線程夸娥萬(wàn)卡集群以全功能GPU為底座,軟硬一體化、完整的系統(tǒng)級(jí)算力解決方案,包括以夸娥計(jì)算集群為核心的基礎(chǔ)設(shè)施、夸娥集群管理平臺(tái)(KUAE Platform)以及夸娥大模型服務(wù)平臺(tái)(KUAE ModelStudio),旨在以一體化交付的方式解決大規(guī)模GPU算力的建設(shè)和運(yùn)營(yíng)管理問(wèn)題。該方案可實(shí)現(xiàn)開(kāi)箱即用,大大降低傳統(tǒng)算力建設(shè)、應(yīng)用開(kāi)發(fā)和運(yùn)維運(yùn)營(yíng)平臺(tái)搭建的時(shí)間成本,實(shí)現(xiàn)快速投放市場(chǎng)開(kāi)展商業(yè)化運(yùn)營(yíng)。
要知道,萬(wàn)卡集群并不是一萬(wàn)張GPU卡的簡(jiǎn)單堆疊,而是一個(gè)超級(jí)復(fù)雜的系統(tǒng)工程。規(guī)模變大的同時(shí),難度也呈指數(shù)級(jí)倍增——既要實(shí)現(xiàn)智算中心擴(kuò)容,也要兼顧質(zhì)量。
首先,需要解決超大規(guī)模組網(wǎng)互聯(lián)和提升集群有效計(jì)算效率問(wèn)題;
其次,要解決穩(wěn)定性問(wèn)題,超萬(wàn)卡集群是由數(shù)千臺(tái)GPU服務(wù)器、數(shù)千臺(tái)交換機(jī)、數(shù)萬(wàn)根光纖/數(shù)萬(wàn)顆光模塊構(gòu)成,訓(xùn)練任務(wù)涉及上千萬(wàn)器件的共同作業(yè),任何一個(gè)部件的故障,可能都會(huì)導(dǎo)致訓(xùn)練中斷。
此外,要應(yīng)對(duì)大模型的迭代問(wèn)題,要求萬(wàn)卡集群具備生態(tài)Day0級(jí)的快速遷移能力,以適應(yīng)不斷變化的技術(shù)需求。同時(shí),算力也不能局限于當(dāng)下的大模型計(jì)算加速場(chǎng)景,還需要考慮未來(lái)通用計(jì)算的需求。
這對(duì)廠商而言是一項(xiàng)極其復(fù)雜的系統(tǒng)工程。尤其算力利用率與穩(wěn)定性是行業(yè)衡量智算中心質(zhì)量的兩項(xiàng)重要指標(biāo)。
具體來(lái)看下,夸娥萬(wàn)卡智算方案性能:
■集群有效計(jì)算效率,目標(biāo)最高可超過(guò)60%;
■具備強(qiáng)大的計(jì)算通用性,專為通用計(jì)算而設(shè)計(jì),可以加速一切大模型;
<span pingfang="" sc",="" system-ui,="" -apple-system,="" blinkmacsystemfont,="" "helvetica="" neue",="" "hiragino="" sans="" gb",="" "microsoft="" yahei="" ui",="" yahei",="" arial,="" sans-serif;"="" style="font-family: -apple-system, 'Source Sans Pro';box-sizing: border-box">■擁有良好的CUDA兼容能力,生態(tài)適配Instant On,加速新模型Day0級(jí)遷移。
至此,摩爾線程已經(jīng)從一家GPU公司,轉(zhuǎn)變?yōu)閷WI的加速計(jì)算平臺(tái)企業(yè)。
04.
因進(jìn)實(shí)體名單聲名鵲起
摩爾線程,見(jiàn)諸媒體的次數(shù)屈指可數(shù)。
第一次聲名鵲起是源自于美國(guó)的實(shí)體名單。
2023年10月17日,美國(guó)商務(wù)部將包括摩爾線程在內(nèi)的13家中國(guó)GPU企業(yè)列入“實(shí)體清單”,以遏制中國(guó)AI產(chǎn)業(yè)的發(fā)展。
成立三年的摩爾線程才第一次進(jìn)入大眾視野。事實(shí)上,能夠進(jìn)入美國(guó)的“實(shí)體清單”也是對(duì)其技術(shù)實(shí)力的一次認(rèn)可。
事實(shí)上,進(jìn)入“實(shí)體清單”對(duì)摩爾線程的影響不小,最重要的就是限制其獲取海外代工和先進(jìn)技術(shù)的可能。
同時(shí)由于貿(mào)易限制和供應(yīng)鏈中斷,企業(yè)可能難以獲得必要的原材料和零部件,導(dǎo)致生產(chǎn)受到影響,進(jìn)而影響其財(cái)務(wù)狀況和信用評(píng)級(jí)。這會(huì)使得企業(yè)在融資時(shí)面臨更多困難,難以獲得銀行和其他金融機(jī)構(gòu)的貸款和支持。
摩爾線程對(duì)此的應(yīng)對(duì)措施是降價(jià)擴(kuò)大銷售,當(dāng)月其將原價(jià)MTT S80顯卡從2999元一次性降價(jià)至1199元,通過(guò)擴(kuò)大銷售來(lái)穩(wěn)定現(xiàn)金流。
第二次被人們關(guān)注是因?yàn)椤逗谏裨挘何蚩铡钒l(fā)售。
《黑神話:悟空》正式發(fā)售之后,摩爾線程團(tuán)隊(duì)迅速推出了針對(duì)MTT S80顯卡的優(yōu)化驅(qū)動(dòng)程序,后期發(fā)布的V270.80驅(qū)動(dòng)程序解決了DirectX11模式下運(yùn)行《黑神話:悟空》Benchmark時(shí)的閃退問(wèn)題。
這也讓摩爾線程小火了一把。8月下旬,摩爾線程的百度搜索指數(shù)達(dá)到了前后兩個(gè)月內(nèi)的峰值。
通過(guò)內(nèi)部測(cè)試和市場(chǎng)反饋,玩家們普遍對(duì)MTT S80顯卡在《黑神話:悟空》中性能提升表示滿意。
這在一定程度上也反映出摩爾線程的技術(shù)實(shí)力。
第三次被關(guān)注,就是此次啟動(dòng)IPO。關(guān)注度創(chuàng)歷史新高。
雖然在被列入實(shí)體清單之前,摩爾線程的知名度并不高,但是在創(chuàng)投圈卻是名副其實(shí)的“當(dāng)紅炸子雞”,一成立就獲得紅杉中國(guó)、字節(jié)跳動(dòng)等國(guó)際頂級(jí)投資機(jī)構(gòu)的投資。
天眼查顯示,摩爾線程已完成5輪融資,累計(jì)融資金額或超過(guò)50億元。2022年12月,摩爾線程完成15億元的B輪融資時(shí),估值已達(dá)到240億元。
而根據(jù)胡潤(rùn)研究院發(fā)布的《2024全球獨(dú)角獸榜》中,摩爾線程以255億人民幣的企業(yè)估值入選,排名第261位。
摩爾線程與英偉達(dá)相比,在算力、制程技術(shù),以及生態(tài)架構(gòu)設(shè)計(jì)上的性能和效率等方面的差距是顯而易見(jiàn)的。例如,摩爾線程在集群訓(xùn)練規(guī)模上仍有一定差距,英偉達(dá)已能進(jìn)行十萬(wàn)卡級(jí)別的集群訓(xùn)練;從芯片設(shè)計(jì)上來(lái)看,跟英偉達(dá)的差距為12—18個(gè)月;在芯片制造制程上,英偉達(dá)已采用3nm制程,而國(guó)內(nèi)目前仍止步于5-7nm……
要翻越英偉達(dá)這座大山,摩爾線程需要做的還有很多,上市成為獲取資金彈藥的必然途徑。
無(wú)論如何,作為一顆冉冉升起的新星,摩爾線程是值得期待的。