說起半導(dǎo)體行業(yè)面臨的難題,人們第一時(shí)間想到的是什么?是光刻機(jī)?是5nm?是一塊方方正正的芯片,我們?cè)觳怀鰜恚?/p>
是,但也不完全是。
人們往往將芯片半導(dǎo)體劃分為硬件產(chǎn)業(yè),但事實(shí)上,這是一個(gè)高度軟硬件集成的產(chǎn)業(yè)——軟件甚至更多時(shí)候占了大頭。
所以,即便我們?cè)?0年前就研發(fā)出了CPU,現(xiàn)在仍會(huì)面對(duì)如此局面。同樣,如今更受人關(guān)注的GPU產(chǎn)業(yè)也遇到了同樣困局,因?yàn)槲覀兠媾R的真正難題,不是硬件,而是軟件。
01. 當(dāng)我們說芯片困局時(shí),我們?cè)谡f什么?
芯片的硬件指的是運(yùn)行指令的物理平臺(tái),包括處理器、內(nèi)存、存儲(chǔ)設(shè)備等等。芯片數(shù)據(jù)中常出現(xiàn)的“晶體管數(shù)量”、“7nm制程”、“存儲(chǔ)”等,往往指的就是硬件參數(shù)。
軟件則包括固件、驅(qū)動(dòng)程序、操作系統(tǒng)、應(yīng)用程序、算子、編譯器和開發(fā)工具、模型優(yōu)化和部署工具、應(yīng)用生態(tài)等等。這些軟件指導(dǎo)硬件如何響應(yīng)用戶指令、處理數(shù)據(jù)和任務(wù),同時(shí)通過特定的算法和策略優(yōu)化硬件資源的使用。芯片數(shù)據(jù)中常出現(xiàn)的“x86指令集”、“深度學(xué)習(xí)算子”、“CUDA平臺(tái)”等,往往指的就是芯片軟件。
沒有硬件,軟件就無法執(zhí)行;可沒有軟件,硬件就只是一堆毫無意義的硅片。
以英偉達(dá)的CUDA平臺(tái)為例。
2012年,隨著深度學(xué)習(xí)+GPU的組合在ImageNet大賽上一炮打響,人工智能一夜之間火遍全球,全球科技界都將目光轉(zhuǎn)向了這一領(lǐng)域。多年深耕CUDA人工智能計(jì)算平臺(tái)的英偉達(dá)股價(jià)自然是一路走紅,成為了新時(shí)代的霸主。
軟件,成為了人工智能時(shí)代的核心技術(shù)壁壘。
為了打破英偉達(dá)一家獨(dú)大的局面,前任全球芯片老大英特爾和多年老對(duì)手AMD對(duì)標(biāo)CUDA都分別推出了OneAPI和ROCm,Linux基金會(huì)更是聯(lián)合英特爾、谷歌、高通、ARM、三星等公司聯(lián)合成立了民間號(hào)稱“反CUDA聯(lián)盟”的UXL基金會(huì),以開發(fā)全新的開源軟件套件,讓AI開發(fā)者能夠在基金會(huì)成員的任何芯片上進(jìn)行編程,試圖讓其取代CUDA,成為AI開發(fā)者的首選開發(fā)平臺(tái)。
反過來,英偉達(dá)也在不斷深挖CUDA的護(hù)城河。
早在2021年,英偉達(dá)就曾公開表示過“禁止使用轉(zhuǎn)換層在其他硬件平臺(tái)上運(yùn)行基于CUDA的軟件”,2024年3月,英偉達(dá)更是將其升級(jí)為“CUDA禁令”,直接添加在了CUDA的最終用戶許可協(xié)議中,已禁止用轉(zhuǎn)譯層在其他GPU上運(yùn)行CUDA軟件
對(duì)于中國用戶而言,這一禁令的打擊面要更大。
早在2022年,英偉達(dá)就已被要求對(duì)中國市場斷供高端GPU芯片,死死地卡住中國GPU芯片購買渠道。
如今連在其他芯片上運(yùn)行CUDA軟件都被英偉達(dá)禁止了,中國人工智能公司們,怎么辦?
02. 國內(nèi)AI芯片全面崛起
其實(shí),在這條禁令下發(fā)之前很久,中國芯片公司們就已經(jīng)有所準(zhǔn)備了。
2015年,國內(nèi)人工智能產(chǎn)業(yè)如火如荼,“AI四小龍”崛起,連帶著整個(gè)產(chǎn)業(yè)步入發(fā)展快車道。
在這波由CNN(卷積神經(jīng)網(wǎng)絡(luò))技術(shù)引領(lǐng)的人工智能行業(yè)熱潮之中,就有大量中國企業(yè)看到了打造國內(nèi)AI芯片的重要性。
在此期間,國內(nèi)陸續(xù)涌現(xiàn)出了近百家國內(nèi)AI芯片公司,其中既有如寒武紀(jì)、地平線、壁仞科技、后摩智能等的明星創(chuàng)業(yè)公司,也有如華為、阿里、百度等的科技巨頭,還有傳統(tǒng)芯片廠商與礦機(jī)廠商。
各家紛紛入局,產(chǎn)業(yè)如烈火烹油、鮮花著錦,大家的共同目標(biāo)只有一個(gè),打造自主可控的國內(nèi)AI芯片生態(tài)。
國內(nèi)AI芯片玩家們?cè)缭缇鸵庾R(shí)到了軟件、工具、生態(tài)對(duì)于芯片的重要性,因此在不斷升級(jí)迭代硬件產(chǎn)品之余,也投入了大量的時(shí)間、精力,試圖解決軟件生態(tài)建設(shè)中存在的問題。
CUDA是一個(gè)封閉的軟件平臺(tái),因此,從底層開始打造原創(chuàng)的軟件棧是打破CUDA生態(tài)壁壘的關(guān)鍵路線。