生成式AI推動大數據時代向大智能時代躍遷
產業觀察家們注意到生成式AI的革命性意義,并作出豐富解讀。英偉達創始人兼首席執行官黃仁勛稱生成式AI的推出為“AI產業的iPhone時刻”,意指其顛覆性的技術突破和產品形態或將引發Al產業的全面變革。投資公司a16z的合伙人馬丁·卡薩多(Martin Casado)則稱其為“第三個計算時代”,意指繼微芯片將計算的邊際成本降到零、互聯網將分發的邊際成本降到零之后,大模型將創作內容的邊際成本降到零的第三次飛躍。麥肯錫技術合伙人萊瑞拉·余(Lareina Yee)則將其類比為計算產業經歷過的大型機到PC的劇變,意指生成式AI將技術使用權從精英轉向大眾,實現了AI技術的民主化。然而,以上解讀局限于AI產業自身,沒有考慮生成式AI如何重塑更廣泛的經濟。筆者認為,生成式AI和大模型有潛力成為整個國民經濟智能基礎設施,進而奠定所謂的大智能時代。
生成式AI,有何不同
不同于專注解釋現有數據的分析式AI或根據給定輸入推斷輸出的預測式AI,生成式AI專注于生成新內容,或稱合成數據(synthetic data)。ChatGPT僅是大模型的一種,準確地說,它僅是文本大模型的一種。文本大模型之外,還有音頻大模型和視覺大模型。最近,大模型已發展至具備多模態對話能力。
不同于預設規則或者試圖尋找結構化規則的傳統AI,生成式AI直接從海量未經標簽化的非結構化數據中提取基礎模型(foundation model)。由于基礎模型的參數巨大,常被稱為大模型。大模型的訓練極端昂貴,但具備一系列傳統AI模型不具備的優勢:一是其采取的非監督訓練的方式極大地降低了人工標注的需要;二是模型具有更好的通用性,可靈活應對多種任務;三是大模型可以理解并使用人類語言,交互體驗非常自然。
歸根到底,大模型是人類全量知識的壓縮。傳統AI利用有限的知識(預設的算法)從豐富的場景數據中提取結果,而大模型利用近乎完備的知識去解讀場景數據(盡管它不一定豐富)。
大模型作為智能基礎設施
生產力的進步通常體現為某種新型基礎設施的建立。工業時代出現電力基礎設施,網絡化時代出現網絡基礎設施,而智能時代將出現何種基礎設施?筆者斷言大模型具備成為智能基礎設施的潛力,因其具備基礎設施的三個基本特征。
一是通用性。傳統AI需要針對特定任務設計,表現出更多的專用性與垂直性。相比之下,經過高強度預訓練的大模型具備靈活應對多種非預設任務的能力,可通過微調及提示詞工程實現應用情景的高擴展,進而在通用性上大大提升。
二是規模經濟。大模型的規模經濟與兩個概念有關。一是智能涌現。只有模型參數規模超越臨界點之后,智能才開始涌現。工業經濟情景下,低于最小有效生產規模的廠商無法有效參與市場競爭。類似地,廠商必須投入高昂的前期訓練成本,才能參與大模型市場競爭。二是智能摩爾定律。傳統摩爾定律預測硅片上的晶體管密度隨時間推移指數級增長,而成本保持不變。智能摩爾定律則預測大模型智能所能覆蓋的場景數(智能密度)具有類似的規律。這意味著,隨著大模型參數的增長,其覆蓋智能場景的單位成本呈指數級降低。
三是外部性。修好的路上不跑車,價值等于零。盡管大模型語境下的“車”是什么尚未完全確定,但確定的是大模型的出現將促進各類“車型”的創新。因此,大模型對經濟的推動作用要遠遠大于生成式AI產業產值本身。聊天類應用僅僅是大模型應用的初級形態,創意和想象力與未知場景結合迸發出的產業能量,才是大模型作為基礎設施最具想象空間之處。
通用性、規模經濟和外部性是基礎設施的一般性特征。那么,大模型作為智能基礎設施的特殊性何在?筆者認為,這是人類歷史上第一次實現智能的大規模集中供給,故而稱其為智能基礎設施。難道數字化時代不是已見證林林總總的智能化基礎設施嗎(如智能手機、智能電網、智能交通等)?此處需澄清,智能的基礎設施化不同于基礎設施的智能化。智能手機的核心是手機,智能電網的核心是電網,智能交通的核心是交通,賦予其各種智能內涵的過程是基礎設施的智能化。智能基礎設施的核心則是相對通用的智能本身,能對接千行百業。過去幾十年,數字化基礎設施圍繞信息的采集、處理、傳輸、存儲、計算等環節得到充分發展,而智能基礎設施的發展才剛剛開始。
從大數據時代到大智能時代
每輪基礎設施躍遷都會引發一輪新商業機遇。這是因為,基礎設施將此前需要分散承擔的可變成本轉化為集中承擔的固定成本,推動新要素普及、降低創新門檻。智能基礎設施帶來的新要素就是智能:大模型壓縮了人類所有知識,將場景數據輸入大模型,大模型就能根據其知識反饋相應結果。當這種智能產生模式廣泛應用,我們或將見證前所未有的大智能時代。
筆者認為,大智能時代區別于大數據時代的核心特征是數據與智能的解耦。谷歌常因所謂數據網絡效應被反壟斷機構約談:搜索引擎的市場份額越大,用戶數據就越多,數據訓練出來的機器算法也就越智能,用戶體驗進一步提升,進而獲取更大的市場份額。曾鳴教授更是基于阿里巴巴的類似經驗,提煉出以“數據智能”為基石的“智能商業”方法論。這種思維強調企業構建的數據飛輪是智能商業的前提:無數據,不智能。
在大智能時代,這一圭臬在產業層面仍然成立,但在企業層面的應用卻值得推敲:智能不再完全來自于企業自身構建的數據飛輪。數據作為智能原料的地位無可撼動,然而,大模型使用這種原料的效率遠超過此前分散部署的“小模型”,以至于有志于“智能商業”的企業構建自身數據飛輪喪失經濟性。國家電網能穩定輸出電力時,為何要在工廠旁邊自建小發電廠呢?
智能基礎設施化的后果之一是數據與智能的解耦(見圖1)。數據與智能的解耦并不意味著數據不重要,而意味著小數據也可以撬動大智能。當前,大模型的進一步發展面臨高質量數據源不足的障礙,可見數據的重要性。但這不意味著任何企業都需要花心思囤積數據。過去,企業要精心構建并維護一個數據供應鏈,才有可能實現所謂的數據智能。而今,大模型使得智能不需要在低水平重復開發。企業只需要用小數據去微調這個模型,便有可能開展“智能商業”。由此,企業可節省精力聚焦業務創新,釋放出所謂——智能紅利。
生成式AI產業生態的三大維度
立足當下,本部分嘗試從三個視角來把握高度動態復雜的生成式AI產業生態。一是供給側視角的技術生態,有助于理解生成式AI技術實現所需的生產要素;二是需求側視角的應用生態,有助于了解生成式AI的應用方向;三是中美競爭背景下的區域生態,有助于理解需求側和供給側在不同條件下的互動模式。
生成式AI技術生態
大模型技術生態符合典型的IT垂直分工架構。最底層是基礎設施,負責提供大模型訓練以及推理所需的算力。產業初期,算力主要用于模型預訓練。隨著各大模型紛紛商用,用于響應用戶請求所需的推理算力占比快速增加。眾所周知,大模型的算力需求主要由GPU(圖像處理單元)來滿足,NPU(神經網絡處理器)和TPU(張量處理器)等專為大模型推理運算設計的芯片也逐步成熟。NPU主要用于手機、無人機等終端產品的計算單元,TPU是谷歌設計的云計算芯片。值得注意的是,硬件集群只是基礎設施的一部分,負責硬件資源調度的云平臺也非常重要。
基礎設施之上是大模型。大模型有開源和閉源之分。Open AI的GPT是一個閉源模型,而2023年7月,Meta的Llama II宣布支持開源和商用,引爆了大模型領域的開源運動。選擇開源模型還是閉源模型,似乎和應用有關。chatGPT、Midjourney等廣受歡迎的面向消費(2C)領域的應用都構建在私有大模型之上。但面向企業(2B)領域的應用通常構建在開源大模型之上,因為開源大模型支持私有化部署,并在微調方面提供了更大的靈活度。
值得指出的是,大模型層與應用層之間存在一個中間層,旨在幫助應用開發者解決兩方面問題。一方面,基于大模型做二次開發 (微調、提示詞工程或基于人工反饋的增強學習)需要一系列工具或模板;另一方面,由于市面上存在多種大模型,應用開發者可能希望一站式接入和管理。所謂MaaS(模型即服務)集成了這些工具和功能。
大模型應用生態
技術生態主要是巨頭和工程師的場域,應用生態則是創業者和產品經理的沃土。在技術生態部分,應用層在技術堆棧中的位置得到了強調。本部分談及的應用生態從需求側視角展開,根本上是要回答大模型如何對接應用場景、創造用戶價值。這個問題可以沿著兩個維度思考:客戶屬性和產品策略。
一方面,2C領域和2B領域的大模型應用在價值創造方面具有顯著差異。首先,消費類應用的價值創造幾乎都在應用內完成,而企業級應用需要與企業內部價值鏈和IT系統整合。其次,消費類應用幾乎都基于公有云,而企業客戶因隱私顧慮偏好私有云或混合云部署。最后,消費類應用通常以一對多的方式提供服務進而迅速規模化,而企業級應用服務通常需要一對一定制。以上2C和2B客戶市場的一般性差異,并不因大模型技術的開創性而改變。可見,2C應用的價值創造具備獨立性,而2B應用的價值創造高度依賴其他互補性資源。進而,2C應用有望構建出一個以自身為中心的生態,而2B應用通常嵌入在位玩家(包括客戶)的生態中。
另一方面,無論是2B還是2C,大模型應用可考慮增強、替代或整合三種策略。增強策略為現有產品或服務加入大模型性能,進一步提升產品體驗。比如,Office產品中嵌入了基于大模型輔助工具(Copilot)或者視頻游戲中引入大模型生成個性化劇情。替代策略則把大模型應用作為生產力工具替代原有的低效流程。比如,在客服行業,替代正在大規模發生,一部分營銷設計工作也有望在大模型的支撐下實現自動化。相較于增強現有產品和替代低效流程,整合策略跳出了現有產品或流程,重新定義客戶體驗。筆者避免使用顛覆一詞,因為這種重新定義很大程度上是基于重組現有要素發生的。大模型并不創造要素,但提供了高超的整合能力(如通過智能體即Agent進行整合)。
上述兩個相對獨立的維度可以構建出一個2X3的矩陣。這個矩陣中的一些格子看起來比另外一些格子更令人興奮。但一個機會令人興奮的程度,通常與其進入門檻成正比,與最終勝出的概率成反比。最終,這個矩陣會被具有不同資源稟賦和風險偏好的創新者(或創新采納者)所填滿,構成一個復雜而多元的大模型應用生態。
生成式AI的區域生態
產業不可避免地嵌入在區域中。縱觀全球,生成式AI的產業競爭主要在中美之間開展。對于中美AI產業的一般性對比分析不是本文的重點。本文主要關注的是兩國區域條件的差異如何影響技術生態、應用生態以及兩者之間的良性反饋。
靜態對比,中美兩國在技術生態方面的差距并不致命。誠然,美國在聚集、培養生成式AI技術人才方面具有顯著優勢。并且,GPU出口管制在很大程度上也增加了中國企業的成本,但同時要看到我國有三個方面的有利因素。第一,得益于開源運動的知識溢出效應,中美技術差距并沒有大到足以阻礙中國的產業進步;第二,中國企業對開源的貢獻也日益顯著,中國也吸引了一些頂級科學家回國創業;第三,盲目的科技軍備競賽并不可取,大模型產業競爭的焦點已轉向工程化和商業化。
令人擔憂的反倒是中美應用生態的差距。高科技產業的發展,短期內可以靠資本維系,長期則需要靠市場來支付發展所需的成本,包括消費者側和企業側的支付。然而,中國消費者的付費能力遠不如美國消費者。中國移動通信用戶的月均支出約為50元,美國約為50美元,但中國企業購買GPU的成本要高于美國企業。在2B市場,先不論支付能力,中國企業數字化水平低首先就是一個大問題,尤其體現在SaaS(軟件即服務)的低滲透率上。大模型應用更容易部署到SaaS化程度較高的企業,因其底層數據治理較規范,流程標準化程度較高。SaaS化程度不高的企業需花費大量時間、精力和資源去做前期準備,這會導致大部分企業淺嘗輒止或望而卻步。
值得強調的是,中國在移動互聯網時代的“場景優勢”在生成式AI產業是不成立的。場景優勢建立在迭代之上,而迭代的前提是發展用戶。縱觀所有國內大模型企業,沒有一家像推廣移動互聯網應用程序那樣去不遺余力發展用戶。關鍵原因在于,移動互聯網應用程序服務一個新用戶的邊際成本幾乎為零,而大模型應用發展一個用戶的邊際成本恒不為零。在商業模式清晰之前,地主家也沒余糧這么燒。
如果說中國移動互聯網的成功經驗之一在于前端場景優勢與后端技術進步的正反饋,筆者擔心中國生成式AI產業正在經歷一個截然相反的過程。從這個動態視角再去看待中美之間技術生態的差距,恐怕會得到與靜態對比不同的結論。
幾點思考與建議
據說,人們容易高估一件事的短期影響但低估其長期潛力。關于生成式AI產業,本文的觀點恰好相反:筆者長期看好其作為智能基礎設施的前途,但短期內對其結構性障礙持悲觀態度。前文沒有論述中美生成式AI產業發展面臨的共性挑戰,而是聚焦中國相對于美國的比較劣勢。那么,中國有沒有比較優勢呢?筆者相信,發揮以下三方面的比較優勢或有助于彌補劣勢:移動互聯網生態、產業協同治理和商業模式創新。
一是打通移動互聯網生態與生成式AI產業生態。我國移動互聯網產業在網絡、終端與應用環節具備端到端的競爭優勢,有望加持孱弱的2C生成式AI應用生態。比如,微信生態如何引入生成式AI、國產手機操作系統如何與生成式AI融合、云網一體如何助力AI算力網絡效率提升等議題都應沿著如何利用業已建立的比較優勢去哺育生成式AI產業的思路去思考。
二是推動智能產業群協同發展。智能基礎設施的建設需要整合算法、算力和數據等要素,是數字基礎設施和數字資源體系的有機融合和升級。支持數字基礎設施運營企業向智能基礎設施運營企業升級,實施算力、數據、算法的一體化運營。在需求側,通過降低各行業使用生成式AI的成本,拉動應用、工程、運營等配套服務的發展。
三是堅定鼓勵商業模式創新。生成式AI產業面臨的問題歸根到底是價值創造和價值分配的問題,即商業模式。無論是打通移動互聯網生態還是推動產業協同發展,都旨在為生成式AI生態的發展創造一個更廣闊的環境和更堅實的基礎。這些比較優勢能否有效轉化并彌補上述比較劣勢,商業模式起決定性作用。