4月22日,騰訊宣布旗下協作SaaS產品已全面接入騰訊混元大模型,包括企業微信、騰訊會議、騰訊文檔、騰訊樂享、騰訊電子簽、騰訊問卷、騰訊云AI代碼助手等。
去年9月推出的騰訊混元,上線之初就強調“實用性”,從最初有超50個騰訊產品接入至今,騰訊內部已有超400個業務在內測騰訊混元。此外,騰訊混元也在零售、教育、金融和醫療等行業落地應用。
如今,隨著騰訊旗下協作SaaS產品全部基于騰訊混元實現智能化升級,也意味著騰訊混元的落地腳步進一步提速。
不過從行業角度,大模型究竟如何落地并沒有明確方向,各個企業也都是摸著石頭過河。騰訊在產品優化以及商業模式上的思考,或許能給行業提供借鑒。
模型升級為MoE架構
此前,騰訊混元完成了架構升級,從原先的Dense架構升級為MoE(Mixture of Experts)架構,并將模型擴展至萬億級參數規模。
騰訊混元模型應用負責人張鋒向21世紀經濟報道記者表示,相比原有架構,MoE架構有兩個優勢:一是模型參數量更大,可吞吐更多tokens;二是實際激活量較小,可顯著降低訓練推理成本。
據其介紹,去年10月,MoE架構效果就已超過Dense架構。同年11月,騰訊混元開始把MoE上線產品內測。目前,騰訊混元已經正式完成MoE架構升級。
有技術人士向記者表示,MoE架構是一種神經網絡架構,它是通過多個專家(Experts)模型來處理輸入數據的不同任務。
簡單來說,MoE架構的核心邏輯就是將輸入數據分配給最適合處理該數據的專家。而且這種架構允許模型通過增加專家的數量來擴展,從而提高了模型處理特定任務的能力。
中信證券在一份研報中指出,隨著大模型體量增長,多模態能力和推理效率成為業界競爭新焦點。Dense架構在處理圖像、視頻等非結構化數據時效率較低,預計未來1~2年MoE等新型架構將成為主流。
在架構完成升級后,騰訊混元的能力也確實得到了提升。在今年3月份發布的財報中,騰訊提到,“在部署了MOE架構等前沿技術后,我們的基礎模型混元在多輪對話、邏輯推理和數字推理領域表現出色,這些對大型語言模型來說一直是個挑戰。”
而這些獲得提升的模型能力,也被直接應用到了騰訊產品中。張鋒表示,騰訊業務使用混元模型,主要有兩種方式,一個是直接API調用,另外就是基于混元一站式平臺進行精調。
目前,騰訊混元對外開放了不同尺寸的模型,以滿足不同業務的需要。騰訊樂享總經理周芝芝表示,樂享在接入混元時,只有智能出題功能是基于混元進行精調,剩下的很多功能,比如智能創作、智能提煉課程知識點、智能撰寫活動方案等,都是用混元公開的API能力。
商業模式有待摸索
除了樂享,騰訊的其他協作SaaS產品也都推出了一些新功能。
比如騰訊電子簽提升了合同起草、審閱效率,并可以智能篩查風險;騰訊AI代碼助手向開發者提供了代碼補全、代碼診斷、單元測試等功能;騰訊會議推出AI小助手、智能錄制、實時字幕翻譯等功能;騰訊文檔則讓用戶可以通過一句話指令即可快速處理各種文檔。
在與記者交流時,這些產品的負責人都表示,他們在開發相關功能時,并沒有硬靠AI,而是過去業務里本身存在的大量痛點,用原來的技術解決不了,現在用大模型技術進行解決。
雖然業界都期望大模型原生產品的出現,但現階段,改造原有產品是大模型最可行的落地路徑。因為原有產品的需求是明確的,通過解決這些需求,能夠加速大模型技術的普及,進而推動大模型向更高階的智能進化。
而在商業化方面,騰訊也沒有急于將大模型能力變現。周芝芝向21世紀經濟報道記者表示,樂享的AI助手主要是依附在原有版本之上。“AI只是樂享能力的升級,所以AI助手的定價是基于原有版本做增值,以增購項的方式來設計。”
比如現在樂享的收費模式是license方式,即按照每人每年多少錢來向客戶收取費用。針對AI功能,如果一些功能是全員使用的,那樂享就會按照一定價格在原有的費用基礎上向客戶收取;如果一個功能不是全員使用,那這部分的收費模式將是一個單獨模塊。
“但整體來說,在樂享AI的產品建設進程中,用戶體驗優先級大于收費,當前我們還是希望用戶先用起來。”周芝芝說。
同樣地,騰訊會議的AI小助手等功能也是開放給付費版本的用戶。騰訊會議云會議產品負責人朱瑩表示,“會議是一個多人協作的場景,為了讓用戶降低使用AI的門檻,騰訊會議在商業模式上也做了些設計。當一場會議的主持人是付費版本時,所有的參會成員在主持人允許的情況下,都可以嘗試使用AI小助手”。
與這些產品不同,騰訊云AI代碼助手的商業模式則更清晰。騰訊云開發者AI產品負責人丁寧向記者表示,AI代碼助手是一個插件形式的產品,所以它可以單獨售賣。而且在市場上,像GitHub Copilot已經有幾百萬的付費用戶,是按license的方式收費,騰訊AI代碼助手也會采用類似的定價方式。
眼下,大模型正處于能力提升與商業落地并行的階段。在模型能力上,繼文生文之后,文生圖片以及文生視頻等多模態能力將是大模型下階段發力的重點,而在商業落地方面,能否抓住用戶真正的痛點,不讓AI功能成為擺設,將是決定大模型應用成敗的關鍵。