6月6日,阿里云AI 峰會在深圳召開。阿里云智能集團副總裁、公共云首席解決方案架構(gòu)師韓鴻源在峰會上表示,隨著大語言模型日漸成熟,未來當基礎(chǔ)模型泛化能力越來越強、能夠做更多處理的時候,模型微調(diào)不一定是企業(yè)最好的選擇,未來不僅要比拼大模型的能力,還要比拼模型的服務(wù)能力。
南都記者關(guān)注到,在此次峰會中,“生態(tài)”再次被阿里云提及。韓鴻源提到,阿里云在模型服務(wù)能力上的優(yōu)勢除了大模型能力和低成本,還有強大的開發(fā)者社區(qū)魔搭,據(jù)悉目前魔搭上已有超5000個模型,以及超500萬的開發(fā)者。
此外,阿里云還瞄準了終端智能場景。北科瑞聲創(chuàng)始人、國家重大人才計劃特聘專家劉軼博士在峰會上表示,電腦、手機、手表等終端是離用戶最近的信息入口,大模型與終端的結(jié)合將加快AI技術(shù)的普及。
不僅比拼大模型,還要比拼模型服務(wù)能力
阿里云智能集團副總裁、公共云首席解決方案架構(gòu)師韓鴻源在峰會上表示,目前正處在生成式AI的爆發(fā)階段,而云計算能幫助用戶降低使用生成式AI的難度、有效運用技術(shù)負載。“今天的生成式AI對所有的技術(shù)能力都提出了非常多新的挑戰(zhàn)。從計算角度來看,生成式AI對計算能力需求提升到非常高的地步,我們需要持續(xù)運行一個訓練任務(wù)到周或者月級別時長,才能拿到結(jié)果;從數(shù)據(jù)方面來講,TB、PB級的數(shù)據(jù)常態(tài)化地參與到所有的密集計算過程中,才能產(chǎn)出想要的結(jié)果;三是在開發(fā)過程中,模型的探索經(jīng)常面臨著非常多的技術(shù)基礎(chǔ)工作,而這些基礎(chǔ)工作需要有效平臺的加持才能運轉(zhuǎn);四是在部署方面,今天絕大部分與AI相關(guān)的工作都承載在云上,絕大部分組織都使用了云能力才讓AI有效地發(fā)揮作用。”
韓鴻源認為,如果把使用大模型的階段分為兩段,那么在大語言模型剛出來的階段,企業(yè)會針對特定業(yè)務(wù)方向把獨有的資源注入模型,讓模型按企業(yè)希望的方式回答問題、處理請求,這是微調(diào)階段。但未來,當基礎(chǔ)模型泛化能力越來越強、能夠做更多處理的時候,模型微調(diào)不一定是企業(yè)最好的選擇。這時候,一個新的發(fā)展方向——模型即服務(wù)(MaaS)的能力就非常重要。
南都記者關(guān)注到,在此次峰會中,“生態(tài)”再次被阿里云提及。韓鴻源提到,阿里云在模型服務(wù)能力上的優(yōu)勢除了大模型能力和低成本,還有強大的開發(fā)者社區(qū)魔搭,據(jù)悉目前魔搭上已有超5000個模型,以及超500萬的開發(fā)者。“今天大家在比拼模型之外,還要比拼模型的服務(wù)能力。希望和大家持續(xù)探討怎樣在云上進行生成式AI模型服務(wù)、構(gòu)建新一代的應(yīng)用,或者在現(xiàn)有應(yīng)用中加入更多智能能力。在模型即服務(wù)這件事上,我們提供有效運行模型的平臺,幫大家更有效、更低成本地讓模型發(fā)揮它應(yīng)該發(fā)揮的作用。除了這兩點之外,更重要的是與開發(fā)者社區(qū)有效地結(jié)合起來,為大家提供一個可以在模型上開展工作、獲取模型、把自己的成果發(fā)布出來的平臺。”據(jù)韓鴻源透露,目前通義和旗下生態(tài)模型已接入model scope、huggingface等開發(fā)者社區(qū)。
大模型軟硬結(jié)合趨勢下,智能終端將迎新爆發(fā)
北科瑞聲創(chuàng)始人、國家重大人才計劃特聘專家劉軼博士在峰會上表示,電腦、手機、手表等終端是離用戶最近的信息入口,大模型與終端的結(jié)合將加快AI技術(shù)的普及。據(jù)悉,北科瑞聲是創(chuàng)立于深圳的智能語音交互領(lǐng)域領(lǐng)軍企業(yè),目前已在智能手表、鼠標等終端解決方案中接入通義千問。通過將語音識別、語音生成技術(shù)與大模型相結(jié)合,用戶可以借助這些靈巧的終端“助理”,完成跨語種無障礙對話、病案自動錄入等動作,語音交互時延縮短至100毫秒。
在峰會上,vivo、小鵬相關(guān)負責人均透露,已在大模型領(lǐng)域與阿里云深度合作,提升產(chǎn)品智能化體驗。
在模型訓練方面, vivo基于阿里云訓練自研藍心大模型,千卡大模型預(yù)訓練性能接近LLaMA水平。目前,藍心大模型已對vivo手機的AI影像、智能助理、圖文創(chuàng)作等場景進行了全面優(yōu)化,并升級了視覺輔助產(chǎn)品“vivo看見”,使其成為行業(yè)內(nèi)首款多模態(tài)大模型視覺輔助產(chǎn)品。據(jù)悉,有了大模型的加持,“vivo看見”不僅可以在鏡頭對準周圍環(huán)境和物品時自動播報畫面內(nèi)容及文字信息,還可切換到文字、卡證、條碼等多種識別模式,并進行多輪對話,獲取更多畫面細節(jié),同時支持常見物品查找。
小鵬汽車也在會上宣布,已在智能座艙場景中新增接入阿里云通義千問。基于小鵬自研大模型XGPT和通義千問等模型升級后的車載助理“小P”可以在用戶說“有點冷”時,準確理解意圖、調(diào)節(jié)車內(nèi)溫度。在發(fā)布量產(chǎn)上車的端到端大模型后,小鵬將成為同時將大模型落地座艙和智駕的車企。
有業(yè)內(nèi)人士提到,軟、硬件結(jié)合是大模型的發(fā)展方向。特別是隨著多模態(tài)大模型的能力不斷增強,手機、個人電腦、頭顯、汽車、機器人等智能終端有望迎來新的爆發(fā)。蘋果、谷歌、特斯拉都已宣布正式入局。在國內(nèi),聯(lián)想AI PC已接入了通義千問等大模型,并于5月10日正式發(fā)售。