2024年下半年以來,生成式AI的行業焦點逐步從模型端向應用層轉移。除了在搜索、教育等應用領域的進展之外,人工智能在硬件領域的突破,如AI手機,也成為備受矚目的創新趨勢。
在剛剛舉行的2024 vivo開發者大會上,vivo正式發布“藍心智能”全新AI戰略,將大模型技術與手機操作系統深度融合,利用AI賦能OS,給用戶帶來更自然、更“懂我”、更普惠的智能體驗。同時發布了全面升級的自研藍心大模型矩陣、OriginOS 5、藍河操作系統2,以及在安全、人文、生態合作等方面的最新成果。
vivo副總裁、OS產品副總裁周圍認為,真正的技術價值是要回到生活,回到用戶本身,把體驗做到極致。AI手機也要從這一思路出發。周圍介紹,過去11個月,vivo在AI領域核心做了三件事,其一,用AI賦能傳統的產品功能,使其變得更強大;其二,構建一系列系統的公共能力,不僅是自用,還要開放給行業第三方;其三,打造具有樣板性的小智能體,讓行業都來用。
三個“重構” vivo發布“藍心智能”戰略
當前,國內廠商競相推出搭載生成式AI技術的智能手機,各自的戰略也有所區別。vivo對于AI手機的定義分三個方面:一是要完整地重構用戶交互體驗;二是重構整個數字世界,整合vivo自有技術和第三方的能力,積極擁抱智能體,同時要確保記憶功能和數據處理能力,保護用戶的隱私和數據安全,讓手機成為個人助理。三是真正幫助人們在生活工作中提高效率,解決痛點問題,來連接社會、管理自我。
從這三方面出發,vivo此次發布的AI戰略“藍心智能”,從3個方向上進行實踐:重構人與設備的交互體驗、重構人與數字世界的服務體驗、重構人與物理世界的溝通體驗。
當AI能力與OS系統進一步融合,交互體驗應變得更自然、更符合直覺。vivo探索了更符合直覺的人機溝通方式,比如以圈選、拖放為代表的自然手勢,和支持多種語言互譯、更情感化的人機自然對話。
在生成式人工智能的推動下,人類與數字世界的服務體驗正迎來一次革命性的重構。vivo則致力于讓智能更加個人化。首先,依托AI技術對手機的基礎功能進行全面升級,讓輸入法、電話、筆記、掃描等15項剛需功能煥然一新,還構建了平臺化的AI公共能力。其次,搭建連接服務的框架和平臺,包括為開發者搭建的集合開發和分發于一體的智能體平臺,以及針對輕量化和原子化的服務構建的完整的意圖框架體系,讓人找服務的同時,服務也主動匹配人的需求。第三,構建個人智能系統框架,讓手機成為專屬個人助理。
人工智能的觸角不僅延伸至數字領域,更深刻地影響著我們所生活的物理世界。手機本質上鏈接的是物理世界的人與人。vivo利用多模態大模型,讓手機成為視障人士的眼睛,幫助他們可以獨自安全地走到更遠的陌生的地方,去探索世界的美好。
端側模型小而強大 多模態大模型首次亮相
基于全新的AI戰略,vivo發布了新一代藍心大模型矩陣,不僅升級語言大模型和端側大模型能力,其自研的語音大模型、圖像大模型以及多模態大模型也首次亮相。
其中,千億級藍心大模型的云端能力,重點優化意圖理解與分發、任務規劃能力。相比去年,其整體能力提升30%,并在CMMLU和SuperCLUE的榜單上繼續領跑國內第一梯隊。
30億參數的全新藍心端側大模型3B,在對話寫作、摘要總結、信息抽取等能力上可以越級比肩行業7B-9B模型。相比藍心7B模型,其性能提升300%,平衡模式下功耗優化46%,出詞速度可以達80字/s,系統功耗僅450mA,內存僅占用1.4GB,打破了“模型小、能力強、功耗低“的不可能三角定律,實現了以小搏大的效果。
在SuperCLUE和南開大學端側5B小模型綜合能力評測中,藍心大模型3B均排名第一,并且同時獲得泰爾實驗室端側大模型綜合能力認證以及AIIA安全防范能力認證。
此外,vivo還發布了自研藍心語音大模型,可準確理解自然語義、感知情緒、模擬人聲,并且支持中英日韓泰同聲傳譯,以及超過15種語言互譯。