剛剛結束的 2024 世界人工智能大會論壇期間,國內外院士、專家學者齊聚「超越邊界:探索下一代大模型的基礎研究」論壇,共同探討「AI for Science 基礎設施建設」和「下一代通用人工智能方法」兩大前沿技術話題。
論壇不僅邀請到多位國內外院士,業內專家學者出席會議研討交流,還同期發布了 4 個重磅成果及產品。
中國科學院院士鄂維南在大會引言中稱:「AI for Science 在材料、生命科學、能源化工等領域落地成果的不斷涌現,讓我們看到其帶來的巨大前景。但 AI for Science 帶來的不僅僅是點狀的突破,而是系統性地帶動科學研究基礎設施的建設,推進邁向「平臺科研」時代。」
鄂院士提到,「回顧科學研究的基本資源和基本方法,無論哪個科研方向,都少不了基本原理、實驗、文獻、算力的支撐。因此,構建科學研究的通用基礎平臺,即基本原理和數據驅動的模型算法與軟件、替代文獻的數據庫與知識庫、高效率、高精度的實驗表征方法、高度整合的算力平臺,可以推動共性問題的解決。AI 方法大大提升了我們的科研能力,但是離真正解決問題還有距離,隨之而來的問題是,這剩下的『最后一公里』該如何打通。
雖然目前人工智能算法、大模型已經取得了突出的進步,但要實現下一代通用人工智能,仍需要在算力資源、數據資源、AI 數據庫能力、下一代模型和人才資源等方面持續發力。人工智能依然有很多細分領域未被探索,需與場景結合,從應用到底層技術進行創新。
我們欣喜地看到,業內已經有產品化與平臺化的成果產出,本論壇發布的四個產品就是這一趨勢的實踐案例。
OpenLAM 大原子模型
OpenLAM 是「平臺科研」與「開源共建」的一個典型代表。「語言數據的爆炸性增長孕育了大語言模型,同樣地,微觀尺度數據的累積也催生了一種創新的模型——大原子模型。」
北京科學智能研究院院長、深勢科技創始人張林峰表示「這一模型的誕生,將帶來仿真設計在時空尺度與覆蓋范圍的量級式提升,實驗表征信號將能被更好地解析,它將成為原子級生產制造的重要組成部分。」
OpenLAM 計劃已于 2023 年底正式發起,北京科學智能研究院協同 DeepModeling 開源社區以及 30 多家共建單位,并邀請了原子級建模、表征、制造以及 AI 產業的多位院士、專家組成顧問團,共同推動構建大原子模型的「社區模式」。秉承「廣泛覆蓋、謹慎評估、開源開放、開箱即用」的開發理念,本論壇上最新發布了在合金、動態催化、分子反應、藥物小分子、固態電池、半導體、高溫超導 7 個領域模型解決方案,這些模型均以開放社區的形式發展而來,并在科學智能廣場可下載。「實驗科學家的語言和視角還未與 AI 技術和數據庫形成有效的連接,為此我們開發了『晶體造句』APP,希望更多實驗科學家通過這個 APP 的窗口,來發現并合成更多人們尚未充分探索的材料。」
![AI 為什么是下一代科研的基礎設施?](http://www.dfulqf.cn/uploads/image/2024/0711/1A20241V0.jpg)
Science Navigator 1.0: 新一代科研文獻開放平臺
AI for Science 的各項基礎設施正在全面落地建設,不僅僅是 OpenLAM,本次論壇還同期發布了 AI for Science 的另一重要基礎設施,替代文獻的數據庫和知識庫的優秀實踐產品——Science Navigator 1.0。
當前,對學科交叉檢索、原文內容溯源、科研數據解讀的需求已經遠遠超出了傳統文獻檢索工具的能力范圍,新一代科研文獻開放平臺 Science Navigator 應運而生。「Science Navigator 強大的自然語言對話式檢索能力,能夠迅速定位到科研工作者所需的信息,且回答可溯源到文獻原文。」北京科學智能研究院副院長李鑫宇介紹道,「AI 向量數據庫疊加大語言模型讓訓練和推理成本大幅降低,等效實現 3-6 倍參數量模型效果。Science Navigator 1.0 不僅僅是一個為科研工作者量身打造的 AI 平臺,它更是一個全新的科研生態系統。Science Navigator 開放了絕大部分能力的 API 接口,使用者可以在這個平臺的基礎上構建自己的應用和智能體,以滿足科研復雜的個性需求,釋放更多的時間精力在解決關鍵問題與創新思考上。」
![AI 為什么是下一代科研的基礎設施?](http://www.dfulqf.cn/uploads/image/2024/0711/1A20243561.jpg)
憶³大模型
那么下一代通用人工智能模型是什么樣的?論壇上的專家們也給出了各自的見解。其中之一是類比人腦記憶與思考方式的記憶分層大模型。目前記憶分層的大模型已經在上海算法創新研究院實現。
會上,上海算法創新研究院大模型中心負責人熊飛宇發布了最新科研成果——憶³大模型(Memory³),該模型創新地引入了顯性記憶機制,顯著提高了性能并降低了訓練與推理成本。憶³在傳統的模型參數(隱性記憶)與上下文鍵值(工作記憶)之外,增加了第三種形式的記憶——顯性記憶。模型無需訓練即可將文本轉換為顯性記憶,并在推理時快速且稀疏地使用記憶。通過外部化模型存儲的知識,顯性記憶減輕了模型參數的負擔,進而提高了模型的參數效率與訓練效率,使基準測試上憶³能夠實現約 3 倍參數量模型的性能。
基于憶³架構的 AI 搜索引擎,利用顯性記憶的快速讀寫,使回答的時效性更強,準確率更高,內容更完整,還能夠根據用戶的反饋實時更新和優化答案。隱性記憶使搜索引擎能夠理解復雜的上下文關系,提供更精準和個性化的搜索結果。基于憶³的特性,這款 AI 搜索引擎不僅提高了用戶的搜索體驗,還在信息檢索領域樹立了新的標桿。此外,憶³已在金融、媒體等行業落地應用。
![AI 為什么是下一代科研的基礎設施?](http://www.dfulqf.cn/uploads/image/2024/0711/1A20223642.jpg)
MyScale AI 數據庫
隨著以深度學習、大模型為代表的 AI 技術迅速發展,圖像、視頻、文本、語音等的非結構化數據處理的需求和能力也有了爆發式的增長。
高維向量是非結構化數據的統一語義表征,但主流的向量數據庫存在通用數據管理能力不足,面對海量數據時性能、可擴展性不佳的問題,難以應對大規模復雜 AI 應用的需求,而 MyScale 的初衷就是克服這些問題并成為 AI 時代的數據底座。
墨奇科技聯合創始人/CTO 湯林鵬介紹道,「MyScale 是國際上首個專為大規模結構化和非結構化數據處理設計的 AI 數據庫,支持海量結構化、向量、文本等各類異構數據的高效存儲和聯合查詢,綜合性能比國內外其他產品提高 4-10 倍。在實際生產中,MyScale AI 數據庫成功扮演了大模型+大數據雙輪驅動下的統一 AI 數據底座。在金融文檔分析、科研文獻智能問答分析、企業私域知識管理、工業/制造業智能化、零售行業客戶服務、人力資源行業智能化、法律行業智能化等應用場景中均幫助客戶創造了巨大價值,加速了大模型和場景數據結合的技術創新和應用落地。」
![AI 為什么是下一代科研的基礎設施?](http://www.dfulqf.cn/uploads/image/2024/0711/1A2022C43.jpg)
未來,從現在出發。在不斷探索人工智能邊界的道路上,培植下一代通用人工智能方法、完善 AI for Science 的基礎設施極為關鍵,它將推動科技向前發展,解鎖以前難以想象的創新可能性。