The Information 報道,微軟正在開發(fā)一種名為MAI-1的新型人工智能大模型,該模型有可能與谷歌、Anthropic以及OpenAI的最先進模型相媲美。這意味著微軟自從向OpenAI投資超過100億美元尋求合作以來,首次自行研發(fā)如此規(guī)模的內(nèi)部人工智能模型。而此前,OpenAI的GPT-4不僅為ChatGPT提供支持,也為Microsoft Copilot提供服務(wù)。
據(jù)說內(nèi)部被稱為MAI-1的LLM預(yù)計最早將于本月首次亮相。MAI-1 的開發(fā)由前Google AI領(lǐng)導(dǎo)者Mustafa Suleyman負責,他最近擔任AI初創(chuàng)公司Inflection的首席執(zhí)行官,之后微軟于今年3月以6.5 億美元收購了這家公司的大部分員工和知識產(chǎn)權(quán)。盡管MAI-1可能建立在前Inflection員工帶來的技術(shù)之上,但據(jù)報道認為,正如兩位熟悉該項目的微軟員工所證實的那樣,它是一種全新LLM。
MAI-1擁有大約5000億個參數(shù),這將比微軟之前的開源模型Phi-3要大得多,需要更多的算力支撐和投喂數(shù)據(jù)。該模型初步可定位為介于GPT-3和GPT-4之間,這樣的配置在提供高響應(yīng)精度的同時,其推理功率比OpenAI的旗艦LLM可低得多,且完全不同于Meta和 Mistral的700億參數(shù)等較小模型。
微軟可能會使用來自Inflection AI的訓(xùn)練數(shù)據(jù)和之外的其他內(nèi)容資產(chǎn)來為MAI-1提供訓(xùn)練源,據(jù)說該模型的訓(xùn)練數(shù)據(jù)集還包括包括GPT-4生成的文本和網(wǎng)頁內(nèi)容。目前微軟正在使用配備Nvidia算力卡的“大型服務(wù)器集群”來進行開發(fā)過程。
盡管目前尚不清楚MAI-1的具體用途,如果該模型表現(xiàn)前景良好,微軟可能會在5月16日召開的 Build開發(fā)者大會上推出MAI-1。顯而易見的是,最理想的用途取決于首次登臺時的性能。