5月31日消息,快手自研大模型產(chǎn)品“可圖”(Kolors)正式對(duì)外開(kāi)放,支持文生圖和圖生圖兩類(lèi)功能,已上線(xiàn)20余種AI圖像玩法。目前,用戶(hù)可以通過(guò)“可圖大模型”官方網(wǎng)站和微信小程序,免費(fèi)使用各項(xiàng)AI圖像功能。值得注意的是,可圖只需一張圖片和幾秒鐘時(shí)間,便可生成一套AI圖像。
在2024年一季度財(cái)報(bào)電話(huà)會(huì)上,快手首席執(zhí)行官程一笑介紹,今年一季度,快手穩(wěn)步推進(jìn)自研大模型各項(xiàng)性能的迭代提升,并且加快大模型在各業(yè)務(wù)場(chǎng)景的應(yīng)用。
從具體功能上看,一方面,可圖提供AI形象定制功能,即圖生圖功能,通過(guò)人像保持技術(shù),可保留人像的自然特征,一鍵生成各種風(fēng)格的人像作品。目前,可圖已上線(xiàn)10余種AI形象定制風(fēng)格玩法。另一方面,快手可圖大模型也提供AI創(chuàng)作功能,即文生圖,支持用戶(hù)自由輸入文本,生成風(fēng)格多樣、創(chuàng)意十足的繪畫(huà)作品。用戶(hù)也可以上傳參考圖,可圖將根據(jù)參考圖像的風(fēng)格、主題和細(xì)節(jié)等內(nèi)容,生成既符合創(chuàng)意描述又與參考圖相關(guān)的圖像作品。
可圖文生圖作品。圖|受訪(fǎng)者供圖
快手大模型團(tuán)隊(duì)的技術(shù)能力為產(chǎn)品提供了支撐。據(jù)官方介紹,“可圖”大模型的參數(shù)規(guī)模達(dá)十億級(jí),這些數(shù)據(jù)來(lái)自于開(kāi)源社區(qū)、快手內(nèi)部構(gòu)建和自研AI技術(shù)合成,覆蓋了常見(jiàn)的千萬(wàn)級(jí)中文實(shí)體概念,還引入強(qiáng)化學(xué)習(xí)和獎(jiǎng)勵(lì)模型技術(shù)(RLHF),解決了文生圖大模型在長(zhǎng)文本和復(fù)雜語(yǔ)義文本輸入下的效果問(wèn)題。
在畫(huà)質(zhì)提升方面,可圖模型通過(guò)優(yōu)化擴(kuò)散模型的加噪去噪理論,以實(shí)現(xiàn)對(duì)高質(zhì)量、細(xì)節(jié)豐富的圖像生成的訓(xùn)練和推理的精準(zhǔn)適配,引入了經(jīng)過(guò)優(yōu)質(zhì)專(zhuān)家標(biāo)注的圖文數(shù)據(jù)集,以提升模型性能表現(xiàn)。
去年9月,“可圖”大模型平臺(tái)已在快手開(kāi)啟內(nèi)測(cè),快手在App評(píng)論區(qū)推出的“AI玩評(píng)”和“AI小快”等多種創(chuàng)新互動(dòng)玩法,集合了文生圖、圖生圖、擴(kuò)圖等功能,也是基于可圖大模型能力。