8月29日,據彭博社報道,谷歌宣布將重新啟用其人工智能模型Gemini的人物圖像生成功能,部分訂閱了Gemini Advanced套餐的英語用戶將能夠再次使用這一功能。此外,企業用戶也將能夠利用這一工具,預計在未來幾天內全面上線。
![谷歌重啟Gemini生成人物圖像功能,解決種族描述爭議](http://www.dfulqf.cn/uploads/image/2024/0829/225P13J50.png)
谷歌產品管理高級總監戴夫·西特倫(Dave Citron)表示,公司在通過Imagin 3生成人物描述方面取得了顯著進展。他提到,團隊一直在努力提升產品的技術性能,并改進了評估集、紅隊練習以及明確了產品原則。盡管Gemini生成的圖像并非完美無瑕,但公司將繼續收集早期用戶的反饋,不斷優化用戶體驗。
所謂“紅隊練習”,是指在產品正式發布前,通過模擬使用來發現其潛在風險。西特倫強調,用戶將無法生成過于真實的圖像、可識別的個人肖像、未成年人的形象,以及涉及血腥、暴力或性場景的內容。
回顧此前事件,今年2月,谷歌的圖像生成工具曾因生成的人物圖像存在歷史不準確的問題而遭到批評。例如,在生成“美國開國元勛華盛頓”主題的圖片時,出現了女性和有色人種的形象。此外,一些用戶指出,Gemini在處理白人形象時顯得異常謹慎,甚至難以生成相關圖像。為此,谷歌于2月22日宣布暫停Gemini的人物圖像生成功能,并致力于解決相關問題,計劃在不久后重新推出改進版本。
谷歌DeepMind首席執行官德米斯·哈薩比斯(Demis Hassabis)在今年MWC 2024的一次小組討論會上也提到,公司已暫時停用了Gemini的人像生成功能,并正在積極修復問題,預計在未來幾周內重新上線。隨著此次更新,谷歌顯然希望能夠在保證內容準確性的同時,進一步提升用戶的使用體驗。