繼將馬斯克畫(huà)成黑人后,谷歌再次翻了車(chē)。(虎嗅注:今年2月份,谷歌的Gemini在推出文生圖功能幾周的時(shí)間內(nèi),被用戶(hù)發(fā)現(xiàn)該平臺(tái)刻意拒絕生成白人形象。對(duì)此谷歌方面表示加快改進(jìn),暫停人物圖片的生成功能。)
此次谷歌又犯了前科。在5月15日推出這一AI搜索引擎功能后,有不少用戶(hù)在使用過(guò)程中發(fā)現(xiàn)谷歌的AI Overviews會(huì)“胡言亂語(yǔ)”,對(duì)搜索的問(wèn)題給出有違常識(shí)的、荒謬的解決方案。比如,兔子曾經(jīng)作為密爾沃基鷹隊(duì)的后衛(wèi)在NBA打過(guò)球、金毛犬可以生下奶牛、建議人們每天至少吃一塊小石頭……
此外,谷歌的人工智能搜索系統(tǒng)有時(shí)會(huì)難以解決基本的數(shù)學(xué)問(wèn)題和方程式。例如,詢(xún)問(wèn)2000年美元的相對(duì)價(jià)值,會(huì)返回一個(gè)荒謬的答案,即“2000 年至 2023 年期間價(jià)格累計(jì)上漲 -43.49%”(根據(jù)谷歌自己引用的通脹計(jì)算器,當(dāng)時(shí)價(jià)格實(shí)際上漲了77% );又或是認(rèn)為2024年10月至2025年1月之間有 738,523 天。
AI Overviews是谷歌在5月15日的I/O大會(huì)上高調(diào)推出的新型AI搜索引擎,由Gemini大模型驅(qū)動(dòng),展示在谷歌搜索的頁(yè)面頂部,可總結(jié)提煉用戶(hù)查詢(xún)內(nèi)容的概要。在I/O大會(huì)上,谷歌稱(chēng)該功能將“重新定義搜索體驗(yàn)”。由于這一功能的推出,一些專(zhuān)家甚至將這一天稱(chēng)為 Google 搜索的“零日”。 2023年5月推出的Search Generative Experience是AI Overviews的測(cè)試版。CEO 桑達(dá)爾?皮查伊曾表示,在測(cè)試版推出后谷歌已經(jīng)處理了超過(guò) 10 億次查詢(xún)。
之所以會(huì)犯這樣的錯(cuò)誤,最直接原因是Reddit網(wǎng)站網(wǎng)友評(píng)論的錯(cuò)誤數(shù)據(jù)。谷歌的大模型以Reddit上的帖子作為學(xué)習(xí)資料,在數(shù)據(jù)清洗與訓(xùn)練環(huán)節(jié)出現(xiàn)紕漏,因而出現(xiàn)了“大模型致幻”。
事實(shí)上,谷歌這樣“滿(mǎn)紙荒唐言”并非個(gè)例。
谷歌之外,OpenAI、Perplexity、You.com等無(wú)一幸免,均出現(xiàn)過(guò)不同程度的失誤。為了增強(qiáng)對(duì)話(huà)的擬真性和數(shù)據(jù)的全面性,這些AI搜索功能都將Reddit等社交平臺(tái)作為模型訓(xùn)練的數(shù)據(jù)庫(kù),甚至奧特曼本身便是Reddit的投資人。
但Reddit等社區(qū)上的發(fā)言良莠不齊,顯然AI在內(nèi)容真實(shí)性和可靠度方面的判斷力還未成熟。在常規(guī)的搜索中,這些來(lái)自隨機(jī)互聯(lián)網(wǎng)用戶(hù)的惡作劇帖子可能不會(huì)成為人們點(diǎn)擊網(wǎng)絡(luò)鏈接列表時(shí)看到的首個(gè)答案。但有了AI Overviews后,這些惡作劇帖子就被整合到結(jié)果頁(yè)面頂部顯示的權(quán)威數(shù)據(jù)摘要中。
本質(zhì)上,AI Overviews此次出現(xiàn)的問(wèn)題是人工智能幻覺(jué)的一種新變體,當(dāng)生成式人工智能模型提供虛假或誤導(dǎo)性信息并將其呈現(xiàn)為事實(shí)時(shí),就會(huì)出現(xiàn)幻覺(jué)。幻覺(jué)是由有缺陷的訓(xùn)練數(shù)據(jù)、算法錯(cuò)誤或?qū)ι舷挛牡恼`解造成的。
HITCon安全會(huì)議上的相關(guān)研究成果顯示,僅僅需要“污染”不到0.7%的數(shù)據(jù)集,就能有效規(guī)避防御機(jī)制,導(dǎo)致大模型輸出的內(nèi)容準(zhǔn)確性大幅下降。當(dāng)大模型被投喂的數(shù)據(jù)集含有誤導(dǎo)性信息時(shí),其給出的結(jié)果必然同樣失真。
對(duì)此,紐約大學(xué)的AI專(zhuān)家和神經(jīng)科學(xué)榮譽(yù)教授加里?馬庫(kù)斯(Gary Marcus)曾表示,AI模型天生無(wú)法對(duì)自己的工作進(jìn)行理性檢查,而這正是這個(gè)行業(yè)的致命傷。
而谷歌發(fā)言人梅根?法恩斯沃斯則表示,“用戶(hù)展示的事例都是不常見(jiàn)的查詢(xún),并不代表大多數(shù)人的經(jīng)歷,我們也看到了一些被篡改或我們無(wú)法復(fù)現(xiàn)的例子”“絕大多數(shù) AI 概覽查詢(xún)都產(chǎn)生了高質(zhì)量信息,并提供了深入挖掘網(wǎng)絡(luò)的鏈接”。谷歌將使用有問(wèn)題答案的“孤立例子”來(lái)完善其系統(tǒng)。