Google早就明確表示,今年的I/O大會將圍繞著AI展開。然而在大會開始的前一天,OpenAI帶著GPT-4o截胡,似乎打亂了Google原有的陣腳。
I/O大會開幕式期間,Google CEO皮查伊與高管總共提到121次“AI”。此刻的Google必須在兩個小時以內,祭出自己多年積累的產品服務和軟硬件優勢,與OpenAI爭奪AI領域的最高峰。
![焦慮的谷歌,軟硬件一起上 跟OpenAI拼了](http://www.dfulqf.cn/uploads/image/2024/0522/23060539500.jpg)
圖源谷歌
Gemini 的進展:
?
在?I/O 大會上,谷歌一口氣提了上百次AI,火力全開的發布了Gemini 1.5 Pro并推出了多種AI工具。 首先Gemini大模型更新,其中Gemini 1.5 Flash可以做到100萬token;Gemini Pro可以做到200萬token。相比之下,GPT-4 Turbo是12.8萬,Claude 3只有20萬。
?
?從上下文的角度,Gemini超過目前所有的大模型。 谷歌表示升級之后,Gemini 1.5 Pro 能夠同時處理 2 小時的視頻、22 小時的音頻、6 萬多行代碼或 140 多萬字。 谷歌還稱這不是終點,未來的目標是無限上下文。
此外,在 Google 辦公套件中,Gemini 也將更深度整合,提供自動整理郵件和生成數據分析表格等功能。
![焦慮的谷歌,軟硬件一起上 跟OpenAI拼了](http://www.dfulqf.cn/uploads/image/2024/0522/23060610G1.jpg)
與此同時,令人驚喜的是,Google也推出了對標sora視頻模型的產品-- Veo,可以生成長度超過 1 分鐘,分辨率最高 1080P 的“高質量”視頻,并具有多種視覺和電影風格。
![焦慮的谷歌,軟硬件一起上 跟OpenAI拼了](http://www.dfulqf.cn/uploads/image/2024/0522/23060611412.jpg)
根據谷歌官方新聞稿,Veo 具備對自然語言有先進的理解能力,能夠理解“延時攝影”、“航拍風景”等電影術語。用戶可以使用文本、圖像或視頻提示來指導他們所需的輸出,谷歌表示,這樣產生的視頻“更加連貫一致”,在整個鏡頭中人物、動物和物體的動作也更加逼真。
AI搜索全面升級:多輪推理、視頻搜索、AI概覽
谷歌宣布,到今年年底,谷歌搜索的AI概覽將超過10億人。這意味著,谷歌搜索將更加智能,能夠為用戶提供更準確、更相關的信息。此外,谷歌搜索還將很快推出多輪推理能力,可將復雜問題分解處理,并將原本需要幾分鐘甚至幾個小時的研究壓縮到在幾秒鐘內完成。
在視頻搜索方面,谷歌將支持用戶通過拍攝視頻來進行搜索。例如,用戶可以通過拍攝電唱機,來獲取故障排除相關的AI搜索概述。
![焦慮的谷歌,軟硬件一起上 跟OpenAI拼了](http://www.dfulqf.cn/uploads/image/2024/0522/23060640393.jpg)
Gemini 在 Android 上的整合:Gemini賦能安卓,打造最強AI手機
谷歌將Gemini大模型嵌入到安卓操作系統中,打造了首個內置端側AI的移動操作系統。這意味著,安卓手機用戶將能夠享受到更智能、更便捷的AI體驗。
![焦慮的谷歌,軟硬件一起上 跟OpenAI拼了](http://www.dfulqf.cn/uploads/image/2024/0522/23060LH14.jpg)
具體來說,谷歌在安卓系統中增加了以下AI功能:
- 畫圈即搜:用戶可以直接在手機屏幕上圈出不懂的問題,Gemini就會給用戶一步步的問題解答。
- Gemini Live:用戶可以通過文本、語音或影像多種方式進行交互,直接與大模型進行對話。
- AI虛擬員工:用戶可以創建一個AI虛擬員工,將其放入各個工作群組中,它可以在各個群聊中提取信息,找到關鍵信息。
AI Teammate:
- Google 推出了 AI Teammate,將 Gemini 的功能包裝成一個 AI 員工,幫助用戶在工作中整理信息、提取關鍵信息并進行智能反饋。AI Teammate 在辦公套件中的應用尤為突出,如在 Gmail 中生成會議紀要、在郵件中提取表格文件等。
Notebook LM:
- Google 進一步發展了去年推出的 Notebook LM,作為教育應用的探索項目。它能模擬教師身份,講述物理課程,并在用戶提問時提供準確的回答,使用戶更好地掌握知識。
DeepMind 的項目:
- DeepMind 創始人哈薩比斯首次在 Google I/O 上亮相,介紹了新項目 Project Astra。這個項目旨在探索通用人工智能如何為我們的日常生活提供幫助。通過演示視頻展示了 Astra 的功能,展示了其強大的通用語言與環境理解能力。
新一代 TPU 硬件 Trilium:
- Google 發布了代號為 Trilium 的第六代 TPU 硬件,計算能力提升 4.7 倍,預計將在 2024 年年底面向用戶推出。Trilium 的發布為 Google AI 技術的發展提供了更強大的硬件支持。
Android 15 中的 AI 功能更新:
- Android 15 也加入了多項 AI 功能更新,尤其是 Gemini 在 Android 中的更深度整合,使其能夠更好地應用于用戶的日常生活中。
今年的 Google I/O 大會在人工智能領域展示了 Google 在 Gemini、AI Teammate、Notebook LM、DeepMind 項目、新一代 TPU 硬件和 Android 15 中的 AI 功能更新等方面的重要進展,顯示了 Google 在 AI 領域的持續領先地位和創新能力。
谷歌I/O 2024大會的召開,標志著谷歌在AI領域的又一次重大突破。憑借著Gemini大模型的強大實力,谷歌在AI搜索、操作系統、視頻生成等多個領域都取得了領先地位。
然而,在AI大模型的競爭中,谷歌并非孤軍奮戰。OpenAI、微軟等公司也在不斷加大投入,研發各自的AI大模型。未來的AI大模型戰火將更加激烈,誰將最終勝出,還有待觀察。