北京時間5月15日凌晨,谷歌舉辦了年度I/O開發(fā)者大會。正如外界預期,人工智能成為這次大會的核心內容。根據(jù)發(fā)布會官方統(tǒng)計,兩個小時的開發(fā)者大會共提及“人工智能(AI)”121次。會上,谷歌發(fā)布了眾多有關AI的產品和服務,AI“全家桶”的創(chuàng)新性如何,引發(fā)外界關注。
具體來看,谷歌對旗下的AI大模型雙子座(Gemini)進行了重要升級,使其可理解的信息量翻番,谷歌還通過對數(shù)據(jù)和算法的改進增強雙子座大模型的代碼生成、邏輯推理和規(guī)劃、多輪對話以及音頻和圖像理解能力。谷歌推出的AI助手Project Astra可以通過視頻和音頻的方式進行識別,不僅支持實時對話,還能通過視頻聊天的方式與用戶進行交互。同時,谷歌也發(fā)布了自己的視頻生成模型Veo,可以根據(jù)文字、圖片和視頻的提示,生成各種風格的高質量視頻,將成為Sora新的勁敵。此外,谷歌還發(fā)布了第六代Tensor處理器單元(TPU)芯片Trillium,谷歌首席執(zhí)行官(CEO)桑達爾·皮查伊表示,新產品的算力表現(xiàn)提升了4.7倍。
谷歌此次將AI功能深度融入搜索引擎和辦公領域中。發(fā)布會結束后,谷歌搜索引擎將在美國推出“AI概覽”功能,賦予搜索引擎多步驟推理的能力和計劃能力。雙子座大模型也將接入谷歌郵件服務Gmail,不僅可以總結郵件內容,還可以根據(jù)上下文語境智能提供回復內容。在手機端,谷歌也明確將在最新發(fā)布的安卓15系統(tǒng)中加入雙子座大模型,提供更多AI服務。
從大模型到人工智能助手,從應用再到芯片,谷歌對AI“全家桶”進行了全面升級。谷歌以搜索為核心,以安卓系統(tǒng)為根據(jù)地,打造全面而豐富的AI產品矩陣,同時通過升級內存容量和整體系統(tǒng)帶寬提升TPU性能,為AI應用提供支持。
就在谷歌舉辦開發(fā)者大會的前一天,OpenAI舉辦新品發(fā)布會,推出一款名為GPT-4o的人工智能模型。與現(xiàn)有模型相比,它可以同時理解文本、圖像、音頻等,并能將其任何組合作為輸入或輸出。新模型甚至能夠讀取人的情緒,在人機交互方面的體驗更為順暢。
OpenAI和谷歌接連推出新品,兩家的產品不免被人拿來比較。從發(fā)布會上看,具體產品似乎各有所長。以此次引起關注的AI助手為例,Astra的視覺理解能力較好,但在交互體驗上要比GPT-4o實時演示的能力差。從整體的創(chuàng)新方向來看,以往OpenAI更側重于AI技術的突破和創(chuàng)新,谷歌則更注重生態(tài)系統(tǒng)的深化與整合,不過,兩家公司在技術上的差距正在縮小,而且都在努力推動AI應用于更廣泛的場景。有評論認為,和GPT-4o不到30分鐘的發(fā)布會相比,谷歌缺乏驚喜,但從生態(tài)和用戶積累上,谷歌依然具有先天優(yōu)勢。隨著新品接連落地應用,圍繞生成式AI的競賽也日趨激烈。