引入AI Mode聊天機器人,Gemini 2.5 Pro加持,谷歌重塑搜索智能
當?shù)貢r間5月20日,谷歌在I/O 2025大會上發(fā)布一系列人工智能新進展,更新了谷歌圖像和視頻生成模型,為搜索和Gmail增加新的AI功能,推出了配備攝像頭和揚聲器的安卓XR眼鏡,最新模型Gemini 2.5 Pro則擁有Deep Think增強推理模式。
谷歌在其搜索引擎中引入一項名為AI Mode的新功能,它類似于聊天機器人,允許用戶使用Gemini人工智能聊天機器人進行網(wǎng)絡搜索。從本周開始,該功能將向美國所有用戶推出。谷歌將在今年夏天測試AI Mode的新功能,比如深度搜索、為 金融 和體育查詢生成圖表,并在“未來幾個月”推出在AI Mode下的購物功能。
谷歌DeepMind首席執(zhí)行官戴米斯·哈薩比斯(Demis Hassabis)表示,谷歌希望保留傳統(tǒng)的搜索方式,同時通過其人工智能摘要( AI summaries)、人工智能模式聊天機器人(AI Mode chatbot)和Gemini助手,為搜索帶來新的人工智能能力。
哈薩比斯展示了谷歌最新的模型Gemini 2.5 Pro。他表示,實驗室一直在繼續(xù)努力把Gemini變成一個可識別和解決現(xiàn)實世界問題的虛擬助手。
憑借其百萬token的上下文窗口,Gemini 2.5 Pro擁有長上下文和視頻理解性能。Deep Think是一種用于高度復雜的數(shù)學和編程的實驗性增強推理模式,Gemini 2.5 Pro將通過Deep Think進一步升級。Gemini 2.5 Pro的Deep Think在數(shù)學基準2025 USAMO上取得49.4%的成績,在競賽級編程的難度基準LiveCodeBench中處于領先地位,獲得80.4%的成績,并在測試多模態(tài)推理的MMMU上取得了84.0%的分數(shù)。
Gemini 2.5 Pro的Deep Think性能表現(xiàn)。
“我們正努力拓展我們最強的多模態(tài)基礎模型Gemini 2.5 Pro,使其成為一個能夠通過理解和模擬世界的各個方面來制定計劃和構想新體驗的世界模型,就像大腦一樣。”哈薩比斯表示。
Gemini系統(tǒng)是谷歌Gmail中個性化智能回復功能的支柱。在用戶允許的情況下,系統(tǒng)會從用戶過去的郵件中提取信息,查看用戶的寫作方式,并根據(jù)用戶的語氣和風格自動給出回復建議。谷歌還將Gemini引入谷歌搜索的購物體驗中。用戶可以要求系統(tǒng)顯示與灰色沙發(fā)相匹配的地毯并優(yōu)化結果,顯示易于清潔的地毯。智能體可以讓人們設定可接受的最高價格,并在商品開始銷售時自動購買。
谷歌同時推出人工智能視頻生成器Veo3,可創(chuàng)建和整合音頻,包括人物之間的對話以及動物的聲音。Veo2則帶有相機控制和物體移除等工具。新推出的圖像生成工具Imagen 4可根據(jù)用戶提示生成更高質量圖像。新的電影制作工具Flow可以根據(jù)用戶描述的地點、鏡頭和風格偏好來創(chuàng)建電影視頻。Flow使用Veo、Imagen和Gemini,根據(jù)文本或圖像創(chuàng)建8秒人工智能生成視頻,還配備了場景構建工具,可將剪輯拼接,創(chuàng)建更長的人工智能視頻。
谷歌希望將其人工智能產(chǎn)品用到硬件中,推出了配備攝像頭和揚聲器的安卓XR眼鏡,可以顯示文本和拍照,用戶可以用Gemini虛擬助手識別和評論人物和地點。不過,該XR眼鏡仍是原型。
“在過去十年中,我們?yōu)楝F(xiàn)代AI時代奠定了許多基礎,從率先提出所有大型語言模型賴以構建的 Transformer架構,到開發(fā)AlphaGo和AlphaZero等可以學習和規(guī)劃的智能體系統(tǒng)。”哈薩比斯表示谷歌將繼續(xù)在基礎研究的廣度和深度上加倍投入,致力于發(fā)明實現(xiàn)通用人工智能所必需的下一個重大突破。
【來源:澎湃新聞】