毫無(wú)疑問(wèn),Google最新推出的Gemini 3再次攪動(dòng)了硅谷的AI格局。在OpenAI與Anthropic激戰(zhàn)正酣之時(shí),谷歌憑借其深厚的基建底蘊(yùn)與全模態(tài)(Native Multimodal)路線,如今已從“追趕者”變成了“領(lǐng)跑者”。
此次Gemini 3不僅在多模態(tài)能力上實(shí)現(xiàn)了新的飛躍,更被視為谷歌對(duì)Scaling Law最極致的一次執(zhí)行。
硅谷101在11月20日舉辦了一場(chǎng)直播,邀請(qǐng)了四位處于AI研發(fā)與應(yīng)用最前線的嘉賓:
-
田淵棟,前Meta FAIR研究總監(jiān)、AI科學(xué)家
-
陳羽北,加州大學(xué)戴維斯分校助理教授、Aizip聯(lián)合創(chuàng)始人
-
Gavin Wang,前Meta AI工程師、負(fù)責(zé)Llama 3后訓(xùn)練及多模態(tài)推理
-
Nathan Wang,資深A(yù)I開(kāi)發(fā)者、硅谷101特約研究員

我們?cè)噲D透過(guò)Gemini 3的發(fā)布,試圖回答關(guān)于AI未來(lái)的幾個(gè)關(guān)鍵問(wèn)題:Gemini 3到底強(qiáng)在哪里?谷歌究竟做對(duì)了什么?全球大模型競(jìng)爭(zhēng)格局將如何改變?LLM的未來(lái)走向,以及在LLM之外,最前沿的AI實(shí)驗(yàn)室正在關(guān)注什么?
以下是我們直播中的嘉賓濃縮觀點(diǎn),如果想收看完整直播內(nèi)容,可以關(guān)注我們的YouTube和B站回放。
01 體驗(yàn)實(shí)測(cè):Gemini 3到底強(qiáng)在哪里?
在Gemini 3發(fā)布后的48小時(shí)內(nèi),各大榜單被迅速刷新。不同于以往模型僅在單一維度(如代碼或文本)上的提升,Gemini 3被認(rèn)為是真正意義上的“全模態(tài)原生”模型。對(duì)于使用者而言,這種技術(shù)參數(shù)上的提升轉(zhuǎn)化為怎樣的實(shí)際體感?
來(lái)源:LM Arena
陳茜:各位這兩天都在高強(qiáng)度測(cè)試Gemini 3,它真的如排行榜那樣霸榜嗎?大家能不能舉例講講,它到底好在哪里?
Nathan Wang:我這兩天大概集中使用了三個(gè)主要產(chǎn)品:Gemini主App、針對(duì)開(kāi)發(fā)者的Google AntiGravity,以及今天剛發(fā)布的Nano Banana Pro。
說(shuō)實(shí)話,AntiGravity給我感覺(jué)非常像是一個(gè)Agentic時(shí)代的IDE(集成開(kāi)發(fā)環(huán)境)。它和Cursor或者Claude Code不太一樣的地方在于,它把界面分成了 "Manager View"(經(jīng)理視角) 和 "Editor View"(編輯視角)。
以前我們?cè)贑ursor里,雖然AI幫我們寫(xiě)代碼,但感覺(jué)還是“我”在寫(xiě)。但在AntiGravity里,Manager View讓你感覺(jué)你是坐在那里的經(jīng)理,底下有8到10個(gè)Agent小弟在干活。你可以看著它們分工,有的在寫(xiě)程序,有的在Run Unit Test(單元測(cè)試)。
最驚艷的是它結(jié)合了Browser Use的功能。比如我寫(xiě)了一個(gè)前端網(wǎng)頁(yè),它有一個(gè)叫Screenshot Pro的功能,跑分非常高。它可以直接調(diào)用Chrome瀏覽器打開(kāi)那個(gè)網(wǎng)頁(yè),“看”著屏幕去測(cè)試。如果你讓它上傳一個(gè)文件、點(diǎn)擊一個(gè)按鈕,它能像人一樣去操作。這意味著測(cè)試加上開(kāi)發(fā)完全自動(dòng)化了,變成了一體式的開(kāi)發(fā)體驗(yàn)。
另外,Nano Banana Pro在生成幻燈片這個(gè)點(diǎn)上解決了我很大的痛點(diǎn)。以前我讓AI做PPT,比如“解釋一下Gemini從1.0到3.0的發(fā)展路線”,它往往邏輯鏈?zhǔn)菙嗟摹5@次我試了一下,它不僅能把邏輯理順,還能生成非常復(fù)雜的圖表。我覺(jué)得市面上那些做Slides(幻燈片)的軟件可能都要被它取代了。