掃描下載 Gate App
qrCode
更多下載方式
今天不再提醒

Gemini3發布後團隊發聲:三大創新點 規模定律仍有效

作者:無忌,騰訊科技特約編譯

北京時間11月19日,在谷歌發布Gemini 3系列模型之後,《紐約時報》旗下科技播客《Hard Fork》發布特別節目,由主持人凱文·羅茲(Kevin Roose)和凱西·牛頓(Casey Newton)專訪谷歌DeepMind首席執行官德米斯・哈薩比斯(Demis Hassabis)與谷歌Gemini團隊負責人喬希・伍德沃德(Josh Woodward)。

CvRvOPvU1NPiq0pgWagbJg1eE6Ig1z0vIyfmcy1f.jpeg

本次訪談聚焦谷歌最新發布的旗艦AI模型Gemini 3(實際爲Gemini 3.0系列中的Pro版本),這是谷歌在經歷Bard失敗、Gemini 1.x和2.x追趕階段之後,首次被業界廣泛認爲重新奪回技術與產品領先地位的裏程碑式發布。

兩位負責人詳細闡述了Gemini 3在多步推理、代碼生成(尤其是前端與“氛圍編碼”)、動態生成交互界面等方面的突破,強調谷歌已將最強模型快速推向搜索、Gmail、Workspace等數十億用戶產品,重塑競爭壁壘。

訪談核心觀點:

  • Gemini 3完全符合預期發展軌跡,距離通用人工智能(AGI)仍需5至10年及1至2次重大研究突破
  • 谷歌在效率、成本、分發上的全棧優勢使其在任何市場環境下都將勝出;
  • AI泡沫部分存在,但谷歌同時擁有短期變現與長期萬億級新賽道的雙重保障

以下爲訪談內容精簡版

羅茲:凱西,我們今天臨時加播一期特別節目,主題是Gemini 3的發布。

牛頓:是的,凱文。這款模型在硅谷AI圈子裏期待已久,我們終於要親手體驗真正的成品了。

羅茲:我們之所以打破常規周五發布節奏,專門錄制這一期,主要有兩個原因。首先,我們獲得了與谷歌兩位AI核心負責人(DeepMind首席執行官哈薩比斯和Gemini團隊副總裁伍德沃德)的專訪機會。

其次,Gemini 3的發布引發了業界強烈關注。我們聽到多個實驗室的內部消息稱,這款模型在某些關鍵領域實現了突破,可能對競爭對手構成實質性威脅。過去兩年,谷歌曾被視爲追趕者,如今的問題是:他們是否已重返領跑位置?

牛頓:在正式進入訪談之前,我們先簡要介紹已知信息。谷歌在發布前舉行了閉門簡報會,Gemini 3最引人注目的新能力包括:大幅提升的編碼與“氛圍編碼”能力;以及全新的交互界面生成功能。

它不再僅輸出文字,而是直接爲用戶生成定制化的交互界面。例如,用戶詢問梵高生平時,模型會即時生成一個包含圖片、時間線和交互元素的完整學習頁面;又如生成百萬美元以上房產的按揭計算器。這些功能標志着從“回答問題”向“構建體驗”的躍遷。

羅茲:在所有公開基準測試中,Gemini 3均大幅超越Gemini 2.5 Pro。例如,在被稱作“人類終極考試”(Humanity's Last Exam)這一跨學科博士級難題集上,前者得分僅21.6%,後者直接提升至37.5%。谷歌的總體表態是:任何你能在ChatGPT、Claude或其他舊版Gemini上完成的任務,在Gemini 3上都能做得更好。

牛頓: 他們還展示了Gemini Agent的早期演示:模型可深度接入用戶郵箱,理解全部郵件內容,自動歸類、擬定回復,甚至幫助用戶徹底清空收件箱。

此外,本週起Gemini 3將登入Gemini App和谷歌搜索的AI Mode;美國大學生將獲一年免費高級版訪問權限。谷歌反復強調的關鍵詞是“Learn Anything”(學習任何事物),這實際上是將Gemini定位爲終極個性化教育工具。

羅茲:德米斯、喬希,歡迎來到《Hard Fork》。兩年前,桑達爾·皮查伊(Sundar Pichai)把Bard比作“一輛改裝後的本田思域”,在與更強勁對手的賽道上競速。那麼,Gemini 3是一輛什麼車?

哈薩比斯:我希望它比本田思域快得多。我不太習慣用汽車來比喻,或許更像一輛專業的拖曳賽車(Drag Racer)。它不是爲日常駕駛或環形賽道設計的,它擁有純粹的、爲某一特定目標所凝聚的巨大力量。它代表着我們最頂尖的研究成果與規模化算力的完美結合,目標就是要在智能前沿的這場競賽中,展現出無與倫比的瞬間爆發力。

羅茲:這很有趣。相比以往所有AI模型,Gemini 3在具體層面上究竟能做什麼全新的事情?請給我們一些量化、實際的例子。

伍德沃德:有三點最爲突出。第一,在多步推理上,它能同時思考更多步驟,我們將其可靠性提升到了一個全新的層次。前代模型常在進行到第5、6步復雜的邏輯推導時“丟失思路”或產生幻覺,而Gemini 3能可靠地完成10到15步的連貫推理任務,例如復雜稅務規劃、跨國差旅的整體規劃與預訂,或是對一個擁有數百萬行代碼的龐大系統進行全面調試。

其次,它將首次大規模生成全新交互界面。用戶需求的不再是簡單的文字回答,而是定制化的軟件組件。比如你問它:“幫我設計一個可以追蹤我所有投資組合的儀表板”,它會實時生成一個交互式的、可操作的儀表盤界面,而不是一堆描述如何制作儀表盤的文字。

第三,我們在編碼能力上投入巨大資源,尤其是前端與“氛圍編碼”,這意味着它可以根據自然語言的提示來生成功能完整、設計優美的用戶界面代碼。即將推出的Google Antigravity等新產品也將充分展示這一點,模型能夠動態地根據上下文改變用戶界面的布局和功能。

牛頓: 許多人認爲,對普通用戶而言,“聊天”這一用例已經基本解決。他們甚至想不出什麼新問題能讓Gemini 3的回答與前代產生質的區別。你如何看待這種看法?

伍德沃德:我理解這種觀點。表面上看,基礎問答的準確率已經很高。但真正的區別在於可靠性、整合度與信息呈現方式。Gemini 3的回答將更簡潔、更有表現力、信息呈現方式更易理解,這是大多數人立刻能感知到的變化。

更重要的是,模型開始與用戶其他數據源深度整合,例如與谷歌生態內其他產品聯動,真正超越單純的問答模式,成爲用戶的“數字化大管家”。它能理解你整個郵箱的語境,從而在起草回復時,不僅回答問題,還能根據你過去的風格、你與收件人的關係來調整語氣和內容。

哈薩比斯:我完全同意。它的可靠性、風格與個性都經過精心打磨,更簡練、更切中要害。在“氛圍編碼”等場景已跨越實用性門檻。這是一種從“智能助手”到“智能同事”的轉變。我本人計劃用它在聖誕假期重拾遊戲編程,它現在不僅能寫出功能代碼,還能在設計初期就提供架構建議。

羅茲:德米斯,你在今年5月接受我們採訪時判斷AGI仍需5至10年,並可能需要若幹重大突破。Gemini 3是否改變了這一時間表?

哈薩比斯:完全沒有。它完全符合我們過去兩年設定的軌跡。事實上,自Gemini系列啓動以來,我們的進步速度已是行業最快。Gemini 3令人驚豔,但仍在預期之內。

距離真正的通用人工智能,仍需在一致性、推理深度、記憶機制以及物理世界建模(如我們正在推進的SIMA與Genie項目)上取得1至2次關鍵突破。我們現在做的是“系統1思維”(快、直覺式),但要實現AGI,我們必須解鎖“系統2思維”(慢、深思熟慮、分析式)。

此外,模型需要具備長期的、選擇性的記憶機制,能夠回憶和應用數周、數月前的特定互動內容,而非僅僅局限於有限的上下文窗口。因此,5至10年的判斷不變。

牛頓:關於模型個性與用戶關係,業界正在熱議“AI伴侶”。你希望用戶與Gemini 3建立何種關係?

伍德沃德:這是一個非常敏感但重要的問題。我們將其定位爲“超級工具”而非情感伴侶,核心價值是幫助用戶高效完成日常任務,提升生產力。我們內部更關注一個新指標:今天我們幫你完成了多少項任務?這更接近初代谷歌搜索的核心價值——效率。我們認爲,將模型推向情感伴侶的定位,既有安全風險,也偏離了谷歌作爲信息和工具提供者的核心使命。

羅茲:你們放棄了“情色伴侶”這一病毒式增長機會,是否重大戰略失誤?

伍德沃德:無可奉告。我們的安全團隊對此有嚴格的規範和指導原則。

羅茲:過去幾周,競爭對手明顯緊張。你認爲谷歌目前在AI競賽中是否已處於領先?

哈薩比斯:當前環境是史上最激烈的競爭。唯一真正重要的是進步速度,而我們對此非常滿意。我們從未失去研究領先地位,現在只是產品落地終於跟上。競爭對手在研究上很優秀,但在規模化分發和垂直整合上,他們無法復制我們的優勢。

我們正將Gemini注入Maps、YouTube、Android、搜索、Workspace等數十億用戶產品,這個分發網路和終端數據反饋環是無法逾越的護城河。此外,我們在定制化TPU芯片上的全棧優勢,使我們的訓練成本和效率遠超依賴外部GPU資源的競爭者。

牛頓:關於規模定律與回報遞減的爭論,你怎麼看?有人認爲,模型的規模越大,性能提升的邊際效益越低。

哈薩比斯:這是一個持續的辯論。我們對Gemini 3相較2.5的提升非常滿意,完全符合預期。回報並非像早期那樣呈指數級爆炸式增長,但它帶來的實用性增量和可靠性提升仍遠高於我們的邊際成本,仍值得我們全力投入。在抵達AGI所需的1至2次研究突破到來之前,通過最大規模的基礎模型持續推動性能,仍然是當前最有效的策略。我們相信,規模定律依然有效。

羅茲:我們是否正處於AI泡沫之中?

哈薩比斯:這是一個過於二元的問題。某些領域(例如數十億美元種子輪卻無實際產品、只講概念的公司)確實存在泡沫,估值與實際收入不成比例。但谷歌同時擁有短期變現(搜索、Workspace、雲TPU)與長期萬億級新賽道(機器人、遊戲、藥物發現、材料科學等)。

例如,我們的AlphaFold等專業模型正在藥物發現領域創造實際價值,這是一個與消費者AI估值無關的萬億級市場。無論短期泡沫是否存在,我們都將勝出:繁榮時抓住機會,收縮時憑藉全棧優勢和深厚的現金流更具韌性。

牛頓:如果現在是感恩節聚會,有人想轉移政治話題,你會建議他們用Gemini 3展示什麼功能來驚豔全場?

伍德沃德:我不知道它能不能拯救感恩節,但它能帶來歡笑。拿出手機自拍,然後讓Gemini 3瘋狂編輯照片。

我們Gemini中的圖像模型在全球範圍內仍然是最強的。你可以即時將家人合影變成任何滑稽的場景、風格或時代背景。絕對能引發全場大笑。隨後,當你展示它能如何幫你撰寫一封得體的辭職信或生成一個定制化的節日食譜計算器時,他們自然就會探索其他新功能了。

查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 讚賞
  • 留言
  • 轉發
  • 分享
留言
0/400
暫無留言
交易,隨時隨地
qrCode
掃碼下載 Gate App
社群列表
繁體中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)