黃仁勳 CES 震撼宣告:物理 AI 的 ChatGPT 時刻快到了

MarketWhisper

黃仁勳預告物理AI

黃仁勳在 CES 宣告「物理 AI 的 ChatGPT 時刻快到了」。英偉達發布 Vera Rubin 平台算力提升 5 倍,開源 Alpamayo 自動駕駛、Cosmos 世界模型和 Groot 機器人。強調兩次平台遷移同時發生:AI 重做應用、Physical AI 重做現實。

Vera Rubin 硬體革命的三大突破

黃仁勳在 CES 演講開頭就稱,「我們有 15 公斤的內容要塞進今天這場演講裡,會場裡坐著 3,000 人,外面的庭院裡還有 2,000 人在看,四樓還有人在線,全球數百萬人在觀看。」但他很快把話題拉回硬體,宣布 Vera Rubin 已經全面投產。

Vera Rubin 這個名字源自 20 世紀的天文學家,她觀察到星系邊緣的旋轉速度與中心差不多,這按牛頓物理學說不通,除非存在看不見的物質——暗物質。英偉達把下一代運算平台命名為 Vera Rubin,因為他們面臨的「看不見的東西」也在膨脹:運算需求。

黃仁勳描述了算力需求的瘋狂。模型規模每年 10 倍增長,o1 之後推理變成「思考過程」,後訓練引入強化學習計算量暴增;test-time scaling 讓每次推理 token 量再漲 5 倍;而且每次衝到新前沿,上一代 token 成本會以每年 10 倍速度下跌。這反過來說明競爭極其激烈,英偉達必須「每年推進一次計算的 state-of-the-art,一年都不能落下」。

Vera Rubin 的六芯協同架構

定制 CPU Vera:性能翻倍,與 Rubin GPU 從一開始就雙向一致性共享數據

Rubin GPU:一塊計算板可達 100 PFLOPS 的 AI 算力,是上一代 5 倍

網路與安全:ConnectX-9 提供 1.6 Tbps 橫向頻寬,BlueField-4 DPU 卸載儲存與安全

一塊計算板上有 17,000 個組件,運算托盤被重新設計到「沒有線、沒有水管、沒有風扇」的型態。第六代 NVLink 交換把 18 個節點連成一體,再擴充到 200G、共封裝光學,把成千上萬機櫃組成「AI 工廠」。在 10 兆參數、100 兆 token 訓練任務裡,Rubin 只需要 Blackwell 四分之一的系統規模就能在同樣一個月窗口裡訓練完畢。

黃仁勳也提到現實的產業難題。英偉達內部原本有規則,新一代產品最多換一兩個晶片,別把供應鏈折騰死。可摩爾定律放緩後,電晶體成長跟不上模型 10 倍、token 5 倍、成本 10 倍下滑的速度,不做「co-design(協同設計)」就不可能追上,所以這一代不得不把每一顆晶片都重新設計。Rubin GPU 浮點效能是 Blackwell 的 5 倍,但電晶體只有 1.6 倍,這意味著單靠製程堆電晶體已經到天花板,必須靠架構與系統級協同設計才能搞出效能。

開源模型的集體躍遷策略

過去一年,真正讓黃仁勳感到「興奮」的,不是某一家閉源模式的進步,而是開源模式的集體躍遷。黃仁勳稱,開放模型現在離前沿模型大約「落後六個月」,但每過六個月就會冒出更聰明的新模型,所以下載量爆炸,因為創業公司想參與,大公司想參與,研究者想參與,學生想參與,幾乎每個國家都想參與。

很多人誤解英偉達,說它只是「賣 GPU」,而黃仁勳在 CES 台上反覆強調,英偉達正在成為前沿開源模型構建者,而且是完全開放的那種。他一口氣報了一堆英偉達開源模型:從混合 Transformer-SSM 的 Nemotron,世界模型 Cosmos,到人形機器人 Groot。連自動駕駛領域的 Alpamayo,不僅開源模型,還開源訓練資料。

黃仁勳宣布 Alpamayo 是「世界第一個會思考、會推理的自動駕駛 AI」。它端到端從攝影機到執行器,既學了大量真實里程的「人類示範」,也學了 Cosmos 生成的里程,再加上「幾十萬」極其仔細的標註樣本。關鍵是它不只輸出方向盤和煞車油門,還會告訴你它將採取什麼動作、為什麼這樣做、軌跡是什麼。

黃仁勳稱,他們八年前就開始做自動駕駛,是因為很早就判斷深度學習會重做整個運算堆疊。Alpamayo 宣布「今天開源」,這套工程規模巨大,黃仁勳說他們的 AV 團隊「幾千人」,而賓士五年前就與他們合作。他預測未來可能會有 10 億輛車自動駕駛,「每一輛車都會有會思考的能力,每一輛車都會由 AI 驅動」。

物理 AI 的三台電腦架構

黃仁勳花了極長時間講一件事:讓 AI 理解世界的常識,比語言困難得多。物體恆存、因果關係、慣性、摩擦、重力,對人類幼兒來說是直覺,對 AI 來說卻完全陌生。而現實世界的數據永遠不夠。他說要做 physical AI,需要「三台電腦」:訓練模型的、在車/機器人/工廠邊緣推理的、以及用於模擬的。

Omniverse 是數位孿生模擬世界,Cosmos 是世界基礎模型,機器人模型則有 Groot 和 Alpamayo。訓練資料從哪裡來?語言模型有大量文本,物理世界的真實視頻很多,但遠遠不夠覆蓋多樣交互。於是他們用符合物理定律的合成資料生成,選擇性地製造訓練樣本。

Cosmos 能從單張圖生成逼真視頻,從 3D 場景描述生成連貫運動,從感測器日誌生成環視視頻,從場景提示把「邊緣案例」製造出來。還能閉環仿真,動作一做,世界響應,Cosmos 再推理下一步。黃仁勳把自動駕駛定義為 physical AI 的第一個「大規模主流市場」,並斷言「拐點就在現在這段時間」,未來十年世界上很大比例的車會高度自動化。

黃仁勳認為,未來的 AI 不只是多模態,而是「多模型」。最聰明的系統應該在不同任務中呼叫最適合的模型,最真實的系統天然是多雲、混合雲、邊緣運算的。這意味著 AI 應用的本質,其實是一套調度與推理的架構,一個能判斷意圖、選擇模型、呼叫工具、組合結果的智能體。黃仁勳認為,這種智能體正在成為新的「使用者介面」,不再是 Excel,不再是表單,不再是命令列。

輝達這家公司正在經歷一種矛盾的時刻。它看起來像是所有泡沫敘事裡最危險的那一個,市值已經衝到史無前例的高度。但它同時像所有 AI 概念股裡最強的那一個,一個季度營收、淨利數百億美元,毛利率能達到 70%。當一家公司同時掌握科技敘事、產業鏈重要位置、以及金融市場注意力時,它就會變成圖騰。圖騰的好處是信仰帶來溢價,壞處是溢價意味著你不能犯錯。

Disclaimer: The information on this page may come from third parties and does not represent the views or opinions of Gate. The content displayed on this page is for reference only and does not constitute any financial, investment, or legal advice. Gate does not guarantee the accuracy or completeness of the information and shall not be liable for any losses arising from the use of this information. Virtual asset investments carry high risks and are subject to significant price volatility. You may lose all of your invested principal. Please fully understand the relevant risks and make prudent decisions based on your own financial situation and risk tolerance. For details, please refer to Disclaimer.
Opmerking
0/400
Geen opmerkingen