“我只想讓大家知道,此刻站在這里,全憑臨場發(fā)揮?!北本r間3月19日凌晨1點,英偉達CEO黃仁勛迎著臺下上萬名觀眾的歡呼聲,開啟了2025年度GTC大會的主題演講。
沒有預(yù)備發(fā)言稿,也沒有提詞器,但黃仁勛在兩個多小時的演講可謂“信息量爆炸”:Blackwell進展、AI市場判斷、機器人、光電共封裝CPO新品…… 這些備受業(yè)界關(guān)注的焦點,英偉達一件不落地給出了最新官方回應(yīng)。
顯然,臨場發(fā)揮的黃仁勛必須“有備而來”,抓住這一令全球目光聚焦的時刻,不僅亟需證明英偉達本身,更要證明英偉達對AI押下的賭注是正確的。
信號一:Agentic AI時代,計算需求或?qū)⒈┰?/strong>
撥開GTC演講的大幕,黃仁勛最先也最想釋放出的信號與AI市場直接相關(guān)。
人工智能真正進入全球公眾視野,大約是在十年前。在這十年光景里,人工智能經(jīng)歷了不同階段的變化。一開始是感知人工智能,包括計算機視覺、語音識別;接著是過去五年逐漸受到關(guān)注的生成式人工智能:在一個模態(tài)與另一個模態(tài)之間進行轉(zhuǎn)換,例如文生圖、圖生文、文生視頻。
“生成式人工智能從根本上改變了計算的方式,從檢索式計算模型轉(zhuǎn)變?yōu)樯墒接嬎隳P??!秉S仁勛表示。
此次GTC大會,“Agentic AI”(代理式AI)成為英偉達頻頻提及的關(guān)鍵詞。黃仁勛對其進行了解釋:“Agentic AI”從根本上說,是指具備“自主性”(agency)的AI,它能夠感知和理解環(huán)境的上下文,很重要的一點是它能進行推理,思考如何回答或解決問題,制定并執(zhí)行計劃,還能使用工具。黃仁勛認為,Agentic AI 的基礎(chǔ)是推理。
“今年的GTC被稱為AI界的‘超級碗’。唯一的區(qū)別在于,在這場‘超級碗’里,每個人都是贏家?!秉S仁勛做出如此比喻,透露出其對AI前景的樂觀態(tài)度。
以DeepSeek為代表的開源推理大模型的問世,曾一度令英偉達遭受資本市場的質(zhì)疑。今年2月,黃仁勛首次正面表達了對于DeepSeek問世將利好英偉達未來的信心。在本次GTC大會上,黃仁勛再次對AI需求問題作出回應(yīng):
“過去這一年,幾乎整個世界在這方面都看走眼了。AI的計算需求及其擴展定律其實更具韌性,甚至可以說是超加速。由于Agentic AI、推理的出現(xiàn),如今我們所需的計算量比一年前的預(yù)期至少高出100倍。”
上述判斷如何得出?答案藏在被英偉達視為人工智能基本構(gòu)成單元的“token”身上。
黃仁勛表示,現(xiàn)在我們有了能逐步推理的AI,它利用“Chain of Thought”(思維鏈)、取多種解法里最優(yōu)和一致性檢查等多種技術(shù),一步一步地分解問題,進行推理。由此可以想見,AI所生成的token數(shù)量會急劇增多。
那么,前文的“100倍”具體意味著什么?黃仁勛用數(shù)字給出解釋:這也許是生成了100倍的token數(shù)量;又或者,模型本身更復(fù)雜,只生成10倍的token,但若想讓模型具備交互性、實時性,就要把計算速度再提高10倍。這樣一來,10倍的token、10倍的速度,就相當于需要100倍的計算量。因此,推理所需的計算量遠超以往。
信號二:芯片路線圖按節(jié)奏推進
如果AI計算需求持續(xù)呈倍數(shù)級增長,英偉達如何應(yīng)對?
“英偉達未來幾年的路線圖,大約保持一年一次的迭代節(jié)奏,就像時鐘滴答一樣穩(wěn)定?!秉S仁勛表示。
借助今年GTC大會,黃仁勛提前透露了一張涉及未來幾年的芯片架構(gòu)路線圖,將每年升級全棧AI系統(tǒng)、發(fā)布一條新產(chǎn)品線:2025年下半年推出Blackwell Ultra,2026年下半年推出Rubin,2027年下半年推出Rubin Ultra,預(yù)計2028年推出采用下一代HBM的Feynman平臺。
具體來看,英偉達于去年3月發(fā)布了AI芯片與超級計算平臺Blackwell架構(gòu),并推出GB200芯片。此次黃仁勛表示,目前Blackwell已經(jīng)全面投產(chǎn)。今年,Blackwell新一代芯片的正式名字為Blakwell Ultra。據(jù)悉,Blackwell Ultra由臺積電N4P工藝的Blackwell GPU+Grace CPU+更大容量的HBM封裝而來。英偉達表示,Blackwell Ultra也適用于AI智能體,以及用于訓練機器人和汽車自動駕駛的“物理AI”。
此外,英偉達公布了繼Hopper、Blackwell之后的下一代GPU架構(gòu)Rubin——以在暗物質(zhì)研究領(lǐng)域取得突破性進展的天文學家Vera Rubin命名,以及Rubin Ultra的計劃配置。據(jù)悉,Rubin平臺擁有全新的CPU和網(wǎng)絡(luò)架構(gòu),性能將是Hopper的兩倍,且內(nèi)存更大,將為AI應(yīng)用提供更強大的支持。Rubin Ultra系統(tǒng)由Rubin Ultra GPU和Vera CPU組成。Rubin Ultra由4塊掩模尺寸的GPU組成,擁有1TB HBM4e內(nèi)存,F(xiàn)P4峰值推理能力可達100PFLOPS。
值得一提的是,此次黃仁勛還宣布了Rubin之后的下一代AI芯片架構(gòu)“Feynman”。該名稱源自對量子計算領(lǐng)域有著重要貢獻的科學家Richard Phillips Feynman。
提前公布未來三年路線圖的原因何在?黃仁勛給出的解釋是,現(xiàn)在要建的是AI工廠,這需要多年規(guī)劃。
“這可不是買臺筆記本電腦那么簡單,也不是一筆隨心所欲的支出,而是必須經(jīng)過對土地、電力、資金、工程團隊等各方面的長遠計劃。”黃仁勛在演講中說道, “所以我們必須給出一個2—3年的預(yù)告,而不是等到某個月份突然說‘嘿,下個月又有一個超棒的新系統(tǒng)’”。
信號三:關(guān)于未來還有更多“宏大敘事”
AI行業(yè)并非一個單點,而是從技術(shù)到設(shè)施再到應(yīng)用的一個立體面。因此,作為AI行業(yè)走在前面的那一批,英偉達的故事只講“芯片”還遠遠不夠。此次,黃仁勛從一些側(cè)面?zhèn)鬟_出英偉達在整個AI產(chǎn)業(yè)鏈的布局。
從上游技術(shù)層面來看,AI光通信時代背景下,數(shù)據(jù)中心規(guī)模持續(xù)擴大,帶寬容量與高速數(shù)據(jù)傳輸速率的需求明顯增加。光電共封裝(Co-Packaged Optics,CPO)作為一種新型的光電子集成技術(shù),受到產(chǎn)業(yè)界眾多頭部企業(yè)關(guān)注。此次,英偉達正式發(fā)布硅光子網(wǎng)絡(luò)交換機Spectrum-X和Quantum-X,目的是推動AI工廠擴展到數(shù)百萬GPU級別。值得關(guān)注的是,英偉達的硅光生態(tài)系統(tǒng)伙伴包括了臺積電、康寧、Browave、Coherent等知名公司。
“AI工廠是一種超大規(guī)模的新型數(shù)據(jù)中心,必須采用全新的網(wǎng)絡(luò)基礎(chǔ)設(shè)施才能跟上它的發(fā)展步伐?!秉S仁勛表示,英偉達將硅光直接集成到交換機中,打破了超大規(guī)模和企業(yè)網(wǎng)絡(luò)的舊有限制,為百萬GPU AI工廠打開大門?!睋?jù)悉,英偉達的硅光交換機創(chuàng)新地集成了光器件,減少了4倍的激光器數(shù)量,與傳統(tǒng)方法相比,能源效率提高到3.5倍,信號完整性提高到63倍,大規(guī)模組網(wǎng)可靠性提高到10倍,部署速度提高到1.3倍。
在下游應(yīng)用層面,機器人賽道是當前人工智能應(yīng)用中最受關(guān)注的領(lǐng)域之一。此次的GTC大會,英偉達發(fā)布了全球首個開源且完全可定制的人形機器人基礎(chǔ)模型Isaac GR00T N1,并推出加速機器人開發(fā)的仿真框架。其中,英偉達、谷歌DeepMind和迪士尼合作開發(fā)新一代開源物理引擎Newton,旨在加速人形機器人學習與開發(fā)。
“物理AI和機器人正在飛速發(fā)展,可能會成為規(guī)模最大的產(chǎn)業(yè)?!秉S仁勛表示,一切的核心挑戰(zhàn)跟之前類似:數(shù)據(jù)從哪來、模型架構(gòu)是什么、以及如何做擴展(scaling)。在機器人領(lǐng)域,同樣需要能大量生成或獲取數(shù)據(jù),需要強大的算力來訓練模型,以及讓AI越訓越強的擴展性。
作者丨楊鵬岳編輯丨張心怡美編丨馬利亞監(jiān)制丨連曉東