• 正文
  • 相關(guān)推薦
申請(qǐng)入駐 產(chǎn)業(yè)圖譜

GTC 2025:黃仁勛拉開AI新紀(jì)元大幕

03/21 15:07
1127
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點(diǎn)資訊討論

“獨(dú)家前線報(bào)道!CDCC專家團(tuán)隊(duì)親臨GTC 2025大會(huì)現(xiàn)場(chǎng),為您揭開這場(chǎng)科技盛會(huì)的神秘面紗。他們將以專業(yè)的洞察力和獨(dú)到的見解,深入解讀GTC 2025上的創(chuàng)新技術(shù)和未來(lái)趨勢(shì)。

AI 界 “超級(jí)碗” 來(lái)襲

在科技飛速發(fā)展的今天,人工智能(AI)領(lǐng)域的每一次重大突破都備受矚目。而英偉達(dá)的GTC大會(huì),堪稱 AI 界的 “超級(jí)碗”,每一屆都吸引著全球目光,匯聚前沿技術(shù),帶來(lái)行業(yè)震撼。

今年,英偉達(dá)創(chuàng)始人兼CEO黃仁勛再次以標(biāo)志性的皮衣造型登場(chǎng),為我們帶來(lái)一場(chǎng)持續(xù)超兩小時(shí)的技術(shù)盛宴,其中的重磅發(fā)布更是讓整個(gè)科技圈為之沸騰。接下來(lái),就讓我們一同深入這場(chǎng)盛會(huì),看看黃仁勛究竟帶來(lái)了哪些令人驚嘆的內(nèi)容。

Blackwell Ultra?GPU

在本次GTC大會(huì)上,英偉達(dá)推出的Blackwell Ultra芯片無(wú)疑是硬件領(lǐng)域的一大亮點(diǎn)。

Blackwell Ultra由兩顆臺(tái)積電N4P(隸屬于5nm家族的4nm加強(qiáng)版)工藝Blackwell GPU+Grace CPU+更大容量的HBM封裝而來(lái),即搭配了更先進(jìn)的12層堆疊的HBM3e,顯存容量提升至為288GB,和上一代一樣支持第五代NVLink,可實(shí)現(xiàn)1.8TB/s的片間互聯(lián)帶寬。

數(shù)據(jù)中心的實(shí)際應(yīng)用為例,Blackwell Ultra芯片的AI性能是前代的1.5倍,這意味著在處理復(fù)雜的AI模型訓(xùn)練和推理任務(wù)時(shí),能夠更加高效地完成工作。同時(shí),該芯片在能效方面也進(jìn)行了優(yōu)化,全面改用液冷散熱,硬剛1.4KW功耗。

Blackwell Ultra芯片的推出,標(biāo)志著AI計(jì)算焦點(diǎn)從大模型預(yù)訓(xùn)練向深度推理與復(fù)雜推理的轉(zhuǎn)變,將為數(shù)據(jù)中心、企業(yè)AI工廠及自動(dòng)駕駛、機(jī)器人等領(lǐng)域提供強(qiáng)勁的計(jì)算能力。

然而,頂級(jí)配置的GB300服務(wù)器價(jià)格突破300萬(wàn)美元(約合人民幣2000萬(wàn))!不過(guò),亞馬遜、微軟等云巨頭已火速下單,畢竟AI軍備競(jìng)賽里,“貴”是你的問(wèn)題,不是他的問(wèn)題。

Blackwell Ultra NVL72:AI推理專用機(jī)柜

和GB200 NVL72一樣,英偉達(dá)今年也推出了類似的產(chǎn)品Blackwell Ultra NVL72機(jī)柜,一共由18個(gè)計(jì)算托盤構(gòu)成,每個(gè)計(jì)算托盤包含4顆Blackwell Ultra GPU+2顆Grace CPU,總計(jì)也就是72顆Blackwell Ultra GPU+36顆Grace CPU,顯存達(dá)到20TB,總帶寬576TB/s,外加9個(gè)NVLink交換機(jī)托盤(18顆NVLink 交換機(jī)芯片),節(jié)點(diǎn)間NVLink帶寬130TB/s。

機(jī)柜內(nèi)置72張CX-8網(wǎng)卡,提供14.4TB/s帶寬,Quantum-X800 InfiniBand和Spectrum-X 800G以太網(wǎng)卡則可以降低延遲和抖動(dòng),支持大規(guī)模AI集群。此外,機(jī)架還整合了18張用于增強(qiáng)多租戶網(wǎng)絡(luò)、安全性和數(shù)據(jù)加速BlueField-3 DPU。

英偉達(dá)說(shuō)這款產(chǎn)品是“為AI推理時(shí)代”專門定制,應(yīng)用場(chǎng)景包括推理型AI、Agent以及物理AI(用于機(jī)器人、智駕訓(xùn)練用的數(shù)據(jù)仿真合成),相比前一代產(chǎn)品GB200 NVL72的AI性能提升了1.5倍,而相比Hopper架構(gòu)同定位的DGX機(jī)柜產(chǎn)品,可以為數(shù)據(jù)中心提供50倍增收的機(jī)會(huì)。

根據(jù)官方提供的信息,6710億參數(shù)DeepSeek-R1的推理,基于H100產(chǎn)品可實(shí)現(xiàn)每秒100tokens,而采用Blackwell Ultra NVL72方案,可以達(dá)到每秒1000 tokens。換算成時(shí)間,同樣的推理任務(wù),H100需要跑1.5分鐘,而Blackwell Ultra NVL72 15秒即可跑完。


Blackwell Ultra NVL72和GB200 NVL72硬件參數(shù)

Vera Rubin

繼Blackwell之后,Nvidia計(jì)劃將于2026年下半年推出Vera Rubin(包含Vera Arm CPU + Rubin GPU) ,2027年下半年推出Rubin Ultra NVL576,2028年推出搭配Feynman GPU架構(gòu)的產(chǎn)品。

Vera是Nvidia的首款定制CPU設(shè)計(jì)。Nvidia表示,Vera將比去年的Grace Blackwell芯片中使用的CPU快兩倍。與Vera搭配使用,Rubin可以在進(jìn)行推理時(shí)實(shí)現(xiàn)每秒50 petaflops,比目前Blackwell芯片每秒20 petaflops的速度高出一倍多。Rubin還可以支持高達(dá) 288GB HBM4內(nèi)存。

Nvidia還對(duì)其GPU進(jìn)行了更改。Nvidia表示,Rubin實(shí)際上是兩個(gè)GPU。2027年下半年,Nvidia計(jì)劃發(fā)布一款“Rubin Next”芯片,該芯片將四個(gè)芯片組合成一個(gè)芯片,使Rubin的速度翻倍。這款產(chǎn)品將搭載在一款名為Vera Rubin NVL144的機(jī)架上。NVIDIA在談?wù)?NVLink域時(shí)計(jì)算的是GPU裸片,而不是單個(gè)GPU芯片。因此NVL144是144個(gè)裸片,而不是144個(gè)芯片。

Rubin Ultra NVL576每機(jī)架600KW,F(xiàn)P4峰值推理算力高達(dá)15 EFLOPS,F(xiàn)P8訓(xùn)練算力達(dá)到5EFLOPS。每個(gè)GPU封裝1TB HBM4e內(nèi)存。Nvidia稱其性能是今年推出的 Blackwell Ultra機(jī)架的14倍。

RTX PRO Blackwell 系列

英偉達(dá)還發(fā)布了RTX PRO Blackwell系列工作站和服務(wù)器GPU,這一系列產(chǎn)品通過(guò)突破性的加速計(jì)算、AI 推理、光線追蹤和神經(jīng)渲染技術(shù),重新定義了AI、技術(shù)、創(chuàng)意、工程和設(shè)計(jì)專業(yè)人士的工作流。

其中,旗艦級(jí)的RTX PRO 6000系列擁有24,064個(gè)CUDA核心、752個(gè)Tensor核心188個(gè)RT核心。

RTX PRO 6000全系均配備96GB GDDR7顯存(支持 ECC 校驗(yàn)),具備512 bit顯存位寬,這意味著GPU板正反兩面都使用了3GB GDDR7顯存模塊。

英偉達(dá)共發(fā)布12款同架構(gòu)產(chǎn)品,包含雙風(fēng)扇設(shè)計(jì)(最高 600W TDP)的工作站版、渦輪鼓風(fēng)式設(shè)計(jì)的集群工作站版,以及服務(wù)器專用版。

數(shù)據(jù)中心

NVIDIA RTX PRO 6000 Blackwell 服務(wù)器版

桌面平臺(tái)

  • NVIDIA RTX PRO 6000 Blackwell 工作站版
  • NVIDIA RTX PRO 6000 Blackwell Max-Q 工作站版
  • NVIDIA RTX PRO 5000 Blackwell
  • NVIDIA RTX PRO 4500 Blackwell
  • NVIDIA RTX PRO 4000 Blackwell

移動(dòng)平臺(tái)

  • NVIDIA RTX PRO 5000 Blackwell
  • NVIDIA RTX PRO 4000 Blackwell
  • NVIDIA RTX PRO 3000 Blackwell
  • NVIDIA RTX PRO 2000 Blackwell
  • NVIDIA RTX PRO 1000 Blackwell
  • NVIDIA RTX PRO 500 Blackwell

在AI領(lǐng)域,該系列GPU能夠加速AI模型的訓(xùn)練和推理過(guò)程,使得研究人員能夠更快地驗(yàn)證和優(yōu)化模型,推動(dòng)AI技術(shù)的發(fā)展。

DGX Spark 和 DGX Station

為了讓AI開發(fā)更加普及,英偉達(dá)發(fā)布了由NVIDIA Grace Blackwell平臺(tái)驅(qū)動(dòng)的DGX Spark和DGX Station個(gè)人AI超級(jí)計(jì)算機(jī)。

DGX Spark體積小巧,尺寸類似Mac Mini,采用標(biāo)準(zhǔn)電源供電,起售價(jià)僅為3000美元,大大降低了AI開發(fā)的門檻。它搭載了新一代NVIDIA Blackwell Ultra平臺(tái),在FP4計(jì)算精度下可提供1 PFLOPS的AI性能,支持本地運(yùn)行高達(dá)2000億參數(shù)的 AI 模型。若將兩臺(tái)設(shè)備互聯(lián),更可擴(kuò)展至4050億參數(shù)模型的訓(xùn)練與推理。

DGX Station則是一款面向更廣泛領(lǐng)域的大型桌面級(jí)AI計(jì)算中心,內(nèi)部搭載強(qiáng)大GB300 Blackwell Ultra、784GB統(tǒng)一系統(tǒng)內(nèi)存、內(nèi)置800Gbps Nvidia網(wǎng)絡(luò),以及承諾的20 petaflops AI性能,據(jù)稱將由華碩、戴爾、惠普等公司生產(chǎn)。

NVIDIA Isaac GR00T N1

英偉達(dá)宣布與DeepMind、迪士尼合作,開發(fā)機(jī)器人模擬的開源物理引擎Newton,并展示了搭載GR00T N1的人形機(jī)器人“Blue”。

黃仁勛在現(xiàn)場(chǎng)演示中強(qiáng)調(diào),通用機(jī)器人時(shí)代已經(jīng)來(lái)臨。相比傳統(tǒng)的工業(yè)機(jī)器人,通用機(jī)器人能夠適應(yīng)不同環(huán)境,具備更強(qiáng)的自主學(xué)習(xí)能力。AI不再局限于計(jì)算機(jī)系統(tǒng),而是開始走入物理世界,成為可以執(zhí)行任務(wù)的智能體。

Spectrum-X Photonics硅光網(wǎng)絡(luò)交換機(jī)

隨著AI工廠規(guī)模的不斷擴(kuò)大,對(duì)網(wǎng)絡(luò)基礎(chǔ)設(shè)施的要求也越來(lái)越高。在本次GTC大會(huì)上,英偉達(dá)推出的Spectrum-X Photonics硅光網(wǎng)絡(luò)交換機(jī),為AI工廠的網(wǎng)絡(luò)連接帶來(lái)了革命性的解決方案。

這款交換機(jī)創(chuàng)新地集成了光器件,采用了全球首創(chuàng)的200Gb/s光電一體化封裝方案,將外部數(shù)字信號(hào)處理單元、1.6Tb/s交換ASIC與收發(fā)器高度集成,徹底重構(gòu)了傳統(tǒng)可插拔交換機(jī)的設(shè)計(jì)邏輯。通過(guò)優(yōu)化信號(hào)傳輸路徑,Spectrum-X Photonics將信號(hào)完整性提升了 63 倍,傳統(tǒng)架構(gòu)因連接器、PCB等介質(zhì)導(dǎo)致22dB電氣信號(hào)損失,而光電一體化封裝光學(xué)方案僅產(chǎn)生4dB損耗。

在能耗方面,Spectrum-X Photonics表現(xiàn)出色。它減少了4倍的激光器數(shù)量,與傳統(tǒng)方法相比,能源效率提高到3.5倍。在信號(hào)傳輸?shù)目煽啃陨?,大?guī)模組網(wǎng)可靠性提高到10倍,部署速度提高到1.3倍,為AI工廠的穩(wěn)定運(yùn)行提供了有力保障。

Spectrum-X Photonics交換機(jī)具有多種配置,包括128個(gè)800 Gb/s端口或512個(gè)200Gb/s端口,總帶寬可達(dá)到100Tb/s,以及512個(gè)800 Gb/s 或2,048個(gè)200 Gb/s端口,總吞吐量可達(dá)400Tb/s,能夠滿足不同規(guī)模AI工廠的網(wǎng)絡(luò)需求。

軟件開源

除了硬件,英偉達(dá)這次在軟件開源方面也有幾個(gè)新動(dòng)作。

其中最重磅的,當(dāng)屬發(fā)布NVIDIA Dyamo,一個(gè)用于加速AI模型推理的分布式推理服務(wù)庫(kù)。

老黃將其稱為“AI工廠的操作系統(tǒng)”,核心目標(biāo)在于提高推理性能的同時(shí)降低Test-Time算力消耗。按照英偉達(dá)的說(shuō)法,在NVIDIA Blackwell上使用Dynamo優(yōu)化推理,能讓DeepSeek-R1的吞吐量提升30倍。

至于背后原因,主要在于Dynamo可以通過(guò)動(dòng)態(tài)調(diào)整GPU資源應(yīng)對(duì)請(qǐng)求波動(dòng),并優(yōu)化數(shù)據(jù)卸載到成本更低的存儲(chǔ)設(shè)備,從而降低推理成本并提高效率。

目前Dynamo已完全開源,支持PyTorch、SGLang、NVIDIA TensorRTyTM以及vLLM,在GitHub獲取后即可將推理工作分配到多達(dá)1000個(gè)NVIDIA GPU芯片。

此外,英偉達(dá)還宣布開源新的AI推理模型——Llama Nemotron,該系列模型也曾出現(xiàn)在今年1月的CES上。

據(jù)介紹,Llama Nemotron基于開源Llama基礎(chǔ)模型構(gòu)建,采用英偉達(dá)最新技術(shù)和高質(zhì)量數(shù)據(jù)集進(jìn)行剪枝和訓(xùn)練,優(yōu)化了計(jì)算效率和準(zhǔn)確性。

行業(yè)合作新進(jìn)展

英偉達(dá)一直注重與各行業(yè)企業(yè)的合作,通過(guò)合作推動(dòng)AI技術(shù)在各個(gè)領(lǐng)域的應(yīng)用和發(fā)展。在本次GTC大會(huì)上,英偉達(dá)也宣布了一系列與行業(yè)企業(yè)的合作成果。

英偉達(dá)與Ansys、Altair、Cadence、Siemens 和 Synopsys等在內(nèi)的領(lǐng)先計(jì)算機(jī)輔助工程(CAE)軟件供應(yīng)商合作,使用NVIDIA Blackwell平臺(tái)加速其仿真工具,速度提升高達(dá)50倍。這將有助于汽車、航空航天、能源、制造業(yè)和生命科學(xué)等行業(yè)在保持能效的同時(shí),大幅縮短產(chǎn)品開發(fā)時(shí)間、降低成本并提高設(shè)計(jì)精度。

在汽車領(lǐng)域,英偉達(dá)與通用汽車合作,共同利用NVIDIA加速計(jì)算平臺(tái)構(gòu)建定制化AI系統(tǒng),訓(xùn)練AI制造模型,優(yōu)化通用汽車的工廠規(guī)劃和機(jī)器人開發(fā)。通用汽車還將使用NVIDIA DRIVE AGX車載硬件,打造未來(lái)的高級(jí)駕駛輔助系統(tǒng)和車內(nèi)增強(qiáng)型安全駕駛體驗(yàn)。

在醫(yī)療領(lǐng)域,英偉達(dá)與GE醫(yī)療合作,共同推進(jìn)自主成像技術(shù)創(chuàng)新,重點(diǎn)開發(fā)自主X射線技術(shù)與超聲應(yīng)用。

在電信領(lǐng)域,英偉達(dá)與T-Mobile、MITRE、思科、Cerberus Capital Management 旗下公司ODC,以及Booz Allen Hamilton達(dá)成合作,共同研發(fā)AI原生6G無(wú)線網(wǎng)絡(luò)硬件、軟件及架構(gòu)。為了無(wú)縫鏈接數(shù)千億部手機(jī)、傳感器、攝像頭、機(jī)器人和自動(dòng)駕駛車輛,下一代無(wú)線網(wǎng)絡(luò)必須從根本上與AI深度融合。AI原生無(wú)線網(wǎng)絡(luò)不僅能夠?yàn)閿?shù)十億用戶帶來(lái)更優(yōu)質(zhì)的服務(wù),還將在頻譜效率(即單位帶寬內(nèi)的數(shù)據(jù)傳輸速率)方面樹立全新標(biāo)準(zhǔn)。

本次GTC大會(huì),英偉達(dá)在黃仁勛的帶領(lǐng)下,展現(xiàn)出了強(qiáng)大的技術(shù)實(shí)力和創(chuàng)新能力。從硬件到軟件,從模型到網(wǎng)絡(luò),英偉達(dá)的每一項(xiàng)發(fā)布都為AI的發(fā)展注入了新的活力。

未來(lái),隨著這些技術(shù)的不斷應(yīng)用和推廣,AI將在更多領(lǐng)域?qū)崿F(xiàn)突破,為我們的生活和工作帶來(lái)更多的便利和創(chuàng)新。

尾記

在英偉達(dá)全球技術(shù)大會(huì)(NVIDIA GTC)的活動(dòng)現(xiàn)場(chǎng),康普隆重推出其最新創(chuàng)新成果 ——Propel XFrame? 。作為Propel?高性能數(shù)據(jù)中心解決方案組合的最新成員,Propel XFrame解決方案是一款落地式光纖配線架光纖配線機(jī)架,旨在支持并滿足數(shù)據(jù)中心和高性能計(jì)算設(shè)施當(dāng)下和未來(lái)的需求。這一簡(jiǎn)潔且高效的解決方案能夠?qū)崿F(xiàn)高密度光纖連接的更快速、更靈活的部署與管理,同時(shí)還能優(yōu)化您的空間和內(nèi)部資源。

Propel XFrame解決方案亮點(diǎn):

通過(guò)緊湊的外形設(shè)計(jì)和多種部署配置,優(yōu)化數(shù)據(jù)中心空間利用。

通過(guò)支持多類標(biāo)準(zhǔn)化連接器的配線機(jī)架,最大限度地利用Propel組件和配線架,從而為數(shù)據(jù)中心管理者提供更多選擇。

通過(guò)前端訪問(wèn)所有配線架,有望降低人工成本。此外,水平和垂直電纜管理可使布線保持有序,從而實(shí)現(xiàn)更快速、更準(zhǔn)確的移動(dòng)、添加和更改操作。

有關(guān) Propel XFrame解決方案的更多信息(包括規(guī)格),請(qǐng)點(diǎn)擊閱讀原文訪問(wèn)官方網(wǎng)站。

英偉達(dá)

英偉達(dá)

NVIDIA(中國(guó)大陸譯名:英偉達(dá),港臺(tái)譯名:輝達(dá)),成立于1993年,是一家美國(guó)跨國(guó)科技公司,總部位于加利福尼亞州圣克拉拉市,由黃仁勛、克里斯·馬拉科夫斯基(Chris Malachowsky)和柯蒂斯·普里姆(Curtis Priem)共同創(chuàng)立。公司早期專注于圖形芯片設(shè)計(jì)業(yè)務(wù),隨著公司技術(shù)與業(yè)務(wù)發(fā)展,已成長(zhǎng)為一家提供全棧計(jì)算的人工智能公司,致力于開發(fā)CPU、DPU、GPU和AI軟件,為建筑工程、金融服務(wù)、科學(xué)研究、制造業(yè)、汽車等領(lǐng)域的計(jì)算解決方案提供支持。

NVIDIA(中國(guó)大陸譯名:英偉達(dá),港臺(tái)譯名:輝達(dá)),成立于1993年,是一家美國(guó)跨國(guó)科技公司,總部位于加利福尼亞州圣克拉拉市,由黃仁勛、克里斯·馬拉科夫斯基(Chris Malachowsky)和柯蒂斯·普里姆(Curtis Priem)共同創(chuàng)立。公司早期專注于圖形芯片設(shè)計(jì)業(yè)務(wù),隨著公司技術(shù)與業(yè)務(wù)發(fā)展,已成長(zhǎng)為一家提供全棧計(jì)算的人工智能公司,致力于開發(fā)CPU、DPU、GPU和AI軟件,為建筑工程、金融服務(wù)、科學(xué)研究、制造業(yè)、汽車等領(lǐng)域的計(jì)算解決方案提供支持。收起

查看更多

相關(guān)推薦

登錄即可解鎖
  • 海量技術(shù)文章
  • 設(shè)計(jì)資源下載
  • 產(chǎn)業(yè)鏈客戶資源
  • 寫文章/發(fā)需求
立即登錄