每年一度的國際消費電子展(CES)是全球科技界的盛會,被譽為科技發(fā)展的風向標。它不僅匯聚了全球最前沿的科技產(chǎn)品和創(chuàng)新技術,更是各大科技巨頭展示實力、引領行業(yè)趨勢的重要舞臺。CES 2025 于 1 月 7 日至 10 日在美國拉斯維加斯舉行,吸引了無數(shù)科技愛好者、行業(yè)專家和媒體的目光。
在眾多參展商中,英偉達(NVIDIA)無疑是本屆 CES 的焦點之一。作為全球領先的 GPU 和 AI 芯片制造商,英偉達憑借其強大的 GPU 和 AI 計算平臺,推動了生成式 AI 和 Agentic AI 等技術的爆發(fā),股價和市值也一路飆升超過3萬億,位列美股第二,甚至一度超過蘋果成為第一。在本次 CES 2025 上,英偉達 CEO 黃仁勛發(fā)表了開幕主題演講,展示了公司在 AI、機器人、游戲和自動駕駛領域的多項重磅技術進展。本文將深入探討英偉達在 CES 2025 上的展示內(nèi)容,分析其在 Agentic AI 和 Physical AI 領域的最新進展,以及這些技術如何改變我們的未來。
AI 應用的發(fā)展:從感知AI 到 Physical AI
個人新品發(fā)布:一塊顯卡,一個AI超級計算機
Agentic AI 開發(fā)套裝:NIM微應用,NeMo端到端框架
Physical AI 開發(fā)套裝:Cosmos世界模型,GR00T運動生成框架
Physical AI 掘金三件套:算法訓練,邊緣,虛擬開發(fā)端AI算力
希望能幫助理解 AI 發(fā)展的邏輯,以及當前?Agentic AI 和以自動駕駛以及人形機器人為代表的 Physical AI 這場 AI 淘金熱,未來已來背后的關鍵的“鏟子”或者驅(qū)動力量。
自從人類互聯(lián)網(wǎng)數(shù)字化以來,人類的內(nèi)容基本通過文字,圖像,視頻等沉淀起來,人類產(chǎn)生數(shù)字化內(nèi)容,人類消化這些數(shù)字化內(nèi)容。這些數(shù)字化的內(nèi)容,萌生了人工智能的發(fā)展四步:
Perception AI 感知AI- 人工智能能夠理解圖像、文字和聲音這些內(nèi)容,主要應用于語音識別,醫(yī)學影像識別,大家去看現(xiàn)在的B超體檢,基本上儀器掃描,儀器自動給出結論,這就是感知識別,而第一代智能駕駛采用CNN識別是同理。
Generative AI 生成式AI,人工智能能夠生成圖像、文本和聲音,用于數(shù)字市場營銷,內(nèi)容生成,這個點就是之前文章《ChatGPT以及其對汽車有什么影響?》講到的ChatGPT以及Midjourney等引發(fā)的,AI可以產(chǎn)生內(nèi)容供人類消費。
Agentic AI AI代理,人工智能能夠感知、推理、自主的規(guī)劃和行動,但主要停留在數(shù)字時代,用于代碼助手,電子客服等,他們可以根據(jù)人類指令自主的推理,生成,搜索等然后反饋給人類數(shù)字世界的內(nèi)容。
Physical AI 物理AI,這個時候AI走出了數(shù)字世界,進入與人類交互的物理世界,他們可以感知、推理、自主的規(guī)劃和擬人化的物理行動,主要落地用于自動駕駛,通用機器人。
以上為人工智能應用發(fā)展,基于人類產(chǎn)生數(shù)字內(nèi)容,之后人工智能產(chǎn)生數(shù)字內(nèi)容,最后人工智能產(chǎn)生物理行為與人類交互。那英偉達在人工智能時代,獲得如此高的價值和地位,主要就是抓住了AI的一軟一硬,硬件就是GPU等,軟件就是CUDA算子等。
下文我們看看此次CES 2025 英偉達從哪些方面在AI的淘金熱時代塑造其鏟子。
個人新品發(fā)布,一塊顯卡,一個AI超級計算機
首先,英偉達的老底,顯卡,本次CES 2025 英偉達推出了 GeForce RTX 50 系列臺式機和筆記本電腦 GPU——面向游戲玩家、創(chuàng)作者和開發(fā)者的消費級圖形處理器單元。
黃仁勛表示,這些 GPU 采用該公司下一代人工智能芯片 Blackwell,引入DLSS 4 多幀生成技術,業(yè)內(nèi)首個采用 Transformer 模型實時應用,等助力其 GPU 強大的性能:
- CUDA 核心:RTX 5090 擁有 21,760 個 CUDA 核心,相比前代產(chǎn)品性能提升高達 70%。顯存:配備 32GB GDDR7 顯存,顯存帶寬高達 1,792GB/s。AI TOPS:AI 算力達到 3,400 TOPS,是 RTX 4090 的兩倍。
旗艦 RTX 5090 型號將于 1 月上市,售價 1,999 美元。RTX 5070 將于 2 月下旬推出,售價 549 美元。
另外,英偉達宣布了Project DIGITS,這是一款售價 3,000 美元的臺式電腦,目標客戶是想要在家中試驗 AI 模型的開發(fā)人員或 AI 愛好者。性能如下:
AI 性能:采用GB10 超級芯片,可提供高達 1 PFLOPS(千萬億次浮點運算)的 AI 性能,專為 AI 大模型的原型設計、微調(diào)和運行而設計。
內(nèi)存和存儲:每個系統(tǒng)配備了 128GB 的統(tǒng)一高一致性內(nèi)存和 4TB 的 NVMe 存儲,足以運行包含高達 2000 億參數(shù)的大語言模型,類似于可以在本地跑一個ChatGPT-3(1750億參數(shù))。
該機器將于2025年 5 月推出,由新的 Blackwell 芯片驅(qū)動??偠灾琍roject DIGITS 將允許用戶運行具有多達 2000 億個參數(shù)的 AI 模型。這意味著以前需要昂貴的云基礎設施才能運行的模型可以在您的桌面上運行。開啟私人本地AI模型桌面化,未來極客本地化玩大模型。
Agentic AI人工智能代理開發(fā)套裝
Agentic AI(代理式人工智能)是一種能夠自主完成任務的智能體,通過復雜的推理和迭代規(guī)劃來解決多步驟的復雜問題。當前就是Agentic AI 快速發(fā)展應用落地的時候,Agentic AI本質(zhì)上是AI在數(shù)字層面的集成應用,他的核心差異有:
多模型協(xié)同工作:該系統(tǒng)包含多個模型,一部分用于理解客戶和用戶互動,另一部分用于從存儲中檢索信息。它可能是一個語義AI系統(tǒng),類似于我們之前文章《LLM大語言模型等AI如何加速汽車行業(yè)變革》分享過的多RAG(Retrieval-Augmented Generation),具備上網(wǎng)、研究PDF文件等多種功能,能夠使用工具如計算器、生成式AI來生成圖表等。
問題分解與迭代:系統(tǒng)將用戶提出的問題分解成多個步驟,并通過不同的模型進行迭代處理,以生成更準確、更全面的回答。這意味著在后臺,多個模型會協(xié)同工作,以提供更好的答案。
可以認為數(shù)字 AI 的一站式解決方案,當前互聯(lián)網(wǎng)在這一塊如火如荼的淘金,英偉達在本次CES 2025 上提出他們的淘金鏟子方案 --?英偉達的代理AI構建塊NIM預訓練模型和NeMo框架讓組織能夠輕松開發(fā)AI代理:英偉達NIM,本質(zhì)上是AI微服務,全部打包好,它將所有這些真正復雜的CUDA軟件、DNN、cutless或tensor rtlm或Triton所有這些不同的真正復雜的軟件和模型本身,英偉達將其打包,進行優(yōu)化,將其放入一個容器中,這樣你可以使用于視覺的模型、用于理解語言的模型、用于語音的模型、用于動畫的模型、用于數(shù)字生物學的模型等等。而英偉達?NeMo 是一款端到端的云原生框架,專為開發(fā)、定制和部署生成式 AI 模型而設計,甚至提供了一系列預訓練的AI 模型,例如本次CES 2025上英偉達表示提供基于Meta 開源大模型 Llama的Llama Nemotron 大語言基礎模型,支持大家微調(diào)構建自己的大語言模型。
所以,英偉達的Agentic AI 開發(fā)套件,將極大降低Agentic AI開發(fā)門檻。
各個行業(yè)的創(chuàng)業(yè)應用都可以買它的鏟子去Agentic AI淘金,開發(fā)自己的應用。
Physical?AI 開發(fā)套裝
解決了數(shù)字層面的AI,與人類物理交互的Physical AI 要出馬了,要與人類交互,必須能夠理解人類的物理世界,包括幾何空間關系,重力,摩擦等等我們大學學習的力學此類。其實,此類正是當前自動駕駛在解決和面對的問題,而機器人由于對安全方面的嚴苛要遠小于自動駕駛汽車,所以,現(xiàn)在隨physical AI 在自動駕駛上獲取大量的經(jīng)驗,機器人應用迅猛發(fā)展。
英偉達此次CES 2025 拋出了他的一個解決方案 -- Cosmos世界基礎模型,一個旨在理解物理世界的世界基礎模型平臺。它通過大規(guī)模的視頻數(shù)據(jù)訓練,生成基于物理的合成數(shù)據(jù),以支持機器人、自動駕駛汽車等在物理世界中運行的 AI 系統(tǒng)。
英偉達在CES 2025 上宣傳了他的 NVIDIA Isaac GR00T 合成運動生成的框架 ,可以采集運動數(shù)據(jù),通過模仿學習(Imitative Learning)幫助開發(fā)者生成海量的合成運動數(shù)據(jù),從而訓練人形機器人。以下是 GR00T 的核心組件及其在機器人開發(fā)中的應用:
GR00T-Teleop:實時遠程操作:通過 Apple Vision Pro 等 VR/AR 設備,操作者可以在數(shù)字孿生環(huán)境中以第一人稱視角控制機器人“化身”。操作者的動作會被精確捕捉,并通過高速網(wǎng)絡傳輸?shù)綑C器人身上,使機器人能夠?qū)崟r復現(xiàn)操作者的動作。
GR00T-Mimic:動作模仿和數(shù)據(jù)擴展:GR00T-Mimic 采用先進的深度學習模型(如循環(huán)神經(jīng)網(wǎng)絡 RNN、長短期記憶網(wǎng)絡 LSTM 和 Transformer)進行軌跡建模,通過訓練學習人類動作的軌跡和規(guī)律,生成新的動作軌跡。此外,圖神經(jīng)網(wǎng)絡(GNN)被引入用于建模人體骨骼的運動關系,使生成的動作更加自然和精確。
GR00T-Gen:數(shù)據(jù)集擴增:基于 NVIDIA Omniverse 和 NVIDIA Cosmos 平臺,GR00T-Gen 通過域隨機化(Domain Randomization)技術和 3D 提升技術,將合成數(shù)據(jù)集擴展到指數(shù)級別。這些數(shù)據(jù)集可以作為機器人策略的輸入,幫助機器人在 NVIDIA Isaac Lab 中學習如何高效且安全地移動和互動。
通過以上方法,可以快速開發(fā)和部署人形機器人,本次CES 2025上英偉達將12家人形機器人的產(chǎn)品拉來亮相了,其中一半來自中國,十二家分別是:
-
- 北美的Apptronik、Boston Dynamics、Agility Robotics、Figure,1X、Sanctuary AI。
中國的,Robotera 星動紀元、Agibot 智元機器人、Fourier 上海傅利葉智能、Galbot 銀河通用機器人、Xpeng小鵬、宇樹Unitree。
- 歐洲德國的NEURA Robotics。以色列,mobileye CEO創(chuàng)立的Mentee。
AI 人形機器人掘金賽道,當有了AI 鏟子之后,接下來會更火熱。Physical AI 掘金三件套:算法訓練,邊緣,虛擬開發(fā)端AI算力當然,目前AI更多的是企業(yè)級的應用,畢Physical AI 尚處于產(chǎn)業(yè)化落地的早期階段,英偉達在此次CES上提出了AI “三臺計算機”的方案:
一臺計算機用于訓練AI,英偉達稱之為DGX計算機主要用于訓練 AI 算法,目前大家喊的總共有多少算力,主要是指這一塊。
另一臺用于部署AI,英偉達稱之為AGX,它在車內(nèi)、機器人內(nèi)或在其他邊緣端,或者你知道在一個體育場或任何地方,比如蔚來汽車搞的換電站,也采用類似AI計算幫助定位,這些計算機都在邊緣,并且是本地化自主運行。最后一臺,英偉達表示要連接云端和邊緣端,還需要一個
數(shù)字孿生,數(shù)字孿生是AI被訓練后去實踐、去完善、去做合成數(shù)據(jù)生成、強化學習AI反饋等等的地方。
英偉達DGX用于訓練AI模型,它提供完全集成的硬件和軟件AI平臺。它包括NVIDIA AI Enterprise軟件,能夠加速數(shù)據(jù)科學流程,簡化生產(chǎn)級AI應用的開發(fā)和部署。當然美國已經(jīng)限制英偉達向中國出售高端AI訓練芯片,當前主要出售A800給國內(nèi),國內(nèi)華為,壁仞以及算能等都盯著這塊市場,但英偉達提供硬件和軟件整體解決方案,產(chǎn)生壁壘,而且平臺之間很難移植還是有優(yōu)勢。
車端,機器等邊緣端的AI計算芯片方案,英偉達稱為AGX,其中Orin芯片一直是當前汽車圈內(nèi)的高性能王者,而英偉達的Thor芯片號稱比其前身Orin模型強大20倍,也是喊出要推出很久了,原本喊2025年年中量產(chǎn),由于英偉達產(chǎn)品技術等原因聽說要推遲到今年年中以后。所以這次CES 2025 英偉達只是廣告了下他運行在芯片上的系統(tǒng)NVIDIA DRIVE OS,通過ASIL B/D,ISO26262認證,芯片平臺也是強調(diào)Blackwell平臺。
目前對于邊緣端AI算力芯片,國內(nèi)新勢力小鵬,理想,蔚來,以及比亞迪都已經(jīng)相繼流片,未來要上自己的AI芯片,國內(nèi)地平線等都摩拳擦掌搶占這塊市場。英偉達表示要連接云端和邊緣端的計算機,主要是用于虛擬驗證和數(shù)據(jù)泛化的Omniverse和Cosmos。Omniverse就是英偉達數(shù)字孿生的平臺,它能夠模擬真實世界環(huán)境,用于測試和驗證自動駕駛系統(tǒng)。例如在自動駕駛方面,它通過Omnimap融合地圖和地理空間數(shù)據(jù),構建可駕駛的3D環(huán)境。駕駛場景變化可以從重放Drive日志或AI交通生成器中生成。
此外,神經(jīng)重建引擎使用自動駕駛汽車傳感器日志創(chuàng)建高保真4D模擬環(huán)境,重放之前的駕駛并生成場景變化以增強訓練數(shù)據(jù)。而本次英偉達推出的Cosmos可以基于Omniverse場景生成大量逼真的數(shù)據(jù),減少模擬到現(xiàn)實的差距,并通過文本提示生成近乎無限的駕駛場景變化。通過條件化Omniverse中的3D場景來增強訓練數(shù)據(jù)集。具體應用:Waabi公司正在評估使用Cosmos進行視頻數(shù)據(jù)的搜索和整理,用于自動駕駛軟件開發(fā)和模擬。
Wayve公司正在評估Cosmos作為工具,用于搜索邊緣和角落駕駛場景,用于安全和驗證。Foretellix公司計劃使用Cosmos和NVIDIA Omniverse Sensor RTX API,大規(guī)模評估和生成高保真測試場景和訓練數(shù)據(jù)。通過這些三臺 AI 計算機技術的協(xié)同工作,英偉達表示可有為Physical AI的自動駕駛汽車或者人形機器等的開發(fā)提供了一個從訓練到測試再到實時決策的完整解決方案。
總結
人工智能全面落地的時代開啟,數(shù)字世界的Agentic AI,物理世界的Physical AI 將全面改變?nèi)祟惖纳睢?/p>
*未經(jīng)準許嚴禁轉(zhuǎn)載和摘錄-參考資料:
英偉達CES 2025演講ppt 以及視頻ces-2025-keynote-deck.pdf
加入我們的知識星球可以下載包含以上參考資料的公眾號海量參考資料。