• 正文
    • 02.Blackwell架構(gòu):支持神經(jīng)網(wǎng)絡(luò)渲染,F(xiàn)P4精度AI算力暴漲
    • 03.DLSS 4多幀生成:幀率暴漲至8倍,占用更少顯存
    • 04.多幀生成的技術(shù)難點(diǎn):控制成本、幀節(jié)奏、延遲
    • 05.DLSS 4全面引入Transformer:增強(qiáng)畫(huà)質(zhì),提升穩(wěn)定性,減少重影
    • 06.將AI引入著色器,秀材質(zhì)、皮膚、毛發(fā)渲染黑科技
    • 07.自主AI agent涌入游戲:AI隊(duì)友、AI助手、AI Boss
    • 08.RTX AI PC:輕松部署生成式AI模型,用AI增強(qiáng)視頻體驗(yàn)和3D創(chuàng)作
    • 09.結(jié)語(yǔ):AI與游戲的融合更加極致
  • 相關(guān)推薦
申請(qǐng)入駐 產(chǎn)業(yè)圖譜

深度揭秘RTX 5090八大看點(diǎn):游戲“兵器庫(kù)”逆天,將AI煉丹術(shù)塞到桌面

01/23 16:48
1672
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點(diǎn)資訊討論

作者 |??ZeR0,編輯?|??漠影

RTX 50系列即將開(kāi)售,刀法如何?

今年一開(kāi)年,NVIDIA GeForce RTX 50系列GPU終于猛獸出籠,能玩頂配游戲,能做AI開(kāi)發(fā)。趕上春節(jié)期間上市,估計(jì)會(huì)成為不少消費(fèi)者的硬核新年禮物。國(guó)內(nèi)外有區(qū)別的是旗艦卡RTX 5090,RTX 5090起售價(jià)1999美元,中國(guó)合規(guī)版RTX 5090 D起售價(jià)16499元。其他非旗艦產(chǎn)品的價(jià)格則至少減半。

關(guān)注新顯卡的朋友們可能還有很多疑問(wèn),比如RTX 5090和RTX 5090D有什么區(qū)別?除去AI外,其他設(shè)計(jì)的變化和性能提升有多少?AI和顯卡的深度融合到底是噱頭還是真有用?在CES 2025期間,芯東西受邀參加了NVIDIA閉門編輯日,聽(tīng)多位NVIDIA副總裁連講一整天的大師課,涉及很多GPU性能提升、基準(zhǔn)測(cè)試和技術(shù)原理的細(xì)節(jié)。在此將一些干貨整理分享給大家。先說(shuō)結(jié)論,如果你不關(guān)注AI,只想看傳統(tǒng)顯卡性能提升,可能50系列顯卡會(huì)讓你略感失望,因?yàn)閺募軜?gòu)來(lái)看,RTX Blackwell和上一代Ada架構(gòu)相差不大,硬實(shí)力升級(jí)幅度比較收斂,但是圍繞AI的軟實(shí)力提升可以稱得上十分驚艷。這也是NVIDIA迄今最大膽的一次將AI和游戲顯卡高度融合,并讓AI成為提升性能的頭號(hào)主角。RTX 5090的TDP是575W,比上一代高125W。這么高的功耗,怎么快速冷卻呢?以前的設(shè)計(jì)是空氣進(jìn)來(lái)后撞到PCB板拐彎,從一個(gè)較小的排氣口排出,風(fēng)扇轉(zhuǎn)得越快噪聲越大。NVIDIA則把原來(lái)的PCB拿掉,中間做了個(gè)更小更緊湊的PCB板,讓氣流可以從兩邊風(fēng)扇的散熱鰭片直接順滑通過(guò),效率更高,還大降噪音。

我們將從以下8個(gè)方面,詳細(xì)解析RTX 50系列消費(fèi)級(jí)GPU的特點(diǎn):1、RTX 50系列的基礎(chǔ)規(guī)格與基準(zhǔn)測(cè)試表現(xiàn);2、Blackwell架構(gòu)的設(shè)計(jì)目標(biāo)、主要變化;3、DLSS 4多幀生成的效果及用途;4、多幀生成的技術(shù)原理與難點(diǎn);5、圖形業(yè)首個(gè)實(shí)時(shí)Transformer模型應(yīng)用;6、首次將AI引入可編程著色器;7、給游戲世界構(gòu)建AI隊(duì)友、AI助手、AI敵人;8、AI PC本地部署生成式AI模型,優(yōu)化直播和3D創(chuàng)意工作。注:本文信息量偏大,讀者朋友可直接跳至感興趣的章節(jié)閱讀。

01.游戲+AI性能猛獸出籠:全系顯存換新,暢玩超250幀4K游戲

RTX 5090仍然采用臺(tái)積電NVIDIA 4N定制工藝,面積變得更大。上一代4090的GPU芯片面積是608mm2,RTX 5090系列的面積則增加到744mm2。RTX 5090擁有920億個(gè)晶體管、21760個(gè)CUDA核心(比上一代多50%),AI峰值算力是3352TOPS。RTX 5090 D硬件配置是一樣的,AI算力受合規(guī)限制到2375TOPS,也就是比5080高了約32%。

▲RTX 50系列顯卡規(guī)格

目前公開(kāi)的RTX 50系列GPU,顯存都升級(jí)到GDDR7,位寬、容量做了分級(jí):5090是512bit、32GB,5080和5070 Ti是256bit、16GB,5070是192bit、12GB。GeForce RTX 50系列筆記本電腦GPU規(guī)格也同步更新,相比上一代,能效更高、能跑2倍大的AI模型、視頻編輯速度快40%,電池壽命延長(zhǎng)40%。

▲RTX 50系列筆記本電腦GPU規(guī)格

令人印象深刻的依然是AI技術(shù),性能最多暴漲至8倍。尤其是DLSS 4,在跑《黑神話:悟空》、《賽博朋克 2077》等硬件密集型光線追蹤游戲時(shí),4K分辨率下幀率超過(guò)200FPS,而且顯著減少延遲。

RTX 5090 / 5090 D無(wú)疑是性能猛獸,開(kāi)DLSS 4和全景光追時(shí)升級(jí)幅度非??捎^。NVIDIA官方公布的游戲及渲染測(cè)試顯示,4K分辨率、最高游戲設(shè)置的情況下,在開(kāi)DLSS 4時(shí),RTX 5090 / 5090 D / 5080基本上都表現(xiàn)出至少翻倍的性能提升。

RTX 5070 Ti / 5070也借助DLSS 4實(shí)現(xiàn)了超過(guò)翻倍的性能提升,在采用 2560x1440 分辨率、最高游戲設(shè)置的情況下,能以高幀率暢玩《心靈殺手2》、《黑神話:悟空》、《賽博朋克2077》等游戲。

不過(guò)在沒(méi)開(kāi)DLSS的情況下,例如《生化危機(jī)4》,RTX 50系列相比上一代的提升幅度更小一些,約提升15%~30%。這些基準(zhǔn)測(cè)試性能對(duì)比已經(jīng)在官網(wǎng)公布。RTX 5070的硬件規(guī)格雖然難與旗艦卡相提并論,但通過(guò)DLSS 4等AI軟實(shí)力的提升,NVIDIA稱其性能表現(xiàn)已經(jīng)堪比前代旗艦卡4090。

02.Blackwell架構(gòu):支持神經(jīng)網(wǎng)絡(luò)渲染,F(xiàn)P4精度AI算力暴漲

RTX 50系列GPU采用Blackwell架構(gòu)。NVIDIA稱Blackwell融合了AI驅(qū)動(dòng)的神經(jīng)網(wǎng)絡(luò)渲染和光線追蹤,是自25年前推出可編程著色以來(lái)最重要的計(jì)算機(jī)圖形創(chuàng)新。

RTX Blackwell架構(gòu)的設(shè)計(jì)目標(biāo)包括優(yōu)化新神經(jīng)網(wǎng)絡(luò)工作負(fù)載、減少顯存占用、提高能效等。

上一代Ada架構(gòu)的SM多單元流處理器里,Shader Core有一半僅支持FP32,一半可以同時(shí)支持FP32/INT32。Blackwell SM則變成所有Shader Core都支持FP32/INT32,并首次支持神經(jīng)網(wǎng)絡(luò)著色器,可提供125TFLOPS算力;承載AI計(jì)算的Tensor Core由第四代升級(jí)到第五代。

下圖中間灰框是著色器執(zhí)行重排序(SER),用于優(yōu)化GPU光線追蹤和圖形渲染。它會(huì)遍歷并重新排序工作,把相同工作分別放在一起,提高運(yùn)行效率,將整體重排序性能翻倍。

負(fù)責(zé)光線追蹤計(jì)算的Blackwell第四代RT Core,能夠更好支持NVIDIA RTX Mega Geometry技術(shù)。該技術(shù)可將場(chǎng)景中的光線追蹤三角形數(shù)量增加多達(dá)100倍,能夠更有效地處理超大幾何圖形簇。

RT Core增加了對(duì)線性掃描球體(Linear-swept spheres)、三角形簇交匯引擎(Triangle Cluster Intersection Engine)、三角形簇解壓縮(Triangle Cluster Decompression)的支持,可支持的幾何復(fù)雜度增加很多。Blackwell也更擅長(zhǎng)加速3D渲染,可將采用生成式AI的3D工作流的性能,較上一代提升50%。相比上一代,由第四代RT Core驅(qū)動(dòng)的3D渲染,性能提升約40%。使用D5 Render時(shí),RTX 5090的性能更是達(dá)到上一代的2.3倍。這對(duì)3D內(nèi)容創(chuàng)作大有裨益。

得益于神經(jīng)網(wǎng)絡(luò)渲染架構(gòu),Blackwell的每幀AI TOPS相比上一代最多提升達(dá)8倍。

針對(duì)AI運(yùn)算,第五代Tensor Core首度增加對(duì)FP4精度的支持,AI推理性能是上一代Ada FP8的2倍,并使生成式AI模型能夠在PC本地運(yùn)行,占用的顯存更小?,F(xiàn)在RTX 50系列GPU已經(jīng)能支持本地運(yùn)行視頻生成模型了。舉個(gè)例子,同樣是跑Black forest labs圖像生成模型FLUX.1,用RTX 4090在FP16精度下要花15秒、占用超過(guò)23GB的顯存,而用RTX 5090在FP4精度下只花5秒、占用10GB顯存。

Blackwell還添加了一個(gè)可編程的AI管理處理器,可以實(shí)現(xiàn)對(duì)AI和圖形工作負(fù)載同時(shí)運(yùn)行的智能調(diào)度分配。比如在玩游戲時(shí),它能優(yōu)先保證AI隊(duì)友第一時(shí)間作出響應(yīng)。

Blackwell顯示引擎和編解碼器同樣更新迭代。顯示引擎首度支持DP 2.1,能運(yùn)行更高的刷新率;還新增了對(duì)硬件級(jí)Flip Metering的支持,用于優(yōu)化多幀生成中的幀節(jié)奏邏輯。

升級(jí)的還有視頻編解碼,現(xiàn)支持4:2:2格式的硬件編解碼,能夠更好地服務(wù)于專業(yè)級(jí)視頻編輯。第9代視頻編碼器可在DaVinci Resolve、Adobe Premiere Pro等應(yīng)用中實(shí)現(xiàn)快速視頻導(dǎo)出,并使用AI驅(qū)動(dòng)特效。

03.DLSS 4多幀生成:幀率暴漲至8倍,占用更少顯存

近年來(lái)DLSS(深度學(xué)習(xí)超級(jí)采樣)已經(jīng)成為RTX系列GPU升級(jí)的重頭戲,用于提高幀率,同時(shí)提供媲美原始分辨率渲染的清晰高質(zhì)量圖像。RTX 50系列里最搶眼的技術(shù)當(dāng)屬最新引入的DLSS 4,首次推出多幀生成功能。

▲支持DLSS技術(shù)的硬件

多幀生成可以為每個(gè)渲染幀額外生成最多3幀。整套DLSS技術(shù)全開(kāi),可將運(yùn)行游戲或應(yīng)用的幀率提高到傳統(tǒng)圖像渲染時(shí)的8倍、單幀生成時(shí)的1.7倍。

僅用超分辨率或光線重建,4個(gè)像素中有3個(gè)是AI生成的;添加單幀生成時(shí),8個(gè)像素中有7個(gè)是由AI生成的;最后通過(guò)DLSS 4多幀生成,16個(gè)像素中就有15個(gè)由AI生成。

可以看幾張對(duì)比圖,來(lái)直觀感受下開(kāi)DLSS 4對(duì)畫(huà)面細(xì)節(jié)的優(yōu)化效果有多明顯。鏡中重影得到優(yōu)化:

紋理更精細(xì):

發(fā)絲、光影的質(zhì)量也顯著提升:

開(kāi)了DLSS 4后,RTX 5090顯卡可以駕馭4K 240 FPS全景光線追蹤游戲。

比如玩《賽博朋克2077》,與傳統(tǒng)渲染相比,RTX 5090的幀率提高近8倍,PC延遲減少一半,圖像質(zhì)量也得到增強(qiáng)。

NVIDIA還針對(duì)RTX 40和50系列GPU強(qiáng)化了幀生成模型。新CNN模型速度提高了40%,顯存占用量減少了30%。例如在《戰(zhàn)錘40000:暗潮》中,使用DLSS幀生成,在4K、最高設(shè)置下提供了10%更快的幀率,同時(shí)減少了400MB的顯存使用量。

同時(shí),DLSS光線重建、DLSS超分辨率和DLAA也轉(zhuǎn)由Transformer模型驅(qū)動(dòng), 它將進(jìn)一步提升RTX20、30、40、50系卡的DLSS 性能體驗(yàn)。在1月30日產(chǎn)品上市時(shí),將有超過(guò)75款游戲和應(yīng)用支持DLSS 4?!逗谏裨挘何蚩铡芬矊⒃谛驴òl(fā)售當(dāng)天支持DLSS 4,并在未來(lái)提供對(duì)DLSS 4的原生支持。除了游戲外,DLSS 4還將用于虛幻引擎5、D5 Render、Chaos Vantage等創(chuàng)作應(yīng)用,顯著增強(qiáng)實(shí)時(shí)視圖的端口體驗(yàn),提高D5 Render中的幀速率,使得設(shè)計(jì)師能更好地迭代和協(xié)作工作。

04.多幀生成的技術(shù)難點(diǎn):控制成本、幀節(jié)奏、延遲

RTX 50系列能用上多幀生成,得益于Blackwell硬件和DLSS軟件創(chuàng)新的相輔相成。DLSS 3幀生成功能在2022年發(fā)布,用AI模型來(lái)預(yù)測(cè)序列中的下一幀。該幀生成AI模型使用游戲里的運(yùn)動(dòng)矢量、深度等數(shù)據(jù)和RTX 40系列光流加速器的光流場(chǎng),在每對(duì)傳統(tǒng)渲染的幀之間創(chuàng)建一個(gè)額外幀。

而要實(shí)現(xiàn)多幀生成,成本就變得很高。因?yàn)槊總€(gè)新生成的幀都需要光流加速器和AI模型,性能成本會(huì)限制GPU,導(dǎo)致輸入幀率降低。多幀生成難在需要一致且精確的幀節(jié)奏。DLSS 3幀生成使用基于CPU的幀節(jié)奏,由于不同游戲引擎在CPU和GPU之間劃分工作負(fù)載的方式不同,其可變性可能會(huì)隨著其他幀而增加,導(dǎo)致每幀之間的幀間隔是變化的,會(huì)造成卡頓。對(duì)此,NVIDIA研究團(tuán)隊(duì)開(kāi)發(fā)了一個(gè)全新AI模型,搭配Blackwell的硬件級(jí)Flip Metering,確保GPU提供一致且最佳的幀率。高效的AI模型取代了硬件光流加速器,來(lái)加快光流場(chǎng)生成速度,能顯著降低生成額外幀的計(jì)算成本。

Flip Metering可以調(diào)整幀傳送速度,使GPU在生成和渲染幀時(shí)能更高效地進(jìn)行時(shí)序管理,實(shí)現(xiàn)更穩(wěn)定的幀生成,避免嚴(yán)重卡頓。

如果一款游戲運(yùn)行所有DLSS 4功能,包括超分辨率、光線重建、多幀生成,GPU需要在幾毫秒內(nèi)為每個(gè)渲染幀運(yùn)行5個(gè)AI模型,否則DLSS多幀生成可能會(huì)成為減速器。這就需要配備更強(qiáng)的硬件。基于Blackwell第五代Tensor Core,RTX 50系列的AI處理性能最高達(dá)到上一代GPU的2.5倍。新幀生成后,其節(jié)奏均勻,從而能提供流暢的體驗(yàn)。針對(duì)AI補(bǔ)幀會(huì)增加延遲的問(wèn)題,NVIDIA的解法是引入Reflex 2來(lái)優(yōu)化圖像渲染管線,最多能將延遲減少75%。Reflex低延遲模式通過(guò)在GPU與CPU之間進(jìn)行精確渲染同步來(lái)降低PC延遲。Reflex 2引入了一種新技術(shù)Frame Warp,可以在將渲染幀發(fā)送到顯示器之前,根據(jù)最新鼠標(biāo)輸入數(shù)據(jù)來(lái)更新渲染幀,以提高游戲響應(yīng)速度。

NVIDIA還開(kāi)發(fā)了一個(gè)Inpaint預(yù)測(cè)修補(bǔ)技術(shù),用于修復(fù)前一幀的顏色與深度數(shù)據(jù)的空白區(qū)域,讓畫(huà)面更加接近原生渲染。

05.DLSS 4全面引入Transformer:增強(qiáng)畫(huà)質(zhì),提升穩(wěn)定性,減少重影

DLSS 4的光線重建、超分辨率、深度學(xué)習(xí)抗鋸齒(DLAA),都采用了由NVIDIA超級(jí)計(jì)算機(jī)訓(xùn)練的全新Transformer模型。

DLSS 4是Transformer模型首次以高實(shí)時(shí)幀率生成連續(xù)圖像,由Blackwell Tensor Core提供額外硬件加速。新模型使用多達(dá)2倍以上的參數(shù)、4倍的Tensor Core計(jì)算能力,能夠更深入地理解場(chǎng)景、更好地渲染游戲場(chǎng)景中復(fù)雜部分,提高幀到幀之間的穩(wěn)定性,減少重影,增加光照細(xì)節(jié)和運(yùn)動(dòng)細(xì)節(jié)。以前DLSS使用卷積神經(jīng)網(wǎng)絡(luò)(CNN),通過(guò)將少量相鄰像素局部聚合并跟蹤連續(xù)幀中的區(qū)域變化來(lái)生成新像素。但經(jīng)過(guò)六年改進(jìn),這種方法已經(jīng)逐漸到達(dá)極限。

Transformer是當(dāng)前主流大模型所采用的架構(gòu)。新DLSS Transformer模型采用ViT(視覺(jué)Transformer),可實(shí)現(xiàn)自注意力操作來(lái)跟蹤評(píng)估整個(gè)幀和多幀中每個(gè)像素的相對(duì)重要性。與CNN相比,Transformer可以用更大的數(shù)據(jù)集訓(xùn)練,更具通用性和可擴(kuò)展性,能在更大的像素窗口內(nèi)輕松識(shí)別更長(zhǎng)距離的模式,而且更多關(guān)注到有問(wèn)題的細(xì)微區(qū)域。光線重建改用Transformer模型,可大幅提升圖像質(zhì)量。例如《心靈殺手2》游戲場(chǎng)景中,相比CNN,Transformer模型改善了高度精細(xì)的鐵絲網(wǎng)圍欄的穩(wěn)定性,減少了風(fēng)扇葉片上的重影,并消除了電線周圍的閃爍。

超分辨率的Transformer模型效果也很好,顯示更穩(wěn)定,圖像細(xì)節(jié)也更豐富,將先以測(cè)試版的形式發(fā)布。

具有光線重建、超分辨率、DLAA的DLSS游戲都可以升級(jí)到新的DLSS Transformer模型。對(duì)于尚未更新到最新DLSS的游戲,NVIDIA app Driver設(shè)置菜單中增加了DLSS優(yōu)設(shè)(DLSS Override)選項(xiàng),可在Frame Generation下拉菜單中設(shè)定所需的輸出模式。

06.將AI引入著色器,秀材質(zhì)、皮膚、毛發(fā)渲染黑科技

自2001年GeForce 3引入第一個(gè)可編程著色器起,NVIDIA 20多年來(lái)持續(xù)點(diǎn)亮圖形創(chuàng)新,推出高級(jí)著色語(yǔ)言、幾何著色器、計(jì)算著色器、Low-level編程,以及2018年發(fā)布的光線追蹤。到RTX 50系列GPU,Blackwell開(kāi)發(fā)人員首次將小型AI網(wǎng)絡(luò)引入可編程著色器,在實(shí)時(shí)游戲中解鎖電影級(jí)材質(zhì)、光照等。NVIDIA將它命名為RTX神經(jīng)網(wǎng)絡(luò)著色器,稱其重塑了著色器的編程方式,可用于將紋理壓縮多達(dá)7倍。

DirectX將很快支持一個(gè)由NVIDIA和微軟合作創(chuàng)建的新API,Cooperative Vectors。它可以真正利用到Tensor Core的能力,更充分加速Windows上的神經(jīng)網(wǎng)絡(luò)著色器。相信神經(jīng)網(wǎng)絡(luò)技術(shù)將很快取代傳統(tǒng)圖形管線的一部分。

神經(jīng)網(wǎng)絡(luò)材質(zhì)就是一個(gè)例子。傳統(tǒng)材質(zhì)采用帶有實(shí)時(shí)圖形的著色編程,光線與材質(zhì)交互的計(jì)算量和數(shù)據(jù)存儲(chǔ)量浩大,如果是電影級(jí)渲染,可能要用成百上千行代碼。而RTX Neural Materials通過(guò)引入一個(gè)只有幾層的小型AI神經(jīng)網(wǎng)絡(luò),能大幅減少著色器編程代碼量和數(shù)據(jù)。在Zorah游戲演示中,用傳統(tǒng)材質(zhì)要占用47MB顯存,用RTX Neural Material則可將顯存占用量壓縮至16MB,視覺(jué)效果還更逼真。

RTX Neural Radiance Cache是一個(gè)更準(zhǔn)確地追蹤間接光線的方法。與許多只用推理的神經(jīng)網(wǎng)絡(luò)技術(shù)不同,該技術(shù)有一個(gè)實(shí)時(shí)自訓(xùn)練網(wǎng)絡(luò),接受了特定游戲數(shù)據(jù)訓(xùn)練,學(xué)習(xí)了任何給定陣列所應(yīng)達(dá)到的間接光照情況,能通過(guò)追蹤每像素一次光線彈射推斷出更多的彈射。還有RTX Skin,針對(duì)半透明材料,NVIDIA借鑒了迪士尼的電影渲染技術(shù),將次表面散射算法首次引入實(shí)時(shí)光線追蹤。

RTX Neural Faces采用簡(jiǎn)單的光柵化面部和3D姿勢(shì)數(shù)據(jù)作為輸入,并使用生成式AI實(shí)時(shí)推理,渲染出穩(wěn)定、高質(zhì)量的數(shù)字面孔。NVIDIA在不同的光照條件下,用不同的情緒和動(dòng)畫(huà)、不同的遮擋(比如部分臉被遮蓋),在每一個(gè)可能的姿勢(shì)下做渲染,然后在超級(jí)計(jì)算機(jī)上創(chuàng)建一個(gè)模型,用于構(gòu)建特色角色的照片級(jí)逼真圖像,再在游戲系統(tǒng)上進(jìn)行部署。

渲染毛發(fā)也很有挑戰(zhàn)性。光線追蹤的毛發(fā)渲染成本高昂。傳統(tǒng)毛發(fā)渲染技術(shù)無(wú)法兼顧性能和圖像質(zhì)量,需要用很多三角形來(lái)保證精度。在NVIDIA展示的例子中,一個(gè)角色的毛發(fā)渲染要用到600萬(wàn)個(gè)三角形。全新RTX Hair技術(shù)改用Linear-swept spheres單元,能夠讓角色頭發(fā)看起來(lái)更逼真細(xì)致、陰影更準(zhǔn)確。相比多邊形,球體能更好地貼近真正的毛發(fā)。這種渲染方式運(yùn)行速度更快,圖像質(zhì)量更高,同時(shí)大幅減少顯存占用。

RTX Mega Geometry是一項(xiàng)突破性技術(shù),可以智能地聚集和更新復(fù)雜幾何體,以進(jìn)行實(shí)時(shí)光線追蹤計(jì)算,能夠減少CPU開(kāi)銷,提高幀率,并減少大量光線追蹤場(chǎng)景中的顯存消耗。

近30年來(lái)游戲里的幾何體數(shù)量一路飆漲,Zorah游戲場(chǎng)景有超過(guò)5億個(gè)三角形,啟用RTX Mega Geometry技術(shù)后能在RTX 50系列GPU上流暢運(yùn)行?!秺Z寶奇兵:古老之圈》未來(lái)的更新將引入全新NVIDIA RTX Hair技術(shù)?!缎撵`殺手 2》將率先采用RTX Mega Geometry技術(shù)。

07.自主AI agent涌入游戲:AI隊(duì)友、AI助手、AI Boss

一個(gè)充滿生命感的游戲世界,會(huì)是什么樣子?可能是一個(gè)充滿自主AI的模擬空間,你的隊(duì)友、系統(tǒng)、敵人等角色都由自主AI agent驅(qū)動(dòng)。而讓AI去復(fù)制人類決策,是一個(gè)困難的感知認(rèn)知行動(dòng),它要像人一樣具備感知、認(rèn)知、記憶、規(guī)劃與行動(dòng)的能力。NVIDIA ACE便旨在為自主游戲角色提供支持。使用該技術(shù),開(kāi)發(fā)者可以創(chuàng)建在本地設(shè)備上運(yùn)行的自主AI隊(duì)友,協(xié)助玩家暢玩游戲。

感知方面,ACE有音頻理解模型Nemoaudio-4B-Instruct、視覺(jué)理解模型Cosmos Nemotron-4B-Instruct-v2。比如玩槍?xiě)?zhàn)游戲,它能理解槍聲的狀態(tài)與位置,據(jù)此來(lái)制定計(jì)劃;在復(fù)雜游戲場(chǎng)景中,視覺(jué)理解模型能夠掌握很多關(guān)于游戲中發(fā)生事情的信息。認(rèn)知方面,ACE提供了Mistral NeMo Minitron instruct模型系列,有不同參數(shù)版本,規(guī)劃模型能輸出agent將要執(zhí)行計(jì)劃的純文本,基于這個(gè)計(jì)劃,行動(dòng)選擇模型將產(chǎn)生一些行動(dòng);音頻生成模型Riva A2 Flow TTS是一個(gè)文本轉(zhuǎn)語(yǔ)音模型,可輸出自然、有感情的音頻。在呈現(xiàn)更好的動(dòng)畫(huà)效果上,ACE提供由音頻驅(qū)動(dòng)的全新AI面部模型新一代Audio2Face,能讓游戲角色說(shuō)話時(shí)的表情和口型更貼合;還有由文本驅(qū)動(dòng)的身體運(yùn)動(dòng)ACE AI Body Motion,只需輸入文本,就能從大量動(dòng)作捕捉數(shù)據(jù)中生成動(dòng)畫(huà)序列,可以幫動(dòng)畫(huà)師節(jié)省時(shí)間。還可以用前文提過(guò)的RTX Neural Faces、RTX Skin、RTX Hair等套件,來(lái)渲染出栩栩如生的數(shù)字人。動(dòng)作游戲《動(dòng)物朋克》的demo中便使用ACE來(lái)實(shí)現(xiàn)游戲中的語(yǔ)音理解,使角色互動(dòng)更自然細(xì)膩,從而增強(qiáng)游戲的代入感。玩家可以用語(yǔ)音或文本,要求AI更改游戲中的裝備涂裝,比如更換飛船的顏色或logo中的動(dòng)物形象。

ACE驅(qū)動(dòng)的自主角色正在集成到戰(zhàn)術(shù)競(jìng)技游戲《絕地求生》、人生模擬游戲InZOI、多人在線角色扮演游戲《傳奇5》中。在《絕地求生》中,由ACE提供支持的AI隊(duì)友可以跟玩家討論戰(zhàn)略、提供游戲建議或者閑聊,也能計(jì)劃和執(zhí)行戰(zhàn)略行動(dòng),與人類玩家動(dòng)態(tài)合作以確保生存。InZOI中由ACE支持的CPC角色Smart Zoi,可以根據(jù)生活目標(biāo)和游戲內(nèi)的事件自主調(diào)整行為,能做出規(guī)劃、制定決策、提供反饋。它支持通過(guò)自然語(yǔ)言來(lái)定制性格、關(guān)系、記憶。

每一天結(jié)束時(shí),Smart Zoi會(huì)分析獲得的經(jīng)驗(yàn),由此影響它第二天的行為,從而塑造出一個(gè)真正獨(dú)特且個(gè)性化的性格?!秱髌?》則設(shè)置了一個(gè)AI Boss。以往基于固定腳本的Boss會(huì)遵循可預(yù)測(cè)的模式來(lái)行動(dòng),比較乏味。而由大語(yǔ)言模型驅(qū)動(dòng)的突襲Boss能夠分析玩家信息,識(shí)別每個(gè)玩家的獨(dú)特技能,從而調(diào)整戰(zhàn)術(shù)。這樣一來(lái),玩家在每次游戲會(huì)話中都能遇到獨(dú)特的Boss,它的攻擊策略變得更不可預(yù)測(cè),也更具挑戰(zhàn)性??紤]到游戲玩家很難找到一個(gè)適合自己系統(tǒng)和喜好的最佳配置,NVIDIA發(fā)布了一個(gè)AI助手Project G-Assist。該AI助手通過(guò)NVIDIA app提供,可以幫助提高RTX PC系統(tǒng)的性能。

Project G-Assist支持用戶用語(yǔ)音或文本命令來(lái)控制系統(tǒng),可以優(yōu)化幀率、延遲、能效等,支持利用AI來(lái)診斷和監(jiān)控性能,還能通過(guò)插件調(diào)用不同系統(tǒng),定制周邊照明、管理風(fēng)扇噪音。NVIDIA創(chuàng)建了一個(gè)插件框架,使得外設(shè)制造商可以構(gòu)建和測(cè)試自己的插件和輔助工具、連接流行的AI工具。

08.RTX AI PC:輕松部署生成式AI模型,用AI增強(qiáng)視頻體驗(yàn)和3D創(chuàng)作

除了暢玩游戲外,RTX 50系列GPU還有一個(gè)重要功能——加速AI模型訓(xùn)練和推理。GeForce做AI開(kāi)發(fā)最早可以追溯到2012年,開(kāi)啟深度學(xué)習(xí)革命的AlexNet模型就是用GeForce GTX 580訓(xùn)練的。根據(jù)NVIDIA披露的數(shù)據(jù),在去年發(fā)表的AI研究論文中,超過(guò)30%都提及對(duì)GeForce RTX的使用。全新Blackwell架構(gòu)首度支持FP4精度,AI推理性能翻倍。其使用案例涵蓋大語(yǔ)言模型、視覺(jué)語(yǔ)言模型、圖像生成、語(yǔ)音、用于檢索增強(qiáng)生成的嵌入模型、PDF提取、計(jì)算機(jī)視覺(jué)等。

你可以用ChatRTX定制專屬AI聊天機(jī)器人,通過(guò)文本或語(yǔ)音搜索個(gè)人筆記、文件及照片;用Broadcast應(yīng)用做AI降噪和背景替換,提升視頻會(huì)議通話、語(yǔ)音聊天和直播的體驗(yàn);用RTX Video通過(guò)AI超分辨率和視頻HDR技術(shù),將互聯(lián)網(wǎng)視頻升級(jí)為超清4K HDR視頻。Broadcast應(yīng)用為直播者提供了2項(xiàng)由AI提供支持的測(cè)試版功能:1)Studio Voice,用于去除噪音和混響,升級(jí)麥克風(fēng)音頻;2)Virtual Key Light,通過(guò)AI補(bǔ)光改善主播的面部光影,從而提升與玩家的互動(dòng)氛圍。

Streamlabs正在推出由NVIDIA ACE和Inworld AI框架提供支持的智能流媒體助手。它可以充當(dāng)聯(lián)合主持人、制作人和技術(shù)助理來(lái)輔助直播,比如做些點(diǎn)評(píng)、和觀眾互動(dòng)或者提供排除故障的建議。這個(gè)AI助手將在今年下半年發(fā)布。

包括NVIDIA Studio專屬AI工具套件在內(nèi),有超過(guò)100款由AI賦能并由RTX加速的創(chuàng)意應(yīng)用可輔助內(nèi)容創(chuàng)作,比如加速圖像生成、增強(qiáng)視頻編輯、助力3D設(shè)計(jì)等。利用NVIDIA NIM微服務(wù)和AI藍(lán)圖,你還可以在RTX AI PC上本地運(yùn)行最新的生成式AI模型。

NIM微服務(wù)針對(duì)RTX GPU優(yōu)化,包括在PC上運(yùn)行AI所需的各種組件,包含為RTX優(yōu)化的基礎(chǔ)模型、領(lǐng)域特定代碼、推理后端(TensorRT、TensorRT-LLM)、支持定制化的工具、行業(yè)標(biāo)準(zhǔn)API、預(yù)構(gòu)建容器??梢园堰@些微服務(wù)想象成堆積木,易組裝和使用。NIM微服務(wù)可從ChatRTX、AnythingLLM、ComfyUI、LM Studio等常用開(kāi)發(fā)者工具中體驗(yàn)前沿AI,讓做AI開(kāi)發(fā)變?nèi)菀?。第一波RTX NIM微服務(wù)將在2月份上線。

NIM微服務(wù)針對(duì)Windows PC集成AI模型做了優(yōu)化。適用于Linux的Windows子系統(tǒng)為Windows 11上的AI開(kāi)發(fā)以及Windows Copilot Runtime提供了跨平臺(tái)環(huán)境。

將NIM微服務(wù)與AI藍(lán)圖(AI Blueprint)結(jié)合,可以快速設(shè)置、定制和部署AI驅(qū)動(dòng)的工作流。AI藍(lán)圖基于NIM微服務(wù)構(gòu)建,向開(kāi)發(fā)者提供了如何使用微服務(wù)來(lái)構(gòu)建AI體驗(yàn)的預(yù)配置參考,比如基于PDF創(chuàng)建播客、構(gòu)建數(shù)字人、生成由3D場(chǎng)景引導(dǎo)的圖像等應(yīng)用。NVIDIA展示了一款具有視覺(jué)能力的PC虛擬形象Project R2X,它可以協(xié)助桌面應(yīng)用和視頻電話會(huì)議、閱讀和總結(jié)文檔等。

R2X可以通過(guò)常用開(kāi)發(fā)者框架連接到GPT-4o、Grok等云端AI服務(wù)以及NVIDIA NIM微服務(wù)和AI藍(lán)圖。該虛擬形象采用RTX Neural Faces渲染,用完全生成的像素來(lái)增強(qiáng)傳統(tǒng)光柵化渲染,然后用Audio2Face模型來(lái)優(yōu)化面部表情和對(duì)口型。還有一個(gè)由3D引導(dǎo)的生成式AI藍(lán)圖,可實(shí)現(xiàn)對(duì)圖像生成更精細(xì)的控制。創(chuàng)作者可以用Blender等3D渲染器中布置的簡(jiǎn)單3D物體來(lái)引導(dǎo)AI圖像生成:手動(dòng)或用AI生成創(chuàng)建3D資產(chǎn),將其放到場(chǎng)景中,設(shè)置3D視圖相機(jī),由FLUX NIM微服務(wù)驅(qū)動(dòng)的預(yù)打包工作流將可以通過(guò)插件使用當(dāng)前布景來(lái)生成與3D場(chǎng)景相匹配的高質(zhì)量圖像。

NVIDIA也提供了在RTX上開(kāi)始使用NIM和AI藍(lán)圖的建議:先在網(wǎng)頁(yè)端體驗(yàn)NIM,然后在RTX一鍵下載安裝和運(yùn)行NIM;有一個(gè)管理AI開(kāi)發(fā)項(xiàng)目的工具AI Workbench,便于共享項(xiàng)目和協(xié)同管理;你還可以嘗試集成agent、構(gòu)建數(shù)字人并連接到UI。消費(fèi)級(jí)GPU RTX 50系列、4090、4080以及臺(tái)式工作站GPU RTX 6000、5000都將從2月起首發(fā)支持NIM微服務(wù)和AI藍(lán)圖。來(lái)自Black Forest Labs、Meta、Stability AI、Mistral等頂級(jí)模型開(kāi)發(fā)商的NIM微服務(wù)和RTX AI PC AI藍(lán)圖流程即將發(fā)布。

GeForce RTX 50系列筆記本電腦將于今年3月開(kāi)始發(fā)布。針對(duì)能效改進(jìn),AI驅(qū)動(dòng)型技術(shù)Max-Q可從GPU、CPU、顯存、散熱、軟件、屏幕等方面優(yōu)化筆記本電腦。全新Blackwell Max-Q技術(shù)包括DLSS 4、GDDR7電壓優(yōu)化、加速頻率切換、低延遲休眠、高級(jí)電源門控等,有助于提升能效和性能、延長(zhǎng)電池續(xù)航時(shí)間。

09.結(jié)語(yǔ):AI與游戲的融合更加極致

正如前文所述,這次RTX 50系列將升級(jí)重點(diǎn)和賣點(diǎn)放在了AI軟實(shí)力上,把AI和游戲的融合玩得更加極致,不僅能駕馭高畫(huà)質(zhì)游戲,在專業(yè)3D內(nèi)容創(chuàng)作和渲染能力上也更具吸引力。想必不少骨灰級(jí)游戲發(fā)燒友、專業(yè)3D制作渲染人員已經(jīng)搓手準(zhǔn)備好將RTX 5090 D放進(jìn)購(gòu)物車了。隨著摩爾定律逐漸走到頭,硬件提升也會(huì)受到一定束縛。

而NVIDIA工程師的思路非常靈活,通過(guò)新硬件和AI驅(qū)動(dòng)的神經(jīng)網(wǎng)絡(luò)渲染的結(jié)合顯著提高GPU性能。DLSS 等神經(jīng)網(wǎng)絡(luò)渲染技術(shù)提高了圖形性能,同時(shí)也提高了游戲的圖像質(zhì)量。隨著神經(jīng)網(wǎng)絡(luò)著色器的推出,Blackwell為游戲渲染的未來(lái)開(kāi)啟了大門。

正如黃仁勛在主題演講強(qiáng)調(diào)的,GeForce顯卡系列和AI相輔相成的關(guān)系,過(guò)去 GeForce助力了AI的發(fā)展,現(xiàn)在AI又反過(guò)來(lái)加速革新GeForce。至于顯卡實(shí)際性能、用AI補(bǔ)幀對(duì)游戲體驗(yàn)的真實(shí)影響,請(qǐng)關(guān)注將在不久后發(fā)布的評(píng)測(cè)。這次RTX 50系列GPU的主要升級(jí),你怎么看?

 

英偉達(dá)

英偉達(dá)

NVIDIA(中國(guó)大陸譯名:英偉達(dá),港臺(tái)譯名:輝達(dá)),成立于1993年,是一家美國(guó)跨國(guó)科技公司,總部位于加利福尼亞州圣克拉拉市,由黃仁勛、克里斯·馬拉科夫斯基(Chris Malachowsky)和柯蒂斯·普里姆(Curtis Priem)共同創(chuàng)立。公司早期專注于圖形芯片設(shè)計(jì)業(yè)務(wù),隨著公司技術(shù)與業(yè)務(wù)發(fā)展,已成長(zhǎng)為一家提供全棧計(jì)算的人工智能公司,致力于開(kāi)發(fā)CPU、DPU、GPU和AI軟件,為建筑工程、金融服務(wù)、科學(xué)研究、制造業(yè)、汽車等領(lǐng)域的計(jì)算解決方案提供支持。

NVIDIA(中國(guó)大陸譯名:英偉達(dá),港臺(tái)譯名:輝達(dá)),成立于1993年,是一家美國(guó)跨國(guó)科技公司,總部位于加利福尼亞州圣克拉拉市,由黃仁勛、克里斯·馬拉科夫斯基(Chris Malachowsky)和柯蒂斯·普里姆(Curtis Priem)共同創(chuàng)立。公司早期專注于圖形芯片設(shè)計(jì)業(yè)務(wù),隨著公司技術(shù)與業(yè)務(wù)發(fā)展,已成長(zhǎng)為一家提供全棧計(jì)算的人工智能公司,致力于開(kāi)發(fā)CPU、DPU、GPU和AI軟件,為建筑工程、金融服務(wù)、科學(xué)研究、制造業(yè)、汽車等領(lǐng)域的計(jì)算解決方案提供支持。收起

查看更多

相關(guān)推薦