在英偉達(dá)股價(jià)因受DeepSeek影響而經(jīng)歷了一輪過山車般的起伏后,黃仁勛終于站了出來。
2月21日,一段黃仁勛的受訪視頻出現(xiàn)在其合作伙伴DataDirect Networksg公司舉辦的線上活動(dòng)。在訪談中,他首次公開回應(yīng)了DeepSeek是否利好英偉達(dá)的相關(guān)話題。
“R1讓實(shí)際情況恰恰相反”
“DeepSeep-R1作為全球首個(gè)開源的推理模型,令人十分興奮。R1模型的開源,讓全球的熱情也變得非常高漲?!秉S仁勛表示。
他首先否定了一個(gè)既有認(rèn)知:從投資者的角度來看,有這樣一種思維定式——AI世界就是先做預(yù)訓(xùn)練,然后就是推理。而“推理”就是給AI提出一個(gè)問題,它立刻給出答案。
“雖然不知道這種思維源自哪里,但它顯然是錯(cuò)誤的?!秉S仁勛強(qiáng)調(diào)。
為此,黃仁勛給出了詳細(xì)的解釋:正確的模式是先進(jìn)行預(yù)訓(xùn)練,讓模型對(duì)信息有一個(gè)基礎(chǔ)的理解,預(yù)訓(xùn)練后要持續(xù)保持嚴(yán)謹(jǐn)。第二個(gè)階段是最為重要的后訓(xùn)練(post training),也就是模型學(xué)會(huì)解決問題的過程。在這一階段,模型已經(jīng)有了基礎(chǔ)的信息,而后運(yùn)用這些基礎(chǔ)知識(shí)去解決實(shí)際問題。后訓(xùn)練階段與一系列不同的學(xué)習(xí)范式相關(guān)。在這些范式的推動(dòng)下,AI技術(shù)在過去五年發(fā)展得非常迅猛,計(jì)算需求也因而變得極為密集?!按蠹視?huì)覺得預(yù)訓(xùn)練要少得多,但是他們忘記了預(yù)訓(xùn)練之后的第二部分——后訓(xùn)練其實(shí)(計(jì)算需求量)是相當(dāng)大的。”他表示。
黃仁勛提到了第三條縮放定律(scaling law)。推理越多,回答問題前思考得就越多,推理效果就會(huì)越好,這是一個(gè)計(jì)算量相當(dāng)大的過程。
“所以市場(chǎng)對(duì)DeepSeek R1問世的反應(yīng)是‘天吶,AI到頭了!’,就好像有了它,我們便不再需要進(jìn)行任何計(jì)算了,但實(shí)際情況恰恰相反?!秉S仁勛表示。
市場(chǎng)是否“買單”?
2025年1月,DeepSeek推出低算力成本的開源大語言模型R1,以僅560萬美元的訓(xùn)練成本實(shí)現(xiàn)了與OpenAI o1等閉源模型相當(dāng)?shù)男阅?。這一成果挑戰(zhàn)了傳統(tǒng)AI訓(xùn)練依賴高算力芯片堆料的商業(yè)模式。
受此影響,英偉達(dá)市值曾一度下跌,尤其在1月27日跌去近17%,一夜蒸發(fā)近6000億美元,創(chuàng)美股單日市值蒸發(fā)紀(jì)錄。當(dāng)時(shí),投資者們擔(dān)憂AI行業(yè)對(duì)英偉達(dá)芯片的需求可能大幅減少,導(dǎo)致市場(chǎng)對(duì)算力泡沫的恐慌。
事實(shí)上,英偉達(dá)官方在股價(jià)暴跌后迅速發(fā)聲,指出DeepSeek的成功恰恰證明了其芯片的實(shí)用性,并強(qiáng)調(diào)“推理階段需要大量英偉達(dá)GPU和高性能網(wǎng)絡(luò)”,未來市場(chǎng)需求將隨著AI應(yīng)用擴(kuò)展而增長(zhǎng)。但當(dāng)時(shí)的發(fā)聲并未對(duì)其股價(jià)回升起到實(shí)際效果。
隨后市場(chǎng)逐漸認(rèn)識(shí)到,DeepSeek的創(chuàng)新可能推動(dòng)更多中小型企業(yè)進(jìn)入AI領(lǐng)域,反而刺激對(duì)GPU等算力芯片的增量需求。英偉達(dá)股價(jià)在接下來近一個(gè)月里震蕩回升,目前已逐漸“收復(fù)失地”。
值得關(guān)注的是,此次黃仁勛的發(fā)聲在英偉達(dá)財(cái)報(bào)公布之前,2月26日美股盤后,英偉達(dá)將公布四季度財(cái)報(bào)。雖然此次黃仁勛正面表達(dá)了對(duì)于DeepSeek問世將利好英偉達(dá)未來的信心,但市場(chǎng)的真正反映將有賴于其財(cái)報(bào)給出的關(guān)鍵數(shù)據(jù)。
作者丨楊鵬岳編輯丨張心怡美編丨馬利亞監(jiān)制丨連曉東