• 正文
    • 軟件3.0:先造好“駕駛大腦”,再考慮怎么上車
    • 擴(kuò)展法則鐵證:為自動(dòng)駕駛領(lǐng)域的“暴力美學(xué)”正名
    • CoT鏈?zhǔn)酵评?+ 強(qiáng)化學(xué)習(xí),教汽車“思考”怎么開
    • 最后一公里:從云端大模型到車端自研芯片
    • 結(jié)語:一份來自真實(shí)世界的行車報(bào)告
  • 相關(guān)推薦
申請(qǐng)入駐 產(chǎn)業(yè)圖譜

小鵬CVPR“亮底牌”:一家中國量產(chǎn)車企,如何為自動(dòng)駕駛的未來探路?

15小時(shí)前
245
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點(diǎn)資訊討論

作者Jessica,郵箱Jessica@pingwest.com

“CVPR的注冊(cè)隊(duì)伍現(xiàn)在在大廳里來回繞了2.5圈。如果你還沒到,可以睡個(gè)懶覺——等待時(shí)間至少45分鐘?!?/p>

6月14日,全球計(jì)算機(jī)視覺頂會(huì)CVPR 2025在美國納什維爾落下帷幕的前一天,社交媒體上仍有人在“抱怨”著入場(chǎng)的長(zhǎng)隊(duì),而這只是今年大會(huì)火爆程度的一個(gè)縮影。

整座城市都因上萬名 AI 研究者的涌入改變了節(jié)奏:機(jī)場(chǎng)里,背著電腦包、戴著參會(huì)證的人隨處可見;市中心的酒店幾乎全滿;會(huì)場(chǎng)走廊里,抱著電腦席地工作的研究者、匆匆穿梭于各個(gè)分會(huì)場(chǎng)的人群、永遠(yuǎn)排成長(zhǎng)龍的咖啡區(qū),共同構(gòu)成了這場(chǎng) AI 盛會(huì)最典型的風(fēng)景。

今年 CVPR 的競(jìng)爭(zhēng)異常激烈。官方數(shù)據(jù)顯示,大會(huì)共收到創(chuàng)紀(jì)錄的 13,008 篇論文投稿,最終錄取率則是歷屆新低,僅為 22.1%。能獲得口頭報(bào)告(Oral)機(jī)會(huì)的更是鳳毛麟角,只有 96 篇,占比約 3.3%。

在海量的論文和討論中,兩大技術(shù)風(fēng)向標(biāo)尤為明確。其一,3D視覺正迎來爆發(fā)前夜,成為高質(zhì)量研究成果和demo展示最密集的領(lǐng)域。本屆的最佳論文VGGT,就是一個(gè)能高效地從2D圖片中重建3D信息的端到端方案,一作王建元是華人研究員。其二,“世界模型”一詞無處不在,頻繁出現(xiàn)在各種論文、海報(bào)和研討會(huì)中,成為全場(chǎng)熱議的焦點(diǎn)。另外,包括謝賽寧、蘇昊、鄭奇立在內(nèi)的多位華人學(xué)者亦獲得多項(xiàng)獎(jiǎng)項(xiàng)與提名,中國研究員的活躍度和影響力持續(xù)提升。

與此同時(shí),一個(gè)更宏觀的趨勢(shì)是:CVPR的學(xué)術(shù)界與產(chǎn)業(yè)界邊界正在快速模糊。會(huì)場(chǎng)隨處可見Meta、Google、NVIDIA的logo,大量參會(huì)者佩戴企業(yè)工牌,“從論文到產(chǎn)品”成為熱門議題。一位連續(xù)參會(huì)者告訴我們,今年的CVPR更像是一場(chǎng)技術(shù)和產(chǎn)業(yè)界緊密結(jié)合的大集市,一個(gè)全球視野下技術(shù)人才、成果、場(chǎng)景三位一體的競(jìng)速場(chǎng)。

而就在“前沿技術(shù)趨勢(shì)”、“產(chǎn)業(yè)深度融合”和“華人力量崛起”這三大焦點(diǎn)的交匯處,一個(gè)來自中國的身影顯得尤為特別。

在今年CVPR自動(dòng)駕駛分論壇(WAD)上,小鵬世界基座模型負(fù)責(zé)人劉先明發(fā)表了題為《Scaling up Autonomous Driving via Large Foundation Models》的主題演講。與眾多“論文參會(huì)型”企業(yè)不同,小鵬汽車作為唯一受邀的中國車企,帶著在工業(yè)領(lǐng)域的重磅實(shí)踐經(jīng)驗(yàn)登場(chǎng)。當(dāng)其他參會(huì)者分享還在探討“如何將研究成果應(yīng)用于產(chǎn)業(yè)”時(shí),他們的主題恰恰相反:如何用產(chǎn)業(yè)的真實(shí)數(shù)據(jù)和研發(fā)經(jīng)驗(yàn),來推動(dòng)基礎(chǔ)科研的邊界。

講臺(tái)上,劉先明的開場(chǎng)白簡(jiǎn)單直接:“我大概是今天唯一一個(gè)來自大規(guī)模量產(chǎn)汽車公司的分享者?!?/p>

這番話點(diǎn)明了演講的獨(dú)特視角:接下來的內(nèi)容,將來自一個(gè)每天處理真實(shí)道路、真實(shí)用戶和海量量產(chǎn)車數(shù)據(jù)的研發(fā)團(tuán)隊(duì)。在場(chǎng)的AI學(xué)者們將聽到的,不再是純粹的理論推演,而是一套在產(chǎn)業(yè)一線被反復(fù)捶打和驗(yàn)證過的解題思路。

這是小鵬自今年 4 月發(fā)布 720 億參數(shù)的“世界基座模型”以來,首次在國際學(xué)術(shù)頂會(huì)上完整披露其自動(dòng)駕駛研發(fā)進(jìn)展。不僅帶來了工業(yè)界首次對(duì)“擴(kuò)展法則”(Scaling Law)在自動(dòng)駕駛領(lǐng)域的系統(tǒng)性驗(yàn)證,結(jié)合“云端基座模型 + 強(qiáng)化學(xué)習(xí)”的方法論,還公開了已被 DeepSeek 驗(yàn)證的“知識(shí)蒸餾”路徑,將 VLA(Visual-Language-Action)模型高效部署在自研芯片的最新實(shí)踐。

一場(chǎng)由“工業(yè)界反哺學(xué)術(shù)界”的大型案例分享,就此展開。

軟件3.0:先造好“駕駛大腦”,再考慮怎么上車

在劉先明看來,自動(dòng)駕駛軟件正在經(jīng)歷一場(chǎng)范式革命。從十年前靠C++ 規(guī)則堆砌的“軟件 1.0”, 到引入模型來逐步替代軟件、漸漸發(fā)展到“模型即軟件”的“軟件 2.0”,再到如今小鵬全面投入的“軟件 3.0”階段,核心理念已經(jīng)發(fā)生了根本性轉(zhuǎn)變,“軟件3.0”時(shí)代的最大特點(diǎn)是用模型生產(chǎn)模型。

在小鵬汽車的實(shí)踐中,就是先“不計(jì)成本”地把最聰明、最強(qiáng)大的“駕駛大腦”在云端訓(xùn)練出來,暫時(shí)不用考慮車上那塊小芯片的計(jì)算能力。等到云端模型能力足夠強(qiáng)大,再通過技術(shù)手段將其蒸餾成適合車端運(yùn)行的版本。目前,小鵬訓(xùn)練的這個(gè)“完全體”基座模型,參數(shù)規(guī)模高達(dá)720億(72B),是現(xiàn)在行業(yè)主流VLA模型的35倍以上。

模型背后,是一座真正意義上的“云端模型工廠:它擁有算力達(dá)10EFLOPS、上萬張GPU卡的智算集群,并采用專門優(yōu)化的數(shù)據(jù)傳輸架構(gòu),將訓(xùn)練速度提升了5倍。更重要的是它的“數(shù)據(jù)引擎”——一個(gè)龐大且持續(xù)運(yùn)轉(zhuǎn)的數(shù)據(jù)飛輪。

相比很多公司要依賴有限的公開數(shù)據(jù)集或單次采集任務(wù),小鵬的一大優(yōu)勢(shì)在于,其數(shù)據(jù)采集能力“不受限制”,直接來自大規(guī)模量產(chǎn)車隊(duì)。小鵬汽車的基座模型累計(jì)處理了超過5000萬段30秒視頻片段,總計(jì)超40萬小時(shí)訓(xùn)練數(shù)據(jù),平均每天上傳數(shù)據(jù)達(dá)600TB,這些數(shù)據(jù)全都來自真實(shí)世界、真實(shí)場(chǎng)景這些數(shù)據(jù)采集由超過100種觸發(fā)機(jī)制驅(qū)動(dòng),確保了數(shù)據(jù)的多樣性和價(jià)值。

更重要的是,這些數(shù)據(jù)并非“采了就用”,而是通過一套?“內(nèi)外雙循環(huán)系統(tǒng)”?持續(xù)驅(qū)動(dòng)模型進(jìn)化。

劉先明在演講中介紹,“我們的基座模型不是靜態(tài)的,它在持續(xù)學(xué)習(xí)、循環(huán)進(jìn)化(Continued Online Learning)。可以把模型的迭代過程分成內(nèi)、外兩個(gè)循環(huán),內(nèi)循環(huán)是指包含預(yù)訓(xùn)練、后訓(xùn)練(包括監(jiān)督精調(diào)SFT和強(qiáng)化學(xué)習(xí)RL)和蒸餾部署的模型訓(xùn)練過程;外循環(huán),是指模型在車端部署之后,持續(xù)獲取新的駕駛數(shù)據(jù)和用戶反饋,數(shù)據(jù)回流云端,繼續(xù)用于云端基模的訓(xùn)練。”

正是這種“數(shù)據(jù)飛輪”機(jī)制,讓小鵬的大模型訓(xùn)練始終處在動(dòng)態(tài)進(jìn)化狀態(tài),也為攻克自動(dòng)駕駛行業(yè)長(zhǎng)期面臨的“長(zhǎng)尾場(chǎng)景”難題提供了充足的數(shù)據(jù)保障。

現(xiàn)場(chǎng)觀眾評(píng)價(jià)小鵬汽車“軟件3.0”觀點(diǎn)。| 來源:硅星人

擴(kuò)展法則鐵證:為自動(dòng)駕駛領(lǐng)域的“暴力美學(xué)”正名

支撐這套“先做大、再做小”邏輯的,是一項(xiàng)關(guān)鍵的實(shí)驗(yàn)結(jié)果,也是小鵬此次分享最核心的貢獻(xiàn)之一:擴(kuò)展法則(Scaling Law)在自動(dòng)駕駛領(lǐng)域是有效的。

在語言大模型(LLM)領(lǐng)域,擴(kuò)展法則已被反復(fù)驗(yàn)證,即模型性能隨著計(jì)算量、數(shù)據(jù)量、參數(shù)規(guī)模增加而系統(tǒng)性提升。但在充滿不確定性的自動(dòng)駕駛物理世界里,輸入是復(fù)雜的多模態(tài)信號(hào),輸出需要實(shí)時(shí)行為決策,“越大越強(qiáng)”是否依然是鐵律?

小鵬團(tuán)隊(duì)此次通過大規(guī)模實(shí)驗(yàn)首次公開驗(yàn)證了這一點(diǎn)。

他們?cè)贑VPR展示的圖表顯示,當(dāng)模型參數(shù)量從10億增加到720億,以及訓(xùn)練視頻片段數(shù)量從100萬增加到3000萬時(shí),衡量軌跡預(yù)測(cè)精準(zhǔn)度的關(guān)鍵指標(biāo)——縱向平均位移誤差(Long ADE)——呈現(xiàn)出一條近乎完美的、持續(xù)下降的曲線。這意味著模型預(yù)測(cè)未來軌跡的精準(zhǔn)度,確實(shí)隨著其規(guī)模增加而系統(tǒng)性提升。劉先明補(bǔ)充道:“目前為止,我們還沒有看到這個(gè)趨勢(shì)出現(xiàn)飽和。”

這為小鵬“軟件 3.0”路線提供了強(qiáng)有力的數(shù)據(jù)支撐,也向整個(gè)行業(yè)證明,在自動(dòng)駕駛這條賽道上,依賴“海量高質(zhì)量數(shù)據(jù)+大模型驅(qū)動(dòng)”,是一條清晰可見、回報(bào)確定的技術(shù)路徑。

CoT鏈?zhǔn)酵评?+ 強(qiáng)化學(xué)習(xí),教汽車“思考”怎么開

但光有規(guī)模還不夠,如何讓這個(gè)“大力士”擁有“繡花針”般的精細(xì)操作能力?小鵬展示了其在大模型能力塑造中的關(guān)鍵策略組合——鏈?zhǔn)酵评恚–hain of Thought, CoT)+強(qiáng)化學(xué)習(xí)(RL)。

這就好比是教一個(gè)新手司機(jī)成長(zhǎng)為老司機(jī)的過程。

第一步:用CoT,讓AI學(xué)會(huì)分步驟思考

新手司機(jī)開車,往往是“看到障礙物,踩剎車”的本能反應(yīng);老司機(jī)則會(huì)在腦中進(jìn)行一連串的思考:“前方有障礙,我需要減速??匆谎酆笠曠R,右后方?jīng)]車。打轉(zhuǎn)向燈,平穩(wěn)地向右并線繞行?!盋oT正是要賦予AI這樣的能力。

在模型訓(xùn)練中,先通過大規(guī)模圖文數(shù)據(jù)建立基礎(chǔ)語義理解;接著在監(jiān)督微調(diào)(SFT)階段引入CoT機(jī)制,讓模型在做出關(guān)鍵決策前生成一段推理鏈,包括環(huán)境描述、邏輯分析和動(dòng)作規(guī)劃,提升可解釋性和魯棒性。劉先明說:“很多復(fù)雜場(chǎng)景需要分步驟思考,CoT正好賦予了模型這種思考時(shí)間?!?/p>

第二步:用RL,讓AI在試錯(cuò)中進(jìn)化

思考能力有了,但面對(duì)未知極限場(chǎng)景,模仿學(xué)習(xí)難以應(yīng)對(duì)——“L3/L4自動(dòng)駕駛很多極端情況是靠模仿學(xué)不會(huì)的,”劉先明坦言。這時(shí)RL就派上用場(chǎng)了。類似教孩子騎車,騎得穩(wěn)有“愉悅”的獎(jiǎng)勵(lì),快摔倒有“恐懼”的懲罰,最終在不斷的試錯(cuò)和調(diào)整中學(xué)會(huì)。RL也是同理,通過“獎(jiǎng)勵(lì)與懲罰”機(jī)制,讓模型在虛擬環(huán)境中不斷試錯(cuò),自主尋找最優(yōu)駕駛策略。劉先明舉例說:在一個(gè)U型掉頭場(chǎng)景,未優(yōu)化的模型動(dòng)作僵硬,甚至可能撞上路沿;而經(jīng)過RL訓(xùn)練后,模型會(huì)主動(dòng)減速,以優(yōu)雅平滑的路線完成掉頭。

為實(shí)現(xiàn)這一點(diǎn),小鵬打造了完整的RL訓(xùn)練體系,包括:Reward Function(強(qiáng)化安全、效率、合規(guī)駕駛能力)、Reward Model(從真實(shí)用戶接管和反饋數(shù)據(jù)中學(xué)習(xí)“好駕駛”行為)、World Model(虛擬博弈環(huán)境,支持高復(fù)雜動(dòng)態(tài)交互)??梢哉f,RL讓大模型真正具備了面對(duì)復(fù)雜現(xiàn)實(shí)場(chǎng)景“悟”出解決方案的能力。

最后一公里:從云端大模型到車端自研芯片

有了這個(gè)既會(huì)“思考”、又能進(jìn)化的云端大腦,下一個(gè)挑戰(zhàn)也是最現(xiàn)實(shí)的問題——如何將它裝進(jìn)每一輛車?yán)铩?/p>

小鵬的軟件解法,是通過“知識(shí)蒸餾”路徑,將 720 億參數(shù)的基座模型能力提煉為適配車端算力的小型模型。在部分實(shí)車測(cè)試中,甚至實(shí)現(xiàn)了未蒸餾小尺寸模型的直接控車,顯著提升駕駛的平滑性與安全性。

而硬件解法,則是另一張王牌:自研芯片。就在 CVPR 舉辦期間的 6 月 11 日晚,小鵬正式發(fā)布其最新車型 G7——全球首款 L3 級(jí)AI汽車,首發(fā)搭載三顆自研圖靈 AI 芯片。

這款芯片在性能上尤為引人注目:?jiǎn)晤w芯片有效算力達(dá)到英偉達(dá) Orin的三倍;三顆協(xié)同工作后的總算力達(dá) 2200 TOPS,相當(dāng)于 9 顆 Orin-X 的效能。集成小鵬自研智駕系統(tǒng)后可實(shí)現(xiàn)接近 100% 的算力利用率(相比通用芯片約 70%–80%),最高可在本地實(shí)時(shí)運(yùn)行 300 億參數(shù)大模型,為高階自動(dòng)駕駛提供了充足的冗余能力。

這塊強(qiáng)大的端側(cè)基石,配合小鵬云端具備5天一輪迭代能力的“云端工廠”,以及年內(nèi)將突破2億clips的訓(xùn)練數(shù)據(jù)目標(biāo),最終構(gòu)建出了一套“云端訓(xùn)練-車端部署、軟件定義-硬件優(yōu)化”的自循環(huán)完整技術(shù)路徑。

結(jié)語:一份來自真實(shí)世界的行車報(bào)告

小鵬汽車的這場(chǎng)CVPR分享,并沒有太多華麗辭藻。它更像一位資深研發(fā)員攤開設(shè)計(jì)圖與實(shí)驗(yàn)數(shù)據(jù),向同行們細(xì)致講述團(tuán)隊(duì)是如何一步步解決問題的。從驗(yàn)證Scaling Law,到拆解“思考型”模型的訓(xùn)練細(xì)節(jié),再到公布軟硬一體的部署方案,小鵬帶來的是一套完整的、在真實(shí)世界里跑出來的工程體系。

更重要的是,它打破了“學(xué)術(shù)→工業(yè)”單向傳導(dǎo)的慣性,展示了工業(yè)界如何通過海量真實(shí)數(shù)據(jù)、扎實(shí)工程實(shí)踐,反哺學(xué)術(shù)探索、為物理世界AI打開全新可能性。

當(dāng)理論照進(jìn)現(xiàn)實(shí),那些來自道路的真實(shí)挑戰(zhàn)和數(shù)據(jù),正在定義著自動(dòng)駕駛的下一程。

小鵬汽車

小鵬汽車

小鵬汽車成立于2014年,是一家專注未來出行的科技公司。我們一直堅(jiān)持飽和式研發(fā)投入,構(gòu)建全棧自研的核心能力,今天小鵬汽車已經(jīng)成為中國領(lǐng)先的智能電動(dòng)汽車公司之一。小鵬汽車的使命是,用科技為人類創(chuàng)造更便捷愉悅的出行生活。

小鵬汽車成立于2014年,是一家專注未來出行的科技公司。我們一直堅(jiān)持飽和式研發(fā)投入,構(gòu)建全棧自研的核心能力,今天小鵬汽車已經(jīng)成為中國領(lǐng)先的智能電動(dòng)汽車公司之一。小鵬汽車的使命是,用科技為人類創(chuàng)造更便捷愉悅的出行生活。收起

查看更多

相關(guān)推薦