新国产免费剧情av,一级女性全黄久久生活片,国产精品网站在线观看

作者｜Jessica，郵箱｜Jessica@pingwest.com

“CVPR的注冊(cè)隊(duì)伍現(xiàn)在在大廳里來回繞了2.5圈。如果你還沒到，可以睡個(gè)懶覺——等待時(shí)間至少45分鐘?！?/p>

6月14日，全球計(jì)算機(jī)視覺頂會(huì)CVPR 2025在美國納什維爾落下帷幕的前一天，社交媒體上仍有人在“抱怨”著入場(chǎng)的長(zhǎng)隊(duì)，而這只是今年大會(huì)火爆程度的一個(gè)縮影。

整座城市都因上萬名 AI 研究者的涌入改變了節(jié)奏：機(jī)場(chǎng)里，背著電腦包、戴著參會(huì)證的人隨處可見；市中心的酒店幾乎全滿；會(huì)場(chǎng)走廊里，抱著電腦席地工作的研究者、匆匆穿梭于各個(gè)分會(huì)場(chǎng)的人群、永遠(yuǎn)排成長(zhǎng)龍的咖啡區(qū)，共同構(gòu)成了這場(chǎng) AI 盛會(huì)最典型的風(fēng)景。

今年 CVPR 的競(jìng)爭(zhēng)異常激烈。官方數(shù)據(jù)顯示，大會(huì)共收到創(chuàng)紀(jì)錄的 13,008 篇論文投稿，最終錄取率則是歷屆新低，僅為 22.1%。能獲得口頭報(bào)告（Oral）機(jī)會(huì)的更是鳳毛麟角，只有 96 篇，占比約 3.3%。

在海量的論文和討論中，兩大技術(shù)風(fēng)向標(biāo)尤為明確。其一，3D視覺正迎來爆發(fā)前夜，成為高質(zhì)量研究成果和demo展示最密集的領(lǐng)域。本屆的最佳論文VGGT，就是一個(gè)能高效地從2D圖片中重建3D信息的端到端方案，一作王建元是華人研究員。其二，“世界模型”一詞無處不在，頻繁出現(xiàn)在各種論文、海報(bào)和研討會(huì)中，成為全場(chǎng)熱議的焦點(diǎn)。另外，包括謝賽寧、蘇昊、鄭奇立在內(nèi)的多位華人學(xué)者亦獲得多項(xiàng)獎(jiǎng)項(xiàng)與提名，中國研究員的活躍度和影響力持續(xù)提升。

與此同時(shí)，一個(gè)更宏觀的趨勢(shì)是：CVPR的學(xué)術(shù)界與產(chǎn)業(yè)界邊界正在快速模糊。會(huì)場(chǎng)隨處可見Meta、Google、NVIDIA的logo，大量參會(huì)者佩戴企業(yè)工牌，“從論文到產(chǎn)品”成為熱門議題。一位連續(xù)參會(huì)者告訴我們，今年的CVPR更像是一場(chǎng)技術(shù)和產(chǎn)業(yè)界緊密結(jié)合的大集市，一個(gè)全球視野下技術(shù)人才、成果、場(chǎng)景三位一體的競(jìng)速場(chǎng)。

而就在“前沿技術(shù)趨勢(shì)”、“產(chǎn)業(yè)深度融合”和“華人力量崛起”這三大焦點(diǎn)的交匯處，一個(gè)來自中國的身影顯得尤為特別。

在今年CVPR自動(dòng)駕駛分論壇（WAD）上，小鵬世界基座模型負(fù)責(zé)人劉先明發(fā)表了題為《Scaling up Autonomous Driving via Large Foundation Models》的主題演講。與眾多“論文參會(huì)型”企業(yè)不同，小鵬汽車是作為唯一受邀的中國車企，帶著在工業(yè)領(lǐng)域的重磅實(shí)踐經(jīng)驗(yàn)登場(chǎng)。當(dāng)其他參會(huì)者分享還在探討“如何將研究成果應(yīng)用于產(chǎn)業(yè)”時(shí)，他們的主題恰恰相反：如何用產(chǎn)業(yè)的真實(shí)數(shù)據(jù)和研發(fā)經(jīng)驗(yàn)，來推動(dòng)基礎(chǔ)科研的邊界。

講臺(tái)上，劉先明的開場(chǎng)白簡(jiǎn)單直接：“我大概是今天唯一一個(gè)來自大規(guī)模量產(chǎn)汽車公司的分享者?！?/p>

這番話點(diǎn)明了演講的獨(dú)特視角：接下來的內(nèi)容，將來自一個(gè)每天處理真實(shí)道路、真實(shí)用戶和海量量產(chǎn)車數(shù)據(jù)的研發(fā)團(tuán)隊(duì)。在場(chǎng)的AI學(xué)者們將聽到的，不再是純粹的理論推演，而是一套在產(chǎn)業(yè)一線被反復(fù)捶打和驗(yàn)證過的解題思路。

這是小鵬自今年 4 月發(fā)布 720 億參數(shù)的“世界基座模型”以來，首次在國際學(xué)術(shù)頂會(huì)上完整披露其自動(dòng)駕駛研發(fā)進(jìn)展。不僅帶來了工業(yè)界首次對(duì)“擴(kuò)展法則”（Scaling Law）在自動(dòng)駕駛領(lǐng)域的系統(tǒng)性驗(yàn)證，結(jié)合“云端基座模型 + 強(qiáng)化學(xué)習(xí)”的方法論，還公開了已被 DeepSeek 驗(yàn)證的“知識(shí)蒸餾”路徑，將 VLA（Visual-Language-Action）模型高效部署在自研芯片上的最新實(shí)踐。

一場(chǎng)由“工業(yè)界反哺學(xué)術(shù)界”的大型案例分享，就此展開。

軟件3.0：先造好“駕駛大腦”，再考慮怎么上車

在劉先明看來，自動(dòng)駕駛軟件正在經(jīng)歷一場(chǎng)范式革命。從十年前靠C++ 規(guī)則堆砌的“軟件 1.0”，到引入模型來逐步替代軟件、漸漸發(fā)展到“模型即軟件”的“軟件 2.0”，再到如今小鵬全面投入的“軟件 3.0”階段，核心理念已經(jīng)發(fā)生了根本性轉(zhuǎn)變，“軟件3.0”時(shí)代的最大特點(diǎn)是用模型生產(chǎn)模型。

在小鵬汽車的實(shí)踐中，就是先“不計(jì)成本”地把最聰明、最強(qiáng)大的“駕駛大腦”在云端訓(xùn)練出來，暫時(shí)不用考慮車上那塊小芯片的計(jì)算能力。等到云端模型能力足夠強(qiáng)大，再通過技術(shù)手段將其蒸餾成適合車端運(yùn)行的版本。目前，小鵬訓(xùn)練的這個(gè)“完全體”基座模型，參數(shù)規(guī)模高達(dá)720億(72B)，是現(xiàn)在行業(yè)主流VLA模型的35倍以上。

模型背后，是一座真正意義上的“云端模型工廠：它擁有算力達(dá)10EFLOPS、上萬張GPU卡的智算集群，并采用專門優(yōu)化的數(shù)據(jù)傳輸架構(gòu)，將訓(xùn)練速度提升了5倍。更重要的是它的“數(shù)據(jù)引擎”——一個(gè)龐大且持續(xù)運(yùn)轉(zhuǎn)的數(shù)據(jù)飛輪。

相比很多公司要依賴有限的公開數(shù)據(jù)集或單次采集任務(wù)，小鵬的一大優(yōu)勢(shì)在于，其數(shù)據(jù)采集能力“不受限制”，直接來自大規(guī)模量產(chǎn)車隊(duì)。小鵬汽車的基座模型累計(jì)處理了超過5000萬段30秒視頻片段，總計(jì)超40萬小時(shí)訓(xùn)練數(shù)據(jù)，平均每天上傳數(shù)據(jù)達(dá)600TB，這些數(shù)據(jù)全都來自真實(shí)世界、真實(shí)場(chǎng)景。這些數(shù)據(jù)采集由超過100種觸發(fā)機(jī)制驅(qū)動(dòng)，確保了數(shù)據(jù)的多樣性和價(jià)值。

更重要的是，這些數(shù)據(jù)并非“采了就用”，而是通過一套?“內(nèi)外雙循環(huán)系統(tǒng)”?持續(xù)驅(qū)動(dòng)模型進(jìn)化。

劉先明在演講中介紹，“我們的基座模型不是靜態(tài)的，它在持續(xù)學(xué)習(xí)、循環(huán)進(jìn)化（Continued Online Learning）。可以把模型的迭代過程分成內(nèi)、外兩個(gè)循環(huán)，內(nèi)循環(huán)是指包含預(yù)訓(xùn)練、后訓(xùn)練（包括監(jiān)督精調(diào)SFT和強(qiáng)化學(xué)習(xí)RL）和蒸餾部署的模型訓(xùn)練過程；外循環(huán)，是指模型在車端部署之后，持續(xù)獲取新的駕駛數(shù)據(jù)和用戶反饋，數(shù)據(jù)回流云端，繼續(xù)用于云端基模的訓(xùn)練。”

正是這種“數(shù)據(jù)飛輪”機(jī)制，讓小鵬的大模型訓(xùn)練始終處在動(dòng)態(tài)進(jìn)化狀態(tài)，也為攻克自動(dòng)駕駛行業(yè)長(zhǎng)期面臨的“長(zhǎng)尾場(chǎng)景”難題提供了充足的數(shù)據(jù)保障。

現(xiàn)場(chǎng)觀眾評(píng)價(jià)小鵬汽車“軟件3.0”觀點(diǎn)。| 來源：硅星人

擴(kuò)展法則鐵證：為自動(dòng)駕駛領(lǐng)域的“暴力美學(xué)”正名

支撐這套“先做大、再做小”邏輯的，是一項(xiàng)關(guān)鍵的實(shí)驗(yàn)結(jié)果，也是小鵬此次分享最核心的貢獻(xiàn)之一：擴(kuò)展法則（Scaling Law）在自動(dòng)駕駛領(lǐng)域是有效的。

在語言大模型（LLM）領(lǐng)域，擴(kuò)展法則已被反復(fù)驗(yàn)證，即模型性能隨著計(jì)算量、數(shù)據(jù)量、參數(shù)規(guī)模增加而系統(tǒng)性提升。但在充滿不確定性的自動(dòng)駕駛物理世界里，輸入是復(fù)雜的多模態(tài)信號(hào)，輸出需要實(shí)時(shí)行為決策，“越大越強(qiáng)”是否依然是鐵律？

小鵬團(tuán)隊(duì)此次通過大規(guī)模實(shí)驗(yàn)首次公開驗(yàn)證了這一點(diǎn)。

他們?cè)贑VPR展示的圖表顯示，當(dāng)模型參數(shù)量從10億增加到720億，以及訓(xùn)練視頻片段數(shù)量從100萬增加到3000萬時(shí)，衡量軌跡預(yù)測(cè)精準(zhǔn)度的關(guān)鍵指標(biāo)——縱向平均位移誤差(Long ADE)——呈現(xiàn)出一條近乎完美的、持續(xù)下降的曲線。這意味著模型預(yù)測(cè)未來軌跡的精準(zhǔn)度，確實(shí)隨著其規(guī)模增加而系統(tǒng)性提升。劉先明補(bǔ)充道：“目前為止，我們還沒有看到這個(gè)趨勢(shì)出現(xiàn)飽和。”

這為小鵬“軟件 3.0”路線提供了強(qiáng)有力的數(shù)據(jù)支撐，也向整個(gè)行業(yè)證明，在自動(dòng)駕駛這條賽道上，依賴“海量高質(zhì)量數(shù)據(jù)+大模型驅(qū)動(dòng)”，是一條清晰可見、回報(bào)確定的技術(shù)路徑。

CoT鏈?zhǔn)酵评?+ 強(qiáng)化學(xué)習(xí)，教汽車“思考”怎么開

但光有規(guī)模還不夠，如何讓這個(gè)“大力士”擁有“繡花針”般的精細(xì)操作能力？小鵬展示了其在大模型能力塑造中的關(guān)鍵策略組合——鏈?zhǔn)酵评恚–hain of Thought, CoT）+強(qiáng)化學(xué)習(xí)（RL）。

這就好比是教一個(gè)新手司機(jī)成長(zhǎng)為老司機(jī)的過程。

第一步：用CoT，讓AI學(xué)會(huì)分步驟思考

新手司機(jī)開車，往往是“看到障礙物，踩剎車”的本能反應(yīng)；老司機(jī)則會(huì)在腦中進(jìn)行一連串的思考：“前方有障礙，我需要減速?？匆谎酆笠曠R，右后方?jīng)]車。打轉(zhuǎn)向燈，平穩(wěn)地向右并線繞行?！盋oT正是要賦予AI這樣的能力。

在模型訓(xùn)練中，先通過大規(guī)模圖文數(shù)據(jù)建立基礎(chǔ)語義理解；接著在監(jiān)督微調(diào)（SFT）階段引入CoT機(jī)制，讓模型在做出關(guān)鍵決策前生成一段推理鏈，包括環(huán)境描述、邏輯分析和動(dòng)作規(guī)劃，提升可解釋性和魯棒性。劉先明說：“很多復(fù)雜場(chǎng)景需要分步驟思考，CoT正好賦予了模型這種思考時(shí)間?！?/p>

第二步：用RL，讓AI在試錯(cuò)中進(jìn)化

思考能力有了，但面對(duì)未知極限場(chǎng)景，模仿學(xué)習(xí)難以應(yīng)對(duì)——“L3/L4自動(dòng)駕駛很多極端情況是靠模仿學(xué)不會(huì)的，”劉先明坦言。這時(shí)RL就派上用場(chǎng)了。類似教孩子騎車，騎得穩(wěn)有“愉悅”的獎(jiǎng)勵(lì)，快摔倒有“恐懼”的懲罰，最終在不斷的試錯(cuò)和調(diào)整中學(xué)會(huì)。RL也是同理，通過“獎(jiǎng)勵(lì)與懲罰”機(jī)制，讓模型在虛擬環(huán)境中不斷試錯(cuò)，自主尋找最優(yōu)駕駛策略。劉先明舉例說：在一個(gè)U型掉頭場(chǎng)景，未優(yōu)化的模型動(dòng)作僵硬，甚至可能撞上路沿；而經(jīng)過RL訓(xùn)練后，模型會(huì)主動(dòng)減速，以優(yōu)雅平滑的路線完成掉頭。

為實(shí)現(xiàn)這一點(diǎn)，小鵬打造了完整的RL訓(xùn)練體系，包括：Reward Function（強(qiáng)化安全、效率、合規(guī)駕駛能力）、Reward Model（從真實(shí)用戶接管和反饋數(shù)據(jù)中學(xué)習(xí)“好駕駛”行為）、World Model（虛擬博弈環(huán)境，支持高復(fù)雜動(dòng)態(tài)交互）?？梢哉f，RL讓大模型真正具備了面對(duì)復(fù)雜現(xiàn)實(shí)場(chǎng)景“悟”出解決方案的能力。

最后一公里：從云端大模型到車端自研芯片

有了這個(gè)既會(huì)“思考”、又能進(jìn)化的云端大腦，下一個(gè)挑戰(zhàn)也是最現(xiàn)實(shí)的問題——如何將它裝進(jìn)每一輛車?yán)铩?/p>

小鵬的軟件解法，是通過“知識(shí)蒸餾”路徑，將 720 億參數(shù)的基座模型能力提煉為適配車端算力的小型模型。在部分實(shí)車測(cè)試中，甚至實(shí)現(xiàn)了未蒸餾小尺寸模型的直接控車，顯著提升駕駛的平滑性與安全性。

而硬件解法，則是另一張王牌：自研芯片。就在 CVPR 舉辦期間的 6 月 11 日晚，小鵬正式發(fā)布其最新車型 G7——全球首款 L3 級(jí)AI汽車，首發(fā)搭載三顆自研圖靈 AI 芯片。

這款芯片在性能上尤為引人注目：?jiǎn)晤w芯片有效算力達(dá)到英偉達(dá) Orin的三倍；三顆協(xié)同工作后的總算力達(dá) 2200 TOPS，相當(dāng)于 9 顆 Orin-X 的效能。集成小鵬自研智駕系統(tǒng)后可實(shí)現(xiàn)接近 100% 的算力利用率（相比通用芯片約 70%–80%），最高可在本地實(shí)時(shí)運(yùn)行 300 億參數(shù)大模型，為高階自動(dòng)駕駛提供了充足的冗余能力。

這塊強(qiáng)大的端側(cè)基石，配合小鵬云端具備5天一輪迭代能力的“云端工廠”，以及年內(nèi)將突破2億clips的訓(xùn)練數(shù)據(jù)目標(biāo)，最終構(gòu)建出了一套“云端訓(xùn)練-車端部署、軟件定義-硬件優(yōu)化”的自循環(huán)完整技術(shù)路徑。

結(jié)語：一份來自真實(shí)世界的行車報(bào)告

小鵬汽車的這場(chǎng)CVPR分享，并沒有太多華麗辭藻。它更像一位資深研發(fā)員攤開設(shè)計(jì)圖與實(shí)驗(yàn)數(shù)據(jù)，向同行們細(xì)致講述團(tuán)隊(duì)是如何一步步解決問題的。從驗(yàn)證Scaling Law，到拆解“思考型”模型的訓(xùn)練細(xì)節(jié)，再到公布軟硬一體的部署方案，小鵬帶來的是一套完整的、在真實(shí)世界里跑出來的工程體系。

更重要的是，它打破了“學(xué)術(shù)→工業(yè)”單向傳導(dǎo)的慣性，展示了工業(yè)界如何通過海量真實(shí)數(shù)據(jù)、扎實(shí)工程實(shí)踐，反哺學(xué)術(shù)探索、為物理世界AI打開全新可能性。

當(dāng)理論照進(jìn)現(xiàn)實(shí)，那些來自道路的真實(shí)挑戰(zhàn)和數(shù)據(jù)，正在定義著自動(dòng)駕駛的下一程。

小鵬CVPR“亮底牌”：一家中國量產(chǎn)車企，如何為自動(dòng)駕駛的未來探路？

軟件3.0：先造好“駕駛大腦”，再考慮怎么上車

擴(kuò)展法則鐵證：為自動(dòng)駕駛領(lǐng)域的“暴力美學(xué)”正名

CoT鏈?zhǔn)酵评?+ 強(qiáng)化學(xué)習(xí)，教汽車“思考”怎么開

最后一公里：從云端大模型到車端自研芯片

結(jié)語：一份來自真實(shí)世界的行車報(bào)告

相關(guān)推薦

小鵬CVPR“亮底牌”：一家中國量產(chǎn)車企，如何為自動(dòng)駕駛的未來探路？

軟件3.0：先造好“駕駛大腦”，再考慮怎么上車

擴(kuò)展法則鐵證：為自動(dòng)駕駛領(lǐng)域的“暴力美學(xué)”正名

CoT鏈?zhǔn)酵评?+ 強(qiáng)化學(xué)習(xí)，教汽車“思考”怎么開

最后一公里：從云端大模型到車端自研芯片

結(jié)語：一份來自真實(shí)世界的行車報(bào)告

相關(guān)推薦

小鵬CVPR“亮底牌”：一家中國量產(chǎn)車企，如何為自動(dòng)駕駛的未來探路？

軟件3.0：先造好“駕駛大腦”，再考慮怎么上車

CoT鏈?zhǔn)酵评?+ 強(qiáng)化學(xué)習(xí)，教汽車“思考”怎么開