• 正文
    • 01算力斗獸場,上演「紅與黑」
    • 02軟硬一體,性價比才是好生意
    • 03生態(tài)攻防戰(zhàn),卡位下一個爆款
  • 相關(guān)推薦
申請入駐 產(chǎn)業(yè)圖譜

智駕芯片五強,卡位下一個爆款

02/05 14:10
1304
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點資訊討論

作者|劉佳藝,編輯|白雪

DeepSeek 往 AI 行業(yè)丟擲了一枚重磅炸彈。

低成本、低算力,做出了媲美 Chatgpt 的高性能模型。這項革新的直接影響者是英偉達,市值一度蒸發(fā)超 3000 億美元。

這也使得關(guān)于「算力過?!沟挠懻撛俣缺涣嗌吓_面。

實際上,DeepSeek 的案例揭示了 AI 行業(yè)隱藏在算力神話下,更具含金量的東西,比如算法模型、芯片性能以及性價比。

它揭示了一個基本事實,算力只是關(guān)乎模型訓(xùn)練的有力條件,但不是充要條件。

今天留在牌桌上的芯片企業(yè),英偉達、地平線、黑芝麻、華為、Mobileye 已經(jīng)注意到了這點,從它們最新動作中可見,算力只是握在手中的籌碼之一,且態(tài)度各異。
包括一度用算力標(biāo)榜自身的英偉達,在當(dāng)下也感到了不小危機感。

市場對于芯片企業(yè)的要求一直是做到未雨綢繆,現(xiàn)在它們都朝著軟硬一體的大方向強化競爭壁壘,這其中,性價比才是重點,擴大生態(tài)圈才是核心。

01算力斗獸場,上演「紅與黑」

2022 年,英偉達發(fā)布了一顆算力猛獸——Drive Thor,AI 算力最高達到 2000TOPS,是上一代 Orin X(256TOPS)的 8 倍。

在業(yè)界還習(xí)慣于用 100TOPS 作為中、高算力的分水嶺時,Thor 無疑來到了夸張級別。

但本應(yīng)在 2024 年中量產(chǎn)的 Thor 陷入難產(chǎn),最新消息是,Thor 的算力被修改為 1000TOPS,今年中將先提供 730TOPS 的低算力版本芯片。

把算力拉滿,Thor 的確值得期待。

極氪、理想、小鵬、比亞迪、沃爾沃、豐田等車企,以及元戎啟行、卓馭科技等供應(yīng)商,早早就下了量產(chǎn)訂單。

根本原因為,行業(yè)新技術(shù)對于算力的需求值漲到了千 TOPS 級別

顯著代表是「VLA」——視覺語言動作模型,被元戎啟行、理想都視為開啟端到端 2.0 時代的鑰匙。但 VLA 需要處理大量視覺、語言等多模態(tài)數(shù)據(jù),對于算力的需求更為苛刻。

目前,理想單「端到端+VLM」雙系統(tǒng)模型,就需要消耗兩顆 Orin-X 芯片,即 508TOPS 算力。

有行業(yè)人士認為,如果要部署「端到端+VLA」模型,Orin-X 顯然不夠,Thor 可能成為了必選項。

英偉達的 Thor 撕開了市場對于芯片超高性能的需求裂口,揭開整個算力市場「紅與黑」的兩面性。

紅指激進。

大算力緯度上,Thor 已經(jīng)有了對手。

黑芝麻 2024 年 12 月底發(fā)布的華山 A2000 系列。

上一代 A1000 系列中的旗艦款,A1000Pro 的 AI 算力還是 106TOPS。

而新發(fā)布的 A2000Pro 盡管未直接標(biāo)明算力大小,但從「4 倍行業(yè)旗艦芯片」的性能注解,可以預(yù)估至少有幾百 TOPS,如果行業(yè)旗艦芯片指 Orin-X,那么 A2000Pro 的算力將來到 1000TOPS,與 Thor 不相上下

地平線則在 2024 年 4 月推出征程 6 系列,覆蓋低中高階智駕,其中旗艦款產(chǎn)品征程 6P 的 AI 算力一度被拉到 560TOPS,幾乎是征程 5(128TOPS)的 5 倍,Orin-x 的兩倍。

據(jù)地平線介紹,征程 6P 采用「神經(jīng)網(wǎng)絡(luò)+規(guī)則引擎」的混合架構(gòu),支持端到端大模型,以及時下流行的 VLM、VLA 等技術(shù)路徑。

值得一提的是,地平線征程 6P 的 560TOPS 算力旁,還有一句注解:在 1/2 稀疏網(wǎng)絡(luò)下的等效算力

它指的是征程 6P 在稀疏網(wǎng)絡(luò)下 AI 算力可以達到 560TOPS。

所謂稀疏網(wǎng)絡(luò),是指網(wǎng)絡(luò)中的權(quán)重矩陣中有大量的零權(quán)重,即只有部分神經(jīng)元與前一層的神經(jīng)元相連。

它對應(yīng)的是稠密網(wǎng)絡(luò),指網(wǎng)絡(luò)中的每個神經(jīng)元都與前一層的每個神經(jīng)元相連,沒有零權(quán)重。

兩者呈現(xiàn)的算力數(shù)值代表意義不同,可以簡單理解為,稀疏算力指計算簡單題的能力,而稠密算力指計算復(fù)雜題的能力。

目前包括英偉達,大多數(shù)芯片的高 TOPS 背后,其實指代的只是稀疏算力,相比稠密算力,它在數(shù)值表現(xiàn)上往往會高出一倍。

在這種情況下,華為選擇強調(diào)稠密算力,由此引出了算力場「黑」的一面,即對算力保持克制態(tài)度。

華為昇騰 610 發(fā)布于 2020 年,算力 200TOPS,此后很長一段時間,華為暫未有發(fā)布新產(chǎn)品的正式動作。

原因有兩點。

一是晟騰 610 足夠能打,200TOPS 級別算力,已經(jīng)是地平線 J5、黑芝麻 A1000Pro 的兩倍,毫無疑問是算力王者。

更何況,200TOPS 是稠密算力,這意味著該芯片在處理智駕這類復(fù)雜計算任務(wù)時,效率更高,性能表現(xiàn)更好。

二是華為作為 Tier1 的身份,使其芯片可以在軟硬一體的優(yōu)勢下,與算法協(xié)同發(fā)揮出更強大效能。

由此,伴隨著華為乾崑 ADS 方案,昇騰 610 一直在市場吃香,據(jù)蓋世汽車研究院數(shù)據(jù)顯示,2024 年前 8 個月,華為昇騰 610 憑借 10.3% 的市占率在國內(nèi)智駕域控芯片市場排名第三。

目前,華為對于昇騰 610 的預(yù)期已經(jīng)提升至 L3 級,比如昊鉑 GT 智駕版就搭載了昇騰 610,目前其同款硬件車型已經(jīng)拿下了 L3 級的上路牌照。

如果說華為對于算力的克制是因為是提前沖刺,并且準(zhǔn)備充分,Mobileye 就是一直小步慢跑,算力一點點往上加。

2022 年,Mobileye 發(fā)布的 EyeQ 6 系列芯片,AI 算力雖然是 EyeQ 5 的兩倍,也僅為 34TOPS。

但 Mobileye 一直自信認為,EyeQ 6 High 的支持上限并不低,比如基于復(fù)合人工智能系統(tǒng),搭載了 2 顆 EyeQ 6 High 的 SuperVision 方案能夠達到可脫手的智駕能力。

而下一站的 EyeQ 7 系列,算力也僅是在 EyeQ 6 High 上繼續(xù)翻倍,AI 算力僅為 67TOPS,不過制程突破到了 5nm,預(yù)計 2025 年中提供樣品,在 2027 年開始量產(chǎn)。

與華為一樣,Mobileye 的芯片與方案往往打包出售,并且,它認為大算力并不能決定一切

Mobileye 認為 FPS 才是算力更貼切的指標(biāo),相比 TOPS 只計算每秒運算次數(shù),F(xiàn)PS 計算每秒幀數(shù)的方式,更能直觀體現(xiàn)該芯片在處理智駕圖像、視頻數(shù)據(jù)的能力。

比如 EyeQ6 High 每秒可以處理超過 1000 幀像素標(biāo)記神經(jīng)網(wǎng)絡(luò),相比 EyeQ5 的每秒 91 幀,效率提高了超十倍。

這意味著,EyeQ6 High 能夠以高幀率完成圖像數(shù)據(jù)處理,在感知、決策端擁有更好表現(xiàn)。

從理性主義出發(fā),Mobileye 已經(jīng)歸納出一條低成本、高性能抵達全無人駕駛的路徑。盡管算力還未超過 100TOPS,但依托于對算法與規(guī)則的融合處理,它堅信這是一條可行的方法論。

02軟硬一體,性價比才是好生意

正如 Mobileye 所言,算力僅是芯片的核心評判維度之一。

今天關(guān)于芯片的終極討論在于性能,芯片企業(yè)都瞄準(zhǔn)了不同的價格帶,竭力思考如何把性能拉到最滿。

通過性價比超車,永遠是一個更切實的機會。


從目前各家芯片的特點中,其實能看到一些共性:

    車規(guī)級芯片,獲得 ASIL-D 安全認證;集合 CPU、GPU、MCU 等多類型計算單元,完成異構(gòu)計算;7nm 制程成為最低門檻。

而當(dāng)共識成為同質(zhì)化表現(xiàn)后,芯片企業(yè)還需要面向未來,注入其它維度的「加成」打造差異化性能。

這里存在兩個發(fā)力方向。

一是芯片都在圍繞高效,強調(diào)「原生適配 Transformer 架構(gòu)」。

這點像是在異構(gòu)計算的基礎(chǔ)上把力打透,Transformer 架構(gòu)作為目前智駕行業(yè)公認的算法框架,芯片支持該模型,強調(diào)的是與主流算法適配,開發(fā)出高階端到端智駕方案的能力。

此前 Orin-X 就因不支持 Transformer 架構(gòu),推理時延長,被理想詬病過。

所以英偉達在 Thor 的產(chǎn)品簡介中,強調(diào)了其 CPU 采用了全新 Blackwell 架構(gòu),專為 Transformer 大模型和生成式 AI 功能設(shè)計的能力。

而地平線征程 6P 與黑芝麻 A2000Pro 也是在這點上「炫技」。

征程 6P 搭載了地平線自研的第三代 BPU 納什架構(gòu),這種架構(gòu)的特點在于靈活計算,即能夠?qū)?Transformer 算法中的各種細小操作進行高效處理,如目標(biāo)檢測、軌跡預(yù)測、路徑規(guī)劃等。

它能確保在處理復(fù)雜運算任務(wù)時,提供足夠的精度與計算速度,同時三層存儲架構(gòu)的設(shè)計也能優(yōu)化帶寬。

黑芝麻 A2000Pro 同樣應(yīng)用了其獨創(chuàng)的 NPU 架構(gòu)——九韶,特點在于大核架構(gòu),解決了算力利用率低、延時高的問題,確保在面對復(fù)雜運算時能高效運行并輸出準(zhǔn)確推理結(jié)果。

此外,芯片還集成了 Transformer 的硬加速模塊,可以提升該模型的算法運行效率,并同樣用三層內(nèi)存架構(gòu)降低了對外部存儲的依賴。

思路其實是一致的,相當(dāng)于此前是培訓(xùn)做題方法,現(xiàn)在是培訓(xùn)專有題型,把智駕難題做得更得心應(yīng)手了。

二是優(yōu)化服務(wù)能力,提供完整的開發(fā)工具鏈。

芯片公司如今卷起了軟硬協(xié)同下的服務(wù)能力,這同樣是「性價比」的重要表現(xiàn)。

一方面是開放,為開發(fā)者提供更多的自主性與可操作性。

Mobileye 從 EyeQ5 開始也意識到這點,芯片開始可編程操作。從 EyeQ6 系列開始,它開始提供軟件開發(fā)工具包 EyeQ Kit,包含算法庫、驅(qū)動程序等,能使得開發(fā)者基于需求完成個性化設(shè)計。

今年 CES 上,MobileyeCEO Amnon Shashua 教授還直言,「我們允許客戶直接在芯片上托管第三方應(yīng)用程序。」

當(dāng)然,開放更是國內(nèi)芯企的強項。

黑芝麻創(chuàng)始人單記章曾提到,黑芝麻芯片之上的每一層軟件都可以進行定制與替換,進而拓寬使用場景,實現(xiàn)大規(guī)模出貨。

這也來到開放的另一方面,提供更豐富、好用的開發(fā)工具。

比如,地平線、黑芝麻為了讓開發(fā)者快速上手最新芯片,孵化了一整套開發(fā)工具,覆蓋從標(biāo)注、訓(xùn)練到仿真等模型開發(fā)全流程。

    前者打造了 BPU 工具鏈、天工開物平臺等。后者則是構(gòu)建了新一代 BaRT 工具鏈、雙芯?;ヂ?lián)技術(shù) BLink 等。

這些工具適配于 TensorFlow、PyTorch 等主流訓(xùn)練框架,可以幫助開發(fā)者充分利用芯片強大潛力,擴展算力邊界,提高模型開發(fā)效率。

實際上,這些行為也在印證并加速軟硬協(xié)同的大趨勢。

黃仁勛一直把英偉達定位成軟件與系統(tǒng)整合的企業(yè),認為旗下的軟件與硬件具備同等價值。

英偉達打造 Thor 能成為性能王者,離不開其在軟件平臺上的高速創(chuàng)新,這其中包括 CUDA 生態(tài)系統(tǒng)、Drive 軟件平臺、推理工具 TensorRT、數(shù)字孿生平臺 NVIDIA Omniverse 等穩(wěn)定的開發(fā)工具。

今天的芯片公司,不僅在比拼在底部構(gòu)筑地基的能力,也在較量往高處建設(shè)大廈的水平。

03生態(tài)攻防戰(zhàn),卡位下一個爆款

芯片企業(yè)已經(jīng)告別了單純賣硬件的生意模式。

它們構(gòu)建完整開發(fā)工具鏈背后,是一直反復(fù)強調(diào)的關(guān)鍵詞:生態(tài)

比如英偉達,屹立不倒的重要原因之一,源于其早早就構(gòu)建了一整套成熟的生態(tài)系統(tǒng),讓客戶形成一定的技術(shù)依賴與轉(zhuǎn)換成本,產(chǎn)生粘性。

而國內(nèi)的后起之秀地平線、黑芝麻也通過性價比策略接連完成了從 0 到 1 的生態(tài)建設(shè)過程,并敲響上市鐘聲。

而華為、Mobileye 在生態(tài)建設(shè)上具有先天優(yōu)勢。

兩者作為智駕供應(yīng)商,能夠通過出售軟硬一體的方案增加芯片出貨量。

    華為的芯片,背靠鴻蒙智行、Hi 模式,享受著「朋友圈」不斷擴大的銷量紅利;Mobileye 芯片則依靠早期品牌聲量積累,能夠吃到全球化市場的蛋糕。

現(xiàn)在,五家芯片企業(yè)在不同節(jié)奏下走到了分岔路口。

在如何進一步上量,擴大生態(tài)圈的命題面前,選擇了不同方向。

一是強調(diào)可擴展性,擴大生態(tài)橫截面

英偉達打了個樣,Thor 的應(yīng)用場景已經(jīng)不止 L2、L3 階段,它能夠覆蓋智駕全場景,包括 L4 的 Robotaxi,已經(jīng) L5 全無人駕駛階段。

而黑芝麻也立刻跟上,其對于 A2000Pro 的定位是全場景通識智駕,簡單理解就是強調(diào)芯片對于駕駛場景的全面理解能力,包括城市道路、高速公路、晝夜變化及各類天氣條件下的不同場景。

這意味著,A2000Pro 同樣可以覆蓋從 L2-L5 的全場景智駕。

值得一提的是,黑芝麻智能 CMO 楊宇欣曾表示,A2000 將不止于智駕,還會面向具身智能等大模型應(yīng)用場景去拓展。

他表示,機器人產(chǎn)業(yè)鏈、生態(tài)的布局和結(jié)構(gòu)跟汽車的重疊度非常高。

這指向了智駕芯片企業(yè)的另一條增長曲線。

二是深度強化軟硬一體,從 Tier2 向前大邁步。

隨著智駕開發(fā)周期越來越緊張,芯企需要靈活配合車企/方案商,滿足不同的市場需求。

    若車企/供應(yīng)商有自研能力,則提供靈活性開發(fā)工具進行適配;若沒有模型開發(fā)經(jīng)驗,則提供全棧軟件方案。

黑芝麻在 A2000 系列發(fā)布前不久推出了端到端算法參考方案,基于端到端架構(gòu),在決策單元引入了 VLM 視覺語言模型與 PRR 行車規(guī)則等,提升智駕系統(tǒng)決策規(guī)劃能力。

這相當(dāng)于一個智駕 Demo,幫助車企/供應(yīng)商快速上手軟件開發(fā)。

值得一提的是,地平線在戰(zhàn)略上選擇了 All in。

從縱向、橫向把市場全面吃透。

憑借 700 萬顆芯片出貨量成績,地平線已經(jīng)牢牢穩(wěn)住了國內(nèi)低階、高階市場位置,分別僅次于 Mobileye 與英偉達。

而從征程 6 系列開始,地平線依然可以用「芯片全家桶」的形式,吃準(zhǔn)低中高階智駕的新需求。

此外,地平線也在延展商業(yè)邊界,用征程 6P 打出了 SuperDrive 這張王牌,該方案目前已經(jīng)在北京晚高峰、上海老城區(qū)等復(fù)雜場景中進行測試,做到了全程無接管,今年 8 月實現(xiàn)量產(chǎn)落地。

從芯片到完整方案,地平線重新定義了自我身份,將商業(yè)生態(tài)的天花板繼續(xù)抬高。

由此,一輪新的較量在芯片行業(yè)開始上演,在這個同樣研發(fā)投入巨大,靠高出貨量解渴的供應(yīng)鏈上,各家都加緊擴建森林,打造良性循環(huán)的生態(tài)模式。

更殘酷的一點是,身處 AI 急劇變化的時代,一條游戲規(guī)則改寫就足以顛覆整個行業(yè)。

DeepSeek 已經(jīng)敲響了警鐘,今天的芯片企業(yè)必須時刻緊繃著,它們不僅要煉出鋒利的武器攻擂,還要磨出堅固的盾牌守塔。

在攻防之間,芯片企業(yè)們,亟待下一個爆款出現(xiàn)。

相關(guān)推薦

登錄即可解鎖
  • 海量技術(shù)文章
  • 設(shè)計資源下載
  • 產(chǎn)業(yè)鏈客戶資源
  • 寫文章/發(fā)需求
立即登錄