• 正文
    • 一:靈活擴展的算力架構
    • 二:算法定義芯片的計算范式
    • 三:算力平權的開源生態(tài)
  • 相關推薦
申請入駐 產業(yè)圖譜

DeepSeek最佳拍檔?深度解析RISC-V顛覆AI芯片的三大殺招

03/03 10:45
1520
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點資訊討論

如果票選25年春晚最精彩的節(jié)目,機器人扭秧歌絕對是前三名,這動作比村頭吳老二可好太多了。

也恰恰在春節(jié)期間,DeepSeek-r1開源了。

我在想,如果每一個機器人都裝上支持deepseek的智能芯片,能夠本地低延遲完成和人類的交互,這樣的機器人真的可以從動作和思想成為一個“智能人”,其想象空間絕對不可限量。

這就是天命!

機器人革命的最大障礙竟被開源打破了?

可能有人說,不需要本地部署芯片,只用聯(lián)網用云端的服務就好了。

Hi ,兄弟,你也不想你的機器人扶你過馬路的時候,突然斷網,從智能變成智障吧。

所以,這樣的機器人必須部署那一個不依賴云端算力的端側AI芯片。

才能同時滿足低功耗和高性能的需求。

那什么架構的芯片能滿足deepseek高效在機器人以及其他端側部署環(huán)境?

作為這個芯片設計師,我會選擇risc-v+張量計算擴展,這是端側算力的“天命人架構”。

一:靈活擴展的算力架構

為什么說RISC-V是端側算力的“天命人架構”?

DeepSeek大模型開源普惠眾生,讓算力從云端神壇走向萬物終端。

這一個多月,我們大家都看到了,deepseek開源帶來科技平權力量是如何勢不可擋。

從智算應用,智算基礎設施,智算服務等千行百業(yè),甚至到普通人都感受到了開源科技平權的力量。

AI算力的終極戰(zhàn)場上,能不能做到萬物智能,答案就在部署在智能終端的芯片之中。

但是,隨之而來帶來一個尷尬的地方,卻是本地部署少之又少可憐的token處理能力。

而目前看,面對大模型推理的需求,端側芯片的算力還是捉襟見肘。

而RISC-V正以開源架構的顛覆性優(yōu)勢,成為破局的核心變量。

RISC-V以開放指令集為基礎,摒棄歷史包袱,僅保留最簡指令集,允許開發(fā)者根據(jù)場景需求自定義擴展(如AI加速模塊)。

這種“歸零解構”契合第一性原原理。

就是從算力需求本質出發(fā),而非模仿現(xiàn)有架構。

我稱之為面向算力需求的架構。

面向人工智能算力,而RISC-V通過開放、靈活、高能效的設計,完美契合AI算力對本質化創(chuàng)新的需求。

AI時代需要CPU、GPU、TPU等多計算單元協(xié)同。

而RISC-V的模塊化設計天然支持異構融合,通過定制化指令集提升資源調度效率,適應端側異構計算融合的趨勢。

也就是說,RISC-V通過指令和模塊擴展,在一套體系架構下,融合了CPU,GPU,TPU等不同功能的單元。

例如在低功耗領域,RISC-V精簡指令集減少冗余計算,能效比顯著優(yōu)于傳統(tǒng)架構,適合端側設備的續(xù)航要求。

在高性能方面:通過模塊化擴展,支持按需組合功能模塊(如浮點運算、向量處理),靈活適配AI推理、圖像處理等場景,而不是做一個大而全的CPU,很多硬件都浪費。

而RISC-V的模塊化設計,讓開發(fā)者能像拼樂高般定制計算單元。

也就是說開發(fā)者可以根據(jù)需求自主添加指令集。

例如可以添加SIMD的指令,達到GPU向量計算能力,添加矩陣運算的指令模塊,達到TPU的張量運算的能力。而RISC-V本身就具備標量運算的能力。

這么說比較枯燥,我們舉個例子。

例如達摩院玄鐵C930?搭載vector+matrix雙引擎,8位整數(shù)指令專攻AI推理,512位矢量單元應對科學計算 。

這么設計的還有Semidynamics將張量單元焊入CPU核內,軟件復雜度腰斬。

還有大神Jim keller創(chuàng)辦的Tenstorrent ?BlackHole,這個芯片用768個RISC-V核懟出745TFLOPS算力,成本僅GPU方案1/10。

除了在架構方面,在計算范式上,RISC-V也在重構端側算力格局。

二:算法定義芯片的計算范式

RISC-V不是走一場傳統(tǒng)的CPU的路徑,而RISC-V要從“通用計算”到“算法定義芯片” 的計算范式革命。

傳統(tǒng)把CPU,GPU,TPU(NPU)異構集成SOC的方式,三駕馬車,各拉各的套,三種編程方式,用過的人都知道,這個編程難度和效率有些一言難盡。

而RISC-V擴展指令和模塊的方式,能夠最大限度的解決算力編程的問題,(當然也是一種DSL面向專用領域架構的變成語言)。

算法定義芯片能夠最大限度解決,軟件和硬件匹配的問題。

這種理念讓芯片成為算法本身的拓撲投影。

大家仔細看最近DeepSeek開源的幾個工程,有幾個在講從芯片底層優(yōu)化算法效率,包括多頭注意力機制的運算優(yōu)化,GEMM的矩陣乘法優(yōu)化等等。

這些都在在優(yōu)化GPU調用本身,其本質原因,GPU并不是為了大模型推理而設計的。

基于RISC-V的DSL本身,作為算法定義芯片的開發(fā)語言,就可以在算子力度最大限度的講芯片算法提交給應用,減少了優(yōu)化的時間。

動態(tài)異構計算的本質優(yōu)勢,RISC-V通過可擴展指令集架構(如V擴展、自定義加速器接口),天然支持硬件任務動態(tài)分區(qū)。

同一芯片內,算力資源可按需分配給AI推理(如矩陣乘加速模塊)或通用計算(如控制邏輯),實現(xiàn)“時分復用硬件”的極致靈活性。

這種能力使端側設備既能滿足AI推理的突發(fā)性高吞吐需求(如視覺識別峰值算力),又能在空閑時段無縫切換至傳感器數(shù)據(jù)處理、通信協(xié)議棧運行等任務,突破傳統(tǒng)GPU/ASIC架構的“功能固化”瓶頸。

傳統(tǒng)CPU如同笨重的卡車,30%芯片面積被復雜解碼邏輯占據(jù),還有層層疊疊積累的前向兼容和后向兼容的指令。

RISC-V通過架構精簡+軟硬協(xié)同實現(xiàn)能效碾壓,RISC-V指令解碼器面積比x86小30%,玄鐵C930在28nm工藝下實現(xiàn)2.3W/GHz,同等性能功耗僅為Arm A55的60%;

數(shù)據(jù)對比在端側典型任務(如720P圖像分類)中,RISC-V方案能效比可達x86架構的7倍,Arm架構的2.3倍。

這種降維打擊策略已見成效。

預計到2030年RISC-V芯片出貨量預計超過160億顆,產品出貨量CAGR保持40%高速增長,在自動駕駛域控領域滲透率超30%。

正如Arm顛覆x86的移動端霸權,RISC-V正從邊緣側包抄傳統(tǒng)架構腹地。

看到這里,可能很多人心中都有疑問。

是真的嗎?

為什么RISC-V發(fā)展如此迅猛?

為什么我的筆記本電腦/手機上還沒有用上?

接下來,我們來講講為什么RISC-V這么受歡迎,你就對這些心中有了答案。

三:算力平權的開源生態(tài)

變革是一個量變引起質變的過程。我們用的藍牙耳機中絕大部分芯片,都已經用了risc-v的處理器核,出貨在十幾億顆,這還僅僅是一個應用。很多的MCU也逐漸向RISC-V遷移。而端側算力芯片也將逐漸滲透。大家用RISC-V做芯片,不是為了趕時髦,是為了賺錢。在芯片界沒有不變的架構只有永恒的利益。而追求這些利益就是芯片發(fā)展的動力。

當下,傳統(tǒng)芯片架構(x86/Arm)的封閉性導致端側算力陷入雙重困境

開發(fā)門檻高:Arm每核授權費高達數(shù)百萬美元,中小企業(yè)難以承受;

迭代周期長:新增AI指令需經漫長標準審批,無法響應大模型快速演進需求。

開源就是RISC-V打破算力壟斷的核武器。

我們從Deepseek的開源,能夠看到開源帶來的技術力量。

同樣RISC-V的開源,也帶來了強大的技術使能。

這種開源帶來了三個好處,分別是成本,敏捷,生態(tài)。

第一個是成本。

如同Deepseek的開源,每個企業(yè)或者個人都能部署最先進的推理模型,而不用花費千萬美金甚至上億美金去訓練自己的大模型,一下子降低了大模型的門檻。

而RISC-V在CPU領域也是如此,同樣降低了設計一個芯片的門檻。當Arm每核授權費高達數(shù)百萬美元級別時,RISC-V的零成本特性讓中小企業(yè)也能玩轉高端芯片,即使是用商用支持的RISC-V的IP,也不同級別的ARM授權費用要低不少。

第二個是敏捷。

RISC-V通過開源生態(tài)+模塊化架構重構游戲規(guī)則,達摩院玄鐵團隊僅用6個月完成Vector 1.0到Matrix指令集升級。通過自定義指令集,其GEMM計算速度提升超7倍,Transformer算子性能提升超17倍,

這種敏捷創(chuàng)新在封閉架構中需要2年審批周期,而RISC-V開發(fā)者僅用6個月就實現(xiàn)技術迭代。

時間就是金錢,快速迭代才能快速收獲。

這種“全民開發(fā)者”模式,使端側芯片能快速適配大模型需求。

RISC-V的模塊化基因使其成為大模型時代的最佳載體。

第三個是生態(tài),

生態(tài)升維定義產業(yè)規(guī)則,RISC-V國際基金會推動RVV矢量擴展標準化,同時允許企業(yè)自定義指令,形成“安卓式開源+廠商定制”的生態(tài)范式。

谷歌Android 15、華為鴻蒙全面擁抱RISC-V,云計算,人工智能、自動駕駛,更不要說藍牙耳機等等,RISC-V已實現(xiàn)規(guī)?;逃?。

還有類似RISC-V無劍聯(lián)盟這樣的上下游一體的產業(yè)生態(tài)。

RISC-V的開放標準允許全球開發(fā)者協(xié)作優(yōu)化,加速技術迭代。

遠超傳統(tǒng)架構發(fā)展速度,這種開源特性與第一性原理倡導的“打破知識藩籬”高度一致,推動端側算力突破經驗局限。

從這次達摩院RISC-V生態(tài)大會傳遞出一個信號:“RISC-V正從替代品升維為定義者”。

RISC-V正通過開源標準化+定制化并行重構產業(yè)生態(tài):

未來不屬于算力最強的架構,而屬于最能激活算力場景的生態(tài)。

也就是構建算力-芯片-生態(tài)的閉環(huán)。

工具鏈方面:平頭哥無劍600平臺提供從算法優(yōu)化到芯片驗證的全流程工具,開發(fā)者僅需3個月即可完成AI芯片流片;

場景化擴展:RISC-V國際基金會推動RVA22虛擬化標準,允許單芯片同時運行Linux大模型和RTOS實時控制任務,滿足自動駕駛多域融合需求。

在大模型方面:玄鐵團隊選擇DeepSeek模型蒸餾+稀疏化壓后1.5B參數(shù)模型在玄鐵C920上快速適配,達到GPT-4o 80%的準確率,證明“小模型+高能效芯片”組合的可行性。

軟件定義硬件,達摩院發(fā)布全球首個RISC-V AI編譯器,支持PyTorch模型自動編譯為RVV指令,算子優(yōu)化效率提升4倍;

目前我們經歷Deepseek的洗禮,沒有人會懷疑AI改變我們這個世界的能力。

這是一場AI革命。

AI革命,終將讓每個智能終端都成為AI進化的神經元——而開源的基因,正是點燃燎原之火的火種。

RISC-V正在證明,真正的算力革命,永遠始于開放,成于普惠。

RISC-V引發(fā)的不僅是技術變革,更是產業(yè)權力結構的重塑:

開源生態(tài)使AI芯片開發(fā)成本降低90%,中小企業(yè)可參與高端市場;

中國企業(yè)在RISC-V基金會貢獻超40%技術提案,打破歐美在芯片架構領域的壟斷。

到2030年,RISC-V將占據(jù)端側AI芯片60%份額。

當大模型通過RISC-V實現(xiàn)“泛在智能”——從端側算力到智能,這場由開源架構驅動的算力平權運動,將AI算力部署在端側,或將終結“算力霸權主義”,開啟人機協(xié)同的新紀元。

正如倪光南院士所言:“RISC-V正從架構替代走向規(guī)則定義?!?/p>

當傳統(tǒng)巨頭還在為制程內卷時,RISC-V軍團已帶著開源生態(tài)的“技術核彈”,在端側智算戰(zhàn)場完成合圍。

也許很快我們就能看到,能夠基于risc-v的deepseek推理芯片能夠部署在人形機器人身上,完成從行走到智能思考交互的改變。

算力革命的勝負手不在工藝制程,而在生態(tài)開放性。

Deepseek是這樣,RISC-V也是這樣。

相關推薦

登錄即可解鎖
  • 海量技術文章
  • 設計資源下載
  • 產業(yè)鏈客戶資源
  • 寫文章/發(fā)需求
立即登錄