• 正文
    • Vol.1/? ?21家企業(yè)適配Deepseek 寒武紀(jì)也未失約
    • Vol.2/? ?適配之后 下一步怎么走?
  • 相關(guān)推薦
申請入駐 產(chǎn)業(yè)圖譜

21家國產(chǎn)芯片企業(yè)適配Deepseek,然后呢?

02/17 15:40
1765
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點資訊討論

服務(wù)器繁忙,請稍后再試”

Deepseek已經(jīng)學(xué)會玩自己的梗

這是近期在官網(wǎng)體驗Deepseek功能的用戶最常看到的提示,讓人抓狂不已。功能間接性癱瘓和算力不足背后,是Deepseek高度破圈,7天實現(xiàn)用戶破億的壯舉。游戲科學(xué)創(chuàng)始人、《黑神話:悟空》制作人馮驥對其有著高度評價,“Deepseek,可能是個國運級別的科技成果?!?/p>

繁榮有競爭力的下游應(yīng)用,能為芯片產(chǎn)業(yè)的未來發(fā)展指明方向并提供廣闊的市場,如我國新能源汽車智能手機行業(yè)對國產(chǎn)芯片的推動作用。如今Deepseek的出現(xiàn),也為國際競爭中處于相對劣勢的國產(chǎn)芯片提供了機會。諸多業(yè)內(nèi)人士稱,“有望推動國內(nèi)廠商有機會在推理側(cè)與英偉達(dá)搶占一定份額?!?/p>

風(fēng)華GPU研發(fā)負(fù)責(zé)人Cuki向芯師爺表示,Deepseek展現(xiàn)出的強大性能吸引了很多用戶,改變了大眾對于大模型的認(rèn)知,未來大家對deepseek的依賴度和認(rèn)可度會很高。對于這樣主流的下游應(yīng)用場景,處于產(chǎn)業(yè)鏈上游的芯片廠商自然會抓緊適配,這和硬件企業(yè)的市場推廣有非常強的正相關(guān)性。

也正因此,近期國內(nèi)掀起一輪國產(chǎn)AI芯片廠商競相適配風(fēng)潮。據(jù)芯師爺不完全統(tǒng)計,已有華為、海光信息、龍芯中科、壁仞科技在內(nèi)的21家國內(nèi)廠商參與其中。

?注 資料源自企業(yè)資料及公開信息 | 芯師爺制圖

Vol.1/? ?21家企業(yè)適配Deepseek 寒武紀(jì)也未失約

目前已經(jīng)官宣適配Deppseek的國產(chǎn)芯片企業(yè)已經(jīng)至少有21家,不過在官宣時間方面略有先后。

早在2月2日(大年初五),Gitee AI稱聯(lián)合國產(chǎn)GPU獨角獸沐曦,基于曦云 C 系列GPU完成DeepSeek 蒸餾版本模型的適配。2月4日(大年初七)的時候,海光信息官宣團隊完成DeepSeek V3和R1模型與海光DCU(深度計算單元)的適配。2月7日,龍芯中科方面稱,聯(lián)合太初元碁等產(chǎn)業(yè)伙伴,在太初T100加速卡上完成DeepSeek-R1系列模型的適配工作,采用龍芯3A6000處理器的誠邁信創(chuàng)電腦和望龍電腦已實現(xiàn)本地部署DeepSeek。

在所有國產(chǎn)芯片企業(yè)當(dāng)中,市值在年前曾突破3000億大關(guān)的國產(chǎn)AI芯片龍頭寒武紀(jì)格外被輿論關(guān)注?;蚴艽汗?jié)假期影響,以及本身行事風(fēng)格比較低調(diào),國產(chǎn)寒武紀(jì)適配Deepseek的消息出得稍晚,一度被眾多網(wǎng)友玩梗。2月10日,南京智算中心稱已經(jīng)攜手寒武紀(jì),用國產(chǎn)芯片、國產(chǎn)算力設(shè)備運行大模型DeepSeek。不過,此次官方信息中并未透露適配芯片的具體型號。據(jù)了解,南京智能計算中心在2021年7月投入運營,起初搭載的是寒武紀(jì)思元270和思元290智能芯片及加速卡。

在所有企業(yè)宣布適配Deepseek的資料當(dāng)中,有兩個信息點被企業(yè)方著重提及,一個是適配的模型類型,如部分企業(yè)可以適配DeepSeek-R1系列模型,其中滿血版的參數(shù)規(guī)格達(dá)671B,部分企業(yè)則只支持DeepSeek-R1全系列蒸餾模型(參數(shù)規(guī)格在1.5B-8B之間)。

另一個比較重要的信息則是適配Deepseek所耗費的時間,如龍芯中科于合作伙伴在適配方面花費時間為2小時,靈汐科技的適配時間為半天,天數(shù)智芯、風(fēng)華創(chuàng)智在適配工作上花費的時間為一天。對于部分企業(yè)著重宣傳適配耗費時間這個點,有業(yè)內(nèi)人士稱,“這是國內(nèi)AI芯片廠商在試圖證實,自身在AI生態(tài)適配方面的速度和實力。”

對于芯片企業(yè)在上述兩點信息披露上的差異,此芯科技多媒體和AI開發(fā)總監(jiān)陳國銀向芯師爺指出,就Deepseek模型推理的適配來看,各個芯片廠商適配分成兩類。

一類是適配原生R1和V3模型,這類主要面向云端推理市場,其適配過程有一定的挑戰(zhàn),主要在于模型671B的這么大參數(shù)量以及MOE和MLA的推理結(jié)構(gòu),通常要解決多卡互聯(lián),MOE路由分配并行計算,異構(gòu)資源分配, MLA新的KV cache緩存機制,F(xiàn)P8參數(shù)類型,內(nèi)存帶寬和卡間通信優(yōu)化等;另一類是通過R1蒸餾的小模型,從1.5B到70B的模型大小都有,端側(cè)推理主要集中在8B模型以下的蒸餾模型。這類模型推理過程和原始非蒸餾版本是一樣的,因此只要原來芯片能夠適配之前流行的Qwen和Llama模型,就能非??焖俚倪m配。成熟硬件在適配端側(cè)蒸餾模型主要挑戰(zhàn)在于內(nèi)存帶寬帶來的挑戰(zhàn)和相關(guān)量化數(shù)據(jù)類型計算支持。

Cuki指出,只要有足夠多的設(shè)備、足夠的時間,其實企業(yè)都可以適配滿血版的Deepseek,但問題在于適配后大模型的體驗感、性能好不好。在日常生活、企業(yè)辦公等常規(guī)環(huán)境中,32B版本的Deepseek已經(jīng)足夠用。所以基于適配后的大模型使用體驗、投入的資源、產(chǎn)品能力等多方面因素的考量,有不少企業(yè)選擇了適配更輕量化的蒸餾模型。

陳國銀表示,不同模型大小適應(yīng)的場景不一樣,云端推理需要模型參數(shù)比較大,模型性能最好,主要適配原生R1或者V3模型,如前面所說,這類適配難度比較大,因此需要一定的開發(fā)和優(yōu)化工作,需要更長的時間。端側(cè)芯片主要適配1.5B~8B間的模型,這類模型推理結(jié)構(gòu)非常成熟,無需花費額外的工作。以此芯P1芯片為例,P1面向端側(cè)AI PC場景設(shè)計,對于端側(cè)8B以下大語言模型有成熟的支持,此芯有完善的AI SDK工具鏈,能夠簡化適配流程,因此只要模型拿到之后,做些簡單量化,就能高效而準(zhǔn)確的完成相關(guān)推理任務(wù)。面對不斷創(chuàng)新的模型和推理結(jié)構(gòu),芯片企業(yè)在芯片設(shè)計時需要充分考慮計算的靈活性和充足的帶寬,在軟件工程上要有極致的工程優(yōu)化能力。

“眾多國產(chǎn)AI芯片廠商與DeepSeek的快速適配潮是中國芯片實現(xiàn)國際化突擊的第一步?!盋IC灼識咨詢高級咨詢顧問張笑璐接受21世紀(jì)財經(jīng)報道采訪時稱,DeepSeek對于中國AI芯片廠商的利好非常確定,通過與DeepSeek合作,中國芯片廠商加速了深度學(xué)習(xí)框架和分布式訓(xùn)練適配,推動了中國“國產(chǎn)算力+國產(chǎn)大模型”閉環(huán)生態(tài)。

Vol.2/? ?適配之后 下一步怎么走?

“在適配工作之后,產(chǎn)業(yè)將會把資源和精力轉(zhuǎn)移到大模型的應(yīng)用落地上。”Cuki認(rèn)為,“在這一階段,硬件企業(yè)承擔(dān)的角色主要有兩個,第一提供模型所需要的硬件底座設(shè)施平臺,第二是與模型應(yīng)用落地所需要的產(chǎn)業(yè)生態(tài)做深度的配合。”

盡管以ChatGPT為代表的各類AI大模型自2022年年底開始風(fēng)靡全球市場,在兩年多的時間里,各行各業(yè)盡管都先后與AI大模型鏈接,但行業(yè)一直處于產(chǎn)業(yè)商業(yè)模式落地的探索過程中,尚未有明確可行的案例出現(xiàn)。之所以如此,一方面在于AI+產(chǎn)業(yè)融合還在融合當(dāng)中,不夠成熟,另一方面在于,此前的AI大模型成本太高。

Deepseek憑借較低成本和高性能出圈,也給了AI大模型的應(yīng)用落地提供了不錯的解決方案。根據(jù)Cuki的觀察,大模型在互聯(lián)網(wǎng)、教育、金融方面會走得更快,例如研究所、高校的基礎(chǔ)教學(xué)、科研工作非常契合大模型的應(yīng)用落地。以為AI芯片產(chǎn)業(yè)界人士與Cuki持類似觀點,他認(rèn)為AI在與教育結(jié)合的過程中,有兩點值得關(guān)注,其一是Deepseek讓學(xué)校能以更低成本、更高效率利用AI技術(shù),加速人工智能教育的普及與實現(xiàn),其二是國產(chǎn)算力對deepseek快速靈活適配和開源,對在美國禁售情況下實現(xiàn)突破,對全國產(chǎn)化環(huán)境下開展AI人才培養(yǎng)和研究成為新途徑。

據(jù)了解,近期壁仞科技聯(lián)合中興通訊、浙江大學(xué)上海高等研究院和一驀科技共同打造了智海AI教育一體機。該產(chǎn)品快速實現(xiàn)了國產(chǎn)算力與DeepSeek的適配及知識課程、實訓(xùn)課題、智能體等教學(xué)工具的設(shè)計開發(fā),形成了包含AI通識課、專業(yè)課、實踐實訓(xùn)在內(nèi)的一體化解決方案,讓學(xué)校能以更低成本、更高效率利用AI技術(shù),加速人工智能教育的普及與實現(xiàn)。

值得一提的是,除了上述三個方向之外,端側(cè)AI也被眾多人士看好。隨著Deepseek的大熱,市場已經(jīng)喊出“2025是端側(cè)AI應(yīng)用元年”的口號。

此前,功能比較齊全的AI大模型的參數(shù)規(guī)格動輒百億上千億,很難在算力有限的AI眼鏡、智能機器人、智能手機上部署,而某些參數(shù)較小的大模型在功能方面有所缺失,用戶實際體驗感并不好。也正因此,即使端側(cè)AI的呼聲很高,但實際的落地效果并不算好。

芯師爺在去年曾體驗了一款新發(fā)布的AI眼鏡,由于產(chǎn)品內(nèi)置芯片的算力較小,所以廠商采用的是云端AI聯(lián)動,AI與人的交互流暢性有待加強,而且一旦離線,其AI功能幾乎不可用。而Deepseek的出現(xiàn),可以直接將其蒸餾版大模型本地部署,無需聯(lián)網(wǎng)便可有較好的用戶體驗,且并不需要太大的算力做支撐。

陳國銀表示,“隨著R1蒸餾技術(shù)的普及,小模型具備了原來只有大模型才具備的能力,特別是長思維鏈下的編程和復(fù)雜問題推理能力,會迸發(fā)出不同的創(chuàng)新應(yīng)用和新場景,加速端側(cè)模型應(yīng)用和落地?!?/p>

一家國內(nèi)消費電子配套芯片公司人士接受《科創(chuàng)板日報》采訪時表示,盡管他們的產(chǎn)品在產(chǎn)業(yè)鏈幾乎最上游,但還是能感受到DeepSeek為智能終端行業(yè)帶來的積極影響。“AI降本之后,終端應(yīng)用預(yù)計會有大的爆發(fā),繼續(xù)看好眼鏡、玩具、AI手機、AI PC等消費電子?!?/p>

未來端側(cè)模型推理落地的場景也會非常豐富,例如AI一體機,家庭AI網(wǎng)關(guān),AI PC,邊緣服務(wù)器,智能機器人等?!睂τ诙藗?cè)AI的未來,陳國銀非??春茫P(guān)于下游AI場景對于上游硬件的推動,他認(rèn)為,不同的端側(cè)場景對芯片算力,功耗,安全,成本和功能都會有不同的要求,未來對于硬件的要求從能運行到運行得好過渡,同時時刻準(zhǔn)備新的模型應(yīng)用場景。硬件企業(yè)應(yīng)該在提供基礎(chǔ)算力能完成相關(guān)推理基礎(chǔ)上,下一步重點可能是性能極致優(yōu)化,多場景下功耗和性能的平衡,豐富AI生態(tài)的對接,多模態(tài)數(shù)據(jù)融合和處理。

相關(guān)推薦

登錄即可解鎖
  • 海量技術(shù)文章
  • 設(shè)計資源下載
  • 產(chǎn)業(yè)鏈客戶資源
  • 寫文章/發(fā)需求
立即登錄

公眾號:芯師爺;最及時且有深度的半導(dǎo)體媒體平臺。每日解讀半導(dǎo)體科技最新資訊、發(fā)展趨勢、技術(shù)前沿信息,分享產(chǎn)業(yè)研究報告,并打造中國最大的半導(dǎo)體社群與生態(tài)圈,歡迎加入半導(dǎo)體專業(yè)人士的圈子!