久久精品欧美一级片,亚洲AV无码成H人动漫无遮挡不卡,亚洲色欲在线一区

“服務(wù)器繁忙，請稍后再試”

Deepseek已經(jīng)學(xué)會玩自己的梗

這是近期在官網(wǎng)體驗Deepseek功能的用戶最常看到的提示，讓人抓狂不已。功能間接性癱瘓和算力不足背后，是Deepseek高度破圈，7天實現(xiàn)用戶破億的壯舉。游戲科學(xué)創(chuàng)始人、《黑神話：悟空》制作人馮驥對其有著高度評價，“Deepseek，可能是個國運級別的科技成果?！?/p>

繁榮有競爭力的下游應(yīng)用，能為芯片產(chǎn)業(yè)的未來發(fā)展指明方向并提供廣闊的市場，如我國新能源汽車和智能手機行業(yè)對國產(chǎn)芯片的推動作用。如今Deepseek的出現(xiàn)，也為國際競爭中處于相對劣勢的國產(chǎn)芯片提供了機會。諸多業(yè)內(nèi)人士稱，“有望推動國內(nèi)廠商有機會在推理側(cè)與英偉達(dá)搶占一定份額?！?/p>

風(fēng)華GPU研發(fā)負(fù)責(zé)人Cuki向芯師爺表示，Deepseek展現(xiàn)出的強大性能吸引了很多用戶，改變了大眾對于大模型的認(rèn)知，未來大家對deepseek的依賴度和認(rèn)可度會很高。對于這樣主流的下游應(yīng)用場景，處于產(chǎn)業(yè)鏈上游的芯片廠商自然會抓緊適配，這和硬件企業(yè)的市場推廣有非常強的正相關(guān)性。

也正因此，近期國內(nèi)掀起一輪國產(chǎn)AI芯片廠商競相適配風(fēng)潮。據(jù)芯師爺不完全統(tǒng)計，已有華為、海光信息、龍芯中科、壁仞科技在內(nèi)的21家國內(nèi)廠商參與其中。

?注資料源自企業(yè)資料及公開信息 | 芯師爺制圖

Vol.1/? ?21家企業(yè)適配Deepseek 寒武紀(jì)也未失約

目前已經(jīng)官宣適配Deppseek的國產(chǎn)芯片企業(yè)已經(jīng)至少有21家，不過在官宣時間方面略有先后。

早在2月2日（大年初五），Gitee AI稱聯(lián)合國產(chǎn)GPU獨角獸沐曦，基于曦云 C 系列GPU完成DeepSeek 蒸餾版本模型的適配。2月4日（大年初七）的時候，海光信息官宣團隊完成DeepSeek V3和R1模型與海光DCU（深度計算單元）的適配。2月7日，龍芯中科方面稱，聯(lián)合太初元碁等產(chǎn)業(yè)伙伴，在太初T100加速卡上完成DeepSeek-R1系列模型的適配工作，采用龍芯3A6000處理器的誠邁信創(chuàng)電腦和望龍電腦已實現(xiàn)本地部署DeepSeek。

在所有國產(chǎn)芯片企業(yè)當(dāng)中，市值在年前曾突破3000億大關(guān)的國產(chǎn)AI芯片龍頭寒武紀(jì)格外被輿論關(guān)注?；蚴艽汗?jié)假期影響，以及本身行事風(fēng)格比較低調(diào)，國產(chǎn)寒武紀(jì)適配Deepseek的消息出得稍晚，一度被眾多網(wǎng)友玩梗。2月10日，南京智算中心稱已經(jīng)攜手寒武紀(jì)，用國產(chǎn)芯片、國產(chǎn)算力設(shè)備運行大模型DeepSeek。不過，此次官方信息中并未透露適配芯片的具體型號。據(jù)了解，南京智能計算中心在2021年7月投入運營，起初搭載的是寒武紀(jì)思元270和思元290智能芯片及加速卡。

在所有企業(yè)宣布適配Deepseek的資料當(dāng)中，有兩個信息點被企業(yè)方著重提及，一個是適配的模型類型，如部分企業(yè)可以適配DeepSeek-R1系列模型，其中滿血版的參數(shù)規(guī)格達(dá)671B，部分企業(yè)則只支持DeepSeek-R1全系列蒸餾模型（參數(shù)規(guī)格在1.5B-8B之間）。

另一個比較重要的信息則是適配Deepseek所耗費的時間，如龍芯中科于合作伙伴在適配方面花費時間為2小時，靈汐科技的適配時間為半天，天數(shù)智芯、風(fēng)華創(chuàng)智在適配工作上花費的時間為一天。對于部分企業(yè)著重宣傳適配耗費時間這個點，有業(yè)內(nèi)人士稱，“這是國內(nèi)AI芯片廠商在試圖證實，自身在AI生態(tài)適配方面的速度和實力。”

對于芯片企業(yè)在上述兩點信息披露上的差異，此芯科技多媒體和AI開發(fā)總監(jiān)陳國銀向芯師爺指出，就Deepseek模型推理的適配來看，各個芯片廠商適配分成兩類。

一類是適配原生R1和V3模型，這類主要面向云端推理市場，其適配過程有一定的挑戰(zhàn)，主要在于模型671B的這么大參數(shù)量以及MOE和MLA的推理結(jié)構(gòu)，通常要解決多卡互聯(lián)，MOE路由分配并行計算，異構(gòu)資源分配， MLA新的KV cache緩存機制，F(xiàn)P8參數(shù)類型，內(nèi)存帶寬和卡間通信優(yōu)化等；另一類是通過R1蒸餾的小模型，從1.5B到70B的模型大小都有，端側(cè)推理主要集中在8B模型以下的蒸餾模型。這類模型推理過程和原始非蒸餾版本是一樣的，因此只要原來芯片能夠適配之前流行的Qwen和Llama模型，就能非?？焖俚倪m配。成熟硬件在適配端側(cè)蒸餾模型主要挑戰(zhàn)在于內(nèi)存帶寬帶來的挑戰(zhàn)和相關(guān)量化數(shù)據(jù)類型計算支持。

Cuki指出，只要有足夠多的設(shè)備、足夠的時間，其實企業(yè)都可以適配滿血版的Deepseek，但問題在于適配后大模型的體驗感、性能好不好。在日常生活、企業(yè)辦公等常規(guī)環(huán)境中，32B版本的Deepseek已經(jīng)足夠用。所以基于適配后的大模型使用體驗、投入的資源、產(chǎn)品能力等多方面因素的考量，有不少企業(yè)選擇了適配更輕量化的蒸餾模型。

陳國銀表示，不同模型大小適應(yīng)的場景不一樣，云端推理需要模型參數(shù)比較大，模型性能最好，主要適配原生R1或者V3模型，如前面所說，這類適配難度比較大，因此需要一定的開發(fā)和優(yōu)化工作，需要更長的時間。端側(cè)芯片主要適配1.5B~8B間的模型，這類模型推理結(jié)構(gòu)非常成熟，無需花費額外的工作。以此芯P1芯片為例，P1面向端側(cè)AI PC場景設(shè)計，對于端側(cè)8B以下大語言模型有成熟的支持，此芯有完善的AI SDK工具鏈，能夠簡化適配流程，因此只要模型拿到之后，做些簡單量化，就能高效而準(zhǔn)確的完成相關(guān)推理任務(wù)。面對不斷創(chuàng)新的模型和推理結(jié)構(gòu)，芯片企業(yè)在芯片設(shè)計時需要充分考慮計算的靈活性和充足的帶寬，在軟件工程上要有極致的工程優(yōu)化能力。

“眾多國產(chǎn)AI芯片廠商與DeepSeek的快速適配潮是中國芯片實現(xiàn)國際化突擊的第一步?！盋IC灼識咨詢高級咨詢顧問張笑璐接受21世紀(jì)財經(jīng)報道采訪時稱，DeepSeek對于中國AI芯片廠商的利好非常確定，通過與DeepSeek合作，中國芯片廠商加速了深度學(xué)習(xí)框架和分布式訓(xùn)練適配，推動了中國“國產(chǎn)算力+國產(chǎn)大模型”閉環(huán)生態(tài)。

Vol.2/? ?適配之后下一步怎么走？

“在適配工作之后，產(chǎn)業(yè)將會把資源和精力轉(zhuǎn)移到大模型的應(yīng)用落地上。”Cuki認(rèn)為，“在這一階段，硬件企業(yè)承擔(dān)的角色主要有兩個，第一提供模型所需要的硬件底座設(shè)施平臺，第二是與模型應(yīng)用落地所需要的產(chǎn)業(yè)生態(tài)做深度的配合。”

盡管以ChatGPT為代表的各類AI大模型自2022年年底開始風(fēng)靡全球市場，在兩年多的時間里，各行各業(yè)盡管都先后與AI大模型鏈接，但行業(yè)一直處于產(chǎn)業(yè)商業(yè)模式落地的探索過程中，尚未有明確可行的案例出現(xiàn)。之所以如此，一方面在于AI+產(chǎn)業(yè)融合還在融合當(dāng)中，不夠成熟，另一方面在于，此前的AI大模型成本太高。

Deepseek憑借較低成本和高性能出圈，也給了AI大模型的應(yīng)用落地提供了不錯的解決方案。根據(jù)Cuki的觀察，大模型在互聯(lián)網(wǎng)、教育、金融方面會走得更快，例如研究所、高校的基礎(chǔ)教學(xué)、科研工作非常契合大模型的應(yīng)用落地。以為AI芯片產(chǎn)業(yè)界人士與Cuki持類似觀點，他認(rèn)為AI在與教育結(jié)合的過程中，有兩點值得關(guān)注，其一是Deepseek讓學(xué)校能以更低成本、更高效率利用AI技術(shù)，加速人工智能教育的普及與實現(xiàn)，其二是國產(chǎn)算力對deepseek快速靈活適配和開源，對在美國禁售情況下實現(xiàn)突破，對全國產(chǎn)化環(huán)境下開展AI人才培養(yǎng)和研究成為新途徑。

據(jù)了解，近期壁仞科技聯(lián)合中興通訊、浙江大學(xué)上海高等研究院和一驀科技共同打造了智海AI教育一體機。該產(chǎn)品快速實現(xiàn)了國產(chǎn)算力與DeepSeek的適配及知識課程、實訓(xùn)課題、智能體等教學(xué)工具的設(shè)計開發(fā)，形成了包含AI通識課、專業(yè)課、實踐實訓(xùn)在內(nèi)的一體化解決方案，讓學(xué)校能以更低成本、更高效率利用AI技術(shù)，加速人工智能教育的普及與實現(xiàn)。

值得一提的是，除了上述三個方向之外，端側(cè)AI也被眾多人士看好。隨著Deepseek的大熱，市場已經(jīng)喊出“2025是端側(cè)AI應(yīng)用元年”的口號。

此前，功能比較齊全的AI大模型的參數(shù)規(guī)格動輒百億上千億，很難在算力有限的AI眼鏡、智能機器人、智能手機上部署，而某些參數(shù)較小的大模型在功能方面有所缺失，用戶實際體驗感并不好。也正因此，即使端側(cè)AI的呼聲很高，但實際的落地效果并不算好。

芯師爺在去年曾體驗了一款新發(fā)布的AI眼鏡，由于產(chǎn)品內(nèi)置芯片的算力較小，所以廠商采用的是云端AI聯(lián)動，AI與人的交互流暢性有待加強，而且一旦離線，其AI功能幾乎不可用。而Deepseek的出現(xiàn)，可以直接將其蒸餾版大模型本地部署，無需聯(lián)網(wǎng)便可有較好的用戶體驗，且并不需要太大的算力做支撐。

陳國銀表示，“隨著R1蒸餾技術(shù)的普及，小模型具備了原來只有大模型才具備的能力，特別是長思維鏈下的編程和復(fù)雜問題推理能力，會迸發(fā)出不同的創(chuàng)新應(yīng)用和新場景，加速端側(cè)模型應(yīng)用和落地?！?/p>

一家國內(nèi)消費電子配套芯片公司人士接受《科創(chuàng)板日報》采訪時表示，盡管他們的產(chǎn)品在產(chǎn)業(yè)鏈幾乎最上游，但還是能感受到DeepSeek為智能終端行業(yè)帶來的積極影響。“AI降本之后，終端應(yīng)用預(yù)計會有大的爆發(fā)，繼續(xù)看好眼鏡、玩具、AI手機、AI PC等消費電子?！?/p>

“未來端側(cè)模型推理落地的場景也會非常豐富，例如AI一體機，家庭AI網(wǎng)關(guān)，AI PC，邊緣服務(wù)器，智能機器人等?！睂τ诙藗?cè)AI的未來，陳國銀非?？春茫P(guān)于下游AI場景對于上游硬件的推動，他認(rèn)為，不同的端側(cè)場景對芯片算力，功耗，安全，成本和功能都會有不同的要求，未來對于硬件的要求從能運行到運行得好過渡，同時時刻準(zhǔn)備新的模型應(yīng)用場景。硬件企業(yè)應(yīng)該在提供基礎(chǔ)算力能完成相關(guān)推理基礎(chǔ)上，下一步重點可能是性能極致優(yōu)化，多場景下功耗和性能的平衡，豐富AI生態(tài)的對接，多模態(tài)數(shù)據(jù)融合和處理。