• 正文
    • 01.算力效率之變:大模型從“大力出奇跡”,轉向“四兩撥千斤”
    • 02.算力結構之變:智能算力市場井噴,推理算力成“香餑餑”
    • 03.算力供應方式之變:算力供應方式多元化,企業(yè)AI選擇更多了
    • 04.城市AI排名之變:京杭滬拿下AI算力全國前三
    • 05.結語:未來算力發(fā)展既要“擴容”,也要“提效”
  • 相關推薦
申請入駐 產(chǎn)業(yè)圖譜

DeepSeek引發(fā)鯰魚效應,中國算力市場呈現(xiàn)“四變”

02/19 10:30
1365
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點資訊討論

作者 |??徐豫,編輯?|??漠影

這個AI領域千億級市場,將輻射千家萬戶。

DeepSeek-R1橫空出世,打響了大模型比拼性價比的第一槍。Meta、OpenAI等國外頭部大模型廠商紛紛復刻或變相降價。比DeepSeek-R1晚兩周發(fā)布的OpenAI o3-mini模型,定價比前代模型o1-mini降低了超6成,比前代完整版的o1模型便宜超9成。國內(nèi)的大模型廠商也迅速做出反應。

2月13日,百度宣布文心一言將于4月1日全面免費開放。文心一言此前采取基礎版免費、專業(yè)版收費的模式,專業(yè)版定價59.9元/月,連續(xù)包月優(yōu)惠價49.9元/月。這場看似僅僅是價格層面的競爭,實則背后蘊含著更為深層次的較量,其不僅是技術實力的比拼,也是對用戶市場的爭奪。

在這場沒有硝煙的商戰(zhàn)中,中國算力市場正經(jīng)歷著深刻的變革。最近發(fā)布的《2025年中國人工智能計算力發(fā)展評估報告》(以下簡稱《報告》),把中國算力發(fā)展的四大變化,從“幕后”搬到了“臺前”。

01.算力效率之變:大模型從“大力出奇跡”,轉向“四兩撥千斤”

第一大變化體現(xiàn)在算力效率方面,DeepSeek通過算法優(yōu)化,大幅降低大模型訓練、推理對高端GPU的依賴,突破了“算力軍備競賽”的傳統(tǒng)路徑?。模算效率的顯著提升,正是DeepSeek能夠實現(xiàn)高性價比的核心因素之一。

DeepSeek的論文顯示,DeepSeek-R1訓練成本僅557萬美元,不足OpenAI同類產(chǎn)品的5%,卻能在數(shù)學競賽、代碼生成等任務中超越GPT-4模型。這意味著DeepSeek-R1以較低的算力成本投入,也能實現(xiàn)高性能產(chǎn)出,即模算效率較高。這其中的模算效率(Model Computation Efficiency)就是,AI模型的訓練和推理過程中用來衡量模型精度與計算資源利用效率的綜合指標,它反映了模型在特定硬件平臺上,以最小的算力消耗實現(xiàn)最高精度的能力。DeepSeek“四兩撥千斤”的研發(fā)模式,更加注重算法創(chuàng)新、架構優(yōu)化和資源的高效利用,這或許將帶動業(yè)界對于模算效率的追求。

IDC中國副總裁周震剛接受采訪時稱,未來,大模型廠商們的關注點將從追求參數(shù)量規(guī)模,轉變?yōu)樽非竽P陀柧?、推理、部署等環(huán)節(jié)的性價比。此外,DeepSeek使用MoE(混合專家模型)架構實現(xiàn)了更高的成本效益,而Dense架構在相同參數(shù)量下擴展的計算成本較高。

浪潮信息高級副總裁劉軍在接受采訪時回顧:“去年開始,大家發(fā)現(xiàn)基于Dense架構的模型,再往前去演化到要訓練一個超過五千億、一萬億參數(shù)量的模型時,所需的算力、時間、數(shù)據(jù)量,都是當前技術條件下實現(xiàn)不了的。有企業(yè)做過一個評估,在這種情況下,需要20萬張卡訓練一年,才能把一個萬億的Dense模型高質(zhì)量訓練出來?!币虼?,MoE展現(xiàn)出來的在計算成本、模型性能等方面的優(yōu)勢,或將引發(fā)業(yè)界對于該架構的一波模仿借鑒。

當下,企業(yè)接入DeepSeek模型主要有兩種策略。一方面,國內(nèi)大模型廠商、芯片廠商、AI硬件廠商、運營商、AI應用開發(fā)商等相繼接入DeepSeek模型671B滿血版;另一方面,有的企業(yè)會根據(jù)自身業(yè)務需求選擇接入DeepSeek參數(shù)量較小的模型,或者選擇蒸餾DeepSeek模型將其與自家模型相結合,從而提高模型性能、降低應用成本。這種多形態(tài)、多參數(shù)的模型協(xié)同發(fā)展,才是大模型生態(tài)應有的狀態(tài)。在浪潮信息高級副總裁劉軍看來,把DeepSeek-R1模型的能力蒸餾到一些小模型上,實際會促進AI技術的擴散

02.算力結構之變:智能算力市場井噴,推理算力成“香餑餑”

將目光放到整個算力市場,我們可以發(fā)現(xiàn)第二大變化,國內(nèi)智能算力規(guī)模正極速擴張,需求結構也正被重塑?!秷蟾妗凤@示,2024年中國智能算力規(guī)模達725.3EFLOPS,同比增長74.1%,是近5年來的總量最高峰。這也是近年來中國智能算力規(guī)模擴張速度最快的一次。相比于國內(nèi)通用算力,智能算力的增幅已經(jīng)達到同期通用算力增幅的3倍以上。2024年中國通用算力規(guī)模為71.5EFLOPS,同比增長20.6%。

這意味著,過去一年內(nèi),AI芯片、AI服務器、AI訓練、AI推理和AI應用的市場規(guī)模也在快速膨脹。例如,2024年中國AI加速計算服務器市場規(guī)模為190億美元,同比大幅增長86.9%。盡管此前業(yè)界對大模型的Scaling law(規(guī)模法則)是否失效有所爭議,但在當下的AI發(fā)展進程中,其仍占主導地位。這也是推動AI算力需求持續(xù)增長的主要原因之一?!秷蟾妗分刑岬?,基于杰文斯悖論的現(xiàn)象反映出,DeepSeek實現(xiàn)的算法效率提升,并未抑制算力需求,反而帶動了更多的用戶和場景,進一步推動了大模型的普及與應用落地。這也有助于AI行業(yè)重構產(chǎn)業(yè)創(chuàng)新范式,并加強數(shù)據(jù)中心、邊緣及端側算力建設。

不過,單單堆疊訓練算力的策略并不能一勞永逸。越來越多大模型廠商轉向加速開發(fā)大模型的多模態(tài)能力,并尋找落地場景。多模態(tài)模型的應用、AI Agent熱潮隨之出現(xiàn),并且知識管理、對話式應用、內(nèi)容生成、營銷、視頻生成等都成為了生成式AI技術的熱門落地場景。

在應用落地側,這會大幅激發(fā)AI推理需求。如聊天機器人、音視頻圖像等的生成、辦公場景的AI助手等,在實際的應用場景中都較為依賴AI推理能力。因此,《報告》中預測,后續(xù)用于推理的算力規(guī)模,將會超過用于訓練的算力規(guī)模。在全球AI服務器市場中,未來生成式AI服務器的占比,將從2025年的29.6%,提升至2028年的37.7%。

在真實的業(yè)務場景中實現(xiàn)“降本增效”是AI技術發(fā)展的重要一環(huán)。未來,隨著大模型相關技術逐漸成熟,以及生成式AI應用不斷拓展,推理場景的需求日益增加,推理服務器的占比將大幅提高。IDC的數(shù)據(jù)顯示,預計到2028年,推理工作負載占比將會達到73%。

這一發(fā)展趨勢也在浪潮信息的業(yè)務中得到了印證。據(jù)浪潮信息高級副總裁劉軍透露,近期公司接到的大部分都是推理算力的訂單,現(xiàn)階段推理算力的投資回報率高,帶來的用戶體驗也更好,所以推理算力的規(guī)模會大幅提升。

03.算力供應方式之變:算力供應方式多元化,企業(yè)AI選擇更多了

第三大變化來自算力供應的方式。蛋糕做大了,下場分蛋糕的人也多了。去年有一大很明顯的市場趨勢是,一方面,AI算力基礎設施的供給結構趨于多元化,另一方面,用戶對智能算力基礎設施和服務能力的需求,也在發(fā)生深刻變化。

在供給端,其形成了數(shù)據(jù)中心服務商、云服務商、硬件廠商和相關AI創(chuàng)企多點提供AI算力資源的格局。在需求端的變化則集中于兩點:首先,生成式AI將進一步推動企業(yè),使用AI就緒的數(shù)據(jù)中心托管設施、生成式AI服務器集群等智算服務,這可以幫助企業(yè)縮短部署時間,降低資本成本。IDC數(shù)據(jù)顯示,2024年中國智算服務市場整體規(guī)模達到50億美元;其預計2025年中國智算服務市場整體規(guī)模將達到79.5億美元,2028年達到266.9億美元,2023年至2028年的年復合增長率將達到57.3%

其次,用于推理的一體機也開始受到市場追捧。IDC中國副總裁周震剛解釋說,早前企業(yè)基于云服務部署AI的案例比較多,而用一體機的比較少。但是DeepSeek模型爆火后,企業(yè)對于一體機的需求隨之大幅上升,開始注重私有化部署。因此,后續(xù)一段時間內(nèi),開源+一體機”可能會成為企業(yè)AI服務的爆款模式。據(jù)不完全統(tǒng)計,目前市面上至少已有60家DeepSeek一體機企業(yè),其中既有京東云、移動云、聯(lián)通云等云服務提供商,也有聯(lián)想、華為等大廠。

基于一體機,企業(yè)便可以通過“開箱即用”的方式,快速接入更強大的AI能力。浪潮信息上周推出的元腦R1推理服務器,就是其中一員。浪潮信息方面稱,該產(chǎn)品通過系統(tǒng)創(chuàng)新和軟硬協(xié)同優(yōu)化,單機即可部署運行DeepSeek-R1滿血版671B的模型。據(jù)浪潮信息高級副總裁劉軍透露,“最近兩個禮拜,來找我們咨詢購買能帶動滿血版DeepSeek-R1模型的AI服務器的客戶數(shù)正直線上升。”

04.城市AI排名之變:京杭滬拿下AI算力全國前三

第四大變化是城市AI算力排名?!秷蟾妗返臄?shù)據(jù)顯示,目前國內(nèi)各城市正通過加大AI投資、吸納人才以及提供政策支持等舉措,持續(xù)為AI發(fā)展提升競爭優(yōu)勢。可以看到,在中國各城市的AI算力排行榜中,北京和杭州依然穩(wěn)居排行榜前兩位,上海的排名則從2023年的第四位上升至第三位。這3座城市的AI策略各有所側重。其中,北京聚集了一大批大模型企業(yè),憑借大量人才、成熟的企業(yè)和有力的政策扶持,持續(xù)位居首位。杭州早在2021年就提出要成為具有全球影響力的AI頭雁城市,并頒布了諸多政策支持AI發(fā)展;上海的優(yōu)勢在于,其正加速推動AI世界級產(chǎn)業(yè)集群建設等工作,并表現(xiàn)出色。此外,廣州、成都、天津、廈門等城市的AI算力全國排名均有所提升。

AI影響下,不同行業(yè)的AI應用滲透度排名也發(fā)生了變化。排名第一的是互聯(lián)網(wǎng)行業(yè),其AI相關應用的滲透率更高。在該行業(yè)中,AI原生應用已覆蓋問答、寫作、客服、路線規(guī)劃、生活指導、學習助手、角色扮演、視頻生產(chǎn)、圖片企業(yè)智能客服、智能銷售分析等多個場景。金融行業(yè)從2023年的第四名,上升至2024年的第二名。制造行業(yè)2024年的排名相較于2023年前進了一位。這是由于金融行業(yè)積累了海量的數(shù)據(jù),可以用于AI訓練,為其進行風險評估等提供決策依據(jù);在制造業(yè)方面,由AI驅動的機器人和自動化設備可以完成重復性高、勞動強度大的工作任務。

05.結語:未來算力發(fā)展既要“擴容”,也要“提效”

從這四大變化可以看出,國內(nèi)算力產(chǎn)業(yè)的發(fā)展正呈現(xiàn)出蓬勃向上的態(tài)勢。與此同時,更為迫切的算力發(fā)展挑戰(zhàn)也被擺到了算力提供商面前。未來,如何持續(xù)優(yōu)化計算架構,如何進一步提升智算中心的算力資源利用率,如何完善數(shù)據(jù)中心的監(jiān)控系統(tǒng)和故障恢復機制,都亟需新的解決方案。

針對此,《報告》也提出了解決辦法,那就是算力提供商可以根據(jù)自身情況,采用算力“擴容”和“提效”并行策略來部署AI算力。其中,擴容包括增加智算中心的數(shù)量和種類,注重智算中心建設的區(qū)域分布和技術先進性,以加強算力供給能力。提效包括以用定建,以應用為導向規(guī)劃AI基礎設施;提高模型架構效率;優(yōu)化算力基礎設施架構,包括計算架構、內(nèi)存層次架構、智能調(diào)度算法等;使用高質(zhì)量的數(shù)據(jù)集,并搭建統(tǒng)一的數(shù)據(jù)存儲和訪問接口,以提高算力利用率。

未來,大模型產(chǎn)業(yè)的底層技術創(chuàng)新加速、場景應用逐漸鋪開,都將為國內(nèi)算力市場注入新活力。

相關推薦