• 正文
    • Qwen與DeepSeek的距離
    • 云廠商“收割”DS流量
    • 短期熱度與長期價(jià)值
  • 相關(guān)推薦
申請入駐 產(chǎn)業(yè)圖譜

DeepSeek播種,阿里云“收割”?

02/24 10:30
757
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點(diǎn)資訊討論

撰文?| 郝 ? 鑫,編輯?| 吳先之

DeepSeek沖擊影響下,云和AI正在成為重估阿里的標(biāo)尺。

2月20日,阿里發(fā)布2025財(cái)年第三季度業(yè)績報(bào)告(截至2024年12月31日止)。報(bào)告期內(nèi),阿里云實(shí)現(xiàn)營收317.42億元,同比增長13%,相比上一季度7%的增速接近翻倍。整體收入(不計(jì)來自阿里巴巴并表業(yè)務(wù)的收入)實(shí)現(xiàn)雙位數(shù)同比增長11%。調(diào)整后EBITA增長33%至31.38億。

財(cái)報(bào)顯示,該增長得益于AI相關(guān)產(chǎn)品推動(dòng)的公共云收入增長,阿里云AI收入已連續(xù)六個(gè)季度三位數(shù)增長。

受云業(yè)務(wù)增長表現(xiàn),阿里在美股盤前交易中上漲10%。相關(guān)數(shù)據(jù)顯示,今年以來,阿里港股股價(jià)上漲了48.7%,一度創(chuàng)下了接近60%的漲幅。

而這背后都離不開AI和云的影子。李飛飛利用開源大模型Qwen,以不到50美元的成本復(fù)刻DeepSeek-R1模型性能。蘋果選擇與阿里通義合作,為蘋果國內(nèi)手機(jī)提供AI服務(wù),一連串消息都獲得了市場的認(rèn)可。

春節(jié)期間,DeepSeek給世界拋下了一枚重磅炸彈,也重新點(diǎn)燃了行業(yè)對大模型的熱情。似乎每個(gè)人都想抓住這波流量,并試圖將流量商業(yè)化變現(xiàn)。

從結(jié)果來看,在由DeepSeek引發(fā)的流量大戰(zhàn)中,贏面較大的仍是以阿里云為代表的云廠商。一方面是有穩(wěn)健的基礎(chǔ)設(shè)施和維護(hù)能力來接納DeepSeek-R1“難民”,另一方面也通過接入DeepSeek推理模型,完成了留存拉新的階段性任務(wù)。特別在開源領(lǐng)域,Qwen系列大模型仍具備競爭力,是國內(nèi)不少中小企業(yè)決策和部署模型選項(xiàng)。

不可否認(rèn)的是DeepSeek已經(jīng)對國內(nèi)大模型行業(yè)產(chǎn)生了影響:開源的價(jià)值被肯定,大模型技術(shù)的護(hù)城河被擊,玩家加速分化和優(yōu)勝劣汰。但短期熱度過后,仍需思考“推理”模型落地場景產(chǎn)生的實(shí)用價(jià)值。

Qwen與DeepSeek的距離

阿里財(cái)報(bào)會上提到,“春節(jié)以來,推理需求呈爆炸性增長”,客戶對AI相關(guān)產(chǎn)品的新需求約有60%-70%用于推理。

未來式智能CEO楊勁松對上面的數(shù)字有著清晰的感知,他回憶在春節(jié)期間,至少有一半的老客戶咨詢在DeepSeek,潛在和尚在溝通的新客戶也有二三十個(gè)。此前,這些人大部分是Qwen或智譜的客戶。

楊勁松介紹來咨詢的客戶大致分為兩類,一類是之前就在使用大模型的客戶,他們比較關(guān)注新模型的性能有哪些提升,以及自身能否部署和應(yīng)用。第二類是尚未下決策的群體,開源正在改變他們的認(rèn)知,意味著未來或許不需要花錢去找模型廠商采購。

盡管去年閉源大模型打到了“骨折價(jià)”,但動(dòng)輒百萬元級別的大模型對許多中小企業(yè)來說,仍是奢望。受困于預(yù)算,大模型決策鏈條十分長,涉及了選擇哪家大模型,配套何種資源以及怎么去驗(yàn)證大模型價(jià)值等。

開源的優(yōu)勢凸顯出來,能夠以輕便的模式跑模型,體驗(yàn)性能的同時(shí)得到結(jié)果。目前,在開發(fā)者和To B客戶中,通義千問的32B和72B最受歡迎。開源版的Qwen同樣在海外得到了認(rèn)可,官方數(shù)據(jù)顯示,海內(nèi)外開源社區(qū)中Qwen的衍生模型數(shù)量已突破9萬,超越Llama系列衍生模型,通義千問Qwen成長為世界最大的生成式語言模型族群。

簡單算一筆賬,假設(shè)使用開源版的通義千問模型搭建一個(gè)AI應(yīng)用項(xiàng)目。模型是免費(fèi)的,大頭支出就變成了硬件,剩下少部分是使用MaaS平臺工具和構(gòu)建應(yīng)用的服務(wù)費(fèi)用。預(yù)估下來,總體成本預(yù)算能控制在百萬以內(nèi)。

DeepSeek帶著新推理模型殺回了開源領(lǐng)域,風(fēng)頭一下子蓋過了Qwen和Llama。截至目前,DeepSeek相繼開源了671B參數(shù)的MoE模型“DeepSeek-V3”,對標(biāo)OpenAI o1的“DeepSeek-R1”和代碼模型“DeepSeek Coder”等幾款重要的模型。

當(dāng)在開源的戰(zhàn)場狹路相逢,Qwen和DeepSeek能否構(gòu)成直接競爭?

楊勁松認(rèn)為“暫時(shí)影響不太大”,Qwen在開源生態(tài)的優(yōu)勢仍十分明顯。

目前,通義千問就像是阿里“全家桶”,實(shí)現(xiàn)了“全尺寸、全模態(tài)、多場景”開源。包含了長文本、代碼生成、多模態(tài)、推理等多款模型,尺寸上也從3B跨越到72B,覆蓋了企業(yè)日常知識問答、客服對話、代碼生成、數(shù)據(jù)分析等常用場景。據(jù)悉,基于Qwen2.5-Max的深度推理模型也即將上線。正是這種“全”,給了用戶更多靈活的選擇。

國內(nèi)阿里是較早選擇開源的,Qwen系列模型就是以開源起家。當(dāng)前,基于模型底座已經(jīng)積累起了很多開發(fā)者用戶、工具,生長出了一些應(yīng)用產(chǎn)品。成熟的生態(tài)會給予用戶便利性,促使其繼續(xù)使用千問模型。

“一定程度上要取決于DeepSeek后期資源分配,在團(tuán)隊(duì)規(guī)模有限的情況下,是專注模型研發(fā)還是花費(fèi)一定精力去維護(hù)開源生態(tài)”,行業(yè)中有部分人認(rèn)為DeepSeek的重心依然在AGI研究上。

如果DeepSeek在開源上一直能保持領(lǐng)先,不排除將演變?yōu)樯鷳B(tài)系統(tǒng)之爭。不過,DeepSeek和Qwen現(xiàn)在更偏向互為補(bǔ)充。一部分小尺寸DeepSeek-R1開源版本,就是基于Qwen模型蒸餾而來。

云廠商“收割”DS流量

高漲的情緒摻雜著些許沖動(dòng),一夜之間,比DeepSeek更火的是“接入DeepSeek”。

“不管怎么樣,本地來一套DeepSeek,讓我們能夠向上匯報(bào)”,大到國央企和政府部分,小到大廠、中小企業(yè)和個(gè)人開發(fā)者都想做第一批“吃螃蟹的人”。

現(xiàn)實(shí)的問題是,在開源社區(qū)只能部署和跑得通R1蒸餾后的小模型,32B、70B小尺寸模型效果并不是很驚艷。

“接入”DeepSeek看上去很熱鬧,好像每家都在宣傳,但其實(shí)大部分還是量化后的版本。要部署“滿血版”6710億參數(shù)的DeepSeek V3/R1,既要求得有硬件層面做推理優(yōu)化的能力,還得扛得住經(jīng)濟(jì)成本。

以往一個(gè)新模型出來,因?yàn)闀r(shí)間差的原因,總會誕生一批賣API的人,但這回屬實(shí)讓一批人望而卻步。有人大致推算,要把6710B拉滿,至少需要1000G內(nèi)存的卡,16臺八卡A100的機(jī)器,即使定價(jià)與DeepSeek漲價(jià)后價(jià)格持平,也是虧錢的狀態(tài)。與此同時(shí),還得承受流量涌進(jìn)后服務(wù)器的壓力和用戶消耗成本。

沒有誰比云廠商更熟悉這套玩法,嗅到流量味道的云廠商們伺機(jī)而動(dòng)了起來,相繼官宣MaaS平臺接入“滿血版”的R1。送token還限時(shí)免費(fèi),恢復(fù)原價(jià)后的模型輸入、輸出價(jià)格也低于DeepSeek官方價(jià)格。

云廠商不靠賣API賺錢,最終獲益的還是整套云計(jì)算基建規(guī)模化后效益。對阿里云們來說,搶奪AI時(shí)代流量入口才更重要,云上多模調(diào)用已經(jīng)是大趨勢,以更開放的心態(tài)才能吸引來更多用戶。一旦調(diào)用R1的API鎖定在一家云上,后期服務(wù)器、存儲、構(gòu)建應(yīng)用等持續(xù)消費(fèi)也將留在該廠商上。

對開發(fā)者和企業(yè)來說,調(diào)用哪家的API沒有差別,最終還是要落到價(jià)格上。在沒有明顯效果差距下,傾向于哪家價(jià)格便宜用哪家。于是,大廠的價(jià)格優(yōu)勢就很明顯。

結(jié)果也是顯而易見,阿里云們接住了這波流量,token調(diào)用量、股價(jià)和市值隨之上漲。

DeepSeek或許讓阿里云等廠商愈發(fā)明確了生態(tài)站位。也許未來,國內(nèi)外還將會出現(xiàn)性能優(yōu)越的模型。這其中不變的是對云基礎(chǔ)設(shè)施、釋放模型能力和普惠的需求。

財(cái)報(bào)會上,阿里也明確了AI未來三年內(nèi)的投資方向,強(qiáng)調(diào)“重投入”。

投資AI基礎(chǔ)設(shè)施,計(jì)劃在未來三年內(nèi)對云和AI基礎(chǔ)設(shè)施的投資將超過過去十年的總和;大幅增加對AI基礎(chǔ)模型的研發(fā)投入,以保持技術(shù)領(lǐng)先地位,并推動(dòng)AI原生應(yīng)用的發(fā)展;增加對AI應(yīng)用研發(fā)和計(jì)算能力的投資,并將AI深度整合到電商和互聯(lián)網(wǎng)平臺業(yè)務(wù)中,抓住AI時(shí)代的新增長機(jī)會。

短期熱度與長期價(jià)值

短期的熱度屬于云廠商,風(fēng)暴中心的DeepSeek已經(jīng)move on,下周將陸續(xù)開源五個(gè)代碼庫。

把視線拉遠(yuǎn),DeepSeek的長期價(jià)值應(yīng)當(dāng)回歸到,推理模型究竟能解決什么問題?!皫装偌医尤隓eepSeek公司,可能自己也沒想明白到底能干什么”。

楊勁松觀察到,整個(gè)行業(yè)仍處于技術(shù)亢奮狀態(tài),還未達(dá)到R1大規(guī)模應(yīng)用落地的階段。結(jié)合國外的發(fā)展,還是有幾個(gè)方向值得探索。

行業(yè)普遍看好的方向之一是AI Coding。海外Cursor等AI編程產(chǎn)品大火,基本確立了Claude 3.5 Sonnet加上o1的組合,即Claude 3.5 Sonnet負(fù)責(zé)生成代碼,再用o1思維鏈去推理證明使用方式。這套組合之前在國內(nèi)沒有平替,現(xiàn)在DeepSeek有了自己代碼+推理組合。這意味著有了構(gòu)建一套Coding Agent的可能性。

“基于R1基座,通過強(qiáng)化學(xué)習(xí)的方式在垂直領(lǐng)域達(dá)到媲美人或超越人的能力,這是我覺得未來應(yīng)用方向”,楊勁松表示道。

之前模型應(yīng)用的路徑是,先有基模,然后收集數(shù)據(jù),再通過微調(diào)訓(xùn)練調(diào)整模型,來預(yù)測下一個(gè)token能力。但在實(shí)際業(yè)務(wù)場景中,采用行業(yè)數(shù)據(jù)和機(jī)器學(xué)習(xí)訓(xùn)練出的通用模型能力效果差強(qiáng)人意。

現(xiàn)在有了推理模型以后,就可以把行業(yè)專家在特定領(lǐng)域和工作流的最佳實(shí)踐,通過強(qiáng)化學(xué)習(xí)方式喂給推理模型。這樣一來,它就可以熟悉企業(yè)內(nèi)部流程,掌握業(yè)務(wù)邏輯,做到像一位專家一樣去工作。楊勁松認(rèn)為,R1真正的價(jià)值在于,可以上升到?jīng)Q策層面,完成垂直領(lǐng)域的任務(wù),且達(dá)到不錯(cuò)的效果。

例如在電力場景,日常存在許多分析電網(wǎng)圖譜的工作。它要基于內(nèi)部規(guī)則做推導(dǎo),再去進(jìn)行決策。現(xiàn)在接入R1推理模型,并配備一些行業(yè)知識后,一定程度上就可以模擬電力專家完成電網(wǎng)調(diào)度、專改公等非常專業(yè)的任務(wù)。

OpenAI已經(jīng)在探索把推理功能落地到場景中。其由o3大模型支持的“Deep Research”功能,可以從互聯(lián)網(wǎng)上收集信息,并將其合成為簡明的報(bào)告。OpenAI聲稱,“只需數(shù)十分鐘就能完成人類需要數(shù)小時(shí)才能完成的工作”。

這本質(zhì)上是復(fù)制行業(yè)分析師和咨詢顧問的思考鏈條。使用模型還原分析過程,過程中調(diào)用搜索引擎、圖表等工具。圍繞一個(gè)研究主題,先推理、檢索再進(jìn)行深度分析,其生成的報(bào)告基本可以達(dá)到中級行業(yè)分析師的水平。

目前,國內(nèi)大廠已經(jīng)開始逐漸上線類似的“深度搜索”功能。要大規(guī)模地落地生產(chǎn)力場景,仍需時(shí)間驗(yàn)證。

阿里巴巴

阿里巴巴

阿里巴巴集團(tuán)經(jīng)營多項(xiàng)業(yè)務(wù),另外也從關(guān)聯(lián)公司的業(yè)務(wù)和服務(wù)中取得經(jīng)營商業(yè)生態(tài)系統(tǒng)上的支援。業(yè)務(wù)和關(guān)聯(lián)公司的業(yè)務(wù)包括:淘寶網(wǎng)、天貓、聚劃算、全球速賣通、阿里巴巴國際交易市場、1688、阿里媽媽、阿里云、螞蟻金服、菜鳥網(wǎng)絡(luò)等。

阿里巴巴集團(tuán)經(jīng)營多項(xiàng)業(yè)務(wù),另外也從關(guān)聯(lián)公司的業(yè)務(wù)和服務(wù)中取得經(jīng)營商業(yè)生態(tài)系統(tǒng)上的支援。業(yè)務(wù)和關(guān)聯(lián)公司的業(yè)務(wù)包括:淘寶網(wǎng)、天貓、聚劃算、全球速賣通、阿里巴巴國際交易市場、1688、阿里媽媽、阿里云、螞蟻金服、菜鳥網(wǎng)絡(luò)等。收起

查看更多

相關(guān)推薦

登錄即可解鎖
  • 海量技術(shù)文章
  • 設(shè)計(jì)資源下載
  • 產(chǎn)業(yè)鏈客戶資源
  • 寫文章/發(fā)需求
立即登錄