• 正文
    • Qwen與DeepSeek的距離
    • 云廠商“收割”DS流量
    • 短期熱度與長期價值
  • 相關推薦
申請入駐 產業(yè)圖譜

DeepSeek播種,阿里云“收割”?

02/24 10:30
1053
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點資訊討論

撰文?| 郝 ? 鑫,編輯?| 吳先之

DeepSeek沖擊影響下,云和AI正在成為重估阿里的標尺。

2月20日,阿里發(fā)布2025財年第三季度業(yè)績報告(截至2024年12月31日止)。報告期內,阿里云實現營收317.42億元,同比增長13%,相比上一季度7%的增速接近翻倍。整體收入(不計來自阿里巴巴并表業(yè)務的收入)實現雙位數同比增長11%。調整后EBITA增長33%至31.38億。

財報顯示,該增長得益于AI相關產品推動的公共云收入增長,阿里云AI收入已連續(xù)六個季度三位數增長。

受云業(yè)務增長表現,阿里在美股盤前交易中上漲10%。相關數據顯示,今年以來,阿里港股股價上漲了48.7%,一度創(chuàng)下了接近60%的漲幅。

而這背后都離不開AI和云的影子。李飛飛利用開源大模型Qwen,以不到50美元的成本復刻DeepSeek-R1模型性能。蘋果選擇與阿里通義合作,為蘋果國內手機提供AI服務,一連串消息都獲得了市場的認可。

春節(jié)期間,DeepSeek給世界拋下了一枚重磅炸彈,也重新點燃了行業(yè)對大模型的熱情。似乎每個人都想抓住這波流量,并試圖將流量商業(yè)化變現。

從結果來看,在由DeepSeek引發(fā)的流量大戰(zhàn)中,贏面較大的仍是以阿里云為代表的云廠商。一方面是有穩(wěn)健的基礎設施和維護能力來接納DeepSeek-R1“難民”,另一方面也通過接入DeepSeek推理模型,完成了留存拉新的階段性任務。特別在開源領域,Qwen系列大模型仍具備競爭力,是國內不少中小企業(yè)決策和部署模型選項。

不可否認的是DeepSeek已經對國內大模型行業(yè)產生了影響:開源的價值被肯定,大模型技術的護城河被擊,玩家加速分化和優(yōu)勝劣汰。但短期熱度過后,仍需思考“推理”模型落地場景產生的實用價值。

Qwen與DeepSeek的距離

阿里財報會上提到,“春節(jié)以來,推理需求呈爆炸性增長”,客戶對AI相關產品的新需求約有60%-70%用于推理。

未來式智能CEO楊勁松對上面的數字有著清晰的感知,他回憶在春節(jié)期間,至少有一半的老客戶咨詢在DeepSeek,潛在和尚在溝通的新客戶也有二三十個。此前,這些人大部分是Qwen或智譜的客戶。

楊勁松介紹來咨詢的客戶大致分為兩類,一類是之前就在使用大模型的客戶,他們比較關注新模型的性能有哪些提升,以及自身能否部署和應用。第二類是尚未下決策的群體,開源正在改變他們的認知,意味著未來或許不需要花錢去找模型廠商采購。

盡管去年閉源大模型打到了“骨折價”,但動輒百萬元級別的大模型對許多中小企業(yè)來說,仍是奢望。受困于預算,大模型決策鏈條十分長,涉及了選擇哪家大模型,配套何種資源以及怎么去驗證大模型價值等。

開源的優(yōu)勢凸顯出來,能夠以輕便的模式跑模型,體驗性能的同時得到結果。目前,在開發(fā)者和To B客戶中,通義千問的32B和72B最受歡迎。開源版的Qwen同樣在海外得到了認可,官方數據顯示,海內外開源社區(qū)中Qwen的衍生模型數量已突破9萬,超越Llama系列衍生模型,通義千問Qwen成長為世界最大的生成式語言模型族群。

簡單算一筆賬,假設使用開源版的通義千問模型搭建一個AI應用項目。模型是免費的,大頭支出就變成了硬件,剩下少部分是使用MaaS平臺工具和構建應用的服務費用。預估下來,總體成本預算能控制在百萬以內。

DeepSeek帶著新推理模型殺回了開源領域,風頭一下子蓋過了Qwen和Llama。截至目前,DeepSeek相繼開源了671B參數的MoE模型“DeepSeek-V3”,對標OpenAI o1的“DeepSeek-R1”和代碼模型“DeepSeek Coder”等幾款重要的模型。

當在開源的戰(zhàn)場狹路相逢,Qwen和DeepSeek能否構成直接競爭?

楊勁松認為“暫時影響不太大”,Qwen在開源生態(tài)的優(yōu)勢仍十分明顯。

目前,通義千問就像是阿里“全家桶”,實現了“全尺寸、全模態(tài)、多場景”開源。包含了長文本、代碼生成、多模態(tài)、推理等多款模型,尺寸上也從3B跨越到72B,覆蓋了企業(yè)日常知識問答、客服對話、代碼生成、數據分析等常用場景。據悉,基于Qwen2.5-Max的深度推理模型也即將上線。正是這種“全”,給了用戶更多靈活的選擇。

國內阿里是較早選擇開源的,Qwen系列模型就是以開源起家。當前,基于模型底座已經積累起了很多開發(fā)者用戶、工具,生長出了一些應用產品。成熟的生態(tài)會給予用戶便利性,促使其繼續(xù)使用千問模型。

“一定程度上要取決于DeepSeek后期資源分配,在團隊規(guī)模有限的情況下,是專注模型研發(fā)還是花費一定精力去維護開源生態(tài)”,行業(yè)中有部分人認為DeepSeek的重心依然在AGI研究上。

如果DeepSeek在開源上一直能保持領先,不排除將演變?yōu)樯鷳B(tài)系統之爭。不過,DeepSeek和Qwen現在更偏向互為補充。一部分小尺寸DeepSeek-R1開源版本,就是基于Qwen模型蒸餾而來。

云廠商“收割”DS流量

高漲的情緒摻雜著些許沖動,一夜之間,比DeepSeek更火的是“接入DeepSeek”。

“不管怎么樣,本地來一套DeepSeek,讓我們能夠向上匯報”,大到國央企和政府部分,小到大廠、中小企業(yè)和個人開發(fā)者都想做第一批“吃螃蟹的人”。

現實的問題是,在開源社區(qū)只能部署和跑得通R1蒸餾后的小模型,32B、70B小尺寸模型效果并不是很驚艷。

“接入”DeepSeek看上去很熱鬧,好像每家都在宣傳,但其實大部分還是量化后的版本。要部署“滿血版”6710億參數的DeepSeek V3/R1,既要求得有硬件層面做推理優(yōu)化的能力,還得扛得住經濟成本。

以往一個新模型出來,因為時間差的原因,總會誕生一批賣API的人,但這回屬實讓一批人望而卻步。有人大致推算,要把6710B拉滿,至少需要1000G內存的卡,16臺八卡A100的機器,即使定價與DeepSeek漲價后價格持平,也是虧錢的狀態(tài)。與此同時,還得承受流量涌進后服務器的壓力和用戶消耗成本。

沒有誰比云廠商更熟悉這套玩法,嗅到流量味道的云廠商們伺機而動了起來,相繼官宣MaaS平臺接入“滿血版”的R1。送token還限時免費,恢復原價后的模型輸入、輸出價格也低于DeepSeek官方價格。

云廠商不靠賣API賺錢,最終獲益的還是整套云計算基建規(guī)?;笮б妗Π⒗镌苽儊碚f,搶奪AI時代流量入口才更重要,云上多模調用已經是大趨勢,以更開放的心態(tài)才能吸引來更多用戶。一旦調用R1的API鎖定在一家云上,后期服務器、存儲、構建應用等持續(xù)消費也將留在該廠商上。

對開發(fā)者和企業(yè)來說,調用哪家的API沒有差別,最終還是要落到價格上。在沒有明顯效果差距下,傾向于哪家價格便宜用哪家。于是,大廠的價格優(yōu)勢就很明顯。

結果也是顯而易見,阿里云們接住了這波流量,token調用量、股價和市值隨之上漲。

DeepSeek或許讓阿里云等廠商愈發(fā)明確了生態(tài)站位。也許未來,國內外還將會出現性能優(yōu)越的模型。這其中不變的是對云基礎設施、釋放模型能力和普惠的需求。

財報會上,阿里也明確了AI未來三年內的投資方向,強調“重投入”。

投資AI基礎設施,計劃在未來三年內對云和AI基礎設施的投資將超過過去十年的總和;大幅增加對AI基礎模型的研發(fā)投入,以保持技術領先地位,并推動AI原生應用的發(fā)展;增加對AI應用研發(fā)和計算能力的投資,并將AI深度整合到電商和互聯網平臺業(yè)務中,抓住AI時代的新增長機會。

短期熱度與長期價值

短期的熱度屬于云廠商,風暴中心的DeepSeek已經move on,下周將陸續(xù)開源五個代碼庫。

把視線拉遠,DeepSeek的長期價值應當回歸到,推理模型究竟能解決什么問題?!皫装偌医尤隓eepSeek公司,可能自己也沒想明白到底能干什么”。

楊勁松觀察到,整個行業(yè)仍處于技術亢奮狀態(tài),還未達到R1大規(guī)模應用落地的階段。結合國外的發(fā)展,還是有幾個方向值得探索。

行業(yè)普遍看好的方向之一是AI Coding。海外Cursor等AI編程產品大火,基本確立了Claude 3.5 Sonnet加上o1的組合,即Claude 3.5 Sonnet負責生成代碼,再用o1思維鏈去推理證明使用方式。這套組合之前在國內沒有平替,現在DeepSeek有了自己代碼+推理組合。這意味著有了構建一套Coding Agent的可能性。

“基于R1基座,通過強化學習的方式在垂直領域達到媲美人或超越人的能力,這是我覺得未來應用方向”,楊勁松表示道。

之前模型應用的路徑是,先有基模,然后收集數據,再通過微調訓練調整模型,來預測下一個token能力。但在實際業(yè)務場景中,采用行業(yè)數據和機器學習訓練出的通用模型能力效果差強人意。

現在有了推理模型以后,就可以把行業(yè)專家在特定領域和工作流的最佳實踐,通過強化學習方式喂給推理模型。這樣一來,它就可以熟悉企業(yè)內部流程,掌握業(yè)務邏輯,做到像一位專家一樣去工作。楊勁松認為,R1真正的價值在于,可以上升到決策層面,完成垂直領域的任務,且達到不錯的效果。

例如在電力場景,日常存在許多分析電網圖譜的工作。它要基于內部規(guī)則做推導,再去進行決策?,F在接入R1推理模型,并配備一些行業(yè)知識后,一定程度上就可以模擬電力專家完成電網調度、專改公等非常專業(yè)的任務。

OpenAI已經在探索把推理功能落地到場景中。其由o3大模型支持的“Deep Research”功能,可以從互聯網上收集信息,并將其合成為簡明的報告。OpenAI聲稱,“只需數十分鐘就能完成人類需要數小時才能完成的工作”。

這本質上是復制行業(yè)分析師和咨詢顧問的思考鏈條。使用模型還原分析過程,過程中調用搜索引擎、圖表等工具。圍繞一個研究主題,先推理、檢索再進行深度分析,其生成的報告基本可以達到中級行業(yè)分析師的水平。

目前,國內大廠已經開始逐漸上線類似的“深度搜索”功能。要大規(guī)模地落地生產力場景,仍需時間驗證。

阿里巴巴

阿里巴巴

阿里巴巴集團經營多項業(yè)務,另外也從關聯公司的業(yè)務和服務中取得經營商業(yè)生態(tài)系統上的支援。業(yè)務和關聯公司的業(yè)務包括:淘寶網、天貓、聚劃算、全球速賣通、阿里巴巴國際交易市場、1688、阿里媽媽、阿里云、螞蟻金服、菜鳥網絡等。

阿里巴巴集團經營多項業(yè)務,另外也從關聯公司的業(yè)務和服務中取得經營商業(yè)生態(tài)系統上的支援。業(yè)務和關聯公司的業(yè)務包括:淘寶網、天貓、聚劃算、全球速賣通、阿里巴巴國際交易市場、1688、阿里媽媽、阿里云、螞蟻金服、菜鳥網絡等。收起

查看更多

相關推薦

登錄即可解鎖
  • 海量技術文章
  • 設計資源下載
  • 產業(yè)鏈客戶資源
  • 寫文章/發(fā)需求
立即登錄