• 正文
    • 開閉源之爭出現新轉折點
    • 不只有DeepSeek開源
    • 中國正重塑全球AI發(fā)展格局
  • 相關推薦
申請入駐 產業(yè)圖譜

中國開源力量崛起

03/31 15:33
644
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點資訊討論

最近一段時間,以DeepSeek、阿里、群核科技等為代表的國內科技企業(yè)密集發(fā)布高性能開源大模型,引發(fā)廣泛關注。美國AI社區(qū)多位業(yè)內人士預測,接下來幾個月,中國將會出現一波開源人工智能(AI)模型的浪潮。美國CNBC電視臺網站發(fā)布標題為《中國對開源的擁抱顛覆了圍繞人工智能的傳統(tǒng)看法》的文章,稱“中國正在積極擁抱開源AI模型,這一趨勢推動國內人工智能技術的普及與創(chuàng)新”。可以看到,中國開源力量的崛起已在全球AI競爭中激起層層漣漪。

開閉源之爭出現新轉折點

一直以來,開閉源之爭從未停止過,卻也保持著微妙的平衡。開源和閉源實際上是兩種開發(fā)模式。開源模型指由開源社區(qū)或組織開發(fā)、維護和共享的大型軟件模型,模型源代碼是公開的,所有人都可以查看、修改和分發(fā)。閉源大模型的源代碼、數據集和技術細節(jié)不對外公開,通常作為商業(yè)產品進行銷售或通過API服務提供。DeepSeek的出現刷新了國際上對于中國開源大模型技術的認知,同時也標志著開源模型的一次巨大成功。

就連OpenAI首席執(zhí)行官Sam Altman也不得不承認:“我們在這里站在了歷史的錯誤一邊,需要找出一個不同的開源策略?!薄癉eepSeek是一款完完全全的開源模型,將各個環(huán)節(jié)包括數據、代碼、權重、推理鏈的運行思路、工程構建方法都開放出來,讓更多人愿意參與進去?!辟惖涎芯吭盒跑浰浖?a class="article-link" target="_blank" href="/industry-map/">產業(yè)研究室副主任黃文鴻解釋說道。就好比建造一所房子,真正的開源不僅公開圖紙、材料、房屋結構,還會清晰地告訴你每一步應該建什么,有了這些信息就可以1:1還原房子。DeepSeek開放程度之高前所未有,這也是其一經發(fā)布就產生巨大影響的原因之一。

與此同時,DeepSeek從軟硬件的適配到應用推廣甚至產品宣傳,都是由全球廠商和開發(fā)者共同完成的,這極大降低了其生態(tài)建設成本。國際市場上,微軟、英偉達、亞馬遜、英特爾、AMD等全球科技巨頭皆已上線DeepSeek開源模型推理服務;國內互聯(lián)網科技廠如阿里、騰訊、百度以及運營商、車企等也都相繼宣布接入DeepSeek。在分享DeepSeek帶來的流量紅利的同時,實際上這些廠商也將反哺DeepSeek,助其進一步拓展模型生態(tài),快速提升用戶數量和市占率。

國際評級機構Counterpoint Research人工智能首席分析師孫薇評論稱,OpenAI和DeepSeek分別代表了AI領域的兩極:開源陣營通過互相借鑒持續(xù)創(chuàng)新,閉源企業(yè)則面臨維護高成本尖端模型的壓力。DeepSeek的成功證明開源戰(zhàn)略能夠帶來更快的創(chuàng)新速度和更廣泛的應用。零一萬物創(chuàng)始人李開復指出,開源模式最終將占據主導地位,Deepseek 采取免費、開源的模式,對 OpenAI 構成了根本性的挑戰(zhàn)。Meta首席AI科學家楊立昆更是直言:R1的出現是“開源模型的勝利”。

不只有DeepSeek開源

實際上,不止是DeepSeek,國內還有不少企業(yè)都在開源模型領域取得了不俗的成績。比如阿里在2018年底便啟動了大模型研發(fā),在超大模型、語言及多模態(tài)能力、低碳訓練、平臺化服務、落地應用等多個方面,為中文大模型的發(fā)展做了前沿性、引領性的工作。作為全球較早研發(fā)并開放類GPT語言模型的科技公司之一,阿里一直堅持走開源之路。記者了解到,截至目前,阿里已開源200多款模型,包括文本生成模型、視覺理解/生成模型、語音理解/生成模型、文生圖及視頻模型等多模態(tài),覆蓋從0.5B到110B參數的各類尺寸。通義千問全球下載量已突破2億,穩(wěn)居全球最大AI開源社區(qū)Hugging Face趨勢榜榜首。旗下魔搭社區(qū)模型總數已超4萬個,成為國內最大的AI開源社區(qū)。

值得關注的是,3月27日,阿里開源首個全模態(tài)大模型Qwen2.5-Omni7B,已經可以在手機上部署運行。在權威的多模態(tài)融合任務OmniBench等測評中,Qwen2.5-Omni刷新業(yè)界紀錄,全維度遠超Google的Gemini-1.5-Pro等同類模型。3月28日消息,被譽為杭州“六小龍”之一的群核科技發(fā)布的空間理解開源模型SpatialLM登上全球最大AI開源社區(qū)Hugging Face趨勢榜第二位。據悉,SpatialLM是群核科技自主研發(fā)的一款空間理解模型,該模型僅通過一段視頻即可生成物理正確的3D場景布局。

不同于傳統(tǒng)大語言模型,SpatialLM突破了對物理世界幾何與空間關系的理解局限,將在機器類人的空間認知和解析能力上發(fā)揮重大作用。該模型的開源,將為像具身智能領域的企業(yè)或機構科研團隊提供一個空間認知理解的基礎訓練框架。尤其是對那些不具備模型開發(fā)能力的具身智能企業(yè),可以基于SpatialLM模型進行微調,降低具身智能訓練門檻。目前,SpatialLM已在HuggingFace、GitHub、魔搭社區(qū)等平臺面向全球開發(fā)者開源。在開源后一周,SpatialLM在海外社交平臺LinkedIn、Twitter受到行業(yè)人士追捧。

值得一提的是,目前Hugging Face趨勢榜前三名皆為中國科技企業(yè)推出的開源大模型(通義千問Qwen2.5-Omni、DeepSeek、群核科技SpatialLM)。據業(yè)內人士統(tǒng)計,在最新的 Hugging Face 熱門模型榜單中,中國模型的含量已經超過了50%。越來越多國際開發(fā)者選擇中國基礎模型作為微調起點,以DeepSeek和Qwen系列模型為基點的衍生模型越來越多??萍即骎、天使投資人、技術創(chuàng)始人Balaji預測,接下來幾個月里,中國還會有一波開源AI模型的浪潮,涵蓋從計算機視覺到機器人技術,再到圖像生成的各個領域?!爸袊缃癯闪碎_源AI的先鋒,這實在令人驚訝。”

中國正重塑全球AI發(fā)展格局

工信部消息顯示,中國已成為全球開源參與者數量排名第二、增長速度最快的國家。“中國愿意與世界分享AI資源,促進AI的普惠化發(fā)展,這意味著中國正在重塑全球AI的發(fā)展格局。”克羅地亞AI研究專家德拉戈·奇利加表示。

騰訊研究院發(fā)布的報告指出,2022年以來,開源模型呈趕超之勢。開源與閉源模型在性能和應用領域的差距迅速縮小,甚至在某些方面實現超越。

這一方面是因為開源的“集市協(xié)作模式”正在AI領域重演,開源大模型將底層能力公開,公眾可免費下載權重自行部署,進行“二次創(chuàng)作”,在不同行業(yè)和場景中微調形成專用版本,靈活適配性大大增強。開發(fā)者共同分享工程經驗,參與技術路線試錯,加速了AI發(fā)展進化。另一方面也是因為開源模型提升了AI系統(tǒng)的透明度和安全性,由于模型架構、權重開放,外部研究者可以深入“解剖”模型,及時發(fā)現偏見或漏洞并共同改進。

相反,封閉模型如同“黑箱”,外界難以對其進行監(jiān)督。此外,開源打破了AI領域的既有封閉格局。此前最先進的AI模型往往為少數巨頭掌握,產業(yè)下游通過API付費使用,對其缺乏議價或約束能力。開源減少了單一供應商的鎖定效應,提升了技術自主權。在大模型領域,開源社區(qū)用更低算力復現了商業(yè)閉源模型的大部分能力,也迫使大型科技公司不得不重新評估策略,保障了行業(yè)的良性競爭。黃文鴻認為,信息技術領域具有強者恒強的發(fā)展規(guī)律,我國在開源模型上是有先發(fā)優(yōu)勢的,必須進一步筑牢技術“護城河”。但目前各行各業(yè)真正懂開源模型的人才并不多,基于開源大模型的下游企業(yè),以及做工程優(yōu)化、模型調優(yōu)的研發(fā)人員相對較少,高校應該培養(yǎng)更多相關人才,共同促成“創(chuàng)新—共享—再創(chuàng)新”,助力產業(yè)生態(tài)更加完備。阿里云高級總監(jiān)朱迅垚建議,從國家到地方再到企業(yè),應以更加積極的態(tài)度擁抱開源,同時在智能算力、高質量數據集、上云用云等方面加快創(chuàng)新步伐,緊跟世界先進水平。這樣的舉措不僅有助于降低技術門檻,也將為用戶提供更方便的工具,幫助他們更好地進行技術實現和創(chuàng)新。

“大模型的格局將從比拼底層模型的技術指標,走向擁抱開源的底層模型,進行商業(yè)賦能。”李開復表示,中國有超大、超常、超多的場景,所以2025年一定會有很多廠商開始擁抱開源底層模型,加速行業(yè)賦能,預計在全球會有非常優(yōu)異的表現。

作者丨宋婧編輯丨趙晨美編丨馬利亞監(jiān)制丨連曉東

相關推薦