• 正文
  • 相關(guān)推薦
申請(qǐng)入駐 產(chǎn)業(yè)圖譜

一文看懂DeepSeek如何火爆全球?

02/11 12:30
2305
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點(diǎn)資訊討論

短短兩周,中國(guó)人工智能初創(chuàng)公司DeepSeek火爆出圈。它拿下了美國(guó)和中國(guó)區(qū)App Store免費(fèi)榜的雙料第一,成為首個(gè)超越OpenAI ChatGPT的AI助手類(lèi)應(yīng)用。外媒用“震動(dòng)硅谷”形容DeepSeek帶給美國(guó)的行業(yè)震撼,其主打的低成本開(kāi)源模型概念更沖擊華爾街,英偉達(dá)市值一周縮水超5000億美元。

DeepSeek是什么?

DeepSeek,全稱(chēng)杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司,成立于2023年7月17日,總部位于浙江杭州。它由量化資管巨頭幻方量化創(chuàng)立,專(zhuān)注于大語(yǔ)言模型(LLM)及相關(guān)AI技術(shù)的研發(fā)。

DeepSeek為何如此震撼?

DeepSeek能夠引發(fā)業(yè)界震動(dòng)的主要原因在于其低廉的成本和開(kāi)源等特點(diǎn)。該公司去年底發(fā)布的大型語(yǔ)言模型DeepSeek-V3,訓(xùn)練成本僅為557.6萬(wàn)美元,與美國(guó)OpenAI最新版chatGPT的訓(xùn)練成本相比,差距約為20倍。API調(diào)用成本更是只有OpenAI的三十分之一。

AI產(chǎn)業(yè)是否存在泡沫化?

自從2022年底OpenAI掀起旋風(fēng)以來(lái),「不動(dòng)輒重砸數(shù)十億美元沒(méi)法訓(xùn)練出強(qiáng)大AI系統(tǒng)」始終是主流觀點(diǎn),市場(chǎng)認(rèn)為唯有像微軟、Google、Meta等科技巨頭才玩得起先進(jìn)AI,英偉達(dá)這類(lèi)AI芯片廠更是一片光明的景象。

然而DeepSeek僅花費(fèi)約560萬(wàn)美元和相對(duì)原始的運(yùn)算能力訓(xùn)練自家系統(tǒng),這比Meta建構(gòu)旗下最新AI所花資金便宜約10倍,引來(lái)AI產(chǎn)業(yè)反思,是否真有必要砸天文數(shù)字的資金?AI產(chǎn)業(yè)又是否存在泡沫化?

DeepSeek是如何辦到使用較少芯片?

美國(guó)的頂尖AI工程師們表示,DeepSeek的研究論文提出一些讓人印象深刻的巧思來(lái)降低芯片使用量,簡(jiǎn)言之就是種讓芯片分析數(shù)據(jù)時(shí)更有效率。

先進(jìn)AI系統(tǒng)需歸納文字、圖片、影音等大量數(shù)據(jù)來(lái)學(xué)習(xí)技能,DeepSeek則把這些數(shù)據(jù)分析工作分配給多個(gè)不同模型,每個(gè)模型負(fù)責(zé)特定領(lǐng)域,如此一來(lái)維持高效數(shù)據(jù)處理的同時(shí)還縮短運(yùn)算時(shí)間。這種方法之前不是沒(méi)有人用過(guò),只是沒(méi)法像DeepSeek用更少的運(yùn)算能力做到。

精通建構(gòu)高效AI系統(tǒng)的卡內(nèi)基美隆大學(xué)(CMU)計(jì)算機(jī)科學(xué)教授戴特摩斯(Tim Dettmers)說(shuō):「現(xiàn)在看顯然除OpenAI這類(lèi)公司外,其他人也能玩。DeepSeek使用的方法人人都能依樣畫(huà)葫蘆?!?

何謂開(kāi)源AI?

與許多公司一樣,DeepSeek也把自身最新的AI系統(tǒng)「開(kāi)源」,即把支撐AI的運(yùn)算代碼公開(kāi)給其他企業(yè)和研究人員,讓所有人都能使用這些技術(shù)來(lái)建構(gòu)、推廣自己的產(chǎn)品。DeepSeek與其他企業(yè)能如此迅速拿出具競(jìng)爭(zhēng)力的AI產(chǎn)品,部分也是受惠于他人開(kāi)源。

中美科技巨頭爭(zhēng)相接入DeepSeek

DeepSeek爆火后,海外巨頭率先接入DeepSeek模型。

1月31日,英偉達(dá)宣布DeepSeek-R1模型登陸NVIDIANIM。同日,亞馬遜和微軟也接入了DeepSeek-R1模型。英偉達(dá)稱(chēng),DeepSeek-R1是最先進(jìn)的大語(yǔ)言模型。

2月份,國(guó)內(nèi)幾大云平臺(tái)也宣布上線DeepSeek系列模型。

2月1日,華為云在官微宣布,與硅基流動(dòng)聯(lián)合首發(fā)并上線基于昇騰云服務(wù)的DeepSeek R1/V3推理服務(wù),其性能可與全球高端GPU部署模型相媲美。

2月2日,騰訊云稱(chēng),將DeepSeek-R1大模型一鍵部署至其“HAI”平臺(tái),開(kāi)發(fā)者僅需3分鐘即可接入調(diào)用。

2月3日,百度智能云也宣布,其千帆平臺(tái)正式上架DeepSeek-R1和DeepSeek-V3模型。阿里云也稱(chēng),其PAI Model Gallery支持云上一鍵部署DeepSeek-V3和DeepSeek-R1模型,

2月4日,字節(jié)跳動(dòng)旗下火山引擎也宣布,全面支持DeepSeek系列大模型,包括V3和R1等不同尺寸的模型,企業(yè)用戶可在火山引擎機(jī)器學(xué)習(xí)平臺(tái)veMLP中部署或通過(guò)火山方舟平臺(tái)直接調(diào)用。此外,聯(lián)通云、天翼云等平臺(tái)也宣布接入DeepSeek模型。

.......

芯片廠商加速對(duì)接完成適配

在芯片領(lǐng)域,國(guó)內(nèi)幾大GPU廠商加速跟DeepSeek模型的對(duì)接,完成適配,提供算力支持。

2月5日,華為官方表示,DeepSeek系列新模型正式上線昇騰社區(qū);Gitee AI同日表示,DeepSeek-V3滿血版在國(guó)產(chǎn)沐曦GPU首發(fā)體驗(yàn)上線。

中科曙光國(guó)家先進(jìn)計(jì)算產(chǎn)業(yè)創(chuàng)新中心有限公司發(fā)文宣布,海光信息技術(shù)團(tuán)隊(duì)已完成DeepSeek V3和R1模型與海光DCU的適配并上線;

摩爾線程也宣布,已實(shí)現(xiàn)對(duì)DeepSeek蒸餾模型推理服務(wù)的部署,并即將開(kāi)放自主設(shè)計(jì)的夸娥(KUAE)GPU智算集群,支持DeepSeek V3、R1模型及新一代蒸餾模型的分布式部署。天數(shù)智芯也稱(chēng),聯(lián)合Gitee AI正式上線DeepSeek R1模型服務(wù)。

據(jù)不完全統(tǒng)計(jì),截至2月7日,已有17家國(guó)產(chǎn)芯片企業(yè)相繼宣布適配或上架DeepSeek模型服務(wù),分別為華為昇騰、沐曦、天數(shù)智芯、摩爾線程、海光信息、壁仞科技、太初元碁、云天勵(lì)飛、燧原科技、昆侖芯、靈汐科技、鯤云科技、希姆計(jì)算、算能、清微智能、芯動(dòng)力、龍芯中科等。

有機(jī)構(gòu)認(rèn)為,DeepSeek通過(guò)模型層面創(chuàng)新,在芯片受限與低算力投入的背景下,達(dá)到全球頂尖閉源模型的性能水平,屬于生態(tài)級(jí)突破,有望帶動(dòng)國(guó)內(nèi)AI全產(chǎn)業(yè)快速發(fā)展,同時(shí)其開(kāi)源與低成本特性也有望賦能AI應(yīng)用廠商,加速推動(dòng)端側(cè)AI落地。

附:DeepSeek時(shí)間線梳理

注:文章綜合相關(guān)報(bào)道,僅供學(xué)習(xí)和交流之用,不構(gòu)成任何建議,不代表本號(hào)立場(chǎng),圖片來(lái)源網(wǎng)絡(luò),版權(quán)歸原作者所有,如有任何問(wèn)題,敬請(qǐng)聯(lián)系我們,謝謝。

專(zhuān)題:

相關(guān)推薦

登錄即可解鎖
  • 海量技術(shù)文章
  • 設(shè)計(jì)資源下載
  • 產(chǎn)業(yè)鏈客戶資源
  • 寫(xiě)文章/發(fā)需求
立即登錄

獵芯網(wǎng)旗下新媒體公眾號(hào)——芯三板,新三板,創(chuàng)業(yè)板,主板,海外板,越來(lái)越多的板爺!需要一個(gè)傳話筒吧?需要來(lái)一點(diǎn)解密吧?需要來(lái)一點(diǎn)心跳吧?麻辣新鮮,陳年往事,說(shuō)出來(lái)是故事,看透了就是人生!