少妇高潮在线观看,亚州av中文无码乱人伦在线,a国产成人免费视频高清v

短短兩周，中國人工智能初創(chuàng)公司DeepSeek火爆出圈。它拿下了美國和中國區(qū)App Store免費榜的雙料第一，成為首個超越OpenAI ChatGPT的AI助手類應用。外媒用“震動硅谷”形容DeepSeek帶給美國的行業(yè)震撼，其主打的低成本開源模型概念更沖擊華爾街，英偉達市值一周縮水超5000億美元。

DeepSeek是什么？

DeepSeek，全稱杭州深度求索人工智能基礎技術研究有限公司，成立于2023年7月17日，總部位于浙江杭州。它由量化資管巨頭幻方量化創(chuàng)立，專注于大語言模型（LLM）及相關AI技術的研發(fā)。

DeepSeek為何如此震撼？

DeepSeek能夠引發(fā)業(yè)界震動的主要原因在于其低廉的成本和開源等特點。該公司去年底發(fā)布的大型語言模型DeepSeek-V3，訓練成本僅為557.6萬美元，與美國OpenAI最新版chatGPT的訓練成本相比，差距約為20倍。API調用成本更是只有OpenAI的三十分之一。

AI產業(yè)是否存在泡沫化？

自從2022年底OpenAI掀起旋風以來，「不動輒重砸數(shù)十億美元沒法訓練出強大AI系統(tǒng)」始終是主流觀點，市場認為唯有像微軟、Google、Meta等科技巨頭才玩得起先進AI，英偉達這類AI芯片廠更是一片光明的景象。

然而DeepSeek僅花費約560萬美元和相對原始的運算能力訓練自家系統(tǒng)，這比Meta建構旗下最新AI所花資金便宜約10倍，引來AI產業(yè)反思，是否真有必要砸天文數(shù)字的資金？AI產業(yè)又是否存在泡沫化？

DeepSeek是如何辦到使用較少芯片？

美國的頂尖AI工程師們表示，DeepSeek的研究論文提出一些讓人印象深刻的巧思來降低芯片使用量，簡言之就是種讓芯片分析數(shù)據(jù)時更有效率。

先進AI系統(tǒng)需歸納文字、圖片、影音等大量數(shù)據(jù)來學習技能，DeepSeek則把這些數(shù)據(jù)分析工作分配給多個不同模型，每個模型負責特定領域，如此一來維持高效數(shù)據(jù)處理的同時還縮短運算時間。這種方法之前不是沒有人用過，只是沒法像DeepSeek用更少的運算能力做到。

精通建構高效AI系統(tǒng)的卡內基美隆大學（CMU）計算機科學教授戴特摩斯（Tim Dettmers）說：「現(xiàn)在看顯然除OpenAI這類公司外，其他人也能玩。DeepSeek使用的方法人人都能依樣畫葫蘆?！?

何謂開源AI？

與許多公司一樣，DeepSeek也把自身最新的AI系統(tǒng)「開源」，即把支撐AI的運算代碼公開給其他企業(yè)和研究人員，讓所有人都能使用這些技術來建構、推廣自己的產品。DeepSeek與其他企業(yè)能如此迅速拿出具競爭力的AI產品，部分也是受惠于他人開源。

中美科技巨頭爭相接入DeepSeek

DeepSeek爆火后，海外巨頭率先接入DeepSeek模型。

1月31日，英偉達宣布DeepSeek-R1模型登陸NVIDIANIM。同日，亞馬遜和微軟也接入了DeepSeek-R1模型。英偉達稱，DeepSeek-R1是最先進的大語言模型。

2月份，國內幾大云平臺也宣布上線DeepSeek系列模型。

2月1日，華為云在官微宣布，與硅基流動聯(lián)合首發(fā)并上線基于昇騰云服務的DeepSeek R1/V3推理服務，其性能可與全球高端GPU部署模型相媲美。

2月2日，騰訊云稱，將DeepSeek-R1大模型一鍵部署至其“HAI”平臺，開發(fā)者僅需3分鐘即可接入調用。

2月3日，百度智能云也宣布，其千帆平臺正式上架DeepSeek-R1和DeepSeek-V3模型。阿里云也稱，其PAI Model Gallery支持云上一鍵部署DeepSeek-V3和DeepSeek-R1模型，

2月4日，字節(jié)跳動旗下火山引擎也宣布，全面支持DeepSeek系列大模型，包括V3和R1等不同尺寸的模型，企業(yè)用戶可在火山引擎機器學習平臺veMLP中部署或通過火山方舟平臺直接調用。此外，聯(lián)通云、天翼云等平臺也宣布接入DeepSeek模型。

.......

芯片廠商加速對接完成適配

在芯片領域，國內幾大GPU廠商加速跟DeepSeek模型的對接，完成適配，提供算力支持。

2月5日，華為官方表示，DeepSeek系列新模型正式上線昇騰社區(qū)；Gitee AI同日表示，DeepSeek-V3滿血版在國產沐曦GPU首發(fā)體驗上線。

中科曙光國家先進計算產業(yè)創(chuàng)新中心有限公司發(fā)文宣布，海光信息技術團隊已完成DeepSeek V3和R1模型與海光DCU的適配并上線；

摩爾線程也宣布，已實現(xiàn)對DeepSeek蒸餾模型推理服務的部署，并即將開放自主設計的夸娥（KUAE）GPU智算集群，支持DeepSeek V3、R1模型及新一代蒸餾模型的分布式部署。天數(shù)智芯也稱，聯(lián)合Gitee AI正式上線DeepSeek R1模型服務。

據(jù)不完全統(tǒng)計，截至2月7日，已有17家國產芯片企業(yè)相繼宣布適配或上架DeepSeek模型服務，分別為華為昇騰、沐曦、天數(shù)智芯、摩爾線程、海光信息、壁仞科技、太初元碁、云天勵飛、燧原科技、昆侖芯、靈汐科技、鯤云科技、希姆計算、算能、清微智能、芯動力、龍芯中科等。

有機構認為，DeepSeek通過模型層面創(chuàng)新，在芯片受限與低算力投入的背景下，達到全球頂尖閉源模型的性能水平，屬于生態(tài)級突破，有望帶動國內AI全產業(yè)快速發(fā)展，同時其開源與低成本特性也有望賦能AI應用廠商，加速推動端側AI落地。

附：DeepSeek時間線梳理

注：文章綜合相關報道，僅供學習和交流之用，不構成任何建議，不代表本號立場，圖片來源網絡，版權歸原作者所有，如有任何問題，敬請聯(lián)系我們，謝謝。

一文看懂DeepSeek如何火爆全球？

相關推薦

一文看懂DeepSeek如何火爆全球？

相關推薦

一文看懂DeepSeek如何火爆全球？