• 正文
  • 相關(guān)推薦
申請入駐 產(chǎn)業(yè)圖譜

PerfXCloud DeepSeek滿血專線,立即體驗!澎峰科技”十年磨一劍,今朝綻鋒芒“

02/10 16:12
2762
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點資訊討論

零門檻體驗DeepSeek-R1滿血版本,性能對標(biāo)OpenAI o1,即刻開啟一場震撼人心的AI探索之旅。

????體驗DeepSeek-R1滿血效果

如果您是開發(fā)者,將需要使用DeepSeek API。注冊成為PerfXCloud用戶,即贈送2千萬token!本服務(wù)獲得了中國曙光、超算互聯(lián)網(wǎng)、沐曦的大力支持和算力支撐。澎峰科技+海光DCU:自研推理框架全面支持DeepSeek系列模型

DeepSeek模型廣場

DeepSeek-R1滿血體驗???????????

DeepSeek-R1滿血版本和蒸餾版本的差異

滿血版是與DeepSeek官網(wǎng)性能一致的V3和R1的全量參數(shù)模型,一般需要多臺高性能GPU服務(wù)器并行才能流暢運行推理服務(wù),低配也要數(shù)百萬人民幣。而蒸餾版是利用DeepSeek-R1生成的數(shù)據(jù)對其他模型進行微調(diào),從而提升其模型性能,但效果差于滿血版。DeepSeek-R1滿血版本性能對標(biāo)OpenAI o1商業(yè)版本水平,但價格只是它的1/30。

舉例參數(shù)規(guī)模和模型大小:???????

  • DeepSeek-R1:參數(shù)為 671B,模型大小約 720G。
  • DeepSeek-R1-Distill-Qwen-7B:參數(shù)為 7B,模型大小約 15G。
  • DeepSeek-R1-Distill-Llama-8B:參數(shù)為 8B,模型大小約 16G。
  • DeepSeek-R1-Distill-Qwen-32B:參數(shù)為 32B,模型大小約 75G。

 

相關(guān)推薦