以DeepSeek-R1和V3為代表的開(kāi)源模型系列在多語(yǔ)言理解和復(fù)雜推理任務(wù)中表現(xiàn)出色,極大優(yōu)化了算力成本,并進(jìn)一步改變了訓(xùn)練和部署的算法結(jié)構(gòu),這一技術(shù)創(chuàng)新將快速提升對(duì)于推理算力的需求,從而加速推動(dòng)AI應(yīng)用場(chǎng)景的落地。作為國(guó)產(chǎn)算力領(lǐng)軍企業(yè),燧原科技完成了對(duì)DeepSeek全量模型的高效適配,包括DeepSeek-R1/V3 671B原生模型、DeepSeek-R1-Distill-Qwen-1.5B/7B/14B/32B、DeepSeek R1-Distill-Llama-8B/70B等蒸餾模型。整個(gè)適配進(jìn)程中,燧原AI加速卡的計(jì)算能力得到充分利用,能夠快速處理海量數(shù)據(jù),同時(shí)其穩(wěn)定性為模型的持續(xù)優(yōu)化和大規(guī)模部署提供了堅(jiān)實(shí)的基礎(chǔ)。
目前,DeepSeek的全量模型已在慶陽(yáng)、無(wú)錫、成都等智算中心完成了數(shù)萬(wàn)卡的快速部署,將為客戶(hù)及合作伙伴提供高性能計(jì)算資源,提升模型推理效率,同時(shí)降低使用門(mén)檻,大幅節(jié)省硬件成本。這一成果標(biāo)志著燧原科技在國(guó)內(nèi)率先實(shí)現(xiàn)了DeepSeek全量模型的部署和落地,也充分展示了燧原科技超大規(guī)模集群的部署能力和日趨成熟的軟件生態(tài),為2025年更大規(guī)模國(guó)產(chǎn)算力的建設(shè)應(yīng)用提供了樣板。
此外,燧原科技與并濟(jì)科技、并行科技、東華軟件、道客網(wǎng)絡(luò)、光環(huán)云、邁富時(shí)、清程極智、燧弘華創(chuàng)、未來(lái)速度、無(wú)問(wèn)芯穹、向量棧、億算智能、中科加禾等合作伙伴緊密合作,積極推進(jìn)DeepSeek全量模型的更多系統(tǒng)級(jí)優(yōu)化,進(jìn)一步提升模型在推理系統(tǒng)的性?xún)r(jià)比,從而為客戶(hù)帶來(lái)更優(yōu)的商業(yè)價(jià)值。
與此同時(shí),燧原科技還與萬(wàn)物安全、飛渡科技、萬(wàn)物之宜等深度合作,即將推出面向“智慧城市、智慧園區(qū)、智慧交通”等AIoT場(chǎng)景的國(guó)內(nèi)首個(gè)DeepSeek智算訓(xùn)推一體機(jī),幫助用戶(hù)解決國(guó)產(chǎn)化私有算力、超清數(shù)字孿生及物聯(lián)網(wǎng)安全等問(wèn)題。
燧原科技正在推動(dòng)“國(guó)產(chǎn)推理算力系統(tǒng)+國(guó)產(chǎn)大模型+國(guó)產(chǎn)應(yīng)用+國(guó)產(chǎn)智算中心” 全方位生態(tài)的普及和泛化,以慶陽(yáng)的推理萬(wàn)卡集群為起點(diǎn),用“算力普惠”的理念推動(dòng)更大規(guī)模的國(guó)產(chǎn)算力部署,為國(guó)產(chǎn)應(yīng)用賦能,為中國(guó)人工智能產(chǎn)業(yè)的發(fā)展提供了新的路徑。