• 正文
    • 破算力困局:國產(chǎn)AI生態(tài)的生死突圍
    • 為什么是唯一一家?
    • “通用人工智能是一場需要聚精會神的長跑”
  • 相關(guān)推薦
申請入駐 產(chǎn)業(yè)圖譜

DeepSeek無問西東!先行者早已趟平全國產(chǎn)之路

02/07 12:10
931
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點(diǎn)資訊討論

夢晨 白交 發(fā)自 凹非寺,量子位 | 公眾號 QbitAI

DeepSeek太過火爆,整個國產(chǎn)AI產(chǎn)業(yè)都調(diào)動起來了!

春節(jié)沒過完,就已迅速適配多個國產(chǎn)芯片,并在各大云平臺上線,好生熱鬧~

這一系列動向主要聚焦于以下三個方面:

平臺層:華為云、阿里云、騰訊云等云廠商先后接入DeepSeek相關(guān)大模型服務(wù),價格不變甚至有的更便宜、性能與官方相當(dāng),直接零門檻部署API開發(fā)各種應(yīng)用。

算力層:一些國產(chǎn)算力玩家,像昇騰、壁仞等,他們聯(lián)合生態(tài)玩家完成了與模型的適配,也紛紛上線了DeepSeek R1模型服務(wù)。

應(yīng)用層AI應(yīng)用廠商、手機(jī)助手也在接入和部署國產(chǎn)模型。像我們更日常的手機(jī)端,華為小藝助手已接入DeepSeek,只需升級至原生鴻蒙系統(tǒng)就可以體驗。

實(shí)際上,國產(chǎn)大模型和國產(chǎn)芯片算力的生態(tài)適配,已經(jīng)有了成功實(shí)踐。

破算力困局:國產(chǎn)AI生態(tài)的生死突圍

為什么DeepSeek的走紅,能夠讓國內(nèi)AI產(chǎn)業(yè)如此迅速地行動起來?僅僅只是因為模型本身的技術(shù)優(yōu)勢嗎?

答案并非如此。

還有一個關(guān)鍵因素,是應(yīng)對國際算力供應(yīng)鏈的不確定性,面對來自國際的壓力,實(shí)現(xiàn)大模型自主可控愈發(fā)緊迫起來。

算力是大模型的基礎(chǔ),可以按照應(yīng)用場景分為:訓(xùn)練算力、推理算力和應(yīng)用算力。

訓(xùn)練算力是指用于訓(xùn)練機(jī)器學(xué)習(xí)模型的計算資源,過程中涉及大量的數(shù)據(jù)輸入、復(fù)雜的數(shù)學(xué)運(yùn)算以及反復(fù)的迭代優(yōu)化,計算密集、時間長、硬件需求高、數(shù)據(jù)量也很大。

推理算力是將訓(xùn)練好的模型應(yīng)用于實(shí)際數(shù)據(jù)以生成預(yù)測或結(jié)果的計算資源,過程比訓(xùn)練簡單,但需求高效且低延遲。

應(yīng)用算力是指支持整個AI應(yīng)用系統(tǒng)運(yùn)行的計算資源,包括數(shù)據(jù)處理、模型推理、用戶交互、存儲和網(wǎng)絡(luò)通信等。

目前,在整個中國的大模型產(chǎn)業(yè)中,大模型算力還是主要依靠海外算力,尤其是在訓(xùn)練環(huán)節(jié)。

那么為什么要特別強(qiáng)調(diào)訓(xùn)練環(huán)節(jié)呢?因為訓(xùn)練算力是人工智能模型從無到有的關(guān)鍵,大模型的進(jìn)步依賴于不斷優(yōu)化和迭代模型,而這需要持續(xù)投入。

在訓(xùn)練階段,強(qiáng)大的算力是優(yōu)化模型參數(shù)、提升模型性能的關(guān)鍵。當(dāng)前主流的大模型動輒擁有數(shù)百億、上千億個參數(shù),如此巨量的參數(shù)空間意味著海量的計算工作量。

只有擁有超大規(guī)模的算力集群,才能支撐起如此復(fù)雜的訓(xùn)練任務(wù)。而訓(xùn)練算法的創(chuàng)新,如更高效的并行化策略、更智能的參數(shù)搜索方法等,都對算力水平提出了更高要求。

訓(xùn)練算力作為AI技術(shù)創(chuàng)新的戰(zhàn)略制高點(diǎn),其自主可控程度直接決定產(chǎn)業(yè)發(fā)展主動權(quán),掌控了大模型的訓(xùn)練過程,才算掌握了AI技術(shù)創(chuàng)新的核心。

在國產(chǎn)算力平臺尚處拓荒期時,多數(shù)企業(yè)因技術(shù)門檻高、投入風(fēng)險大而卻步,科大訊飛作為先行者選擇了一條“硬核突圍”之路:

科大訊飛聯(lián)合華為打造的萬卡國產(chǎn)算力平臺“飛星一號”,自2023年10月啟用以來,目前已長穩(wěn)運(yùn)行,全年平均使用率94%,能支撐萬億參數(shù)大模型訓(xùn)練。

2024年1月,“飛星一號”的首個成果訊飛星火V3.5是首個全國產(chǎn)算力訓(xùn)練的大模型。

一年過去了,訊飛星火仍然是唯一的一家全國產(chǎn)算力大模型。

為什么是唯一一家?

這既是由于全棧自研的技術(shù)處于深水區(qū),從芯片指令集優(yōu)化,到超大規(guī)模集群穩(wěn)定性保障,技術(shù)復(fù)雜度呈指數(shù)級攀升。

也是對長期投入的戰(zhàn)略定力的考驗,全算力國產(chǎn)化需要持續(xù)多年的高強(qiáng)度投入,多數(shù)企業(yè)難免更傾向于選用現(xiàn)成方案,這種路徑依賴導(dǎo)致其訓(xùn)練算力環(huán)節(jié)始終受制于人。

值得一提的是,今年1月15日,科大訊飛發(fā)布了我國首個基于全國產(chǎn)算力訓(xùn)練的具備深度思考和推理能力的大模型訊飛星火X1,和DeepSeek可以說是異曲同工。

僅用1萬張910B國產(chǎn)算力卡,科大訊飛不僅取得了大模型研發(fā)上的一系列成果,而且做了大量國產(chǎn)算力平臺上的無人區(qū)的適配和效率優(yōu)化,用更少的算力、更小的模型尺寸,在國產(chǎn)算力平臺上實(shí)現(xiàn)了業(yè)界一流的深度思考和長文本推理效果。

可以說是真正把國產(chǎn)算力做到了極致效率,這更需要技術(shù)實(shí)力和戰(zhàn)略勇氣,也標(biāo)志著國產(chǎn)AI技術(shù)在應(yīng)對復(fù)雜認(rèn)知任務(wù)上取得了重要突破。

科大訊飛董事長劉慶峰透露,訊飛團(tuán)隊正在加緊迭代,有望在未來一個月內(nèi)推出性能更上一層樓的升級版訊飛星火X1,確保在數(shù)學(xué)、教育、醫(yī)療一科研等關(guān)鍵領(lǐng)域始終處于業(yè)界領(lǐng)先水平。

與此同時,“飛星二號”——科大訊飛、華為、合肥市大數(shù)據(jù)資產(chǎn)運(yùn)營有限公司三方聯(lián)合打造的中國國產(chǎn)超大規(guī)模智算平臺,首批算力也將在2025年交付試用。

這種國產(chǎn)AI生態(tài)協(xié)同產(chǎn)生了遠(yuǎn)超預(yù)期的“化學(xué)反應(yīng)”:華為昇騰系列芯片在真實(shí)場景中得到千錘百煉,不斷打磨、迭代出更適配AI應(yīng)用的特性;訊飛模型通過與硬件深度適配,擺脫了算力瓶頸的桎梏,探索出的創(chuàng)新訓(xùn)練范式。

當(dāng)下愈來愈多的企業(yè)加入戰(zhàn)場,國產(chǎn)AI技術(shù)體系的獨(dú)特性開始顯現(xiàn)——它既非對國際技術(shù)的簡單模仿,也非閉門造車的另起爐灶,而是在生態(tài)協(xié)同中進(jìn)化演繹的全新物種。

科大訊飛董事長劉慶峰說:“都說前人栽樹,后人乘涼。在全國產(chǎn)化大模型的路上,總得有人做那個栽樹人?!笔袌隹駳g背后,先行者的遠(yuǎn)見與定力,正在這場AI競賽中顯現(xiàn)出跨越周期的戰(zhàn)略意義。

科大訊飛已經(jīng)完成了訓(xùn)練算力、推理算力和應(yīng)用算力的全部國產(chǎn)化。

從2024年1月至今,訊飛星火大模型已經(jīng)實(shí)現(xiàn)了5次升級,持續(xù)對標(biāo)GPT-4 Turbo和GPT-4o,還首發(fā)星火多語言大模型,給了世界第二選擇。

在產(chǎn)業(yè)應(yīng)用上,科大訊飛是少有的GBC三方向都覆蓋的市場參與者,以“GBC聯(lián)動”的方式,推動大模型應(yīng)用落地。

GBC聯(lián)動,不僅是三大業(yè)務(wù)方向都要布局,更是利用好其中的資源共享與協(xié)同效應(yīng)。

G端建立示范效應(yīng),為B端和C端市場的拓展奠定基礎(chǔ);在B端通過與行業(yè)龍頭企業(yè)的合作,擴(kuò)大市場影響力,增強(qiáng)C端產(chǎn)品的市場認(rèn)知度和信任度;同時C端的反饋和市場需求為G端和B端的產(chǎn)品優(yōu)化提供了數(shù)據(jù)支持。

在這種策略下,具體取得哪些成果呢?

模型迭代層面,2024年的訊飛星火GB端共性能力相對提升25%,長文本效果相對提升50%,行業(yè)圖文效果相對提升60%。

業(yè)務(wù)落地層面,截至去年底,科大訊飛已經(jīng)與中國石油、中國移動、中國海油等央國企及20多個行業(yè)的頭部企業(yè)一起發(fā)布行業(yè)大模型,覆蓋300多個應(yīng)用場景。

此外值得一提的是,科大訊飛在2024年還奪得“央國企大模型第一”的好成績,中標(biāo)金額超第2-6名之和,在中標(biāo)項目數(shù)量和金額上都實(shí)現(xiàn)斷層領(lǐng)先。

像這樣以模型和算力為底座,以行業(yè)數(shù)據(jù)為積累,以應(yīng)用和服務(wù)為落腳點(diǎn),最終建立起”技術(shù)優(yōu)勢-商業(yè)回報-數(shù)據(jù)反哺”的正向循環(huán),才能不斷加深自己的”護(hù)城河”,在錯綜復(fù)雜的競爭中找到立足點(diǎn)。

這場始于算力突圍的技術(shù)革命,終將演變?yōu)樯鷳B(tài)價值的全面釋放——這或許是中國AI給世界的最好答案。

“通用人工智能是一場需要聚精會神的長跑”

而如果將時間繼續(xù)往前推進(jìn),能夠看到當(dāng)前國內(nèi)大模型發(fā)展,其實(shí)來到了重要節(jié)點(diǎn)。

一邊大模型朝著更高智能水平方向演進(jìn),另一邊關(guān)于AI產(chǎn)業(yè)生態(tài)也進(jìn)一步深入和夯實(shí),不管是從底座、到模型再到應(yīng)用,都在向通用人工智能這一最終目標(biāo)加速行進(jìn)。

這在各海內(nèi)外專家的看法中,也進(jìn)一步得到了印證:雖然AGI實(shí)現(xiàn)時間表眾說紛紜,但也的確迎來了關(guān)鍵時刻。

奧特曼認(rèn)為在現(xiàn)有GPU硬件上可以實(shí)現(xiàn)通用人工智能。在他的年終總結(jié)中能夠看到,OpenAI已經(jīng)明確AGI如何實(shí)現(xiàn),并且將目標(biāo)轉(zhuǎn)向了更遠(yuǎn)的超級智能。

而李飛飛聚焦在空間智能的實(shí)現(xiàn)上,認(rèn)為作為AGI的關(guān)鍵一步,空間智能能讓AI學(xué)習(xí)、理解并行動。就在前段時間他們團(tuán)隊完成了AI模擬世界的雛形:AI可以僅憑一張圖,就能生成可交互的3D世界。

圖靈獎得主LeCun、Hinton則是關(guān)注在大模型能力過快迭代背后的安全隱憂之中,探討如何以人為本地發(fā)展人工智能。這本身也是AGI繞不開的問題。

在大家都在探討如何實(shí)現(xiàn)、還有多遠(yuǎn)的時候,科大訊飛董事長劉慶峰提出了一個獨(dú)特的觀點(diǎn):通用大模型的天花板仍然在被持續(xù)打開。但是,就算再怎么發(fā)展,根基也得在自己手里,自己的大樓決不能建在別人的院子里。

如今在風(fēng)起云涌的通用人工智能浪潮,劉慶峰認(rèn)為,有沒有自主可控的國產(chǎn)底座能力做支撐,這決定了我們在這條路上能走多遠(yuǎn),決定了在通用人工智能這一波浪潮中,我們能不能享受這波紅利,能不能成為美國之后全球智慧涌現(xiàn)的第二級。

基于這樣的邏輯,為什么做“飛星一號”?其實(shí)就能找到背后的原因。

訊飛不僅走得遠(yuǎn),還走得深。

科大訊飛在其創(chuàng)立第一天起,就一直堅持走國產(chǎn)化路線,立志“技術(shù)報國”,要讓“中文語音技術(shù)由中國人做到最好,中文語音產(chǎn)業(yè)掌握在中國人自己手中”。這是做中國技術(shù)的初心,現(xiàn)在看來,其影響無比深刻。

外在鑒于眾所周知的原因,科大訊飛成為最早被打壓、最早放棄幻想的那一波玩家之一,經(jīng)過一系列艱難攻關(guān),其核心技術(shù)研究和產(chǎn)品開發(fā)平臺逐步實(shí)現(xiàn)全面自主可控,才得以有今天生生不息的繁榮生態(tài)。

科大訊飛的選擇,其實(shí)不僅適用于科大訊飛,也不僅適用于大模型,也能給整個中國的人工智能產(chǎn)業(yè)帶來一定的啟示。

首先,底座大模型的創(chuàng)新是自主創(chuàng)新的核心驅(qū)動力。在當(dāng)前全球底座模型迭代放緩的趨勢下,以訊飛為代表的玩家還能持續(xù)更新大模型底座。

底座大模型的持續(xù)迭代與升級,不僅決定AI系統(tǒng)能力的上線,還能推動AI技術(shù)在各個領(lǐng)域的落地和創(chuàng)新。

隨著AI技術(shù)的不斷發(fā)展,產(chǎn)業(yè)分工逐漸優(yōu)化變得清晰,形成了“基礎(chǔ)層專注算力攻堅、應(yīng)用層聚焦場景創(chuàng)新”新格局。

基礎(chǔ)層的企業(yè)可以專注于提升算力和算法效率,而應(yīng)用層的企業(yè)則可以基于這些基礎(chǔ)技術(shù),開發(fā)出更多創(chuàng)新的應(yīng)用場景。

另外,還有更為關(guān)鍵的層面,安全邊際的提升是企業(yè)自主創(chuàng)新的重要保障。當(dāng)前市場環(huán)境波譎云詭,自主可控能為行業(yè)建立“技術(shù)冗余空間”,使得企業(yè)在面對外在環(huán)境波動時能夠更加從容應(yīng)對。

例如,芯片供應(yīng)緊張時候,擁有自主訓(xùn)練能力的企業(yè)可以通過優(yōu)化算法和模型,減少對硬件的依賴,從而保持業(yè)務(wù)的連續(xù)性。這種技術(shù)冗余不僅提升了企業(yè)的抗風(fēng)險能力,也為整個行業(yè)提供了更多的安全保障。

最后,國產(chǎn)算力平臺的崛起,其實(shí)也為更廣更大范圍的企業(yè)提供了便利。

企業(yè)無需重復(fù)造輪子,可以直接在國產(chǎn)平臺上進(jìn)行應(yīng)用開發(fā)。這不僅降低了技術(shù)門檻,還加速了AI技術(shù)的普及和應(yīng)用。

比如,為幫助各行各業(yè)更好地落地大模型,科大訊飛以“通專結(jié)合、端云聯(lián)動、軟硬一體”的方式助力更多企業(yè)完成數(shù)智化升級,構(gòu)建了從“建算力、理數(shù)據(jù)、訓(xùn)模型”,到“落場景、保安全、精運(yùn)營”的全套解決方案。目前,訊飛星火已成為央國企大模型的第一選擇。

展望未來,AGI的實(shí)現(xiàn)仍然充滿挑戰(zhàn),但也充滿了希望。

在這一過程中,自主創(chuàng)新將成為關(guān)鍵。中國企業(yè)必須堅持自主可控的技術(shù)路線,不斷提升自身的技術(shù)實(shí)力,才能在未來的競爭中占據(jù)有利位置。同時,產(chǎn)業(yè)分工更加明確,應(yīng)用場景也將更加豐富,企業(yè)能夠從容應(yīng)對外在各種不確定性。

隨著技術(shù)的不斷進(jìn)步,AGI不再遙不可及,而是我們共同努力的目標(biāo)。用科大訊飛董事長劉慶峰的話說,這會是一場需要聚精會神的長跑。

相關(guān)推薦