• 正文
  • 相關(guān)推薦
申請(qǐng)入駐 產(chǎn)業(yè)圖譜

AI Infra行業(yè)分享會(huì):與澎峰科技一起開(kāi)啟算力時(shí)代

03/18 11:44 來(lái)源:唯快資本
872
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點(diǎn)資訊討論

本次活動(dòng)于2025年3月15日舉辦,采用線上+線下的方式,研討主題為:AI Infra賽道。本次分享會(huì)得到了來(lái)自于深合投資、毅嶺資本、碧鴻投資等機(jī)構(gòu)的廣大投資人的熱情參與和探討。后續(xù)我們將持續(xù)進(jìn)行其他主題的行業(yè)分享會(huì),如有意愿參與分享的企業(yè)和嘉賓,可聯(lián)系我們報(bào)名參與。

分享企業(yè)簡(jiǎn)介——澎峰科技

澎峰科技是一家以“軟件定義算力”為核心的AI基礎(chǔ)設(shè)施領(lǐng)軍企業(yè),核心團(tuán)隊(duì)源自中科院,匯聚了高性能計(jì)算與人工智能領(lǐng)域的頂尖專家。公司致力于通過(guò)自主研發(fā)的國(guó)際領(lǐng)先算力基礎(chǔ)軟件棧,為算力芯片企業(yè)提供加速計(jì)算解決方案,通過(guò)軟件優(yōu)化釋放硬件潛能,構(gòu)建從芯片適配到行業(yè)落地的AI全棧能力。作為國(guó)產(chǎn)算力生態(tài)的關(guān)鍵參與者,公司已攜手海光、華為、中科院等10+芯片企業(yè)及20+智算中心,推動(dòng)國(guó)產(chǎn)AI基礎(chǔ)設(shè)施的規(guī)?;瘧?yīng)用,加速智能時(shí)代的全面到來(lái)。

—核心產(chǎn)品—

PerfMPL高性能計(jì)算庫(kù):以O(shè)penBLAS為基礎(chǔ),覆蓋FFT、SPARSE、DNN等計(jì)算場(chǎng)景,顯著提升芯片計(jì)算性能,適配國(guó)產(chǎn)異構(gòu)算力硬件(如華為昇騰、寒武紀(jì)、燧原等)。PerfXAPI異構(gòu)計(jì)算平臺(tái):提供統(tǒng)一API接口,支持跨架構(gòu)硬件(CPU/GPU/NPU)的快速開(kāi)發(fā)與部署,內(nèi)置集成開(kāi)發(fā)環(huán)境,簡(jiǎn)化復(fù)雜工作負(fù)載管理。PerfXCloud大模型服務(wù)平臺(tái):向下兼容主流國(guó)產(chǎn)算力與AI框架,向上提供模型推理、微調(diào)、插件生態(tài)等全流程服務(wù),已集成80+大模型,助力企業(yè)及開(kāi)發(fā)者高效開(kāi)發(fā)AI應(yīng)用。

01分享會(huì)內(nèi)容概要

AI Infra賽道是生成式人工智能領(lǐng)域的重要組成部分,涵蓋了從算力芯片的研發(fā)到算力運(yùn)營(yíng)的全過(guò)程。隨著深度學(xué)習(xí)模型的不斷發(fā)展,尤其是像DeepSeek這樣的模型的出現(xiàn),AI基礎(chǔ)設(shè)施的需求和應(yīng)用正在經(jīng)歷巨大的變革。

AI Infra的定義

  • 算力芯片:包括GPU、FPGA、ASIC等芯片的研發(fā)和生產(chǎn),這些芯片為AI模型提供強(qiáng)大的計(jì)算能力。
  • 算力運(yùn)營(yíng):涉及算力中心的建設(shè)和運(yùn)營(yíng),確保算力資源的高效分配和使用。
  • 軟硬件協(xié)同:AI模型的訓(xùn)練和推理不僅依賴于硬件,還需要高效的軟件優(yōu)化,如模型壓縮、分布式計(jì)算等技術(shù)。

產(chǎn)業(yè)鏈

  • 上游芯片制造國(guó)產(chǎn)芯片企業(yè)(如華為、寒武紀(jì)等)正在崛起,但在技術(shù)上仍與國(guó)際領(lǐng)先企業(yè)(如英偉達(dá))存在差距。
  • 中游算力中心:國(guó)內(nèi)大量建設(shè)算力中心,但存在算力利用率低、適配性差等問(wèn)題。
  • 下游應(yīng)用需求:AI應(yīng)用(如大模型、智能助手等)的爆發(fā)式增長(zhǎng),推動(dòng)了對(duì)算力的巨大需求。

現(xiàn)狀與未來(lái)

  • 單純的算力規(guī)模并不能滿足需求,關(guān)鍵在于如何提高算力效率,即“有效算力”的重要性日益顯現(xiàn)。算力中心建設(shè)與實(shí)際應(yīng)用需求之間存在脫節(jié),導(dǎo)致部分算力資源閑置。一方面我們可以看到應(yīng)用場(chǎng)景的多樣化,AI應(yīng)用正在滲透到內(nèi)容生成、數(shù)據(jù)分析、智能助手等多個(gè)領(lǐng)域。另一方面我們也可以注意到許多企業(yè)和組織都在構(gòu)建自己的AI生態(tài),通過(guò)技術(shù)優(yōu)化和資源整合,提升算力資源的利用效率。
  • 展望未來(lái), AI Infra的發(fā)展需要芯片、算法、算力中心等多環(huán)節(jié)技術(shù)的深度融合,構(gòu)建高效、安全、可持續(xù)的AI基礎(chǔ)設(shè)施,是未來(lái)AI技術(shù)發(fā)展的關(guān)鍵??傊?,AI Infra賽道正處于快速發(fā)展和變革之中,技術(shù)、產(chǎn)業(yè)鏈和安全將是未來(lái)發(fā)展的核心要素。

02研討會(huì)問(wèn)題精選

問(wèn):國(guó)內(nèi)目前的這些AI Infra企業(yè),如果從長(zhǎng)遠(yuǎn)的商業(yè)化來(lái)看,未來(lái)的發(fā)展路徑會(huì)是什么樣呢?以及你為什么認(rèn)為這樣發(fā)展?

答:我認(rèn)為可以用“向左走、向右走”來(lái)總結(jié)。

  • 向左走:將軟件算法能力轉(zhuǎn)化為硬件化、IP化、工具化,服務(wù)于國(guó)產(chǎn)芯片公司(如華為昇騰、寒武紀(jì)等)。例如,通過(guò)優(yōu)化模型適配國(guó)產(chǎn)硬件,推動(dòng)軟硬協(xié)同創(chuàng)新。
  • 向右走:直接面向市場(chǎng)提供AI服務(wù),包括綁定國(guó)產(chǎn)芯片銷售算力、開(kāi)發(fā)API接口服務(wù)客戶,或?yàn)槠髽I(yè)提供定制化算力解決方案。例如,無(wú)問(wèn)芯穹通過(guò)私有化部署AI工具鏈降低企業(yè)推理成本。

問(wèn):為何企業(yè)需要在這兩個(gè)方向中選擇?

答:我認(rèn)為核心原因是AI產(chǎn)業(yè)鏈的“斷層”現(xiàn)狀:

  • 上游芯片與下游應(yīng)用脫節(jié):國(guó)產(chǎn)芯片(如海光、昆侖芯)的性能尚未完全匹配大模型需求,導(dǎo)致應(yīng)用層企業(yè)需適配不同硬件架構(gòu)。
  • 算力效率瓶頸:?jiǎn)渭兌哑鏊懔σ?guī)模無(wú)法解決實(shí)際問(wèn)題,需通過(guò)算法優(yōu)化提升“有效算力”。
  • 商業(yè)模式分化:企業(yè)需在技術(shù)自研(向左)與商業(yè)化落地(向右)之間平衡投入與收益。

向左走適合適合具備算法積累的企業(yè),通過(guò)技術(shù)復(fù)用降低硬件適配成本,或者叫技術(shù)導(dǎo)向型的企業(yè)。風(fēng)險(xiǎn)在于需長(zhǎng)期投入研發(fā),短期商業(yè)化效果有限。向右走適合已有客戶資源的企業(yè),通過(guò)快速迭代服務(wù)搶占市場(chǎng)份額,或者叫市場(chǎng)導(dǎo)向型企業(yè)。風(fēng)險(xiǎn)在于依賴外部算力供應(yīng)商,議價(jià)能力較弱。

從市場(chǎng)來(lái)看,向右走(商業(yè)化落地)更受資本青睞,例如提供MASS API服務(wù)的初創(chuàng)企業(yè)融資活躍。但我認(rèn)為長(zhǎng)遠(yuǎn)來(lái)看,向左走(軟硬協(xié)同)將成為核心競(jìng)爭(zhēng)力,尤其在國(guó)產(chǎn)替代背景下,算法與芯片的深度綁定是突破“卡脖子”問(wèn)題的關(guān)鍵。

問(wèn):國(guó)產(chǎn)AI Infra在生態(tài)與能效上面臨哪些挑戰(zhàn)?

答:生態(tài)碎片化:國(guó)產(chǎn)芯片廠商(如華為、寒武紀(jì))的軟件棧與CUDA生態(tài)不兼容,開(kāi)發(fā)成本高。能效比低:智算中心處理1G數(shù)據(jù)耗電13kW·h,需通過(guò)液冷技術(shù)、異構(gòu)計(jì)算架構(gòu)(如16卡GPU集群)提升能效。未來(lái)AI生態(tài)的構(gòu)建需兩者結(jié)合,回到前一個(gè)問(wèn)題中,我認(rèn)為通過(guò)左側(cè)的技術(shù)創(chuàng)新支撐右側(cè)的商業(yè)落地,最終形成“算法-芯片-應(yīng)用”的閉環(huán)。

問(wèn):開(kāi)源生態(tài)對(duì)AI Infra發(fā)展有何影響?

答:開(kāi)源生態(tài)會(huì)推動(dòng)技術(shù)普惠,DeepSeek開(kāi)源的FlashMLA、DeepGEMM等工具鏈,推動(dòng)大模型訓(xùn)練效率提升至硬件極限。也可以加強(qiáng)生態(tài)整合,開(kāi)源社區(qū)加速國(guó)產(chǎn)芯片適配,例如驛基于3FS系統(tǒng)構(gòu)建低成本存儲(chǔ)方案,兼容主流框架。開(kāi)源可能導(dǎo)致技術(shù)同質(zhì)化,風(fēng)險(xiǎn)與機(jī)遇并存,同時(shí)也為初創(chuàng)企業(yè)提供硬件創(chuàng)新機(jī)會(huì)(如LPU推理芯片)。

問(wèn):AI Infra市場(chǎng)的未來(lái)格局會(huì)是怎樣的?

答:市場(chǎng)可能呈現(xiàn)“公有主導(dǎo)、私有補(bǔ)充”態(tài)勢(shì),但存在兩大變數(shù):硬件不確定性:國(guó)產(chǎn)芯片(如寒武紀(jì))與進(jìn)口芯片(如英偉達(dá)H100)的適配效率影響市場(chǎng)格局,異構(gòu)計(jì)算架構(gòu)或成主流。應(yīng)用驅(qū)動(dòng):若AI應(yīng)用(如Agent)爆發(fā),可能由應(yīng)用廠商主導(dǎo)AI Infra需求,倒逼基礎(chǔ)設(shè)施升級(jí)。

問(wèn):創(chuàng)業(yè)公司在AI Infra賽道中如何與大廠競(jìng)爭(zhēng)?

答:創(chuàng)業(yè)公司需聚焦細(xì)分場(chǎng)景與大廠形成差異化競(jìng)爭(zhēng)。例如,選擇企業(yè)私有化部署場(chǎng)景,通過(guò)優(yōu)化模型推理成本(如DeepSeek的千億模型部署方案)切入市場(chǎng)。具體策略我認(rèn)為可總結(jié)為3點(diǎn)。第一,技術(shù)專精:即針對(duì)特定硬件(如國(guó)產(chǎn)芯片)或場(chǎng)景(如端側(cè)推理)開(kāi)發(fā)適配工具鏈,減少算力閑置并提升效率。第二,成本控制:通過(guò)模型壓縮、FP8精度計(jì)算等技術(shù)降低推理成本,例如DeepSeek將千億模型推理成本壓縮至可商用范圍。第三,生態(tài)合作:與芯片廠商(如華為昇騰)或云服務(wù)商聯(lián)合開(kāi)發(fā)訓(xùn)推一體機(jī),彌補(bǔ)自身硬件短板。

相關(guān)推薦