大模型的能力邊界在不斷拓寬,主流云端大模型普遍具備了多模態(tài)推理能力。技術(shù)路線上,也不再局限于算力堆疊,而是探索強(qiáng)化學(xué)習(xí)、符號(hào)推理、類(lèi)腦計(jì)算等新路徑。并且,投入更小、更垂直的小模型涌現(xiàn),為特定領(lǐng)域的應(yīng)用提供了更高效的解決方案。
與此同時(shí),我國(guó)大模型領(lǐng)域仍然存在多方面痛點(diǎn),例如:云端訓(xùn)練成本高、高端算力存在“卡脖子”風(fēng)險(xiǎn)、優(yōu)質(zhì)數(shù)據(jù)匱乏、人才缺口、AI算法開(kāi)源生態(tài)仍需強(qiáng)化、數(shù)據(jù)安全和隱私問(wèn)題等等,仍是市場(chǎng)進(jìn)一步發(fā)展和應(yīng)用落地的不確定因素。
芯片側(cè)也掀起范式之爭(zhēng)。盡管GPU仍是基于Transformer框架及多種AI工作負(fù)載的不二之選,不過(guò),近來(lái)先有博通AI芯片收入飆升220%、市值首破萬(wàn)億美元大關(guān),接著寒武紀(jì)市值一度突破3000億、問(wèn)鼎“AI股王”,業(yè)界關(guān)于“GPU到ASIC范式大轉(zhuǎn)變”的聲音開(kāi)始不絕于耳。
種種跡象顯示,2025年的AI應(yīng)用市場(chǎng)正處在關(guān)鍵轉(zhuǎn)折點(diǎn)上,商業(yè)變現(xiàn)的可能性與不確定性并存。
AI變現(xiàn),哪些背景和預(yù)期?
Arm中國(guó)區(qū)業(yè)務(wù)全球副總裁鄒挺認(rèn)為,AI工作負(fù)載大幅增加,對(duì)計(jì)算資源的需求同步激增。同時(shí),AI模型的復(fù)雜性和應(yīng)用場(chǎng)景的多樣化導(dǎo)致了能源消耗的增加,特別是AI訓(xùn)練和推理中,需要使用大量能源和電力。因此,整個(gè)產(chǎn)業(yè)對(duì)能效問(wèn)題表現(xiàn)出了前所未有的關(guān)注,行業(yè)正在尋求更高性能、更低功耗的解決方案,以應(yīng)對(duì)這些挑戰(zhàn)。
Imagination公司產(chǎn)品管理副總裁Dennis Laudick表示,2024 年是邊緣AI成為主流的一年。在過(guò)去的 18 個(gè)月里,圍繞基于Transformer框架的模型數(shù)量激增,徹底改變了自然語(yǔ)言處理等AI應(yīng)用的能力。正因如此,使得實(shí)時(shí)翻譯和對(duì)話式個(gè)人助手等應(yīng)用能夠在消費(fèi)類(lèi)設(shè)備上運(yùn)行,而非依靠云端。
中存算董事長(zhǎng)陳巍比較關(guān)注視頻大模型應(yīng)用的崛起和下沉。在他看來(lái),視頻是人類(lèi)自然交互的主流模式,視頻大模型也是通向未來(lái)世界模型的必經(jīng)之路。相對(duì)傳統(tǒng)的文本類(lèi)大模型和Chatbot,視頻大模型對(duì)計(jì)算芯片有更高的要求,對(duì)傳統(tǒng)的GPGPU架構(gòu)提出了新的巨大挑戰(zhàn)。他認(rèn)為,視頻大模型的需求爆發(fā)很可能會(huì)重構(gòu)算力芯片產(chǎn)業(yè)的格局,博通DSA(ASIC)芯片的需求上漲可能只是前奏。
安謀科技產(chǎn)品總監(jiān)鮑敏祺則談到,2024年可以被視作端側(cè)AI元年,目前這一趨勢(shì)已成為行業(yè)普遍共識(shí),并逐步成為芯片、終端制造、操作系統(tǒng)、大模型、AI應(yīng)用等各大廠商爭(zhēng)相投入的重點(diǎn)領(lǐng)域。同時(shí),全球科技巨頭也紛紛在AI手機(jī)、AIPC、智駕智艙等新興應(yīng)用場(chǎng)景進(jìn)行“重兵部署”,極大地帶動(dòng)了端側(cè)AI創(chuàng)新浪潮的高速演進(jìn)。
2025年,AI應(yīng)用變現(xiàn)的關(guān)鍵轉(zhuǎn)折?
隨著多模態(tài)AI、推理AI等發(fā)展,以及大模型能力的普及,2025年會(huì)是AI應(yīng)用變現(xiàn)的關(guān)鍵轉(zhuǎn)折點(diǎn)嗎?
陳巍認(rèn)為,2025年會(huì)出現(xiàn)明顯的剪刀差。一方面是AI應(yīng)用大規(guī)模滲透到編程、政企辦公、教育、工業(yè)場(chǎng)景帶來(lái)的增量,另一方面是全球的需求變緩和區(qū)域沖突帶來(lái)的緊縮,這也就意味著機(jī)遇和風(fēng)險(xiǎn)并存,對(duì)企業(yè)決策層的市場(chǎng)感知能力和趨勢(shì)預(yù)見(jiàn)能力提出很高的要求。
不過(guò),樂(lè)觀的方面在于,中國(guó)大陸依然具備全世界最完備的產(chǎn)業(yè)鏈,相對(duì)全球可以具備更好的成本優(yōu)勢(shì)。挑戰(zhàn)在于,中國(guó)產(chǎn)業(yè)界需要進(jìn)一步提升在AI生態(tài)的話語(yǔ)權(quán)。
Dennis Laudick談到了AI商業(yè)化變現(xiàn)途徑的多元化,他認(rèn)為會(huì)因行業(yè)而異,比如在移動(dòng)領(lǐng)域,AI正被用作提升設(shè)備銷(xiāo)量的品牌差異化策略,以推動(dòng)銷(xiāo)量增長(zhǎng)并增強(qiáng)用戶忠誠(chéng)度。在汽車(chē)等其他市場(chǎng),軟件定義汽車(chē)使得汽車(chē)制造商(OEM)能夠根據(jù)消費(fèi)者偏好的價(jià)格點(diǎn)來(lái)提供不同級(jí)別的新功能,例如自動(dòng)駕駛功能,并且能夠通過(guò)OTA更新,升級(jí)AI功能來(lái)拓展商業(yè)化路徑。
鮑敏祺認(rèn)為,2025年有望成為端側(cè)AI商業(yè)化落地的關(guān)鍵節(jié)點(diǎn),更多端側(cè)AI芯片解決方案將陸續(xù)面世,支撐端側(cè)AI應(yīng)用的快速演化與落地,期待涌現(xiàn)更多成熟、商業(yè)化路徑清晰的AI解決方案。但挑戰(zhàn)依然嚴(yán)峻,主要問(wèn)題在于不同技術(shù)架構(gòu)下AI算法開(kāi)發(fā)的理念存在差異,傳統(tǒng)CNN模式下的能效比思維慣性已難以適用于當(dāng)前快速迭代、部署的新要求,進(jìn)而影響算法使用者能否快速將算法部署到端側(cè)。因此,聚焦前沿AI算法演進(jìn)趨勢(shì),并實(shí)現(xiàn)快速響應(yīng),將成為端側(cè)AI研發(fā)工作的關(guān)鍵。
后摩智能聯(lián)合創(chuàng)始人、產(chǎn)品副總裁信曉旭對(duì)2025年AI應(yīng)用變現(xiàn)持相對(duì)樂(lè)觀態(tài)度,認(rèn)為AI技術(shù)進(jìn)步、市場(chǎng)需求增長(zhǎng),提供了商業(yè)化的基礎(chǔ)和空間。特別是在端側(cè)AI方面,有望迎來(lái)爆發(fā),比如AI PC等應(yīng)用的擴(kuò)展,需要支持端側(cè)AI大模型運(yùn)行的芯片提供強(qiáng)大算力支持。同時(shí),落地傳統(tǒng)行業(yè),需要AI解決方案提供商需具備技術(shù)能力和行業(yè)知識(shí),這對(duì)許多技術(shù)公司是挑戰(zhàn)。
AI變現(xiàn),哪些機(jī)遇和挑戰(zhàn)?
正如多位受訪人對(duì)<與非網(wǎng)>所說(shuō),端側(cè)和邊緣AI落地已經(jīng)成為業(yè)界關(guān)注的焦點(diǎn)。綜合各方觀點(diǎn)來(lái)看,變現(xiàn)挑戰(zhàn)主要在于以下兩方面:第一,成本控制、算法快速迭代與實(shí)時(shí)性要求;第二,AI生態(tài)與技術(shù)協(xié)同。
成本、算法與實(shí)時(shí)性
Dennis Laudick認(rèn)為,軟件開(kāi)發(fā)成本是目前企業(yè)實(shí)施AI的一大障礙,特別是邊緣AI系統(tǒng)中專用AI加速器的軟件難度更大,它雖能實(shí)現(xiàn)高TOPS性能,但面臨兩大挑戰(zhàn):第一,可能不適用于汽車(chē)等產(chǎn)品生命周期內(nèi)的AI算法;第二,缺乏通用軟件棧和工具,代碼移植困難。Imagination在這方面的AI策略是,基于成熟GPU和并行計(jì)算架構(gòu),提供高性能、靈活、易編程的計(jì)算平臺(tái),支持高度并行的AI加速,并配備了基于開(kāi)放標(biāo)準(zhǔn)和廣泛支持框架的計(jì)算軟件棧。
在陳巍看來(lái),目前AI落地的大挑戰(zhàn)主要有兩個(gè),一個(gè)是AI應(yīng)用的準(zhǔn)確度,或者說(shuō)是相對(duì)人類(lèi)智力的水平;另一個(gè)是AI應(yīng)用的性價(jià)比,也就是能不能比人工更便宜。事實(shí)上,后者是目前阻礙AI應(yīng)用落地的最大因素,例如GPT-o3的解題成本據(jù)說(shuō)高達(dá)3000美元,這使得標(biāo)準(zhǔn)o3的落地受到成本擠壓的閑置。在降成本方面,中存算目前借助自研的大模型來(lái)輔助芯片設(shè)計(jì),以降低研發(fā)成本;另一方面,使用存算一體和先進(jìn)封裝集成技術(shù)降低AI芯片的單位Token成本。
鮑敏祺則認(rèn)為,大模型在端側(cè)部署的一大挑戰(zhàn)在于如何實(shí)現(xiàn)算法的快速迭代。在當(dāng)前以Transformer架構(gòu)為主流的大模型時(shí)代,算法更加多樣、迭代更加快速。此前,端側(cè)AI算法的設(shè)計(jì)思路側(cè)重于極盡所能去優(yōu)化功耗、性能和面積,例如將計(jì)算精度限定于int8甚至更低,導(dǎo)致算法遷移成本攀升。尤其是將云端開(kāi)發(fā)好的算法部署到端側(cè)時(shí),需要進(jìn)行大量的剪枝、量化等處理,所需周期會(huì)非常長(zhǎng),嚴(yán)重影響了實(shí)時(shí)性。安謀科技正在研發(fā)的下一代“周易”NPU通過(guò)增加高精度f(wàn)p16算力并支持包括int8/int16/fp16等在內(nèi)的多精度計(jì)算,以及W4A16硬件加速、帶寬壓縮加速技術(shù)和多核高性能協(xié)同等一系列調(diào)優(yōu)措施,能更好地兼容傳統(tǒng)視覺(jué)及語(yǔ)音模型的輕算力場(chǎng)景和大模型的中算力場(chǎng)景。
信曉旭認(rèn)為,AI應(yīng)用的下一個(gè)爆發(fā)點(diǎn)極有可能在端側(cè)出現(xiàn)。當(dāng)前,AI落地和傳統(tǒng)行業(yè)轉(zhuǎn)型的最大挑戰(zhàn)在于滿足端邊側(cè)大模型部署的“三高三低”要求:即對(duì)硬件的高算力、高帶寬、高精度需求,以及對(duì)低功耗、低延時(shí)、低成本的追求。傳統(tǒng)的CPU和GPU在這些方面存在局限,尤其是在成本和功耗方面,端邊側(cè)大模型需要更高性能、更高效率的AI芯片來(lái)支持。后摩智能利用存算一體技術(shù)打造的AI芯片,在保持低功耗的同時(shí),能夠?qū)崿F(xiàn)與傳統(tǒng)GPU相當(dāng)?shù)乃懔?,并且無(wú)需占用系統(tǒng)內(nèi)存,在成本和性能上都具有優(yōu)勢(shì)。
AI生態(tài)與技術(shù)協(xié)同
鄒挺表示,行業(yè)對(duì)于算力、性能、能效以及縮短上市時(shí)間的需求都在不斷攀升。因此,構(gòu)建計(jì)算的方式需要隨之演變,芯片不再是一個(gè)由離散模塊或組件以模塊化的方式構(gòu)建的簡(jiǎn)單集合,需要從整體解決方案的角度進(jìn)行設(shè)計(jì),也需要更深度的集成,更多的功能需要協(xié)作共存,以實(shí)現(xiàn)更低的延遲、更高的帶寬,以及更高的能效。為充分釋放AI的潛力,Arm從系統(tǒng)層面思考問(wèn)題,將硬件、軟件和生態(tài)無(wú)縫集成到一個(gè)全面的解決方案,通過(guò)Arm計(jì)算子系統(tǒng)(CSS)和軟件生態(tài)系統(tǒng)來(lái)推動(dòng)行業(yè)發(fā)展。
他指出,由于專用AI處理器開(kāi)發(fā)周期較長(zhǎng),高能效CPU在AI初期成為推理核心;隨著技術(shù)發(fā)展和場(chǎng)景多樣化,定制化專用AI加速器興起,CPU與GPU、NPU等異構(gòu)單元協(xié)同工作,平衡推理性能、成本和功耗。在AI推理及應(yīng)用的各個(gè)階段,高能效CPU都發(fā)揮著關(guān)鍵作用。
阿里巴巴達(dá)摩院資深技術(shù)專家李春強(qiáng)認(rèn)為,AI技術(shù)落地催生的模型推理需求,對(duì)硬件提出了更高要求,他強(qiáng)調(diào)RISC-V作為新興芯片架構(gòu),其開(kāi)放性和可定制性具有獨(dú)特優(yōu)勢(shì)。達(dá)摩院玄鐵團(tuán)隊(duì)針對(duì)AI模型定制的Matrix擴(kuò)展指令集,提升基于RISC-V芯片的端側(cè)AI能效,已首次應(yīng)用于玄鐵C907處理器;并且針對(duì)當(dāng)前的主流網(wǎng)絡(luò)特征,進(jìn)行了端到端推理優(yōu)化,通過(guò)創(chuàng)新硬件架構(gòu)提升算力利用效率。軟硬件一體的玄鐵AI平臺(tái)解決方案,可以為芯片廠家提供通用的、高效的AI算力基礎(chǔ)設(shè)施,已應(yīng)用于云端視頻轉(zhuǎn)碼卡、AI邊緣計(jì)算盒子、RISC-V筆記本電腦等終端產(chǎn)品。
變現(xiàn)去!國(guó)產(chǎn)AI芯片與大模型如何互為促進(jìn)?
縱觀大模型的商業(yè)落地,高度集成的軟硬件一體化方案在滿足特定需求方面有優(yōu)勢(shì)。那么,國(guó)產(chǎn)AI芯片與大模型在商業(yè)落地方面如何互為促進(jìn)?有哪些新趨勢(shì)?
李春強(qiáng)表示,AI芯片與大模型互為促進(jìn),具體表現(xiàn)為:大模型需求驅(qū)動(dòng)芯片創(chuàng)新,推動(dòng)芯片開(kāi)發(fā)高效硬件架構(gòu),如支持并行計(jì)算的NPU、多模態(tài)協(xié)同處理的IP設(shè)計(jì);同時(shí),AI芯片加速大模型訓(xùn)練和推理,提供本地化、高性價(jià)比算力,降低硬件成本,縮短研發(fā)周期。
三大趨勢(shì)正在發(fā)生:第一,大模型專用加速芯片興起,支持稀疏矩陣運(yùn)算、低精度計(jì)算等,優(yōu)化Transformer模型訓(xùn)練和推理效率,提升GPT、BERT等模型性能;第二,AI芯片從通用算力走向定制算力,滿足不同場(chǎng)景大模型應(yīng)用的多樣化算力需求;第三,芯片-模型-算法的三位一體優(yōu)化,通過(guò)硬件加速深度學(xué)習(xí)模型的注意力機(jī)制、動(dòng)態(tài)路由技術(shù)等,實(shí)現(xiàn)芯片算力最優(yōu)利用。
鮑敏祺則看到,高度集成的軟硬件一體化方案過(guò)去多用于智能眼鏡、低功耗手機(jī)攝像頭等ISP相關(guān)場(chǎng)景,追求極致成本控制,投入產(chǎn)出比并不理想。
而端側(cè)AI領(lǐng)域,正在從專適專用芯片或IP設(shè)計(jì)方法,逐步轉(zhuǎn)變?yōu)榫邆涓ㄓ么竽P椭С帜芰Φ姆绞?。大模型時(shí)代,AI算法加速迭代,這就需要快速部署、找到用戶高頻使用熱點(diǎn)并獲取反饋以調(diào)優(yōu)算法。并且,云端到端側(cè)部署更看重快速迭代能力而非極致成本控制,只有快速部署、抓住用戶才是實(shí)現(xiàn)良好商業(yè)落地的關(guān)鍵。
陳巍談到,目前看到的大部分情況是大模型需要遷就國(guó)產(chǎn)AI芯片,進(jìn)行相對(duì)復(fù)雜的適配,但國(guó)產(chǎn)AI芯片確實(shí)在規(guī)避算力禁運(yùn)方面起到了非常大的作用。盡管大部分國(guó)產(chǎn)AI芯片和大模型還處于各自為戰(zhàn)的情況,預(yù)計(jì)未來(lái)會(huì)有更多的國(guó)產(chǎn)AI芯片與大模型進(jìn)行深度適配和架構(gòu)優(yōu)化,降低大模型的部署成本。
寫(xiě)在最后
對(duì)AI應(yīng)用變現(xiàn)的預(yù)期,是多年來(lái)技術(shù)發(fā)展與市場(chǎng)需求共振的結(jié)果,顯示出市場(chǎng)對(duì)AI應(yīng)用價(jià)值的認(rèn)可和期待。
盡管AI領(lǐng)域的競(jìng)爭(zhēng)比任何時(shí)候都更為激烈,但技術(shù)迭代的速度在加快,大模型賦能的AI應(yīng)用正在多種場(chǎng)景迅速普及,AI的實(shí)際滲透率在逐步增長(zhǎng),這也預(yù)示著AI應(yīng)用變現(xiàn)的潛力和廣闊前景。