在AI技術的狂飆突進中,2024年給整個行業(yè)帶來了較大的變革與震撼。多模態(tài)AI模型的橫空出世,讓智能設備擁有了看、聽、說的能力;從云端奔涌向端側和邊緣側的算力需求轉移,如同一場“大遷徙”,帶來一場新的博弈;算力價格產(chǎn)生“松動”,AI技術的普及門檻大幅降低,帶動了更多中小企業(yè)和開發(fā)者躍躍欲試……
在這樣的時代狂潮中,AI芯片如何在市場巨浪中找準定位,已然成了一個迫切需要解答的問題。
小模型、多模態(tài)、預訓練……AI何去何從?
2024年,AI領域出現(xiàn)了一些新的技術趨勢,包括小數(shù)據(jù)、大規(guī)模預訓練模型、大模型微調(diào)、多模態(tài)大模型等等。這些趨勢的走向如何?業(yè)界又將如何布局未來的市場?
Arm中國區(qū)業(yè)務全球副總裁鄒挺,重點談到了多模態(tài)AI模型和小語言模型。他認為,多模態(tài)AI模型正迅速演進,超越傳統(tǒng)大語言模型(LLM)的文本處理能力,整合圖像、音頻和傳感器數(shù)據(jù),賦予AI類似人類的感知能力,使其能更全面地理解世界并進行互動。
與此同時,Arm預計小語言模型(SLM)將在2025年迎來加速發(fā)展。這類模型具有更高的壓縮率和量化能力,參數(shù)更少、資源需求更低,易于定制和部署,尤其適合在計算資源受限的設備上運行。預計到2025年,這類模型的數(shù)量將顯著增加,且在任務中的使用也將越來越廣泛,包括語言和設備交互,以及基于視覺的任務,例如事件解讀和掃描等。這些模型能夠直接在邊緣設備上運行,提升性能的同時也增強隱私保護。
中存算董事長陳巍表示,目前看大模型逐漸從文本的單一模態(tài)走向多模態(tài)、混合模態(tài),包含視頻等多元傳感信息的世界模型是大模型發(fā)展的“圣杯”,會是未來的焦點。但世界模型對算力芯片的要求也極高,需要通過更多新架構和集成技術去實現(xiàn)。他們正在按照世界模型的目標來優(yōu)化架構,包括整合先進CAG(Cache-Augmented Generation)等前瞻技術。
模型和算力的“雙向奔赴”是安謀科技產(chǎn)品總監(jiān)鮑敏祺強調(diào)的變化。得益于模型數(shù)據(jù)質(zhì)量的顯著提升,原本需要百億參數(shù)級別的模型規(guī)?,F(xiàn)在可以降低至十幾億參數(shù)級別。換言之,隨著數(shù)據(jù)質(zhì)量的不斷提高,小模型的性能也會隨之得到優(yōu)化,這樣就能夠讓整個端側的AI算法應用變得更加靈活。
此外,多模態(tài)模型因涉及語音、圖像、視頻等數(shù)據(jù)源,其上下文長度增加,導致算力需求上升,需提前布局應對。同時,模型訓練和微調(diào)的應用范圍更為廣闊,如OpenAI的最新模型在一次推理中多次調(diào)用以優(yōu)化結果,與之對應的是增加了算力需求。未來三年,基于Transformer結構進行推理仍將是主流,端側大模型需在支持更長上下文和低延時之間找到平衡,以應對多樣化的推理任務。
算力遷徙,端、邊如何發(fā)展?
生成式AI趨勢下,云邊端一體化的混合AI架構,正在推動AI技術在更多領域的廣泛應用。
后摩智能聯(lián)合創(chuàng)始人、產(chǎn)品副總裁信曉旭認為,云端AI將繼續(xù)在AI技術演進上發(fā)揮核心作用,特別是在模型訓練和大規(guī)模數(shù)據(jù)處理方面。
同時,他看好端側和邊緣側AI的巨大成長潛力,因為它們更接近數(shù)據(jù)源,更貼近場景,能夠針對性地提供個性化服務、實時響應和更好的數(shù)據(jù)隱私保護,尤其是多模態(tài)大模型的爆發(fā)將會加速這一進程。隨著生成式AI技術的發(fā)展,端邊側設備將能夠執(zhí)行更復雜的任務,如內(nèi)容生成、決策支持和交互式學習,推動端側設備從數(shù)據(jù)收集點轉變?yōu)楸镜刂悄軟Q策終端。目前,后摩智能專注于開發(fā)能夠支持端、邊側大模型部署的AI芯片及配套硬件產(chǎn)品,通過存算一體架構實現(xiàn)算力和功耗方面的優(yōu)勢。他透露,2025年,后摩智能計劃推出新款芯片,進一步提升性能,加速端邊設備部署大模型的進程。
Imagination公司產(chǎn)品管理副總裁Dennis Laudick談到,AI應用在邊緣和端側設備中的需求主要集中在網(wǎng)絡受限、實時響應和安全性要求高的場景。生成式AI在這些場景中展現(xiàn)出巨大潛力,尤其是在Transformer架構下,其生成內(nèi)容的高效性和逼真性受到市場青睞。多模態(tài)生成式AI和個性化體驗正不斷涌現(xiàn),其應用范圍也在持續(xù)拓展至自動駕駛、圖像處理等領域。Imagination希望通過提供可編程GPU和并行計算平臺,助力生成式AI的消費者體驗革命。
鄒挺認為,2024年,AI大模型從云端向邊緣和終端下沉的趨勢日益顯著,2025年,或?qū)⒊霈F(xiàn)復雜的混合AI架構,這些架構將AI任務分配到邊緣設備和云端之間。系統(tǒng)將在邊緣設備上運行AI算法以檢測感興趣的事件,而云端模型則負責提供附加信息。最終,決定是在本地還是云端運行AI工作負載,將取決于可用電力、延遲要求、隱私考慮和計算復雜性等因素。
針對邊緣和端側市場的巨大潛力,Arm當前主要聚焦于解決AI推理從云端擴展到邊緣及端側所面臨的復雜性問題,例如針對智能終端市場推出Arm終端計算子系統(tǒng)(CSS)、面向汽車市場將服務器級的Neoverse CPU引入Arm汽車增強(AE)IP產(chǎn)品線、在物聯(lián)網(wǎng)領域通過從Cortex-M到Cortex-A的廣泛產(chǎn)品滿足多樣需求。
陳巍則認為,具身智能和大模型的家用落地會進一步推動邊緣生成式AI的發(fā)展,目前正與合作方共同推進云/邊緣計算的編譯生態(tài)和MaaS生態(tài),在大模型辦公一體機和大模型盒子方面進行高性價比產(chǎn)品的布局。
談及國內(nèi)AI產(chǎn)業(yè)在云、邊、端發(fā)展環(huán)境與海外市場的差異,鮑敏祺表示,國內(nèi)AI產(chǎn)業(yè)的獨特優(yōu)勢在于國內(nèi)超大市場的規(guī)?;瘍?yōu)勢,如完備的電力、通信等基礎設施、海量用戶群體和豐富的數(shù)據(jù)積累,以及成熟的產(chǎn)業(yè)分工,為本土AI產(chǎn)業(yè)發(fā)展提供了堅實基礎。安謀科技自研“周易”NPU通過IP設計增加可擴展性,不僅可以滿足端側AI的算力需求,還能配合其他通用算力單元實現(xiàn)混合AI的多樣化算力拓展。
算力降階,AI芯片面臨沖擊?
2024年,AI市場的供需變化也是一個顯著趨勢,出現(xiàn)了AI算力價格的下調(diào)。這給AI芯片的落地應用帶來哪些挑戰(zhàn)?又將如何影響AI芯片下一步的發(fā)展?
陳巍首先認為,從摩爾定律的角度看,AI算力的價格下調(diào)非常正常。算力成本的下降對大模型的廣泛落地和應用,具有非常關鍵的意義。事實上,更多的大模型落地,會進一步帶動AI芯片的銷售和發(fā)展。按照目前的趨勢,大模型和大模型計算芯片正從研究成果快速轉化為生產(chǎn)力,AI芯片的研發(fā)目標也在變化,成本要更低。
“2024年是AI算力基礎設施市場的一次重構。我在2023年初對ChatGPT進行分析時,就預測推理需求會超過訓練成為主要的大模型算力需求,高性價比的算力會成為大模型廠商競爭的關鍵。對國內(nèi)AI芯片廠商來說,如何在半導體競爭的大背景下降低芯片成本,既是機會也是挑戰(zhàn)”,他表示。
鮑敏祺談到,AI算力價格下調(diào)的本質(zhì)是供需關系錯配的結果。當前,AI應用的類型和數(shù)量有限,市場對算力的需求并不大,而算力供應相對充足,導致市場呈現(xiàn)買方態(tài)勢,從而促使算力價格呈現(xiàn)“內(nèi)卷”態(tài)勢。然而,隨著多模態(tài)和世界模型的加速成熟,以及端側應用場景的不斷涌現(xiàn),對于AI算力需求將攀升,供需關系可能在未來達到平衡,進而影響算力定價策略。
在他看來,AI芯片面臨的挑戰(zhàn)不僅來自云端的制程工藝和算力供應受限,端側也面臨算法迅速增長、軟件生態(tài)割裂的現(xiàn)狀,如何實現(xiàn)算法快速部署成為難題。同時,當前終端市場和產(chǎn)業(yè)環(huán)境瞬息萬變,芯片廠商需要在有限的時間窗口內(nèi)完成產(chǎn)品定義、設計、制造和上市等流程,以搶占市場競爭先機。綜合來看,在“內(nèi)卷”的產(chǎn)業(yè)環(huán)境下,追求高效的Go-to-Market或許比一味追求自研創(chuàng)新更加重要,也更加符合當下的市場競爭需求。從這個角度來說,也為IP廠商等上游技術供應方提供了更多機遇。
信曉旭則認為,算力價格下調(diào)將使AI技術更易獲取,降低了企業(yè)尤其是中小企業(yè)的使用成本,從而推動AI應用的普及和落地,也為AI芯片帶來擴大市場和深化合作的機遇。然而,隨著算力價格的下降,市場對AI芯片的算力和能效比要求更高,AI芯片廠商需要在保持競爭力的同時,提供更高效、更經(jīng)濟的解決方案,在技術創(chuàng)新和成本控制上做出更大的努力。
對于AI芯片的下一步研發(fā),這意味著需要更加注重性能優(yōu)化和能效比的提升。“在算力價格下調(diào)的市場環(huán)境下,存算一體AI芯片能夠提供更高的性價比,滿足市場對于成本效益和能效比的雙重需求”,他補充。
國產(chǎn)AI芯片將經(jīng)歷泡沫破裂?
Gartner發(fā)布的《2024年中國數(shù)據(jù)、分析和人工智能技術成熟度曲線》顯示,國產(chǎn)人工智能芯片正處于期望膨脹期。根據(jù)這一解析,國產(chǎn)AI芯片之后將進入泡沫破裂低谷期,然后才能到穩(wěn)步爬升復蘇期。
來源:Gartner《2024年中國數(shù)據(jù)、分析和人工智能技術成熟度曲線》
陳巍表示,這一過程符合國內(nèi)產(chǎn)業(yè)發(fā)展的特點,即:先投入較多資源在短時間快速形成多家頭部企業(yè),然后再通過競爭、并購的方式優(yōu)選出能夠跟世界巨頭競爭的企業(yè),這有利于產(chǎn)業(yè)在短期成長起來。
另一方面他強調(diào)了新的可能性,由于Gartner曲線是根據(jù)已知預測未知,但集成電路產(chǎn)業(yè)的技術也在不斷前進,不管是新的視頻大模型技術、3D集成技術和CPO等光互連技術,其發(fā)展曲線目前看起來都超越了Gartner曲線,在幾種新技術的推動下,國產(chǎn)AI芯片仍有不斷前進的可能,且現(xiàn)在應該開始注重生態(tài)和客戶TOC,逐漸從芯片視角轉向生態(tài)和需求視角。
信曉旭談到,泡沫破裂是技術創(chuàng)新的必經(jīng)階段,標志著技術成熟和市場篩選的開始。隨著AI大模型升級和生成式AI的廣泛應用,國產(chǎn)AI芯片迎來發(fā)展窗口期,大模型向邊緣和端側設備下沉的趨勢,使其更具生命力。國產(chǎn)AI芯片需在性能突破和產(chǎn)業(yè)鏈協(xié)同上搶占先機,提供高性價比、高能效比、易用性強的芯片。具體變化包括:從數(shù)據(jù)中心擴展到端邊的應用場景多元化;大模型普及對計算效率和算法優(yōu)化要求更高,推動存算一體等創(chuàng)新技術融合加速;國產(chǎn)AI芯片要和軟硬件、應用等環(huán)節(jié)協(xié)同,形成合力突破。
鮑敏祺談到,事物發(fā)展的普遍規(guī)律是螺旋式上升、波浪式前進。比如應用最為廣泛的免費語言類模型,目前已經(jīng)有很多用戶會安裝豆包、Kimi等智能問答型App。此外,很多證券分析平臺、社交平臺等已經(jīng)植入了智能Copilot產(chǎn)品,這代表著新一輪生成式AI浪潮并不僅僅是AI算法的一路高歌猛進,還伴隨著一些商業(yè)模式的實踐和驗證。
因此,AI芯片的發(fā)展并非毫無支撐,也非泡沫,或許之后會迎來市場充分競爭下的行業(yè)洗牌,但相信不會出現(xiàn)斷崖式下跌的情況。
此外,他認為AI芯片存在外循環(huán)和內(nèi)循環(huán)。一是目前受地緣政治影響,芯片和AI領域的全球供應體系遭遇挑戰(zhàn),國產(chǎn)替代成為主流,為國內(nèi)AI芯片提供了一定的發(fā)展機遇。二是國內(nèi)在如AI PC、AI手機、智駕智艙等新興應用領域呈現(xiàn)出蓬勃的發(fā)展前景,這無疑也為AI芯片的高質(zhì)量發(fā)展提供了雄厚的產(chǎn)業(yè)支撐。
不可否認,目前國內(nèi)AI芯片面臨著諸如產(chǎn)品同質(zhì)化和部分性能不如預期等挑戰(zhàn),但長期來看,整體需求體量不會“硬著陸”。市場在經(jīng)過大浪潮沙和資源整合后,那些經(jīng)歷過優(yōu)勝劣汰而生存下來的企業(yè)將成為未來本土AI發(fā)展的重要力量。
寫在最后
國產(chǎn)AI芯片的發(fā)展歷程中,“泡沫破裂”似乎是一個難以回避的階段。特別是個別企業(yè)的市場表現(xiàn)引發(fā)了市場對AI芯片的擔憂。然而,這也并非全然是負面現(xiàn)象,更像是技術創(chuàng)新和市場篩選的必經(jīng)之路。
即便如此,我們?nèi)孕杩吹絿a(chǎn)AI芯片的廣闊前景。隨著AI技術的不斷普及和應用場景的拓展,市場對高性能、低功耗AI芯片的需求將持續(xù)增長。特別是在云計算、數(shù)據(jù)中心和邊緣計算等領域,國產(chǎn)AI芯片有望憑借技術突破和產(chǎn)業(yè)鏈協(xié)同,逐步實現(xiàn)國產(chǎn)替代和突破,最終走向成熟并實現(xiàn)大規(guī)模應用。