• 正文
    • 01、DeepSeek「降本增效」,AI正在成為終端側(cè)新的UI
    • 02、引領(lǐng)AI推理——軟硬件「協(xié)同」以及AI Hub「加持」
  • 相關(guān)推薦
申請入駐 產(chǎn)業(yè)圖譜

DeepSeek出圈,AI模型開啟終端側(cè)「范式轉(zhuǎn)移」

03/10 08:57
680
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點資訊討論

作者丨劉伊倫,編輯丨包永剛

未來,AI智能體就是唯一與終端用戶交互的UI。”?

“在資源受限的端側(cè),有了DeepSeek的蒸餾模型之后,比如原來只能部署7B模型的場景,現(xiàn)在能達到14B模型的效果,讓端側(cè)AI的能力上一個臺階?!?a class="article-link" target="_blank" href="/tag/%E8%8A%AF%E7%89%87/">芯片工程師哲宇認為DeepSeek的出現(xiàn)對生成式AI的普及意義重大。

DeepSeek的出現(xiàn)讓終端側(cè)AI的表現(xiàn)超越了一年前僅能在云端運行的模型,端側(cè)AI蓄勢待發(fā),高通作為連接和計算領(lǐng)域的領(lǐng)導(dǎo)者,也正在加速終端側(cè)AI時代的到來。去年,高通公司總裁兼CEO安蒙(Cristiano Amon)就表示,“AI推理正在向數(shù)據(jù)所產(chǎn)生的邊緣側(cè)轉(zhuǎn)移。邊緣側(cè)和終端側(cè)AI實現(xiàn)了AI功能的擴展,提升了AI的性能和效率。它兼具即時性、可靠性和極低時延。數(shù)據(jù)保留在終端,有助于保障隱私性和個性化。”最近高通發(fā)布《AI變革正在推動終端側(cè)推理創(chuàng)新》白皮書后,高通公司高級副總裁兼技術(shù)規(guī)劃和邊緣解決方案業(yè)務(wù)總經(jīng)理馬德嘉(Durga Malladi)表示,AI推理和處理正在全面向終端側(cè)轉(zhuǎn)移。而從硬件軟件到生態(tài)的全面適配,高通將加速終端側(cè)AI時代的到來。高通也正在引領(lǐng)端側(cè)AI多模態(tài)的發(fā)展。2025年世界移動通信大會(MWC 2025)上,搭載驍龍8至尊版的智能手機演示了采用AI智能體作為用戶界面,對音樂、導(dǎo)航、天氣和信息等任務(wù)的處理。搭載驍龍X系列的商用PC,也具備多模態(tài)AI的能力。

01、DeepSeek「降本增效」,AI正在成為終端側(cè)新的UI

終端側(cè)AI是將AI直接部署在終端設(shè)備上,對本地數(shù)據(jù)進行處理、分析以及決策。在過去一段時間里,終端側(cè)AI的發(fā)展受制于模型部署需要消耗大算力、占用存儲空間以及高昂的開發(fā)成本。DeepSeek出現(xiàn)后,高效“小”模型開始涌現(xiàn),新的蒸餾模型,保持準(zhǔn)確性的同時遷移知識,實現(xiàn)更快的推理速度、更少的內(nèi)存占用和更低的算力需求,讓端側(cè)AI也能有媲美云端AI的效果。LiveBench.ai數(shù)據(jù)顯示,對比同為700億參數(shù)的Llama 3.3和DeepSeek R1蒸餾模型各項性能表現(xiàn),結(jié)果顯示蒸餾能夠在推理、編程、數(shù)學(xué)和數(shù)據(jù)分析任務(wù)中顯著提高性能。

Meta Llama 700億參數(shù)模型和DeepSeek對應(yīng)蒸餾模型的LiveBench AI基準(zhǔn)測試平均結(jié)果對比蒸餾小模型與前沿大模型的性能差距正在縮小,量化、壓縮和剪枝等進一步優(yōu)化技術(shù),推動了較小的高質(zhì)量生成式AI模型的激增,在2024年發(fā)布的大規(guī)模AI模型中,超過75%的模型參數(shù)在千億規(guī)模以下。豐富的小模型為邊緣AI開發(fā)者提供了多樣化的選擇,以用于開發(fā)應(yīng)用和AI智能體。“這意味著我們關(guān)注的焦點已不再是模型本身,而是演進到終端上的應(yīng)用發(fā)展?!?/strong>馬德嘉說,“隨著終端側(cè)可以運行越來越多高質(zhì)量的AI模型,越來越多的AI應(yīng)用和用例開始涌現(xiàn)。AI正在重新定義所有終端的用戶界面,這也意味著,AI正在成為終端側(cè)新的UI?!?/strong>

AI成為終端側(cè)新的UI未來,不同的信息輸入類型將不直接應(yīng)用于某個具體的App,而是先傳輸?shù)紸I智能體,AI智能體接收后再將工作負載分配給后臺的不同應(yīng)用,所有的處理任務(wù)都將由AI智能體直接完成。對于終端用戶來講,AI智能體就是唯一在前端與他們交互的UI,而所有實際應(yīng)用的處理都是在后臺完成的,用戶全程“無感”。除了簡化原有的APP交互之外,AI智能體對復(fù)雜任務(wù)的推理同樣讓用戶體驗“絲滑”。馬德嘉在驍龍8至尊版剛發(fā)布時表示:“智能體能夠執(zhí)行更加復(fù)雜的任務(wù),尤其是那些指令不明確的任務(wù)?!?/strong>

02、引領(lǐng)AI推理——軟硬件「協(xié)同」以及AI Hub「加持」

如何突破算力以及應(yīng)用生態(tài)的限制助力終端側(cè)AI的發(fā)展?構(gòu)建硬件、軟件及生態(tài)協(xié)同的全面解決方案是高通給出的答案。追求高效處理、保持電池續(xù)航對終端側(cè)AI的用例至關(guān)重要,高通通過提供集成定制CPU、NPU、GPU和低功耗子系統(tǒng)的SoC芯片,在硬件層面實現(xiàn)能效與功耗的雙重性能優(yōu)勢。以最新發(fā)布的驍龍8至尊版移動平臺為例,其自研的第二代高通Oryon CPU性能較上一代提升45%、Hexagon NPU AI性能和能效均提升45%,而最新的Adreno GPU性能提升40%,且功耗降低40%。在搭載驍龍8至尊版的最新智能手機上,我們已經(jīng)看到了諸多創(chuàng)新的AI智能體應(yīng)用涌現(xiàn),以小米15系列為例,其AI智能體“超級小愛”推出兩項AI功能,“AI記憶能力”可以協(xié)助用戶管理個人信息、日程及收藏等,“多模態(tài)交互能力”則讓超級小愛能理解屏幕中的信息并進行交互反饋。而為了在平臺上充分釋放AI潛能,高通構(gòu)建了強大的AI軟件棧與之協(xié)同。軟硬件協(xié)同讓高通構(gòu)建出更強的競爭力,資深A(yù)I從業(yè)者對雷峰網(wǎng)表示,同樣實現(xiàn)一個功能,代碼寫得好,效率就會高很多。高通構(gòu)建的AI軟件棧包括庫、SDK和優(yōu)化工具,能夠簡化模型部署流程并提高性能。以圖像生成為例,圖像擴散模型Stable Diffusion通過高通AI Stack進行全棧式AI優(yōu)化,結(jié)合驍龍平臺上的NPU等領(lǐng)先AI處理器組件,兩年前就能在終端側(cè)于15秒內(nèi)完成20步推理生成AI圖像,無需訪問云端,為用戶提供高效且可靠的交互式體驗。如今,驍龍平臺已經(jīng)支持在終端側(cè)運行高達100億參數(shù)的模型和70億參數(shù)的多模態(tài)大模型。“開發(fā)者不需要知道硬件端的具體設(shè)計細節(jié)?!?/strong>馬德嘉說,“他們需要的是軟件工具庫支持、讓他們能夠按照自己所需,非常自由、靈活地選擇他們所需的框架、runtime和工具,面向任何操作系統(tǒng)設(shè)計AI應(yīng)用和智能體?!?/strong>通過遵循開發(fā)者為中心的策略,高通為開發(fā)者簡化了在消費和商用產(chǎn)品中集成先進AI特性的過程,幫助開發(fā)者加速創(chuàng)新。而為了向各行各業(yè)實現(xiàn)規(guī)?;疉I擴展,則需要推動開發(fā)者創(chuàng)新走向生態(tài)式創(chuàng)新,高通與全球AI模型廠商積極合作,并推出高通AI Hub。馬德嘉表示:“目前已有超過1500家企業(yè)在使用高通AI Hub,比如Meta、Allam、OpenAI等。此外,還有許多服務(wù)和軟件提供商合作,如AWS、dataloop、IBM Watsonx、Nota AI等。豐富多元的合作伙伴,讓高通AI Hub在能夠運行的模型數(shù)量、支持的模型廠商數(shù)量和整個生態(tài)系統(tǒng)的合作方面取得了長足的進步?!?/p>

高通AI Hub高通AI Hub支持主流大語言模型和多模態(tài)大模型,讓開發(fā)者可在搭載高通平臺的終端上部署、優(yōu)化和管理推理任務(wù)。馬德嘉表示,高通AI Hub讓應(yīng)用開發(fā)變得非常簡單,高通提供大量的軟件工具、模型庫、編譯器,開發(fā)者可以編寫生成應(yīng)用并在高通提供的免費云端設(shè)備場上進行測試,最終完成部署。高通要做的就是極大簡化邊緣側(cè)AI開發(fā)者的整個開發(fā)流程。借助預(yù)優(yōu)化模型庫和支持定制模型優(yōu)化與集成等特性,不僅縮短開發(fā)周期,同時增強了與廣泛AI生態(tài)的兼容性?!拔覀兒腿蚋鱾€地區(qū)的眾多開源和閉源模型廠商展開了廣泛的合作?!瘪R德嘉說,“這讓我們能夠和生態(tài)系統(tǒng)實現(xiàn)非常緊密的結(jié)合,并且在實施我們的AI發(fā)展戰(zhàn)略和推動生成式AI創(chuàng)新方面擁有獨特優(yōu)勢?!?/strong>
03

多終端覆蓋,高通讓智能計算「無處不在」

智能手機被認為是最普適的終端設(shè)備,驍龍8至尊版讓AI智能體變成手機上的“原生應(yīng)用”,在通信優(yōu)化、圖像生成以及其他個性化功能上進行助力。在MWC 2025上,榮耀發(fā)布全球首款圖形界面移動AI助手“榮耀AI agent”,這款A(yù)I助手通過深度學(xué)習(xí)用戶習(xí)慣,能智能識別用戶的需求和意圖,自動化地進行任務(wù)安排。比如,榮耀AI Agent可以在用戶和朋友的聊天中讀取上下文,根據(jù)用戶的地點和偏好來選擇餐廳,并為用戶實時預(yù)定。這種便捷的交互體驗,讓用戶真正感受到AI技術(shù)如何在日常生活中發(fā)揮作用。這也正是高通在驍龍8至尊版發(fā)布時,對接下來終端側(cè)智能體體驗發(fā)展的預(yù)測。需求的演進讓終端形態(tài)走向多元,智能手機之外,PC、平板電腦及汽車同樣覆蓋大量消費者,AI眼鏡、XR以及IoT設(shè)備則方興未艾。驍龍X系列平臺搭載的領(lǐng)先NPU,擁有45TOPS的行業(yè)領(lǐng)先AI算力,能夠為Windows應(yīng)用帶來推理加速,并率先支持諸多Windows 11 AI+PC先進特性,帶來性能、續(xù)航及隱私保護上的全面優(yōu)化。驍龍數(shù)字底盤解決方案則利用先進攝像頭、生物識別、環(huán)境傳感器以及先進的多模態(tài)AI網(wǎng)絡(luò),提供根據(jù)駕駛員狀態(tài)和環(huán)境條件而調(diào)整的實時反饋和功能,從而增強汽車安全和駕駛體驗。面對工業(yè)互聯(lián)網(wǎng)的隱私性和數(shù)據(jù)安全問題,高通推出的Qualcomm AI本地設(shè)備解決方案和Qualcomm AI推理套件讓敏感客戶數(shù)據(jù)、調(diào)優(yōu)模型和推理負載能夠保留在本地,增強隱私性、可控性、能效和低時延。“從移動到汽車、PC、XR以及IoT終端,我們都有一系列出色的產(chǎn)品。”馬德嘉說,“對于開發(fā)者來說,使用搭載驍龍平臺的終端進行開發(fā)的優(yōu)勢在于能夠獲得更廣闊的應(yīng)用開發(fā)和規(guī)?;瘮U展空間,并且擁有非常全面的產(chǎn)品線選擇。”然而,面對多個不同的終端,開發(fā)者擔(dān)心“多端部署”所帶來的兼容性挑戰(zhàn)。對此,馬德嘉表示:“開發(fā)者不用面向不同平臺進行重復(fù)開發(fā),只需一次開發(fā),即可輕松實現(xiàn)跨多平臺部署。進入高通AI Hub后,開發(fā)者首先可以看到高通AI Hub所支持的所有不同細分領(lǐng)域的芯片平臺,如果對PC感興趣,就選擇需要的PC芯片平臺,并選擇想要運行的模型,你會看到你在PC平臺上所選擇的模型能夠支持的其他的芯片平臺。”在DeepSeek帶來的發(fā)展浪潮之下,智能手機、PC、汽車、AI眼鏡以及IoT等各類終端的AI功能將被重新定義,一個以終端側(cè)AI為主導(dǎo)的AI行業(yè)新格局正在形成。?//
近期熱門文章

部分國產(chǎn)芯片適配滿血版 DeepSeek,仍「遙遙無期」

Arm自研芯片:背刺客戶,卻振奮股民?

手握800萬期權(quán),上市前辭職,AI芯片人的情非得已

相關(guān)推薦