Deepseek已經(jīng)火了個(gè)把月。
它的出現(xiàn)提升了普羅大眾對(duì)于大模型的認(rèn)可度,改變了大模型的行業(yè)格局,讓豆包、Kimi等競品有些黯然失色。對(duì)于下游終端而言,Deepseek的最大作用,或是加快了端側(cè)AI落地應(yīng)用的步伐。
在最近一段時(shí)間內(nèi),市場已經(jīng)在給出“2025是端側(cè)AI應(yīng)用元年”之類的概念,而在此之前還在搖旗吶喊“2024是端側(cè)AI元年”。概念的更迭在一定程度上顯現(xiàn)出市場對(duì)新鮮事物的敏銳性,也同樣反映了Deepseek對(duì)于端側(cè)AI的推動(dòng)作用。
那么,端側(cè)AI如今的實(shí)際發(fā)展處于什么階段?在應(yīng)用落地過程中還有哪些需要解決的問題?
Vol.1/? ?什么是端側(cè)AI
當(dāng)前我們所熟知的Deepseek、ChatGPT、文心一言、通義千問及Kimi等語言大模型皆屬于云端AI范疇。一般而言,云端AI從終端采集信息,再將信息通過網(wǎng)絡(luò)傳輸?shù)皆浦行膫?cè)進(jìn)行后續(xù)處理,再輸出到終端。所謂端側(cè)AI,則是在終端設(shè)備上直接運(yùn)行人工智能算法 ,讓設(shè)備具備智能化處理和決策的能力。而終端設(shè)備則包括智能手機(jī)、電腦、智能家居、可穿戴設(shè)備等等,所以與AI結(jié)合后也衍生出了AI手機(jī)、AI PC、AI眼鏡等概念。
由于可以在本地設(shè)備完成數(shù)據(jù)處理、分析與輸出,少了上傳云端這一環(huán)節(jié),端側(cè)AI的響應(yīng)速度更快,可以離線使用,只要設(shè)備算力支持,基本上不會(huì)有“服務(wù)器繁忙,請(qǐng)稍后再試”的情況出現(xiàn)。
不過,此前將大模型“搬運(yùn)”至終端設(shè)備往往遇到一個(gè)問題,那便是大語言模型內(nèi)置參數(shù)多達(dá)百億千億,而PC、智能手機(jī)等設(shè)備的算力是有限的,還需要考慮內(nèi)存容量、內(nèi)存寬度及功耗等因素,所以端側(cè)與AI的融合并不算好。我們?nèi)粘J褂玫闹悄苁謾C(jī)或電腦等設(shè)備,有時(shí)候就算多同時(shí)運(yùn)行幾個(gè)應(yīng)用或者對(duì)設(shè)備配置要求比較高的游戲時(shí),都會(huì)卡成“PPT”,更別提搭載大模型了。
就在從業(yè)者等著產(chǎn)業(yè)鏈上下游聚力進(jìn)行系統(tǒng)級(jí)優(yōu)化(硬件、算法、大模型之間的協(xié)同),抱著幾年后才能實(shí)現(xiàn)端側(cè)AI高效落地的想法時(shí),Deepseek的橫空出世給業(yè)界提供了解題思路。一方面,Deepseek蒸餾和量化出來的端側(cè)模型最小參數(shù)規(guī)模為1.5B,可以與當(dāng)前大多數(shù)智能手機(jī)、PC實(shí)現(xiàn)硬件無縫銜接;另一方面,通過優(yōu)化模型架構(gòu),Deepseek的動(dòng)態(tài)異構(gòu)計(jì)算框架支持端側(cè)芯片內(nèi)多種計(jì)算單元的協(xié)同調(diào)度來解決硬件配置碎片化難題。
“Deepseek的出現(xiàn)無疑為端側(cè)AI的推進(jìn)帶來了諸多積極作用。”芯??萍枷蛐編煚敱硎荆紫?,端側(cè)AI的發(fā)展是技術(shù)進(jìn)步的必然趨勢。隨著人工智能技術(shù)的不斷發(fā)展,越來越多的應(yīng)用場景需要本地化的智能處理能力,以減少數(shù)據(jù)傳輸延遲、保護(hù)用戶隱私并降低對(duì)云服務(wù)的依賴。
“AI發(fā)展之路依然漫長,從云到端將會(huì)是一個(gè)新的發(fā)展趨勢?!本嫘究萍挤矫嫱瑯诱J(rèn)為當(dāng)下端側(cè)AI的發(fā)展是大趨勢,會(huì)給半導(dǎo)體市場需求提供增長動(dòng)力,也同時(shí)參考傳統(tǒng)計(jì)算在處理數(shù)據(jù)的演變歷史,AI處理將是云端與終端結(jié)合的混合式。“混合式AI能實(shí)現(xiàn)A I的規(guī)?;瘮U(kuò)展,并發(fā)揮其最大潛能?;旌螦 I架構(gòu)在云端和邊緣終端之間分配并協(xié)調(diào)A I工作負(fù)載,所以預(yù)測混合AI應(yīng)該會(huì)是AI的未來。”
Vol.2/? ?場景應(yīng)用加速落地 企業(yè)基于AI定義芯片
在AI發(fā)展的過程當(dāng)中,應(yīng)用場景落地是最為關(guān)鍵的一步。
“AI降本之后,終端應(yīng)用預(yù)計(jì)會(huì)有大的爆發(fā),繼續(xù)看好眼鏡、玩具、AI手機(jī)、AI PC等消費(fèi)電子。”一家國內(nèi)消費(fèi)電子配套芯片公司人士接受《科創(chuàng)板日?qǐng)?bào)》采訪時(shí)表示,盡管他們的產(chǎn)品在產(chǎn)業(yè)鏈幾乎最上游,但還是能感受到DeepSeek為智能終端行業(yè)帶來的積極影響。
或?yàn)閾屨加脩粜闹呛吞嵘a(chǎn)品賣點(diǎn),蘋果、谷歌、榮耀、VIVO等公司均在2024年加強(qiáng)了在端側(cè)領(lǐng)域的投入。而在2025年的CES上,各大參展企業(yè)所展出的產(chǎn)品也都與AI強(qiáng)相關(guān),如手機(jī)、手表。耳機(jī)、音響、機(jī)器人、廚具等,但凡產(chǎn)品存在人機(jī)交互的空間,廠商都在做相應(yīng)的工作。
不過,此前受限于各種因素,端側(cè)與AI之間的融合并不成功。
以AI眼鏡為例,2024年發(fā)布的部分AI眼鏡疑似翻車。據(jù)多家媒體報(bào)道,受制于續(xù)航、散熱、價(jià)格高等因素,一些國產(chǎn)AI眼鏡的市場表現(xiàn)未能達(dá)到企業(yè)預(yù)期。另外,也因AI眼鏡所采用的SOC芯片與AI的匹配度有限,端側(cè)AI的使用體感一般。
值得一提的是,了解到軟硬件融合的重要性,蘋果、英特爾、高通、AMD等多家芯片企業(yè)巨頭已經(jīng)根據(jù)當(dāng)前AI發(fā)展的實(shí)際需要,推出了具備強(qiáng)大AI處理能力的芯片產(chǎn)品。例如蘋果A18 Pro芯片則搭載了16核神經(jīng)網(wǎng)絡(luò)引擎,提供了強(qiáng)大的AI運(yùn)算能力,相比前代產(chǎn)品有了顯著提升,能夠支持多種AI特性。?驍龍8至尊版搭載了高通自研的Hexagon NPU,性能相比前代提升了最高12倍,支持多種精度的AI運(yùn)算,能夠利用大型語言模型和動(dòng)作模型,為端側(cè)AI提供強(qiáng)大的支持。
除蘋果、高通等海外芯片企業(yè)之外,國內(nèi)有哪些芯片企業(yè)推出了基于端側(cè)AI時(shí)代定義的芯片?
近幾個(gè)月,國內(nèi)的瑞芯微受益于端側(cè)AI概念,在二級(jí)市場有著非常亮眼的表現(xiàn),其市值一度超過800億元。據(jù)了解,瑞芯微部署AloT多年,開發(fā)的旗艦產(chǎn)品RK3588 系列非常契合端側(cè)AI的需要,集成了ARM四核Cortex-A76和四核Cortex-A55,內(nèi)置6T算力的NPU。能夠支持端側(cè)主流的 0.5B~3B 參數(shù)級(jí)別的模型部署。根據(jù)東北證券研報(bào)數(shù)據(jù),這款芯片系列已經(jīng)用用于AR眼鏡、平板電腦、新能源汽車等場景當(dāng)中。
據(jù)了解,炬芯科技面向電池驅(qū)動(dòng)的低功耗IoT領(lǐng)域成功落地了第一代基于模數(shù)混合電路實(shí)現(xiàn)的SRAM based CIM(Mixed-mode SRAM based CIM,簡稱MMSCIM)在500MHz時(shí)實(shí)現(xiàn)了0.1TOPS的算力,并且達(dá)成了6.4TOPS/W的能效比。2024年,炬芯科技發(fā)布了全新一代基于MMSCIM端側(cè)AI音頻芯片,共三個(gè)芯片系列:第一個(gè)系列是 ATS323X,面向低延遲私有無線音頻領(lǐng)域;第二個(gè)系列是ATS286X,面向藍(lán)牙AI音頻領(lǐng)域;第三個(gè)系列是ATS362X,面向AI DSP領(lǐng)域。其中ATS323X有望最快在2025年上半年實(shí)現(xiàn)終端產(chǎn)品量產(chǎn)。
芯??萍纪瑯痈SAI技術(shù)的發(fā)展,不斷推出能夠滿足市場需求的產(chǎn)品。在端側(cè)方面,芯??萍加屑闪烁呔?a class="article-link" target="_blank" href="/tag/ADC/">ADC的傳感器信號(hào)調(diào)理芯片、BMS芯片、壓力觸控芯片等??傮w而言,在計(jì)算外圍產(chǎn)品生態(tài)中,芯海科技實(shí)現(xiàn)了從EC到PD、HapticPad、USB HUB、BMS的全方位產(chǎn)品布局,同時(shí)也完成了從AI PC到臺(tái)式機(jī)、工控機(jī)、邊緣計(jì)算及服務(wù)器的全面覆蓋。
Vol.3/? ?如何解決數(shù)據(jù)安全問題?
在端側(cè)AI火熱之時(shí),還存在一個(gè)重要的隱患尚未解決——數(shù)據(jù)安全與隱私保護(hù)。
進(jìn)入信息時(shí)代和智能時(shí)代為人們的生活工作帶來不少便利,但也存在不少副作用,隱私和信息泄露便是其中之一。據(jù)報(bào)道,近期一場規(guī)模巨大的物聯(lián)網(wǎng)(IoT)安全漏洞事件曝光了27億條包含敏感用戶數(shù)據(jù)的信息,其中包括Wi-Fi網(wǎng)絡(luò)名稱、密碼、IP地址和設(shè)備標(biāo)識(shí)符,這存在非常大的數(shù)據(jù)風(fēng)險(xiǎn),有可能被攻擊者利用。據(jù)Palo Alto Networks的威脅報(bào)告,之所以會(huì)發(fā)生這樣的事故,在于98%的物聯(lián)網(wǎng)設(shè)備數(shù)據(jù)未加密,57%的設(shè)備高度脆弱。
隨著邁入AI時(shí)代,原本尚未解決的數(shù)據(jù)安全和隱私保護(hù)問題正變得更加復(fù)雜,這其中涉及第三方大模型,手機(jī)終端廠商、大模型提供者和開發(fā)者等不同商業(yè)主體間的生態(tài)模式及責(zé)任邊界尚不清晰。盡管端側(cè)AI的概念當(dāng)中,數(shù)據(jù)可以在本地設(shè)備處理,經(jīng)過加密之后上傳至云端,無需擔(dān)憂個(gè)人隱私泄露的問題,較云端大模型更加安全。但實(shí)際上,端側(cè)AI并沒有辦法從根本上解決問題。
“從云端到端側(cè),每一個(gè)環(huán)節(jié)都可能成為數(shù)據(jù)泄露的薄弱環(huán)節(jié)。云端雖然擁有強(qiáng)大的數(shù)據(jù)處理能力,但一旦遭受攻擊,海量用戶數(shù)據(jù)將面臨巨大風(fēng)險(xiǎn)。相比之下,端側(cè)AI在數(shù)據(jù)安全方面具有天然優(yōu)勢,但仍需警惕硬件層面的潛在漏洞。”炬芯科技方面向芯師爺坦言。
“主要?dú)w因于第三方App介入時(shí)的隱私保護(hù)邊界模糊、無障礙權(quán)限的濫用、數(shù)據(jù)在端側(cè)云端和第三方AI之間流動(dòng)復(fù)雜等因素。”芯??萍挤矫嬉蚕蛐編煚斨赋觯藗?cè)AI之所以無法再根本上杜絕信息泄露的情況。芯??萍挤矫娣Q,以計(jì)算機(jī)系統(tǒng)為例。計(jì)算機(jī)系統(tǒng)由硬件單元、底層固件、操作系統(tǒng)、應(yīng)用軟件組成,其系統(tǒng)啟動(dòng)流程的每個(gè)環(huán)節(jié),包括“硬件上電啟動(dòng)、底層固件執(zhí)行、硬件配置完成、操作系統(tǒng)加載、應(yīng)用軟件執(zhí)行”等流程,每一步都可能成為被替換攻擊的目標(biāo),進(jìn)而導(dǎo)致本地機(jī)密數(shù)據(jù)泄露。
對(duì)如何解決端云協(xié)同中的交互數(shù)據(jù)安全問題,阿里研究院人工智能治理中心主任傅宏宇曾撰文給出自己的思考,或可作為端側(cè)AI背景下對(duì)數(shù)據(jù)安全保護(hù)的一個(gè)參考。
傅宏宇認(rèn)為,首先需要建設(shè)云側(cè)、端側(cè)等執(zhí)行環(huán)境的安全保障能力,采取協(xié)議承諾、技術(shù)管控等方式讓用戶對(duì)自身數(shù)據(jù)可控可管可審計(jì),為用戶進(jìn)一步使用模型、與模型進(jìn)行數(shù)據(jù)交互奠定信任基礎(chǔ)。
一是要保障用戶數(shù)據(jù)處理環(huán)境的安全一致性。無論是端側(cè)還是云側(cè),用戶-模型交互處理的整體環(huán)境應(yīng)當(dāng)在數(shù)據(jù)安全保障級(jí)別上需要和用戶私域等同,用戶數(shù)據(jù)在各類執(zhí)行環(huán)境中都受到同等的安全保護(hù),例如對(duì)企業(yè)用戶需高度關(guān)注企業(yè)商業(yè)秘密在傳輸、存儲(chǔ)過程中的加密和防攻擊,應(yīng)用處理過程中的權(quán)限限制,對(duì)個(gè)人用戶則要保障對(duì)其個(gè)人數(shù)據(jù)的控制權(quán)和安全性,保證對(duì)數(shù)據(jù)處理的知情同意。
二是要保障用戶對(duì)自身數(shù)據(jù)的高度可控性。嚴(yán)格遵守用戶指令,以用戶授權(quán)為前提,強(qiáng)化權(quán)限保護(hù)、數(shù)據(jù)可控性、可審計(jì)性,責(zé)任可追蹤。通過授權(quán)和密鑰控制,保障用戶數(shù)據(jù)的私密性,對(duì)用戶數(shù)據(jù)管控和濫用防控,讓用戶了解并控制各執(zhí)行環(huán)境中的數(shù)據(jù)使用情況,避免超權(quán)限、超范圍、超目的的數(shù)據(jù)訪問,做到“操作可審計(jì)”。在發(fā)現(xiàn)事故后快速定位問題源頭,區(qū)分是用戶不當(dāng)使用、系統(tǒng)漏洞還是外部攻擊等行為所導(dǎo)致的安全風(fēng)險(xiǎn),做到“責(zé)任可追溯”。
另外,對(duì)于個(gè)人信息和隱私保護(hù),監(jiān)管層也非常關(guān)切,出臺(tái)了不少法律法規(guī),可以在一定程度上約束部分企業(yè)在這方面的小心思。例如,《網(wǎng)絡(luò)安全法》《數(shù)據(jù)安全法》《個(gè)人信息保護(hù)法》明確規(guī)定了處理個(gè)人信息的要求,包括知情同意規(guī)則,最小必要原則等;今年1月1日生效的《網(wǎng)絡(luò)數(shù)據(jù)安全管理?xiàng)l例》進(jìn)一步對(duì)涉及自動(dòng)化工具、生成式人工智能等新興技術(shù)的數(shù)據(jù)處理活動(dòng)作出了特殊規(guī)定。
值得一提的是,除了大模型、APP、手機(jī)廠商等企業(yè)在設(shè)備、應(yīng)用運(yùn)行和數(shù)據(jù)處理過程中可能引發(fā)的數(shù)據(jù)安全問題外,一些非法的黑客攻擊同樣需要各方多加留意。去年12月,歐盟網(wǎng)絡(luò)安全局(ENISA)發(fā)布《2024年聯(lián)盟網(wǎng)絡(luò)安全狀況報(bào)告》,報(bào)告針對(duì)2023年7月至2024年6月期間歐盟的網(wǎng)絡(luò)威脅進(jìn)行了評(píng)估,結(jié)果顯示,歐盟面臨嚴(yán)重的網(wǎng)絡(luò)威脅,遭受的網(wǎng)絡(luò)攻擊明顯升級(jí),攻擊的種類、數(shù)量及后果均創(chuàng)新高。報(bào)告認(rèn)為,未來網(wǎng)絡(luò)攻擊可能對(duì)重要實(shí)體造成嚴(yán)重破壞,尤其是拒絕服務(wù)(DDoS)和勒索軟件攻擊,勒索軟件仍然是歐盟面臨的最主要的威脅形式。
針對(duì)上述情況,2022 年以來歐盟委員會(huì)先后推出《網(wǎng)絡(luò)安全條例》草案、第二版《網(wǎng)絡(luò)與信息安全指令》、歐盟網(wǎng)絡(luò)彈性法案(CRA)、歐盟無線電設(shè)備指令(RED)授權(quán)法案等,旨在促進(jìn)成員國網(wǎng)絡(luò)安全機(jī)制間的互聯(lián)互通,支撐歐洲更多行業(yè)部門的基礎(chǔ)設(shè)施應(yīng)對(duì)快速變化和大規(guī)模的網(wǎng)絡(luò)攻擊安全威脅。
也就是說,芯片等硬件企業(yè)無法缺席這場對(duì)數(shù)據(jù)安全的保衛(wèi)戰(zhàn)。
“數(shù)據(jù)安全是一場沒有硝煙的戰(zhàn)爭,需要時(shí)刻保持警惕,不斷創(chuàng)新。”炬芯科技方面向芯師爺表示,炬芯科技致力于通過前沿的芯片安全技術(shù),如芯片安全信任根技術(shù)、高級(jí)加密標(biāo)準(zhǔn)(AES)等,為數(shù)據(jù)安全筑起銅墻鐵壁。同時(shí),積極擁抱PSA(Platform Security Architecture)認(rèn)證體系,以國際認(rèn)可的安全標(biāo)準(zhǔn),不斷提升產(chǎn)品的安全性能。
芯海科技也稱,目前,“公司在數(shù)據(jù)安全保護(hù)方面采取的措施涵蓋了數(shù)據(jù)加密、訪問控制、安全審計(jì)、硬件架構(gòu)設(shè)計(jì)和故障恢復(fù)機(jī)制等多個(gè)方面,為端側(cè)AI的數(shù)據(jù)安全提供了有力的保障。”據(jù)了解,芯海科技在2024年推出的 CSCE2102 芯片(簡稱:E2102)便在固件安全方面做出了顯著的創(chuàng)新提升。
Vol.4/? ?結(jié)語
在智能時(shí)代和AI時(shí)代,數(shù)據(jù)安全從來不是單個(gè)企業(yè)或單個(gè)組織能夠完成的事業(yè),這需要從技術(shù)、法律、生態(tài)和用戶等多個(gè)維度構(gòu)建堅(jiān)固的數(shù)據(jù)安全防線,才從根本上降低端側(cè)AI的數(shù)據(jù)泄露風(fēng)險(xiǎn)。
雖然,在過去的十?dāng)?shù)年間,數(shù)據(jù)安全的城墻并未完滿砌成,個(gè)人隱私和數(shù)據(jù)泄露案例頻發(fā),但并不意味著這項(xiàng)事業(yè)在后續(xù)的AI時(shí)代可以懈怠。事實(shí)上,只有在這片安全的土地上,AI的花朵才能綻放得更加絢爛,人類的智慧才能在數(shù)字的天空中自由翱翔。
參考資料:
第一財(cái)經(jīng):《越聰明,越開放,越危險(xiǎn)!如何讓個(gè)人隱私不“裸奔”?》
21世紀(jì)經(jīng)濟(jì)報(bào)道:《當(dāng)deepseek們走向端側(cè) 用戶數(shù)據(jù)安全成必答題丨端側(cè)AI戰(zhàn)事》