近日,英國半導體科技公司 XMOS 宣布推出 Xcore.ai ,它是一款面向 AIoT 市場的超強性能跨界處理器,該處理器可在單個設備中提供高性能 AI,DSP,控制和 IO,價格從 1 美元起。旨在用于端點設備中的實時 AI 推理和決策,還擁有很強的信號處理,控制和通信功能,使電子制造商能夠以最低成本將高性能處理器集成到他們的產(chǎn)品中。
實際上,這已經(jīng)是 Xcore.ai 架構(gòu)的第三代產(chǎn)品了,第一代體系結(jié)構(gòu)實現(xiàn)了跨不同 I / O 協(xié)議之間的“數(shù)百種”應用程序,而第二代體系結(jié)構(gòu)通過添加雙流水線設計來增強芯片的控制和數(shù)字信號處理性能,最典型的就是其 XVF3510 語音處理器,實現(xiàn)了很牛 X 的遠場語音識別能力。最新的 Xcore.ai 是一種交叉芯片,旨在在單個設備中提供高性能 AI,數(shù)字信號處理,控制和輸入 / 輸出,價格從 1 美元起。
接下來我們看看,Xcore.ai 究竟有多么牛逼的性能!
?
Xcore 基于排列在帶有內(nèi)存,ALU 和向量單元的圖塊中的邏輯核心
Xcore.ai 芯片可提供 3200 MIPS,51.2 GMACC 和 1600 MFLOPS。它具有 1 MB 的 SRAM 以及一個用于擴展的低功耗 DDR 接口。
與 Cortex-M7 設備相比,以相似的工作頻率運行,但是,XMOS 將其 AI 處理性能提高了 32 倍,DSP 性能提高了 15 倍。大家說說,與前幾天 arm 發(fā)布的 M55 內(nèi)核哪個更牛逼?
Arm 宣布推出 Cortex-M55 核心和 Ethos-U55 microNPU,瞄準低功耗 Edge AI
Xcore.ai 基于 XMOS 的專有 Xcore 架構(gòu)。Xcore 本身建立在稱為邏輯核心的構(gòu)建塊上,可用于 I / O,DSP,控制功能或 AI 加速。每個圖塊上有八個邏輯核心,每個 Xcore.ai 芯片中都有兩個圖塊,設計人員可以選擇為每個功能分配多少個核心。每個圖塊還包含內(nèi)存,ALU 和邏輯內(nèi)核共享訪問權(quán)限的向量單元。
Xcore 是多核的,通過將不同功能(I / O,DSP,控制,AI)映射到固件中的邏輯內(nèi)核,可以創(chuàng)建完全由軟件編寫的“虛擬 SoC”。因此我們可以為應用程序的特定部分提供特定的資源。在下面的示例中,一個內(nèi)核正在執(zhí)行驅(qū)動以及采集信號的任務,例如 I2S,I2C 和 LED 驅(qū)動器應用;一些內(nèi)核正在處理神經(jīng)網(wǎng)絡,而其他內(nèi)核則在執(zhí)行其它任務。這些都可以在軟件中定義實際的需求速度,所有可以做到速度非常快,以適應物聯(lián)網(wǎng)設備的瞬態(tài)需求。
可編程性:
1、完全可在“ C”中進行編程,具有特定的功能,例如可通過優(yōu)化的 c 庫訪問 DSP 和機器學習。
2、支持 FreeRTOS 實時操作系統(tǒng),使開發(fā)人員能夠使用各種熟悉的開源庫組件。
3、TensorFlow Lite 到 xcore.ai 轉(zhuǎn)換器,可輕松進行神經(jīng)網(wǎng)絡模型的原型設計和部署。
連接性:
1、多達 128 個靈活的 IO 引腳(可通過軟件編程)可訪問各種接口和外圍設備,ns 級別響應速度,可根據(jù)應用的確切需求進行定制。
2、集成的硬件 USB 2.0 PHY 和 MIPI 接口,用于收集和處理來自各種傳感器的數(shù)據(jù)。
神經(jīng)網(wǎng)絡:
1、使用深度神經(jīng)網(wǎng)絡使用二進制值進行激活和權(quán)重,而不是全精度值,從而大大減少了執(zhí)行時間。
2、通過使用 Binary Neural Networks,xcore.ai 的效率比 8 位同類產(chǎn)品高 2.6 倍至 4 倍。
亮點:
1、Xcore.ai 結(jié)合了 DSP 和機器學習功能以及標量,浮點和定點以及矢量指令,以提供有效的控制。
2、16 個實時邏輯內(nèi)核,支持標量 / 浮點 / 矢量指令,可根據(jù)應用實現(xiàn)靈活性和可擴展性。
3、具有納秒級延遲的靈活 IO 端口,確??鐟贸绦虻臅r間要求嚴格的響應。
4、支持 8 位和二值化神經(jīng)網(wǎng)絡推斷(以及 16 位 / 32 位),提供設備上的智能。
5、復雜的多模式數(shù)據(jù)捕獲和處理,可跨分類,音頻接口,存在檢測,語音接口,通信和控制,啟動進行并發(fā)的設備上應用程序。
6、用于數(shù)字信號處理,機器學習和加密功能的高性能指令集。
7、針對 TensorFlow Lite 的微控制器模型的設備上推斷,提供了熟悉的開發(fā)環(huán)境。
從最近發(fā)布的這些超強性能的處理器來看,未來在本地端進行 AI 處理,機器學習將變得非常重要,強大的本地處理能力可以有效的解決很多云端處理的痛點,比如穩(wěn)定的連接性,隱私以及延遲。在發(fā)布這些牛逼芯片的同時,對我們工程師來說,很重要的一點就是易用性,有了這一點,我們可以很快速的掌握芯片的基本使用,使嵌入式軟件工程師能夠在單個多核交叉處理器上部署各種不同類型的處理工作。
未來,更多公司肯定會加重 AI 芯片的研發(fā),低成本,高性能,快速上手開發(fā)將是我們選擇芯片最主要考慮的因素,到 2025 年,人工智能芯片市場預計將達到 911.8 億美元,有了這些強大的 AI 芯片,未來的產(chǎn)品的將有無限的想象空間,人們的生活也會因此變得更加智能,更加安全,更加幸福!
?