作者:暢秋
最近,中國(guó)本土服務(wù)器芯片出現(xiàn)兩大亮點(diǎn):首先,RISC-V又進(jìn)一步,特別是以山東大學(xué)部署的采用 RISC-V CPU的服務(wù)器為代表,十分引人關(guān)注;其次,基于自研架構(gòu)的高性能芯片繼續(xù)取得本土客戶的認(rèn)可,凸出代表就是華為和龍芯自研的CPU,特別是華為的服務(wù)器芯片,市場(chǎng)接受度進(jìn)一步提升。
?01中國(guó)RISC-V芯片和系統(tǒng)進(jìn)展
RISC-V指令集架構(gòu)是免費(fèi)、開(kāi)源的,提供了一種更快、更便宜的芯片設(shè)計(jì)方案,而且,RISC-V的結(jié)構(gòu)使其非常適用于處理各種應(yīng)用和復(fù)雜計(jì)算需求的云原生環(huán)境。近些年,RISC-V對(duì)英特爾和AMD使用的x86架構(gòu),以及亞馬遜、蘋(píng)果、三星和高通等公司使用的Arm架構(gòu)的威脅越來(lái)越大,雖然短期內(nèi)還無(wú)法實(shí)現(xiàn)替代,但長(zhǎng)期發(fā)展前景非常好。也正是因?yàn)槿绱?,?guó)內(nèi)外多家廠商和科研機(jī)構(gòu)都在RISC-V技術(shù)和產(chǎn)品研發(fā)方面加大投入。
在中國(guó)大陸市場(chǎng),還存在減少對(duì)西方芯片技術(shù)依賴的問(wèn)題,在此情況下,RISC-V的優(yōu)勢(shì)就更凸出了。
10月,山東大學(xué)部署了一個(gè)采用 RISC-V CPU 的服務(wù)器集群,該系統(tǒng)共有3072個(gè)核,有48個(gè)64位RISC-V CPU節(jié)點(diǎn)。阿里巴巴生態(tài)系統(tǒng)總監(jiān)陳大偉在加利福尼亞州圣克拉拉舉行的 RISC-V 峰會(huì)上發(fā)表演講時(shí)表示,這是 RISC-V 集群在云端的首次部署,目前,該系統(tǒng)主要用于山東大學(xué)的教學(xué)和科研項(xiàng)目,部分功能也可用于商用云計(jì)算。
據(jù)悉,山東大學(xué)的RISC-V系統(tǒng)采用了Sophgo的SG2042芯片,該芯片主頻為2GHz,緩存為64MB。系統(tǒng)支持 PCIe Gen 4 接口。今年早些時(shí)候,Sophgo發(fā)布了RISC-V芯片,阿里巴巴與該公司合作將Linux操作系統(tǒng)引入該服務(wù)器集群。不過(guò),目前的RISC-V軟件生態(tài)系統(tǒng)還比較弱,需要時(shí)間去培育。
目前,中國(guó)已經(jīng)實(shí)現(xiàn)流片的RISC-V芯片主要采用110nm和28nm制程工藝,但相關(guān)產(chǎn)品和系統(tǒng)僅用于科學(xué)研究,未完全達(dá)到商用水平。
今年,中國(guó)科技部資助了多個(gè)RISC-V芯片的研發(fā)工作,許多大學(xué)和科研院所都開(kāi)始專(zhuān)注于RISC-V芯片開(kāi)發(fā)。
中國(guó)科學(xué)院 (CAS) 正在與阿里巴巴、騰訊和中興通訊等中國(guó)本土頂尖企業(yè)合作開(kāi)發(fā)名為“香山-v3”的RISC-V 芯片,同時(shí),相關(guān)的新型操作系統(tǒng)也在開(kāi)發(fā)過(guò)程中。CAS希望該芯片的性能能與Arm于2021年發(fā)布的Neoverse-N2服務(wù)器 CPU相當(dāng)。據(jù)悉,中國(guó)相關(guān)企業(yè)和科研機(jī)構(gòu)正在開(kāi)發(fā)專(zhuān)門(mén)用于RISC-V芯片設(shè)計(jì)的開(kāi)源EDA工具。
經(jīng)過(guò)這些年的推廣和積累,中國(guó)相關(guān)企業(yè)和科研機(jī)構(gòu)已經(jīng)成為全球RISC-V芯片和解決方案的主要貢獻(xiàn)者。2022年,全球生產(chǎn)了100億顆RISC-V芯片,其中,一半在中國(guó)制造。
?02國(guó)際廠商在RISC-V方面的進(jìn)展
十年前,當(dāng)RISC-V問(wèn)世后,迅速獲得了包括蘋(píng)果公司在內(nèi)的國(guó)際芯片大廠的支持,最近幾年,英特爾也很看好RISC-V的發(fā)展前景,并加大了投入。
如前文所述,RISC-V的軟件生態(tài)系統(tǒng)比較弱,針對(duì)于此,英特爾的Codeplay軟件部門(mén)發(fā)布了OneAPI套件,其中包括供開(kāi)發(fā)人員在x86 PC上的模擬RISC-V環(huán)境中測(cè)試代碼的工具。該套件的標(biāo)志性功能是支持SYCL,它允許編碼人員在不同的硬件架構(gòu)上編譯應(yīng)用程序。該套件包括對(duì)英特爾 DPC++/C++編譯器的支持,允許重新編譯C++代碼,可以跨多個(gè)硬件架構(gòu)使用。
如果沒(méi)有硬件和軟件協(xié)同設(shè)計(jì)的架構(gòu),編碼人員就會(huì)習(xí)慣性地使用x86和Arm系統(tǒng)。對(duì)此,英特爾的做法是:在芯片發(fā)布之前就提供Linux驅(qū)動(dòng)程序,以確保硬件與最新版本的操作系統(tǒng)兼容。
開(kāi)發(fā)人員還可以在類(lèi)似Raspberry Pi的開(kāi)發(fā)板或Milk-V、StarFive等公司的系統(tǒng)上測(cè)試 RISC-V代碼,這兩家公司都提供支持Linux的64位RISC-V系統(tǒng)。
目前來(lái)看,一些RISC-V軟件包(如 Pytorch、GCC、TensorFlow和OpenJDK)可以正常工作,但尚未完全得到支持,近些年,對(duì)LibreOffice和Firefox等開(kāi)源應(yīng)用程序的支持正在建立過(guò)程中。廠商方面,谷歌正在加速對(duì)RISC-V上的AOSP(Android開(kāi)源項(xiàng)目)的支持,這將是下一個(gè)架構(gòu)規(guī)范的重要組成部分。
RISC-V服務(wù)器芯片制造商Esperanto Technologies和Ventana Micro Systems已經(jīng)推出了用于云計(jì)算的芯片,其中,Esperanto 已將 Meta 的 Open Pre-Trained Transformer 模型移植到其RISC-V服務(wù)器上。不過(guò),總體來(lái)看,這兩家公司涉及軟件支持和編程模型的產(chǎn)品和服務(wù)并不多。
負(fù)責(zé)開(kāi)發(fā)和推進(jìn)RISC-V標(biāo)準(zhǔn)的 RISC-V International正在研發(fā)架構(gòu)規(guī)范,試圖通過(guò)建立RISC-V軟件生態(tài)系統(tǒng)(稱為RISE),為RISC-V系統(tǒng)創(chuàng)建底層軟件工具和中間件,該項(xiàng)目的支持者包括谷歌、英特爾、英偉達(dá)、高通、三星和 Ventana 等公司。
在歐洲,英特爾正在與巴塞羅那超級(jí)計(jì)算中心(BSC)合作,為超級(jí)計(jì)算機(jī)制造RISC-V芯片。BSC希望高性能RISC-V處理器能盡早商用,他們希望利用Chiplet(小芯片)技術(shù),將RISC-V內(nèi)核整合到Chiplet架構(gòu)中,這正是英特爾的強(qiáng)項(xiàng),未來(lái),英特爾將會(huì)制造越來(lái)越多的Chiplet架構(gòu)芯片,以增加設(shè)計(jì)靈活性,因?yàn)樗軐PU、GPU、I/O、內(nèi)存、電源管理和其它電路功能放入同一個(gè)封裝中。如果能將RISC-V與內(nèi)存通過(guò)Chiplet架構(gòu)封裝在一起,則可以降低眼下的內(nèi)存帶寬瓶頸,從而拓寬RISC-V在機(jī)器學(xué)習(xí)應(yīng)用領(lǐng)域的發(fā)展道路。
最近,Meta也推出了一款基于RISC-V架構(gòu)的AI推理芯片。
由于中國(guó)已經(jīng)是全球RISC-V產(chǎn)業(yè)的重要組成部分,因此,國(guó)際產(chǎn)業(yè)界一直在呼吁加強(qiáng)與中國(guó)的合作。RISC-V International首席執(zhí)行官Calista Redmond表示:“健康的合作和競(jìng)爭(zhēng)可以推動(dòng)最先進(jìn)技術(shù)向前發(fā)展。我想強(qiáng)調(diào)一點(diǎn),正確的全球標(biāo)準(zhǔn)支撐著我們?cè)跉v史進(jìn)程中所見(jiàn)過(guò)的最重要的技術(shù),無(wú)論是USB還是以太網(wǎng),以及HTTPS等網(wǎng)絡(luò)協(xié)議。這些東西可以創(chuàng)造公平的競(jìng)爭(zhēng)環(huán)境,讓我們能夠創(chuàng)新?!?/p>
業(yè)界普遍反對(duì)政府對(duì)RISC-V開(kāi)發(fā)與合作的限制和干擾,美國(guó)業(yè)界人士表示:“任何限制都只會(huì)減少美國(guó)對(duì)一項(xiàng)重要新興技術(shù)的參與,同時(shí)鞏固Arm作為現(xiàn)有嵌入式CPU壟斷供應(yīng)商的地位。”
?03RISC-V距離規(guī)模商用依然較遠(yuǎn)
目前來(lái)看,RISC-V處理器在高性能計(jì)算領(lǐng)域的應(yīng)用和研究依然處于探索階段。軟件生態(tài)系統(tǒng)、芯片、電路板和系統(tǒng)的可靠性問(wèn)題并沒(méi)有解決。除了技術(shù),商業(yè)問(wèn)題也很凸出。
目前,RISC-V處理器僅能滿足嵌入式應(yīng)用場(chǎng)景,對(duì)于高性能服務(wù)器來(lái)說(shuō),還無(wú)法承擔(dān)那樣的性能負(fù)荷,不要說(shuō)服務(wù)器,就目前而言,RISC-V還不能滿足PC的應(yīng)用要求。
就目前的發(fā)展階段和性能來(lái)看,RISC-V并不適合做高性能CPU。RISC-V標(biāo)準(zhǔn)指令集非常精簡(jiǎn),32位基礎(chǔ)指令是47條,64位基礎(chǔ)指令是15條,基礎(chǔ)指令共62條,加上并入標(biāo)準(zhǔn)的擴(kuò)展指令,總數(shù)在300條左右,而Arm的指令數(shù)超過(guò)2000條,x86則更多。由于RISC-V的功能比較簡(jiǎn)單,用RISC-V和龍芯實(shí)現(xiàn)同樣的功能(GCC編譯器),RISC-V會(huì)比龍芯多用20%的指令。
雖然RISC-V允許拓展指令集,但這并不能解決一切問(wèn)題,因?yàn)檐浖鷳B(tài)系統(tǒng)支持不足的話,單靠拓展指令集是遠(yuǎn)遠(yuǎn)不夠的,因?yàn)樯碳易约和卣沟牟皇荝ISC-V標(biāo)準(zhǔn)指令集,很容易產(chǎn)生碎片化問(wèn)題,缺乏統(tǒng)一性的話,軟件生態(tài)系統(tǒng)建設(shè)就會(huì)缺乏錨點(diǎn),很難讓一套軟件生態(tài)滿足所有拓展出的RISC-V指令要求。
?04中國(guó)本土CPU新勢(shì)力崛起
除了RISC-V處理器,近期,中國(guó)本土其它架構(gòu)高性能計(jì)算產(chǎn)品也在不斷突破應(yīng)用極限,華為、龍芯等都有好消息傳出。
2022年底,英偉達(dá)的高性能GPU芯片H100(全球人工智能應(yīng)用系統(tǒng)的首選處理器)被禁止銷(xiāo)往中國(guó)大陸,那之后,中國(guó)本土企業(yè)只能購(gòu)買(mǎi)降低了內(nèi)存帶寬的版本,也就是H800和A800,但是,近期,這些降速版本的GPU也被禁售了。
在這樣的背景下,華為自研的昇騰910和昇騰310處理器,特別是性能更高的昇騰910,及其最新版本芯片得到了越來(lái)越多中國(guó)本土IT系統(tǒng)設(shè)備和互聯(lián)網(wǎng)大廠的青睞,訂單量持續(xù)提升。這兩款芯片是華為在2018年發(fā)布的,同期還推出了神經(jīng)網(wǎng)絡(luò)計(jì)算架構(gòu)、開(kāi)發(fā)工具包和跨AI的云訓(xùn)練框架。
今年8月,中國(guó)人工智能公司科大訊飛董事長(zhǎng)劉慶峰高度評(píng)價(jià)了華為開(kāi)發(fā)的處理器,將它比作英偉達(dá)的A100。劉慶峰表示,科大訊飛正在與華為合作進(jìn)行硬件開(kāi)發(fā)。當(dāng)然,不止科大訊飛一家,有幾家中國(guó)本土頭部IT和互聯(lián)網(wǎng)大廠都在與華為合作,開(kāi)發(fā)高性能計(jì)算系統(tǒng)。
英偉達(dá)在2020年和2022年分別推出了A100和H100芯片,憑借多年的技術(shù)積累,以及先發(fā)優(yōu)勢(shì),英偉達(dá)占據(jù)了全球AI芯片市場(chǎng)的最大份額,而生成式AI的興起進(jìn)一步鞏固了該公司的行業(yè)地位。在生態(tài)系統(tǒng)方面,華為要想與英偉達(dá)競(jìng)爭(zhēng),最大的劣勢(shì)是人工智能軟件生態(tài),這方面,英偉達(dá)已經(jīng)非常完善了,需要后來(lái)者付出幾倍的努力才有趕超希望。
近些年,華為也在建設(shè)自己的人工智能生態(tài)系統(tǒng),被稱為CANN。不過(guò),據(jù)專(zhuān)家介紹,與英偉達(dá)的生態(tài)系統(tǒng)相比,華為在訓(xùn)練AI模型方面存在局限性,需要補(bǔ)的課還很多。
除了華為,龍芯是另一大看點(diǎn)。
近期,龍芯確認(rèn),將在11月底正式推出處理器3A6000,測(cè)試數(shù)據(jù)顯示,3A6000的SPEC性能達(dá)到了英特爾10代酷睿4核處理器的水準(zhǔn)。
雖然龍芯一直受到質(zhì)疑,但是,其每一代處理器的性能提升確是肉眼可見(jiàn)的。這次,3A6000依然基于該公司自研的LoongArch指令集架構(gòu),工藝制程依舊是12nm,內(nèi)核升級(jí)為L(zhǎng)A664,也就是64位。3A6000為4核處理器,所以擁有4個(gè)LA664核心,支持128位向量處理擴(kuò)展指令(LSX)和256位高級(jí)向量處理擴(kuò)展指令(LASX)。
另外,3A6000的一個(gè)非常大的變化是首次支持同步多線程技術(shù),也就是超線程技術(shù),所以,3A6000實(shí)際為4C8T。頻率依舊是2.5GHz,L3為16MB,支持DDR4-3200內(nèi)存。
龍芯還推出了服務(wù)器CPU芯片3C6000和3D6000,以及具有較高性價(jià)比的桌面級(jí)CPU芯片2K3000,可用于上網(wǎng)本、工控、迷你主機(jī)等。
龍芯也在GPU方面發(fā)力,近期推出了9A1000,對(duì)標(biāo)AMD 的RX 550顯卡,計(jì)劃在2024年第三季度流片。9A1000支持科學(xué)計(jì)算加速和AI加速。
?05結(jié)語(yǔ)
目前,PC和手機(jī)應(yīng)用發(fā)展已經(jīng)達(dá)到瓶頸期,未來(lái)幾年,主要拼存量市場(chǎng),對(duì)增量市場(chǎng)已經(jīng)沒(méi)有什么期待了。因此,在處于成長(zhǎng)階段的中國(guó)大陸半導(dǎo)體市場(chǎng),特別是各個(gè)系統(tǒng)必需的CPU、GPU等處理器,必需要以有巨大增量市場(chǎng)為主要目標(biāo),而高性能計(jì)算和AI的發(fā)展前景非常廣闊。
在這樣的大背景下,中國(guó)本土相關(guān)企業(yè)和科研院所正在加大對(duì)擁有較大發(fā)展?jié)摿Φ募夹g(shù)領(lǐng)域的投入,這其中就包括RISC-V,同時(shí),也不能放下自主處理器架構(gòu)的開(kāi)發(fā),只有兩條腿走路,一條充分與國(guó)際接軌,另一條立足于自主,才能在未來(lái)的競(jìng)爭(zhēng)中擁有更多籌碼。
中國(guó)本土企業(yè)之間,以及與相關(guān)的科研院所,也需要進(jìn)一步加強(qiáng)溝通與合作,這樣可以提升芯片和系統(tǒng)研發(fā)效率。