• 正文
    • 天河星逸通用算力提升了5倍
    • 國(guó)產(chǎn)E級(jí)超算神威·海洋之光
  • 推薦器件
  • 相關(guān)推薦
申請(qǐng)入駐 產(chǎn)業(yè)圖譜

國(guó)產(chǎn)新一代超算“天河星逸”發(fā)布:1597.44萬(wàn)核心,峰值性能達(dá)620PFLOPS?

2023/12/19
2744
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點(diǎn)資訊討論

12月17日消息,據(jù)金羊網(wǎng)報(bào)道,本月6日,以“超智融合,算啟新篇”為主題的2023年超算創(chuàng)新應(yīng)用大會(huì)在廣州盛大召開(kāi)。在此次大會(huì)上,國(guó)家超算廣州中心正式發(fā)布了中心的新一代國(guó)產(chǎn)超級(jí)計(jì)算系統(tǒng)——“天河星逸”。

據(jù)國(guó)家超算廣州中心主任盧宇彤介紹,“天河星逸”以應(yīng)用為中心,采用國(guó)產(chǎn)先進(jìn)計(jì)算架構(gòu)、高性能多核處理器、高速互連網(wǎng)絡(luò)、大規(guī)模存儲(chǔ)等關(guān)鍵技術(shù)構(gòu)建,在通用CPU計(jì)算能力、網(wǎng)絡(luò)能力、存儲(chǔ)能力以及應(yīng)用服務(wù)能力等多方面較“天河二號(hào)”實(shí)現(xiàn)倍增,支持高性能計(jì)算、AI大模型訓(xùn)練以及大數(shù)據(jù)分析等多種應(yīng)用場(chǎng)景的需求,將進(jìn)一步提升國(guó)家超算廣州中心的多領(lǐng)域應(yīng)用服務(wù)能力,為廣州市、廣東省和粵港澳大灣區(qū)的前沿科技突破、戰(zhàn)略工程建設(shè)、產(chǎn)業(yè)升級(jí)轉(zhuǎn)型提供強(qiáng)勁的高端算力與平臺(tái)支撐,有力提升廣州市作為國(guó)家中心城市和綜合性門(mén)戶(hù)城市的核心科技創(chuàng)新實(shí)力,支持區(qū)域科技經(jīng)濟(jì)社會(huì)高質(zhì)量發(fā)展。

國(guó)家超算廣州中心副主任陳志廣表示,“天河星逸”采用了最先進(jìn)的超算技術(shù),相比原有系統(tǒng),在通用算力上提升了5倍,并且強(qiáng)調(diào)了應(yīng)用能力的提升,應(yīng)用軟件存在進(jìn)一步發(fā)展的空間。超算互聯(lián)網(wǎng)最終目標(biāo)是實(shí)現(xiàn)全國(guó)聯(lián)網(wǎng),下一步計(jì)劃與深圳超算、無(wú)錫超算實(shí)現(xiàn)聯(lián)網(wǎng)。

天河星逸通用算力提升了5倍

資料顯示,“天河二號(hào)”部署在國(guó)家超算廣州中心,它使用了Intel Xeon E5-2692 12核處理器及Xeon Phi 31S1P加速卡,總計(jì)擁有312萬(wàn)個(gè)核心,整機(jī)功率也達(dá)到了17808千瓦,理論性能是54.9PFLOPS(5.49億億次),Linpack峰值性能33.86PTFLOPS,從2013年6月份到2016年6月份它的性能都沒(méi)有變化,連任了六次TOP500冠軍。

天河二號(hào)原本有后期升級(jí)計(jì)劃,但是2015年美國(guó)政府頒布禁令,嚴(yán)禁Intel等公司向中國(guó)四家超算中心出口高性能計(jì)算芯片,這樣使用Intel Xeon Phi加速卡的天河二號(hào)就不能再使用美國(guó)公司的高性能芯片了。

2017年9月份,廣州超算中心宣布2017年底前升級(jí)天河二號(hào)超算系統(tǒng),使用國(guó)產(chǎn)加速器Matrix 2000取代原本的Intel Xeon Phi加速器。據(jù)了解,Matrix 2000的整數(shù)架構(gòu)應(yīng)該是ARM,但是矢量單元是國(guó)內(nèi)自定義的256bit VFU矢量單元。每個(gè)Matrix 2000由128個(gè)內(nèi)核組成,頻率為1.2GHz,每周期能執(zhí)行16個(gè)雙精度運(yùn)算,處理器峰值性能為2.45TFLOPS。升級(jí)后的天河二號(hào)被稱(chēng)為天河2A,峰值性能從之前的54.9PFLOPS提升到了100PFLOPS左右。

按照官方的說(shuō)法,“天河星逸”的通用性能相比原有系統(tǒng)(升級(jí)后的“天河二號(hào)”,即天河2A),在通用算力上提升了5倍,也就是說(shuō),“天河星逸”的峰值算力應(yīng)該達(dá)到了約600 PFlop/s(每秒50億億次)。

值得注意的是,在今年11月10日在北京召開(kāi)的“ChinaSC2023第五屆中國(guó)超級(jí)算力大會(huì)”上,發(fā)布了2023中國(guó)高性能計(jì)算機(jī)性能TOP100排行榜,其中就披露了排名第一的于2023年在超算中心安裝的“超算中心主機(jī)系統(tǒng)異構(gòu)眾核處理器”性能參數(shù),其CPU核數(shù)達(dá)到15974400核,峰值性能達(dá)620PFLOPS,超過(guò)了神威·太湖之光。顯然,這個(gè)數(shù)據(jù)符合前面關(guān)于“天河星逸”算力的說(shuō)法。

今年8月12日,國(guó)防科技大學(xué)公布的《國(guó)產(chǎn)天河新一代超級(jí)計(jì)算機(jī)智能計(jì)算節(jié)點(diǎn)機(jī)時(shí)服務(wù)單一來(lái)源談判公告(2023-YKJSJY-F5027)》顯示,“擬采購(gòu)國(guó)產(chǎn)天河新一代超級(jí)計(jì)算機(jī)智能計(jì)算節(jié)點(diǎn)36萬(wàn)節(jié)點(diǎn)小時(shí)的機(jī)時(shí)服務(wù),用于測(cè)試驗(yàn)證動(dòng)態(tài)風(fēng)場(chǎng)計(jì)算軟件的功能和性能。擬合作供應(yīng)商:國(guó)家超級(jí)計(jì)算天津中心?!?/p>

對(duì)于選擇國(guó)家超級(jí)計(jì)算天津中心為單一供應(yīng)商的理由為:“因項(xiàng)目需要在具備MT3000處理器的國(guó)產(chǎn)高性能計(jì)算系統(tǒng)上測(cè)試驗(yàn)證動(dòng)態(tài)風(fēng)場(chǎng)計(jì)算軟件環(huán)境,需采購(gòu)36萬(wàn)節(jié)點(diǎn)小時(shí)的國(guó)產(chǎn)高性能計(jì)算系統(tǒng)機(jī)時(shí)服務(wù)。天津超算主機(jī)系統(tǒng)是天河一號(hào)系統(tǒng)(TH-1A)和天河新一代系統(tǒng)(含E級(jí)驗(yàn)證系統(tǒng))。其中,天河新一代系統(tǒng)具備基于MT3000處理器的計(jì)算節(jié)點(diǎn),能夠滿(mǎn)足項(xiàng)目需求,且目前國(guó)內(nèi)僅有天津超算能提供基于MT3000處理器的國(guó)產(chǎn)高性能計(jì)算環(huán)境。因此,本次采購(gòu)擬采用單一來(lái)源的方式進(jìn)行?!?/p>

2018年7月,新華社曾報(bào)道稱(chēng),由天津超算中心研發(fā)的“國(guó)產(chǎn)新一代百億億次超級(jí)計(jì)算機(jī)——“天河三號(hào)”E級(jí)原型機(jī)完成研制部署,并順利通過(guò)分項(xiàng)驗(yàn)收。該原型機(jī)系統(tǒng)采用了三種國(guó)產(chǎn)自主高性能計(jì)算和通信芯片?!彪S后在2019年,進(jìn)一步的報(bào)道顯示,“我國(guó)百億億次超算‘天河三號(hào)’原型機(jī)已為30余家單位完成大規(guī)模并行應(yīng)用測(cè)試并逐步開(kāi)放服務(wù)”。

結(jié)合上述信息來(lái)看,傳聞中的具備E級(jí)算力的“天河三號(hào)”采用的正是國(guó)產(chǎn)的MT3000處理器。而此次廣州超算中心發(fā)布的“天河星逸”很可能也是基于MT3000處理器,當(dāng)然也有可能是基于傳聞的Matrix 2000+。目前尚未有關(guān)于MT3000處理器的更進(jìn)一步信息,不過(guò)可以肯定的是,其性能相比上一代的MT2000將會(huì)帶來(lái)大幅的提升。

國(guó)產(chǎn)E級(jí)超算神威·海洋之光

另外,值得一提的是,相比天河2A性能更為強(qiáng)大的“神威·太湖之光”超級(jí)計(jì)算機(jī)系統(tǒng),采用了40960個(gè)中國(guó)自主研發(fā)的“申威26010”眾核處理器,該眾核處理器采用64位自主申威指令系統(tǒng),核心工作頻率1.45GHz,峰值性能3.168萬(wàn)億次每秒。神威·太湖之光里安裝有40960個(gè)這樣的處理器,整體的峰值性能可達(dá)12.5億億次/秒,持續(xù)性能為9.3億億次/秒。

而傳聞中的新一代神威超算——神威·海洋之光(Sunway Oceanlite)將采用全新的申威 SW26010-Pro 處理器,預(yù)計(jì)將帶來(lái)更為強(qiáng)大的性能。

在今年11月召開(kāi)的SC23 (International Conference for High Performance Computing, Networking, Storage, and Analysis,是高性能計(jì)算、體系結(jié)構(gòu)領(lǐng)域頂級(jí)會(huì)議)大會(huì)上,我國(guó)科學(xué)家向世界展示了全新的申威 SW26010-Pro 處理器,性能比上一代提高了四倍。這是我國(guó)采用自主指令集(基于 Alpha 進(jìn)行擴(kuò)展),具有完全自主知識(shí)產(chǎn)權(quán)的處理器系列產(chǎn)品。

根據(jù)PPT資料顯示,SW26010 pro是SW26010改進(jìn)型,擁有6個(gè)核心模塊和 1 個(gè)協(xié)議處理單元(PPU)構(gòu)成,每個(gè)模塊有1個(gè)管理Linux線程的核心(MPE)和64個(gè)計(jì)算核心,總計(jì)384 個(gè)內(nèi)核,相比之下上一代的SW26010 只有 4 個(gè)核心組,說(shuō)明SW26010 pro單芯片應(yīng)該有50%的性能提升。

SW26010 Pro處理器的64個(gè)(8×8)計(jì)算核心網(wǎng)絡(luò)是一個(gè)具有256KB L2高速緩存的計(jì)算處理單元(CPE)。每個(gè)CPE有四個(gè)邏輯塊,可以在一對(duì)上支持FP64和FP32,在另一對(duì)上則可以支持FP16和BF16。

SW26010 Pro中的每個(gè)核心模塊上都有一個(gè)DDR4-3200內(nèi)存控制器和16 GB內(nèi)存,內(nèi)存帶寬為51.4 GB/秒,因此整個(gè)處理器有96 GB主內(nèi)存(相比 SW26010 的 32 GB 實(shí)現(xiàn)了顯著提升)和307.2 GB/s帶寬。六個(gè)CPE通過(guò)環(huán)形互連連接,并有兩個(gè)網(wǎng)絡(luò)接口,使用專(zhuān)有互連將它們連接到外部。SW26010 Pro芯片的FP64或FP32精度為14.03 PB,BF16或FP16精度為55.3 PB。

另外,SW26010 Pro的MPE內(nèi)核運(yùn)行在2.1 GHz(前代產(chǎn)品僅 1.45 GHz),CPW內(nèi)核運(yùn)行在2.25 GHz,再加上全新 64 位 RISC 微架構(gòu)和系統(tǒng)架構(gòu)的改進(jìn),其 FP64 計(jì)算吞吐量也增加了四倍以上。

據(jù)介紹,神威·海洋之光最大的配置超過(guò)100000個(gè)節(jié)點(diǎn),共有超過(guò)4100萬(wàn)個(gè)核心,分布在大約105個(gè)機(jī)柜中,峰值半精度(FP16)性能超過(guò)5 Exaflop/s,F(xiàn)P64的理論峰值性能為1.5 exaflops,僅次于美國(guó)Frontier超級(jí)計(jì)算機(jī)。

據(jù)The next platform此前報(bào)道稱(chēng),如果將神威·海洋之光的規(guī)模擴(kuò)大到120個(gè)機(jī)柜,在FP64 pervision下的峰值將達(dá)到1.72 Exaflops,這將超過(guò)美國(guó)橡樹(shù)嶺國(guó)家實(shí)驗(yàn)室的1.68 Exaflops的“Frontier”超級(jí)計(jì)算機(jī)。在160個(gè)機(jī)柜的條件下,在FP64的峰值性能將接近2.3 Exaflops,將有望擊敗已經(jīng)安裝完成的美國(guó)能源部阿貢國(guó)家實(shí)驗(yàn)室的基于英特爾CPU及GPU的新一代超級(jí)計(jì)算機(jī)“Aurora”,以及正在建設(shè)的美國(guó)勞倫斯·利弗莫爾國(guó)家實(shí)驗(yàn)室基于AMD MI300芯片的“El Capitan”超級(jí)計(jì)算機(jī),后兩者的FP64性能都將達(dá)到 2 Exaflops以上。

編輯:芯智訊-浪客劍

推薦器件

更多器件
器件型號(hào) 數(shù)量 器件廠商 器件描述 數(shù)據(jù)手冊(cè) ECAD模型 風(fēng)險(xiǎn)等級(jí) 參考價(jià)格 更多信息
KSZ8863RLL 1 Microchip Technology Inc DATACOM, LAN SWITCHING CIRCUIT, PQFP48

ECAD模型

下載ECAD模型
$4.82 查看
KSZ8081MNXIA-TR 1 Microchip Technology Inc DATACOM, ETHERNET TRANSCEIVER, QCC32

ECAD模型

下載ECAD模型
$1.71 查看
RTL8211E-VB-CG 1 Realtek Semiconductor Ethernet Transceiver
$8.5 查看

相關(guān)推薦

登錄即可解鎖
  • 海量技術(shù)文章
  • 設(shè)計(jì)資源下載
  • 產(chǎn)業(yè)鏈客戶(hù)資源
  • 寫(xiě)文章/發(fā)需求
立即登錄