• 正文
    • 01、Chiplet互聯(lián)標準逐漸統(tǒng)一,芯片研發(fā)流程正在重構(gòu)? ?
    • 02、存算一體引發(fā)計算架構(gòu)變革,將在垂直領(lǐng)域規(guī)模化商用??
    • 03、軟硬融合云計算體系架構(gòu),云上應用全面加速? ??
    • 04、連續(xù)第五年發(fā)布科技趨勢報告,多個趨勢已被市場驗證? ??
  • 相關(guān)推薦
申請入駐 產(chǎn)業(yè)圖譜

達摩院預測后摩爾時代的三駕馬車:芯粒、存算一體與CIPU

2023/01/12
817
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點資訊討論

作者 | 吳優(yōu)? ?編輯 | 包永剛

摩爾定律失效下芯片廠商的一次集體出逃。

1965年的一天,美國仙童半導體公司一位叫戈登·摩爾的工程師應邀撰寫了一篇題為《讓集成電路填滿更多的元件》的文章,對集成電路未來的發(fā)展做出經(jīng)濟性預測,并在《電子學》雜志刊出。這一預言之后逐漸被完善,并影響了此后60多年全球集成電路產(chǎn)業(yè)的發(fā)展,對整個信息技術(shù)產(chǎn)業(yè)都產(chǎn)生深刻影響。用確定的方法對不確定的未來進行預測是人類最樸素的追求,卻也是一件充滿風險與挑戰(zhàn)的事情,那些擁有領(lǐng)先技術(shù)卻在時代發(fā)展洪流中破產(chǎn)倒下的公司,在復盤經(jīng)驗教訓時八成不會少了這一條:對市場趨勢的誤判。剛剛結(jié)束的2022已經(jīng)足夠波譎云詭,2023注定充滿更多不確定性,我們從未像今天這樣渴望精準把握科技發(fā)展趨勢,通過定性的預測抵御未知的風險。1月11日,阿里達摩院發(fā)布2023十大科技趨勢,多模態(tài)預測訓練大模型、Chiplet(芯粒)、存算一體、云原生安全、軟硬融合云計算體系架構(gòu)、端網(wǎng)融合的可預期網(wǎng)絡(luò)、雙引擎智能決策、計算光學成像、大規(guī)模城市數(shù)字孿生、生成式AI位列其中。其中Chiplet、存算一體以及軟硬融合云計算體系架構(gòu)恰好為處于后摩爾時代的算力產(chǎn)業(yè)提供了可供參考的發(fā)展方向。

01、Chiplet互聯(lián)標準逐漸統(tǒng)一,芯片研發(fā)流程正在重構(gòu)? ?

達摩院將Chiplet作為底層突破引起的“范式重置”列為2023十大科技趨勢之一。報告指出,在后摩爾時代,Chiplet可能是突破現(xiàn)有困境最現(xiàn)實的技術(shù)路徑,能夠降低對先進工藝的依賴,實現(xiàn)與先進工藝接近的性能,重構(gòu)芯片研發(fā)流程,從制造到封測,從EDA工具到IP設(shè)計,全方位影響芯片產(chǎn)業(yè)格局。在芯片界,被譯為芯?;蛐⌒酒腃hiplet早已不是新鮮陌生的名詞,可以將其理解為硅片級別的“解構(gòu)-重構(gòu)-復用”。

目前主流的系統(tǒng)級單芯片是將多個負責不同類型計算任務的計算單元,通過光刻的形式制造到同一塊晶圓上,Chiplet則是將傳統(tǒng)的SoC分解為不同的核心,選擇合適的工藝分開制造,再用2.5D、3D先進的封裝技術(shù)封裝,不需要全部都采用先進工藝在同一塊晶圓上進行一體化制造。

不難看出,Chiplet改變了芯片制造流程,芯粒之間的互聯(lián)尤其是2.5D、3D先進封裝帶來的電磁干擾、信號干擾、散熱等諸多復雜物理問題,也在芯片設(shè)計時就需要納入考慮,對EDA工具也提出新需求。正是因為Chiplet技術(shù)能夠?qū)崿F(xiàn)IP模塊復用,又能讓不同的核心采用最適合自己的工藝,因此成為許多芯片廠商在設(shè)計新產(chǎn)品時努力平衡經(jīng)濟與性能的一種系統(tǒng)級的設(shè)計理念。

AMD在2019年發(fā)布的Ryzen3000系列中部署了基于小芯片技術(shù)的Zen2內(nèi)核,憑借高性價比獲得了消費者的認可,AMD在CES 2023展會上最新推出的下一代面向數(shù)據(jù)中心的APU產(chǎn)品Instinct MI300,也采用了Chiplet設(shè)計,擁有13個小芯片。英特爾同樣采用小芯片技術(shù),其Ponte VecchioGPU集成了47個小芯片。而在2021年云棲大會上,阿里平頭哥發(fā)布的倚天710同樣采用了這一技術(shù),其用2.5D封裝技術(shù)集成了600億個晶體管,并實現(xiàn)了能效比的大幅提升。

最讓人印象深刻的,是蘋果去年3月發(fā)布會上將兩塊M1 Max芯片“黏合”而成的M1 Ultra,號稱性能超越英特爾頂級CPU i9 12900K和GPU性能天花板英偉達RTX3090,直接向業(yè)界展示了Chiplet如何實現(xiàn)降本增效。Chiplet早已從實驗室走向產(chǎn)業(yè),不過其此前各家分別自定義接口與協(xié)議,如同混亂的“春秋戰(zhàn)國”。缺少統(tǒng)一的標準,讓Chiplet真正的潛力難以釋放。

2022年3月份,英特爾、AMD、臺積電芯片公司聯(lián)合成立小芯片互連產(chǎn)業(yè)聯(lián)盟,并定制了UCIe 1.0標準,有望解決長期以來Chiplet發(fā)展的最大難題,即實現(xiàn)各家優(yōu)質(zhì)芯片模塊間的互連,標志Chiplet時代真正到來。

半導體設(shè)備公司華封科技創(chuàng)始人王宏波曾這樣看待UCIe標準的意義:Chiplet時代,其實是將PC時代建立生態(tài)體系的邏輯縮小復刻到芯片中,Chiplet作為一個芯片組合,需要靠UCIe標準將不同公司的芯片設(shè)計方便的組合在一個芯片中,通過這種方式建立生態(tài)并推動整個行業(yè)向前發(fā)展。達摩院2023十大科技趨勢項目組成員秦钖告訴雷峰網(wǎng):“同構(gòu)和異構(gòu)的芯粒將長期并存,所有工藝混合使用是所有廠家乃至整個產(chǎn)業(yè)界都應該注意的現(xiàn)象之一。未來企業(yè)需要根據(jù)自身需求對Chiplet技術(shù)做出選擇。”

02、存算一體引發(fā)計算架構(gòu)變革,將在垂直領(lǐng)域規(guī)?;逃??

打破馮·諾依曼架構(gòu)存算分離的局限性,是學界和業(yè)界研究多年的命題。90年代,學界提出名為“存算一體”的概念,希望通過計算單元與存儲單元的融合,實現(xiàn)數(shù)據(jù)存儲的同時直接進行計算,提高運算效率,作為打破馮式架構(gòu)局限性的方法之一。但由于當時受限于應用場景的匱乏,以及摩爾定律的經(jīng)濟性依然適用,架構(gòu)創(chuàng)新對產(chǎn)業(yè)發(fā)展的意義不大,存算一體在過去幾十年研究進展緩慢。直到最近幾年人工智能的普及以及摩爾定律失效,存算一體才真正走進大眾視野。

過去的一年,1月份三星在頂級學術(shù)期刊Nature上發(fā)表了全球首個基于MRAM(磁性隨機存儲器)存內(nèi)計算研究,2月份海力士也發(fā)表了基于GDDR接口的DRAM存內(nèi)計算的最新研究成果,臺積電在ISSCC上合作發(fā)表了六篇關(guān)于存內(nèi)計算存儲器IP的論文。不僅如此,諸如Mythic、Syntiant、知存科技、閃億半導體等初創(chuàng)公司紛紛涌入這一賽道,融資不斷,阿里巴巴達摩院也于2021年12月對外公布了與產(chǎn)業(yè)鏈合作伙伴推出的全球首款基于DRAM的3D鍵合堆疊存算一體芯片,國內(nèi)初創(chuàng)企業(yè)知存計算也于2022年3月份正式量產(chǎn)國際首顆存內(nèi)計算SoC芯片。

存算一體也隨之形成三大主流分支:利用2.5D或3D先進封裝技術(shù)將計算邏輯芯片和存儲器封裝到一起的近存計算;基于傳統(tǒng)存儲介質(zhì),但存儲器內(nèi)置獨立計算單元,可以直接完成計算的存內(nèi)計算;以及基于新型非易失性存儲器技術(shù)做的新型存儲原件,通過更加創(chuàng)新的方式讓計算和存儲同時進行。其中近存計算較為成熟,廣泛用于各類CPU和GPU上,存內(nèi)計算投資熱度較高,新型存儲器依然處于探索期。達摩院對此做出預測:在資本和產(chǎn)業(yè)雙輪驅(qū)動下,基于 SRAM、NOR Flash 等成熟存儲器的存內(nèi)計算將在垂直領(lǐng)域迎來規(guī)?;逃茫∷懔?、低功耗場景有望優(yōu)先迎來產(chǎn)品和生態(tài)的升級迭代,大算力通用計算場景或?qū)⑦M入技術(shù)產(chǎn)品化初期。

需要明確的是,存算一體依然是一種新興技術(shù),測試標準、量產(chǎn)方法、測試方法、計算范式與現(xiàn)有的方式完全不同,距離成為主流技術(shù)還有很長的一段要走?!邦嵏擦笋T諾依曼架構(gòu)的存內(nèi)計算會落地,但可能也只是一種過渡性技術(shù),對于產(chǎn)業(yè)來講,在關(guān)注這些能夠產(chǎn)業(yè)化大規(guī)模應用技術(shù)的同時,也要關(guān)注未來十年可能成為主流的技術(shù)趨勢?!鼻罔栒f到。

03、軟硬融合云計算體系架構(gòu),云上應用全面加速? ??

過去十多年,云計算發(fā)展經(jīng)歷了分布式架構(gòu)技術(shù)和資源池化技術(shù)兩次革新。第一階段的分布式架構(gòu)替代大型機,滿足當時企業(yè)所需算力需求;第二階段的資源池化技術(shù),計算、存儲、網(wǎng)絡(luò)資源可以分別按需擴容,突破了規(guī)模和穩(wěn)定性的瓶頸,提供超大規(guī)模的云計算服務。不過隨著數(shù)據(jù)密集型計算場景的普及,用戶對低時延、高帶寬的需求越來越高,而傳統(tǒng)以CPU為中心的計算體系架構(gòu),不僅需要承擔計算任務,還要負責邏輯控制,導致計算和網(wǎng)絡(luò)傳輸時延大,且無法提供高帶寬,CIPU/IPU/DPU加速計算芯片應運而生,云計算進入第三階段。“DPU誕生的背景是帶寬與計算性能的增速失調(diào)。CPU的性能從5-10年前每年30%的增幅,到三年前大概只有每年不到3%的性能增幅。而網(wǎng)絡(luò)帶寬每年依舊還有35%左右的增長。處理性能和帶寬增速的比例從原來的大概1:1,變成了現(xiàn)在的1:10左右?!敝锌岂S數(shù)CEO鄢貴海如此評價道。

從另一個角度,這其實也是摩爾定律放緩之下的CPU性能提升趨于天花板,無法滿足爆發(fā)式增長的算力需求產(chǎn)生的結(jié)果,軟硬融合的云計算體系架構(gòu),是科技融合觸發(fā)的產(chǎn)業(yè)革新。達摩院2023十大科技趨勢報告中指出,以CIPU為核心的云計算體系架構(gòu),在工程上主要實現(xiàn)三個方面的突破:一是底層硬件結(jié)構(gòu)的融合帶來的全面硬件加速;二是在全鏈路實現(xiàn)硬件加速的技術(shù)上,創(chuàng)新地實現(xiàn)eRDMA,不但能大規(guī)模組網(wǎng),還能讓用戶無需修改負載代碼無感加速,讓云上高性能計算普惠服務化成為現(xiàn)實;三是CIPU和服務器的系統(tǒng)組合,既能一對多,也能多對一,高效滿足云上不同計算場景下東西向流量配比的靈活度。

近幾年,無論是傳統(tǒng)芯片巨頭,還是云服務提供商,還是初創(chuàng)公司,都在涌入這一賽道。英偉達早在2020年就推出了BlueField-2 DPU ,亞馬遜早已擁有基于自研DPU的系統(tǒng),谷歌云也同英特爾合作IPU,百度、字節(jié)、騰訊云紛紛加入自研DPU的隊伍,2022年6月,阿里云也發(fā)布了自己的CIPU處理器,DPU初創(chuàng)公司們,一時間也成為投資人眼中的香餑餑。

從整個產(chǎn)業(yè)鏈條來看,云計算向CIPU/IPU/DPU為中心的全新云計算體系架構(gòu)深度演進,是未來不可阻擋的科技趨勢?!霸朴嬎泱w系架構(gòu)基礎(chǔ)技術(shù)的不斷革新,正在推動云上基礎(chǔ)計算能力開始大幅超越線下服務器, 而企業(yè)只要上云就能從云計算資源或云服務中, 低成本獲得這些還在不斷擴大的系統(tǒng)紅利。”阿里云研究院、阿里云神龍計算平臺負責人蔣林泉說到。

04、連續(xù)第五年發(fā)布科技趨勢報告,多個趨勢已被市場驗證? ??

芯粒、存算一體和軟硬融合的云計算體系架構(gòu),是達摩院對后摩爾時代的預測,這些預測的底層邏輯和背景并不僅僅是著眼于“摩爾定律的失效”,而是更宏大的工業(yè)革命的變遷與規(guī)律。秦钖表示,歷史上的三次工業(yè)革命都有十分明顯的上下半場,每半場的時間持續(xù)50年左右,上半場是各式各樣的技術(shù)涌現(xiàn),下半場是技術(shù)與傳統(tǒng)行業(yè)的融合所產(chǎn)生的技術(shù)固化?!袄缭朴嬎闶钦麄€信息革命上半場產(chǎn)生的技術(shù)的集大成者,那么下半場,就有可能由量子計算開啟。判斷一個技術(shù)短期內(nèi)能不能應用非常困難,預測結(jié)果準確率超過一半已是罕見?!鼻罔栒f到。

今年已經(jīng)是達摩院連續(xù)第五年預測十大科技趨勢,此前已經(jīng)有不少趨勢被市場精準驗證,例如在達摩院這一次走訪對談的過程中,發(fā)現(xiàn)AI for Science已經(jīng)被學術(shù)界專家廣泛接受,對大模型的判斷也被產(chǎn)業(yè)界所肯定。這讓我們不由得期待,2023十大科技趨勢中所描繪的世界,又會在哪些領(lǐng)域命中未來。

相關(guān)推薦