10月17日,美國對中國半導(dǎo)體限制再次加碼,為堵塞之前限制條款的漏洞,美國商務(wù)部進一步擴大了出口限制范圍,新增加了一個新的參數(shù),旨在阻止中國獲得先進芯片,以減緩中國在小芯片(Chiplet)技術(shù)領(lǐng)域的發(fā)展。
禁令一出,英偉達股價應(yīng)聲暴跌,市值一夜蒸發(fā)4000億。其實英偉達等公司都在為出口限制付出代價,而中國AI芯片行業(yè)或?qū)⒁虼双@得一些機會。
從“互連帶寬”到“性能密度閾值”
根據(jù)美國商務(wù)部工業(yè)與安全局(BIS)提交了對某些先進計算設(shè)備實施額外出口管制的臨時最終規(guī)則,并更改了參數(shù),將13家中國公司列入實體名單。規(guī)則生效日期為2023年11月16日。
BIS刪除了“互連帶寬”作為識別受限芯片的參數(shù),修改了原有的性能閾值,并添加了一個名為“性能密度閾值”的新參數(shù),以針對中國芯片制造商正在開發(fā)的小芯片技術(shù)。BIS還對其他半導(dǎo)體制造設(shè)備實施了限制,包括一些DUV光刻系統(tǒng)。
“互連帶寬”是能被互連傳輸且未造成有效損耗的最高正弦波分量,是用來衡量行業(yè)如何充分利用其互連潛力的度量標(biāo)準(zhǔn)。帶寬基本單位是比特每秒(bps)或比特率。而“性能密度”并沒有對應(yīng)解釋,它與帶寬、IOPS(每秒輸入/輸出操作數(shù))有關(guān),性能密度越高帶寬和IOPS越大。
BIS的新參數(shù)適用于分類為ECCN 3A090和4A090的產(chǎn)品,將影響英偉達并不限于A100、A800、H100、H800、L40、L40S和RTX 4090芯片的使用。
被列入實體名單的13家總部位于中國的實體,大部分是壁仞科技和摩爾線程的子公司。美國政府認為這些實體參與了先進計算芯片的開發(fā)。這些芯片可用于進一步開發(fā)大規(guī)模殺傷性武器、先進武器系統(tǒng)以及引起國家安全擔(dān)憂的高科技監(jiān)控應(yīng)用。
此外,新規(guī)則將制定一項全球許可證要求,只要其母公司總部位于中國、澳門和其他受美國武器禁運或美國視為國家安全威脅的國家,即可停止向這些公司交付芯片。
美國商務(wù)部長Gina Raimondo在聲明中表示,更新后的規(guī)則將提高出口管制的有效性,并進一步切斷規(guī)避限制的途徑。這些控制措施保持了對軍事應(yīng)用的明確關(guān)注,同時可以應(yīng)對中國政府軍民融合戰(zhàn)略對國家安全構(gòu)成的威脅。
中國政府已聲明強烈反對補充限制,認為這些限制是由政治議程任意施加的。這些措施違背了市場經(jīng)濟和公平競爭的原則,并威脅到全球經(jīng)濟和貿(mào)易框架。
壁仞科技和摩爾線程做了什么?
與英偉達一樣,壁仞在技術(shù)研發(fā)、商業(yè)應(yīng)用等方面都進行了布局,同時也在打造完備、易用的軟件平臺,幫助用戶實現(xiàn)不同軟件生態(tài)的無縫遷移。事實上,由于不在同一起跑線,壁仞與英偉達之間技術(shù)差距還不小。在性能方面,英偉達的H100 SXM的INT8算力達3958TOPS,而壁仞的BR100算力約為2048TOPS。
在能耗方面,同樣實現(xiàn)3026TOPS計算,英偉達H100 PCLe為350W,而壁仞的BR100功耗高達550W。對AI廠商而言,能耗高低會影響企業(yè)的商業(yè)決策。
不過,BR100的16位浮點算力超過1000T、8位定點算力超過2000T,單芯片峰值算力達到PFLOPS級別,是國際廠商在售旗艦產(chǎn)品的3倍以上,創(chuàng)造了全球通用GPU的算力記錄。
反觀成立于2020年的摩爾線程,旨在致力于創(chuàng)新面向元計算應(yīng)用的新一代GPU,構(gòu)建融合視覺計算、3D圖形計算、科學(xué)計算及人工智能計算的綜合計算平臺,建立基于云原生GPU計算的生態(tài)系統(tǒng)。
從公開信息看,摩爾線程并未采用小芯片技術(shù)。2022年11月,其推出基于第二代MUSA架構(gòu)的處理器“春曉”GPU,以及基于“春曉”的面向消費領(lǐng)域的國產(chǎn)芯片顯卡MTT S80和面向服務(wù)器應(yīng)用的MTTS3000顯卡。
相比之前的“蘇堤”芯片,“春曉”內(nèi)置的四大計算引擎全面升級,性能顯著提升:圖形渲染能力平均提升3倍;編碼能力提升4倍,解碼能力提升2倍;AI計算加速平均提升4倍,物理仿真計算性能提升2.5倍;同時引入了新技術(shù)支持窄帶高清,節(jié)約帶寬30%以上。
有報道稱,“春曉”基于全國產(chǎn)化平臺,對比國內(nèi)外同類代表產(chǎn)品,其全功能GPU性能在各種標(biāo)準(zhǔn)測評項目上均有2-3倍提升。就是這樣一家主打消費類GPU的公司居然也上了實體名單!
小芯片是一種分段異構(gòu)集成
在開發(fā)每一代處理器時,工藝節(jié)點的改進可使芯片不斷縮小,為提高產(chǎn)品功能和性能提供了一種方法,而無需使用大而昂貴的芯片。事實是,邏輯電路可以跟隨工藝節(jié)點的進步而縮小,但模擬電路幾乎沒有變化,SRAM也開始達到極限。因此,采用同一工藝節(jié)點制造所有電路的成本效益越來越低。
小芯片是一種分而治之的方法——處理器分段。它不是將每個部分集成到一個芯片中(單片方法),而是先制造出特定部分的單獨芯片,然后利用復(fù)雜的連接系統(tǒng)將這些單獨的芯片封裝在一起。這種方法可以縮小部件尺寸,提高工藝效率,并將它們封裝在更多組件中。此外,一些芯片可以使用傳統(tǒng)而經(jīng)濟的方法生產(chǎn)。雖然制造這類處理器的過程很復(fù)雜,但通常總體成本較低,還有利于代工廠管理來源廣泛的產(chǎn)品組件。
根據(jù)國際半導(dǎo)體技術(shù)路線圖(ITRS),3D集成是未來關(guān)鍵發(fā)展技術(shù)之一,有助于實現(xiàn)小型化,克服信號延遲的“布線危機”。在后摩爾時代,各種數(shù)字功能將從板級向封裝級、芯片級、堆疊芯片過渡。
SiP可以在一個封裝中集成一個CPU、一些DRAM和NAND閃存、多個控制器和其他組件。這在2016年發(fā)布的Series 1 Apple Watch中就已成為現(xiàn)實。而將不同的系統(tǒng)放在一個芯片上就是SoC(系統(tǒng)級芯片),但這種方法無法利用不同節(jié)點的價格優(yōu)勢來分而治之地制造每個組件。
2017年,AMD發(fā)布了Zen架構(gòu)單芯片Ryzen臺式CPU,在一顆SoC上集成了內(nèi)核到I/O和控制器的所有部分。幾個月后,AMD的多芯片產(chǎn)品線Threadripper和EPYC亮相,后者擁有多達四個芯片,在結(jié)構(gòu)上依舊采用了小芯片設(shè)計。
兩年后Zen 2發(fā)布,AMD將大部分在更簡單、更便宜的工藝節(jié)點制造的模擬部分從處理器中移出,將它們放入一個單獨的芯片中,更先進的工藝節(jié)點只用于邏輯和緩存。
至此,小芯片也越來越流行。
小芯片開始走到技術(shù)最前沿
事實上,新一代處理器迭代需要增加電路集成度,特別是更大的邏輯電路和SRAM模塊。過去,向更高密度邏輯電路持續(xù)前進意味著要持續(xù)收縮光刻,但隨著晶體管尺寸不斷縮小,制造工藝也變得更加復(fù)雜和昂貴。
2022年,處理器產(chǎn)業(yè)已到了接近FinFET(鰭式場效應(yīng)晶體管)時代終結(jié)的時刻,3nm和2nm的全環(huán)繞柵極(gate-all-around)晶體管架構(gòu)即將到來。隨著這些節(jié)點的設(shè)計成本急劇增加,人們對其他設(shè)計和小芯片等集成方法越來越感興趣。
從20nm節(jié)點開始,從3個節(jié)點的平面轉(zhuǎn)向FinFET,每平方毫米峰值晶體管增加了約3倍,晶體管便宜了60%,而每平方毫米成本和每個晶體管成本也有增加。到了2nm節(jié)點,從FinFET到全環(huán)繞柵極,每平方毫米峰值晶體管可增加約16倍,晶體管便宜了40%,每平方毫米成本和每個晶體管成本也在相應(yīng)增加。
2022年晶體管尺寸縮小對成本的影響
事實上,小芯片已走在遍地開花的路上。之前,雖然小芯片的使用已有幾十年歷史,但僅限于一些特定目的?,F(xiàn)在,它終于走到技術(shù)最前沿,全球已有數(shù)以百萬計的臺式PC、工作站和服務(wù)器中有了它的身影。
多年來,摩爾定律一直是半導(dǎo)體行業(yè)發(fā)展的準(zhǔn)繩。通過工藝節(jié)點的不斷改進實現(xiàn)了CPU和GPU邏輯和內(nèi)存方面的巨大進步,芯片也變得越來越小。不過,無論出現(xiàn)什么新的工藝節(jié)點,這種趨勢都不會永遠持續(xù)下去。
AMD和英特爾等行業(yè)巨頭沒有等待摩爾定律達到極限,就另辟蹊徑轉(zhuǎn)向了小芯片,探索芯片組合的各種方式,以繼續(xù)創(chuàng)造更強大的處理器,并利用小芯片重新獲得創(chuàng)新前沿的優(yōu)勢地位。
頭部處理器玩家領(lǐng)跑
小芯片很快就會成為計算世界的標(biāo)準(zhǔn),這話有它的道理,從行業(yè)引領(lǐng)者到一些初創(chuàng)企業(yè)都在進行這方面的探索。
Yole Intelligence計算與軟件業(yè)務(wù)的高級技術(shù)與市場分析師John Lorenz 認為:“隨著芯片節(jié)點的設(shè)計成本不斷上升,業(yè)界對替代性設(shè)計和集成方法的興趣也越來越濃厚,特別是小芯片。小芯片旨在利用先進封裝技術(shù)解決對更小且可重復(fù)使用的設(shè)計的需求。小芯片集成的突飛猛進正在推動2.5D和3D封裝的發(fā)展?!?/p>
目前,處理器市場基本上由英特爾、AMD、英偉達和高通等幾家頭部企業(yè)主導(dǎo),這些巨頭占據(jù)了54%的市場總份額。隨著亞馬遜和阿里巴巴等科技巨頭進軍CPU賽場,競爭日趨激烈。高通、聯(lián)發(fā)科和蘋果在APU領(lǐng)域領(lǐng)先,共占據(jù)32%的市場份額。SoC FPGA和AI ASIC這兩個細分市場由AMD、英特爾,以及谷歌和亞馬遜這樣的科技巨頭領(lǐng)導(dǎo)。
2022年收入排名前十的處理器玩家
英特爾、臺積電、AMD、英偉達和三星等主要廠商正在引領(lǐng)這一發(fā)展趨勢,足見小芯片已成為當(dāng)今半導(dǎo)體工藝發(fā)展的重中之重。隨著時間的推移,各種應(yīng)用中硅中介層(Interposer)和混合鍵合等高性能封裝平臺的關(guān)鍵地位也與日俱增。
值得注意的是,近年來處理器初創(chuàng)企業(yè)動作頻繁,籌集了大量資金,特別是在AI領(lǐng)域。在投資和不斷豐富的生態(tài)系統(tǒng)推動下,中國半導(dǎo)體產(chǎn)業(yè)正在持續(xù)發(fā)展。
小芯片越小越好?
從制造上看,通過使用較小的芯片,每個晶圓可以生產(chǎn)更多芯片。晶圓被切割得越小,隨機分布的缺陷導(dǎo)致芯片失效的可能性就越小,生產(chǎn)過程也更具成本效益。另外,相同的小芯片可用于多種型號的產(chǎn)品,增加了靈活性。
隨著小型化互連技術(shù)的成熟,多模塊、小芯片設(shè)計開始變得司空見慣。例如今年6月,英特爾發(fā)布Meteor Lake架構(gòu)酷睿處理器,通過小型化模塊連接實現(xiàn)2.5D和3D封裝,實現(xiàn)了高密度連接,體現(xiàn)了產(chǎn)品功耗、成本、性能優(yōu)勢。
小芯片的統(tǒng)治才剛剛開始。可以想見,未來普通PC內(nèi)可能裝有更大的CPU和GPU,但取下散熱器,下面是許多微型芯片巧妙地平鋪或堆疊在一起。