AI大模型正在重新定義CPU,它除了具備更高的可靠性、穩(wěn)定性、可擴展性,還要具備更強的AI計算能力,以滿足AI大模型對計算資源的需求。同時,能效比越來越重要,這樣才能保證大模型訓(xùn)練和推理過程中,能源和成本的合理支出。在這些趨勢下,CPU逐漸從傳統(tǒng)的通用計算能力,轉(zhuǎn)變?yōu)楦螦I大模型需求的“多面手”。
IDC表示,隨著AI應(yīng)用的日益普及,預(yù)計到2027年,各組織在生成式AI(GenAI)方面的支出將高達1530億美元,而機器學(xué)習(xí)和分析的總支出將達到3610億美元。英特爾至強6處理器經(jīng)過優(yōu)化,有望在這一蓬勃發(fā)展的市場中扮演重要角色,并可作為機頭節(jié)點CPU,在傳統(tǒng)機器學(xué)習(xí)、小型生成式AI模型和GPU加速工作負載中提供出色性能。
英特爾臨時聯(lián)合首席執(zhí)行官兼英特爾產(chǎn)品首席執(zhí)行官Michelle Johnston Holthaus表示,“英特爾深耕數(shù)據(jù)中心市場數(shù)十余年,并通過x86 架構(gòu)引領(lǐng)標(biāo)準(zhǔn)制定和行業(yè)發(fā)展。目前,英特爾的處理器正為絕大多數(shù)數(shù)據(jù)中心提供動力?!?/p>
為了充分滿足市場多樣需求,英特爾不斷完善至強產(chǎn)品系列,日前推出了至強6性能核處理器6700/6500,實現(xiàn)了2倍的AI處理性能提升;同時,專為網(wǎng)絡(luò)和邊緣應(yīng)用設(shè)計的全新至強6 SoC芯片,實現(xiàn)了2.4倍的無線接入網(wǎng)(RAN)工作負載容量提升。
至強6700/6500——提供出色性能與能效平衡
最新的至強6700/6500性能核處理器,在數(shù)據(jù)中心和網(wǎng)絡(luò)產(chǎn)品組合方面均取得了顯著進展。與上一代產(chǎn)品相比,至強6處理器在廣泛的企業(yè)工作負載中實現(xiàn)了平均1.4倍的性能提升。作為AI系統(tǒng)的機頭節(jié)點CPU,至強6可與GPU搭配,為客戶提供優(yōu)選組合。
此外,它以更少的核心數(shù)量,提供1.5倍的AI推理性能提升。至強6處理器還具備出色的每瓦性能效率,以五年使用周期計,平均可以實現(xiàn)以一臺新的服務(wù)器替代五臺舊服務(wù)器,在某些用例中該比例可達10:1,從而節(jié)省高達68%的總體擁有成本(TCO)。
上述特性使得至強6700/6500性能核處理器在性能與能效平衡方面表現(xiàn)更為出色,更加符合數(shù)據(jù)中心需求。
英特爾數(shù)據(jù)中心與AI集團副總裁兼中國區(qū)總經(jīng)理陳葆立介紹,最新推出的6700/6500性能核處理器目標(biāo)是傳統(tǒng)數(shù)據(jù)中心企業(yè)應(yīng)用。相比高核高密度計算的大芯片,這些新品的TDP也比較適合傳統(tǒng)機架,比如150W-350W的TDP,在內(nèi)存通道上也有8個內(nèi)存通道的配置。
同時在內(nèi)存技術(shù)方面,英特爾推出了MRDIMM技術(shù),顯著提升了內(nèi)存帶寬,可以更好地支持AI工作負載。MRDIMM技術(shù)是首次在至強6產(chǎn)品上推出,相比第五代至強的內(nèi)存速度4800-5600MT/s,至強6速度提升至DDR5 6400MT/s,而、MRDIMM進一步將速率提升至8800MT/s,相比現(xiàn)有數(shù)據(jù)中心服務(wù)器提升超過50%。據(jù)透露,很多客戶對此表現(xiàn)出濃厚興趣,并正在進行快速試驗以期快速落地。
陳葆立指出,傳統(tǒng)AI應(yīng)用如推薦引擎、語音助手和圖像識別等,適合CPU處理。全新的至強6處理器憑借多核、高內(nèi)存帶寬、AI加速指令和完整軟件棧,是支持傳統(tǒng)AI應(yīng)用的理想選擇。
對于大語言模型來說,盡管需要GPU等加速器,但每個GPU系統(tǒng)仍需兩顆CPU作為機頭,以加快數(shù)據(jù)傳輸,這要求CPU具備快速I/O、良好單核性能和更快內(nèi)存。此外,GPU服務(wù)器長時間運行對系統(tǒng)穩(wěn)定性要求極高,至強處理器憑借其可靠性和穩(wěn)定性,成為智算中心和GPU服務(wù)器設(shè)計的重要選擇。
“在小于20B的模型規(guī)模下,用至強進行生成式AI的推理很有優(yōu)勢。因為對小規(guī)模大語言模型來說,推理過程在生成首個Token時需要密集計算,后續(xù)多數(shù)Token推理則對內(nèi)存帶寬需求高”,英特爾技術(shù)專家補充,“至強6處理器結(jié)合MRDIMM技術(shù),可提升性能,128核至強AP平臺性能甚至超競品50%核心平臺,MRDIMM帶寬達8800MT/s,對性價比要求高的中小模型推理重要?!?/p>
據(jù)英特爾技術(shù)專家分析,當(dāng)前客戶面臨的兩類問題比較突出:一是系統(tǒng)老舊問題,需考慮是否更換新系統(tǒng),這涉及更新TCO的ROI計算。以目前市面上應(yīng)用廣泛的五年更新周期的第二代至強為例,客戶關(guān)注空間與能耗節(jié)省,更新后可實現(xiàn)10:1整合比例,節(jié)省約2/3的TCO,鼓勵客戶更新基礎(chǔ)設(shè)置。
其二,在客戶采購時,需對比市面同類產(chǎn)品。至強AP平臺在傳統(tǒng)數(shù)據(jù)、網(wǎng)絡(luò)服務(wù)、科學(xué)計算及AI領(lǐng)域性能優(yōu)于競品。至強6處理器系列,包括SP平臺的6700P和6500P系列,在傳統(tǒng)AI推薦系統(tǒng)、科學(xué)計算、網(wǎng)絡(luò)服務(wù)、圖像構(gòu)建等業(yè)務(wù)中,帶來顯著性能提升與TCO節(jié)省。
據(jù)透露,英特爾將在2026年發(fā)布采用18A制程的下一代至強Clearwater Forest,目前進展順利,這也將會是英特爾至強處理器發(fā)展歷程中下一個重要的里程碑。
面向網(wǎng)絡(luò)和邊緣應(yīng)用的英特爾至強6處理器SoC——提供高性能與能效
英特爾同時還推出一款面向網(wǎng)絡(luò)和邊緣應(yīng)用的至強6處理器,它是一款系統(tǒng)級芯片(SoC),集成多種加速器,旨在提供高性能與能效。該產(chǎn)品主要面向運營商,涵蓋從辦公室到數(shù)據(jù)中心的網(wǎng)絡(luò)與邊緣領(lǐng)域,涉及多樣化工作負載,兼顧計算密度、連接性能、功耗及物理尺寸,整合了多種安全和控制功能。
由于至強6系統(tǒng)級芯片定位于網(wǎng)絡(luò)與邊緣場景,因此針對多樣化的功能特性進行了高度集成。它融合了英特爾至強6性能核處理器特性,核心數(shù)達72個,整合了多種加速器,例如:整合vRAN boost技術(shù)、英特爾媒體轉(zhuǎn)碼加速器及英特爾AMX等加速器等,實現(xiàn)了功耗性能的平衡優(yōu)化。
據(jù)英特爾中國網(wǎng)絡(luò)與邊緣事業(yè)部總經(jīng)理阮伯超介紹,至強6 SoC廣泛應(yīng)用于運營商網(wǎng)絡(luò)及網(wǎng)絡(luò)與邊緣領(lǐng)域,所實現(xiàn)的優(yōu)勢包括:在運算網(wǎng)絡(luò)中,為vRAN帶來高性能功耗比增長,如與諾基亞合作提升了70%的性能功耗比,從而幫助運營商提升了整體密度,達到2.4倍的無線接入網(wǎng)(RAN)工作負載容量;在AI領(lǐng)域,通過內(nèi)置英特爾AMX使單核AI RAN性能較上一代提升3.2倍;在網(wǎng)絡(luò)安全領(lǐng)域,大幅提升Webroot CSI上傳模型推理速度,相比英特爾至強D-2899NT處理器提升最高達4.3倍。
作為首款媒體轉(zhuǎn)碼加速器的服務(wù)器SoC,至強6 SoC在編解碼時可以實現(xiàn)較大的性能功耗比提升。相較于英特爾至強6538N處理器,每瓦性能提升達到了14倍。同時,內(nèi)置的媒體加速器也可以幫助傳統(tǒng)的VDI(虛擬桌面基礎(chǔ)架構(gòu))領(lǐng)域,提升媒體的處理效率,減少總體擁有成本。
值得注意的是,由于網(wǎng)絡(luò)與邊緣領(lǐng)域,智算網(wǎng)融合是一個重要方向。以 AI 應(yīng)用為例,邊緣服務(wù)器可應(yīng)用于智能工廠,助力礦山開采作業(yè),亦能用于智能攝像頭相關(guān)場景。用于這些場景的設(shè)備需要集成多種網(wǎng)絡(luò)功能,如 SD-WAN(軟件定義廣域網(wǎng)),同時整合安全功能。更為重要的是,它將各類 AI 應(yīng)用集成于一體,例如智能監(jiān)控與安全監(jiān)控應(yīng)用。通過性能均衡設(shè)計,將英特爾AMX和英特爾媒體轉(zhuǎn)碼加速器集成在同一設(shè)備中,通過一個38核系統(tǒng)可以同時支持38路攝像頭視頻流的int8推理,系統(tǒng)實現(xiàn)了功耗、性能的平衡和優(yōu)化。
AI算力需求井噴,至強6如何滿足數(shù)據(jù)中心需求?
隨著AI算力需求的不斷增長,至強6如何成為符合AI大模型需求的“多面手”?
陳葆立指出,早在大模型興起之前,AI就已經(jīng)廣泛應(yīng)用于數(shù)據(jù)中心,包括推薦引擎和搜索等領(lǐng)域,國內(nèi)許多大型互聯(lián)網(wǎng)企業(yè)一直使用大量的至強處理器來支持這些業(yè)務(wù)。多年來,英特爾推出了多種AI加速技術(shù),例如AMX加速器,幫助客戶提升AI計算性能。相比友商,英特爾在支持AI場景方面充滿信心,技術(shù)上也具有明顯優(yōu)勢。
面對大規(guī)模應(yīng)用的GPU服務(wù)器,陳葆立認(rèn)為,機頭位置的CPU選擇至關(guān)重要。因為處理大模型計算時需要著重關(guān)注兩個性能指標(biāo):一是提問后第一個回答的延遲時間,二是CPU內(nèi)存帶寬,因為CPU需要快速調(diào)取數(shù)據(jù)進行分析并給出響應(yīng)。
“盡管隨著更多新模型的出現(xiàn),客戶對推理算力的需求增加,但并非所有場景都需要超大規(guī)模模型。客戶開始關(guān)注至強6處理器與MRDIMM的組合是否能在不同場景下有效支持大模型運算。我們已經(jīng)證明,這種組合是可行的。盡管國內(nèi)有許多不同類型的加速卡,現(xiàn)階段最新一代至強6處理器系列依然是客戶和合作伙伴的首選平臺,并且能夠進行更好的適配和驗證”,陳葆立強調(diào)。