傳聞是真的,微軟正在開發(fā)定制AI芯片,它可以用來訓(xùn)練大語言模型,讓微軟獲得更多獨(dú)立,避免過度依賴英偉達(dá)。不只如此,微軟還在開發(fā)Arm CPU,主要供云計(jì)算網(wǎng)絡(luò)使用。兩款芯片瞄準(zhǔn)的都是Azure數(shù)據(jù)中心,微軟企業(yè)客戶可以用它們來搭建AI平臺(tái)。
最新消息顯示,微軟Azure Maia AI芯片和Arm版Azure Cobalt CPU將會(huì)在2024年推出。目前市場(chǎng)上最流行的AI芯片是英偉達(dá)的H100 GPU,企業(yè)用它訓(xùn)練生成式圖形工具和大語言模型。英偉達(dá)GPU需求很高,供不應(yīng)求,網(wǎng)上標(biāo)價(jià)單塊已經(jīng)沖破4萬美元。
深度定制芯片
微軟Azure硬件系統(tǒng)和基礎(chǔ)設(shè)施主管Rani Borkar解釋說:“在芯片開發(fā)方面微軟實(shí)際上有很長(zhǎng)的歷史?!?0多年前微軟就曾聯(lián)合其它企業(yè)開發(fā)Xbox芯片,還曾開發(fā)過Surface芯片?!八羞@些努力都是建立在經(jīng)驗(yàn)之上的。2017年我們開始研究云計(jì)算硬件,開始研發(fā)自己的定制處理器?!?/p>
Rani Borkar稱,Azure Maia AI芯片和Cobalt CPU都是微軟自己開發(fā)的,當(dāng)中還涉及到云服務(wù)器堆棧,兼顧性能、能耗和成本?!癆I時(shí)代來臨,我們重新思考云基礎(chǔ)設(shè)施,重新優(yōu)化了基礎(chǔ)設(shè)施的每一層?!?/p>
Azure Cobalt CPU是一款128核芯片,它是基于ArmNeoverse CSS設(shè)計(jì)的,屬于微軟定制產(chǎn)品。芯片將會(huì)用來驅(qū)動(dòng)Azure云服務(wù)。Rani Borkar說:“我們除了深入思考性能,還考慮到能耗管理。在設(shè)計(jì)時(shí)我們有意做了一些選擇,比如可以控制每個(gè)內(nèi)核的性能和能耗,還有它在虛擬機(jī)上的表現(xiàn)?!?/p>
目前微軟已經(jīng)在Teams、SQL服務(wù)器上測(cè)試Cobalt CPU,明年就會(huì)向客戶提供虛擬機(jī)。
全面提升性能
亞馬遜也開發(fā)了Graviton 3服務(wù)器,它與微軟服務(wù)器相比誰更勝一籌呢?微軟沒有明說,不過考慮到微軟Azure Cobalt CPU是基于Arm架構(gòu)開發(fā)的,性能上應(yīng)該有一些優(yōu)勢(shì)。Rani Borkar稱:“最初的測(cè)試顯示,微軟新品的性能比微軟現(xiàn)有數(shù)據(jù)中心中產(chǎn)品的性能高40%,目前用的是商用版Arm服務(wù)器?!?/p>
至于Maia 100 AI,它是面向AI開發(fā)的。有些企業(yè)想在Azure平臺(tái)上執(zhí)行AI任務(wù),Maia 100 AI可以幫上忙。微軟已經(jīng)與OpenAI攜手合作,設(shè)計(jì)測(cè)試Maia。
OpenAI CEO Sam Altman說:“很高興微軟在第一時(shí)間向我們分享了Maia芯片的設(shè)計(jì),我們正在努力改進(jìn)、測(cè)試模型。Azure提供的端到端AI架構(gòu)已經(jīng)針對(duì)Maia進(jìn)行了優(yōu)化,未來可以幫助客戶訓(xùn)練更強(qiáng)大的模型,讓模型變得更便宜。”
Maia芯片是用臺(tái)積電5納米工藝制造的,擁有1050億晶體管,比AMD MI300X AI GPU的1530億個(gè)少30%。微軟、AMD、英特爾、Meta、英偉達(dá)、高通都在努力,它們?cè)噲D讓下一代AI模型數(shù)據(jù)模式實(shí)現(xiàn)標(biāo)準(zhǔn)化。
Rani Borkar說:“Maia是微軟開發(fā)的第一款真正的液冷服務(wù)器處理器。我們的目標(biāo)是打造更高密度、更高效率的服務(wù)器。”微軟新系統(tǒng)與當(dāng)前的數(shù)據(jù)中心是契合的,所以部署時(shí)會(huì)更快。
目前微軟正在利用GPT 3.5 Turbo、必應(yīng)AI、GitHub Copilot對(duì)Maia 100進(jìn)行測(cè)試,只是部署還處在早期階段,所以微軟沒有提供具體的性能測(cè)試數(shù)據(jù)。
打造多樣化供應(yīng)鏈
因?yàn)槿鄙倬唧w數(shù)據(jù)支撐,我們不知道Maia相比英偉達(dá)H100、AMD MI300X誰更強(qiáng)大。Rani Borkar不愿意和競(jìng)爭(zhēng)對(duì)手對(duì)比,她只是說微軟與AMD、英偉達(dá)都有合作。微軟主要還是想打造多樣化供應(yīng)鏈,不想過度依賴英偉達(dá)。
照估計(jì),為了讓ChatGPT商用,OpenAI采購(gòu)了3萬顆A100 GPU芯片,如果微軟能擁有自己的芯片,就可以幫OpenAI降低成本。至于微軟為Azure開發(fā)的芯片,它不會(huì)對(duì)外出售。Borkar解釋稱:“它更多像是補(bǔ)充,不是為了與對(duì)手競(jìng)爭(zhēng)。我們的云計(jì)算平臺(tái)上有AMD、英特爾芯片,在AI方面,除了英偉達(dá)芯片,我們也會(huì)用AMD芯片。對(duì)于我們的基礎(chǔ)設(shè)施而言,這些合作伙伴相當(dāng)重要,我們也想給客戶更多選擇。”
從Maia 100和Cobalt 100的命名看,微軟肯定已經(jīng)在設(shè)計(jì)第二代產(chǎn)品。Borkar說:“這是一個(gè)系列的產(chǎn)品,不只有100,還會(huì)有更多……不過我們暫時(shí)不會(huì)透露路線圖規(guī)劃?!?/p>
到目前為止微軟并沒有透露Maia的價(jià)格,不過微軟已經(jīng)悄悄推出微軟365 Copilot服務(wù),每月每用戶收費(fèi)30美元,并不便宜,照此推測(cè),Maia應(yīng)該也不會(huì)便宜。
從微軟的規(guī)劃看,Maia 100人工智能芯片的直接對(duì)手是英偉達(dá)GPU,Cobalt 100芯片主要針對(duì)英特爾處理器。截止10月底,微軟擁有現(xiàn)金1440億美元,2022年在全球云計(jì)算市場(chǎng)占據(jù)21.5%的份額。到了2024年,運(yùn)行Cobalt 100芯片的虛擬機(jī)服務(wù)將會(huì)正式商用。
巨頭定制芯片大勢(shì)所趨
微軟的對(duì)手也沒有閑著。2016年谷歌推出Tensor處理器,2018年亞馬遜推出Graviton Arm處理器和Inferentia AI處理器,還于2020年推出Trainium(可以訓(xùn)練AI模型)。
從競(jìng)爭(zhēng)對(duì)手的舉動(dòng)看,微軟推出自有處理器也是隨了大流。在過去一年多時(shí)間里,芯片價(jià)格上漲,美國(guó)加息,企業(yè)不得不尋找辦法提高資金利用效率,于是它們開始偏愛AWS Graviton處理器。在AWS前100大客戶中,幾乎所有客戶都在使用ARM處理器,性價(jià)比提升了40%。
毋庸諱言,定制AI芯片已經(jīng)成為巨頭們必須參與的游戲,競(jìng)爭(zhēng)會(huì)越來越激烈?。ㄐ〉叮?/p>