• 正文
  • 相關(guān)推薦
申請(qǐng)入駐 產(chǎn)業(yè)圖譜

騰訊盯上了AI訓(xùn)練芯片

2021/08/30
392
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點(diǎn)資訊討論

大家都知道,在中美脫鉤的背景下,中國(guó)希望建立一個(gè)豐富的、本土的、多樣化的半導(dǎo)體生態(tài)系統(tǒng)來(lái)滿足國(guó)內(nèi)最大的計(jì)算消費(fèi)者群體,這已經(jīng)不算是什么新聞了??梢哉f(shuō),從超級(jí)計(jì)算系統(tǒng),到為本土最大的在線社交和零售平臺(tái)提供芯片驅(qū)動(dòng)的系統(tǒng),美國(guó)的芯片制造商們都應(yīng)該密切關(guān)注它們的進(jìn)展,同時(shí)也必將面臨著嚴(yán)苛的考驗(yàn)。

中國(guó)的頂級(jí)超級(jí)計(jì)算機(jī)——包括神威太湖之光或強(qiáng)大的天河 2A——充滿了從芯片到互連在內(nèi)的各種本土技術(shù)。其社交媒體巨頭,包括阿里巴巴百度,也已經(jīng)在使用自己設(shè)計(jì)的芯片進(jìn)行大規(guī)模的人工智能訓(xùn)練和推理。

在BAT三巨頭中,同樣是中國(guó)計(jì)算領(lǐng)域的超大規(guī)模企業(yè)-騰訊尚未推出自己的芯片。但值得注意的是,騰訊對(duì)總部位于上海的燧原科技進(jìn)行了大量投資,該公司將很快發(fā)布自 2018 年以來(lái)一直在進(jìn)行開發(fā)的第一代人工智能訓(xùn)練設(shè)備 DTU 1.0。在過(guò)去的三年中,燧原科技已經(jīng)籌集了近 5億 美元的資金,其中的牽頭投資者便是騰訊。

這顆DTU 1.0 器件的有趣之處在于它根本沒(méi)有什么特別有趣的地方。換句話說(shuō),它并沒(méi)有試圖做任何古怪的事情。當(dāng)然,這并不能表明它就是一個(gè)比較簡(jiǎn)單的芯片,因?yàn)樗幸恍┆?dú)特的功能,但燧原科技并沒(méi)有采取冒險(xiǎn)主義的路線,比如疊加多得令人難以置信的核心數(shù)量、采取一個(gè)非主流精度或模型類型,又或者在封裝技術(shù)上進(jìn)行冒險(xiǎn)。

對(duì)于我們來(lái)說(shuō),我們所關(guān)心的問(wèn)題是這個(gè)器件可以用來(lái)做什么,眾所周知, GPU 不適合用于大規(guī)模的訓(xùn)練。所以,上面這個(gè)問(wèn)題的答案可能很簡(jiǎn)單,騰訊作為燧原科技最為熱情的支持者,它正在建立自己的中國(guó)本土技術(shù)——顯然,騰訊希望并需要通過(guò)構(gòu)建(或購(gòu)買)本土人工智能硬件來(lái)追趕上同屬中國(guó)超大規(guī)模數(shù)據(jù)計(jì)算領(lǐng)域的兄弟公司們。

DTU 1.0一直以來(lái)都是猶抱琵琶半遮面,就在本周,我們終于在 Hot Chips 上看到了燧原科技基于 12納米 FinFET工藝的訓(xùn)練SOC。下面這個(gè)圖顯示了 32 個(gè)“AI 計(jì)算核心”,分為四個(gè)集群。同時(shí),還有另外四十個(gè)主機(jī)處理模塊沿著燧原科技自己的四個(gè)互連信道推送數(shù)據(jù)。每個(gè)設(shè)備有兩個(gè) HBM2 模塊,帶寬為 512GB/秒。
?

可以看出,燧原科技SoC的AI部分與我們最先從英偉達(dá)看到的 TensorCore 概念有很多共同之處,現(xiàn)在它正在被部署添加到其他幾個(gè) CPU 的設(shè)計(jì)中。 燧原科技表示,它們的器件可以在 FP32 下達(dá)到 20 teraflops。該器件還支持 FP16 和 Bfloat(均達(dá)到 80 teraflops 的峰值),并且可以支持具有 Int-32、18 和 8 位數(shù)據(jù)類型的混合精度工作負(fù)載。其中每一個(gè)都基于一個(gè) 256 張量的計(jì)算內(nèi)核。

下面是張量單位的詳細(xì)介紹:

這款芯片的設(shè)計(jì)考慮了 GEMM 操作和 CNN,這正是騰訊業(yè)務(wù)之中的重點(diǎn),因?yàn)樗饕梢曈X(jué)媒體(視頻、照片、電子商務(wù))驅(qū)動(dòng)。

這家初創(chuàng)公司提供了一款名為云隧CloudBlazer的 PCIe Gen4 加速卡,根據(jù)配置的不同,功耗在 225W 到 300W 之間,其中功耗最大的是基于開放計(jì)算項(xiàng)目的 OAM(開放加速模型)設(shè)計(jì)的 CloudBlazer T21。除了僅限 PCIe 的設(shè)備外,燧原科技還對(duì)系統(tǒng)進(jìn)行了封裝打包,從單個(gè)節(jié)點(diǎn)到機(jī)架,再到具有 2D 環(huán)面互連的“pod”。

燧原科技分享了各種配置的擴(kuò)展結(jié)果,顯示單卡在擴(kuò)展到 160 張卡時(shí)達(dá)到 81.6%,在打包到一個(gè)節(jié)點(diǎn)時(shí)達(dá)到 87.8%。這與我們?cè)?GPU 可擴(kuò)展性方面所看到的大致相當(dāng),盡管它不是一個(gè)條件對(duì)等的比較。

這家初創(chuàng)公司有機(jī)會(huì)為中國(guó)的超大規(guī)模企業(yè)提供人工智能訓(xùn)練業(yè)務(wù)加速,但它并非土生土長(zhǎng)在中國(guó),事實(shí)上它在美國(guó)也有一些根基。該公司的首席執(zhí)行官兼聯(lián)合創(chuàng)始人趙立東在舊金山灣區(qū)工作了 20 年,一直從事 GPU 的研發(fā)和產(chǎn)品工作,不過(guò)他并不在英偉達(dá)工作。在幫助 AMD 在中國(guó)建立研發(fā)中心之前,他有七年的時(shí)間在 AMD 為其 CPU/APU 部門研發(fā)產(chǎn)品。在此之前,他負(fù)責(zé)開發(fā)網(wǎng)絡(luò)安全設(shè)備,還曾在 S3 Inc. 從事 GPU 開發(fā)工作。

另一位聯(lián)合創(chuàng)始人、同時(shí)也是燧原科技的首席運(yùn)營(yíng)官?gòu)垇喠衷勤w立東在 AMD 工作時(shí)的老同事,他擔(dān)任高級(jí)芯片經(jīng)理和全球器件研發(fā)技術(shù)經(jīng)理,同時(shí)也從事 AMD 早期 GPU 的工作。

“人工智能是未來(lái)數(shù)字經(jīng)濟(jì)基礎(chǔ)設(shè)施的核心,也是硬技術(shù)的戰(zhàn)場(chǎng),”燧原科技創(chuàng)始人兼首席執(zhí)行官趙立東說(shuō)。

“作為一家技術(shù)驅(qū)動(dòng)型的公司,我們已經(jīng)規(guī)劃并正在全面實(shí)施未來(lái)三年的產(chǎn)品技術(shù)路線圖,以軟硬件系統(tǒng)聯(lián)合開發(fā)為核心進(jìn)行產(chǎn)品迭代,建立燧原科技技術(shù)在市場(chǎng)上的競(jìng)爭(zhēng)優(yōu)勢(shì)。同時(shí),我們也會(huì)加大對(duì)人工智能領(lǐng)域前沿技術(shù)的探索,讓未來(lái)的創(chuàng)新賦能更大的商業(yè)價(jià)值?!?/p>

作者:Nicole Hemsoth

編譯:與非網(wǎng)
?

騰訊

騰訊

騰訊于1998年11月成立,是一家互聯(lián)網(wǎng)公司,通過(guò)技術(shù)豐富互聯(lián)網(wǎng)用戶的生活,助力企業(yè)數(shù)字化升級(jí)。我們的使命是“用戶為本 科技向善”。Founded in 1998, Tencent is an Internet-based platform company using technology to enrich the lives of Internet users and assist the digital upgrade of enterprises. Our mission is "Value for Users, Tech for Good".

騰訊于1998年11月成立,是一家互聯(lián)網(wǎng)公司,通過(guò)技術(shù)豐富互聯(lián)網(wǎng)用戶的生活,助力企業(yè)數(shù)字化升級(jí)。我們的使命是“用戶為本 科技向善”。Founded in 1998, Tencent is an Internet-based platform company using technology to enrich the lives of Internet users and assist the digital upgrade of enterprises. Our mission is "Value for Users, Tech for Good".收起

查看更多

相關(guān)推薦