AMD Epyc Rome選用Nvidia的新DGX 但HGX具有Intel選件
AMD繼續(xù)通過其第二代Epyc“羅馬”處理器進(jìn)入數(shù)據(jù)中心,該處理器上周因Nvidia宣布其基于Ampere的新DGX系統(tǒng)將依靠AMD而非英特爾CPU贏得了勝利。但是,在使用基于DGX的HGX底板構(gòu)建基于Ampere的HGX服務(wù)器時(shí),Nvidia合作伙伴(OEM和超大規(guī)模生產(chǎn)商)仍可以選擇Intel CPU。
除了為AI和HPC工作負(fù)載的DGX A100提供動(dòng)力的八個(gè)基于A100 Ampere的GPU之外,Nvidia還加入了兩個(gè)AMD Epyc 7742處理器,它們總共提供128個(gè)內(nèi)核,8個(gè)內(nèi)存通道和每個(gè)CPU 128個(gè)PCIe 4.0通道。
在媒體發(fā)布會(huì)上,英偉達(dá)公司DGX Systems副總裁兼總經(jīng)理查理·博伊爾(Charlie Boyle)將更換CPU供應(yīng)商的決定描述為技術(shù)上的決定。他說:“在市場上,我們一如既往地進(jìn)行設(shè)計(jì),因?yàn)槲覀儗?duì)CPU不了解。” “我們只是想使用最佳平臺(tái),而AMD CPU是正確的選擇。”
羅馬的PCIe Gen4支持和高內(nèi)核數(shù)被認(rèn)為是主要的推動(dòng)力。當(dāng)前,英特爾®至強(qiáng)®8200-R CPU最高支持28核,并使用PCIe Gen3。
DGX A100是Nvidia的第三代DGX系統(tǒng),它是第一個(gè)包含PCIe Gen4的系統(tǒng),它使PCI總線上的I / O帶寬增加了一倍。當(dāng)然,要充分利用這一優(yōu)勢,必須使系統(tǒng)中的所有組件都具有該功能。博伊爾說:“ Mellanox CX6 200-gig網(wǎng)卡,PCIe交換和系統(tǒng)內(nèi)部使用的NVMe存儲(chǔ)是Gen4,我們需要一個(gè)可以為八個(gè)A100s GPU供電的CPU復(fù)合體。” “這就是為什么我們選擇AMD CPU;它具有我們需要的PCIe Gen4支持,以及我們需要的非常高的核心數(shù)量。當(dāng)我們解決這些越來越大的AI問題時(shí),您需要那些內(nèi)核才能將數(shù)據(jù)放入GPU。”
博伊爾還指出,x86的基礎(chǔ)和AMD工程技術(shù)意味著客戶可以無縫移植到新系統(tǒng)。他說:“ [他們]可以獲取在V100 DGX系統(tǒng)上運(yùn)行的代碼,將其放在A100 DGX上,并且運(yùn)行速度更快,他們不需要更改任何代碼。”
英特爾基于10nm +工藝節(jié)點(diǎn)的Ice Lake服務(wù)器處理器將于2020年第三季度上市。內(nèi)核數(shù)量尚未正式披露,但像AMD第二代Epycs一樣,即將到來的英特爾處理器將支持PCIe Gen4和八個(gè)內(nèi)存通道(六個(gè)通道)。
帶有AMD即將面市的5nm Epyc CPU的HGX系統(tǒng)已經(jīng)在至少一個(gè)系統(tǒng)供應(yīng)商的路線圖上。Atos 透露,其基于HGX的X2415 BullSequana刀片將支持Eypc Rome和(未來的)Milan CPU。
盡管英偉達(dá)在其最新的DGX系統(tǒng)中將Xeons換成Epycs,但合作伙伴服務(wù)器內(nèi)部使用的HGX A100底板仍可以使用Intel Xeon CPU。例如,技嘉 正在開發(fā)四款新的HGX A100服務(wù)器,并計(jì)劃提供帶有第二代AMD Epycs或第三代Intel Xeon可擴(kuò)展CPU的8-GPU和4-GPU DGX A100配置。
標(biāo)簽: AMDEpycRome