大數(shù)據(jù)對計算和存儲性能更高的要求,引發(fā)了高性能 CPU 市場的新一輪爭奪戰(zhàn)。x86 架構(gòu)是在這一市場擁有優(yōu)勢,但英特爾和 AMD 的競爭正在加劇。另外,Arm 陣營近年來在服務(wù)器市場發(fā)起猛烈攻勢,新興的 RISC-V 也不想錯過這一利潤豐厚且潛力巨大的市場。
今天,英特爾正式發(fā)布第三代至強可擴展處理器(代號:Ice Lake)及一系列相關(guān)產(chǎn)品組合,開啟了 x86 陣營英特爾和 AMD 第三代高性能 CPU 新一輪的爭奪戰(zhàn)。
核心數(shù)最高為 40 核的 10nm 第三代至強處理器對戰(zhàn)三月中旬 AMD 發(fā)布的最高 64 核 7nm 第三代 EPYC(霄龍)CPU,誰更有優(yōu)勢?正式發(fā)布前就已經(jīng)出貨 20 萬顆第三代至強 CPU 的英特爾,能否壓制 AMD 在 CPU 市場的上升勢頭?
第三代至強平均性能提升 46%
自 2017 年英特爾發(fā)布首款至強可擴展處理器,英特爾至今已經(jīng)交付了超過 5000 萬顆至強處理器,部署了超過 10 億個至強核心,有超過 800 個云服務(wù)提供商部署了基于英特爾至強 CPU 的服務(wù)器。
這是值得驕傲的成績,但市場的競爭也足以讓英特爾保持警惕。市場分析公司 Mercury Research 指出,截至 2020 年第三季度,AMD 在客戶計算芯片市場的份額已經(jīng)連續(xù) 12 個季度增加。IDC 分析師 Shane Rau 指出,2020 年第四季度,AMD 在服務(wù)器 CPU 市場的單位占有率為 7.7%,營收占有率為 8.7%。
英特爾公司副總裁兼至強處理器與存儲事業(yè)部總經(jīng)理 Lisa Spelman 在新品發(fā)布會上表示:“我們沒有把至強稱作一個服務(wù)器產(chǎn)品,它是一個數(shù)據(jù)中心產(chǎn)品。”
無論定位如何,處理器的升級最為直觀的就是性能提升。據(jù)悉,第三代至強可擴展處理器采用英特爾 10nm 工藝,最多有 40 個核心,IPC 相比上一代 20 核 Cascade Lake 有 20% 的提升,AI 性能相比上一代提升 74%,總體性能相比上一代平均提升 46%,相比第一代產(chǎn)品平均提升 2.65 倍。
“我們一直努力保守核心數(shù)這一秘密,但在發(fā)布前還是泄漏了。”Lisa Spelman 表示。
核心數(shù)雖然是被迫減少,但 Lisa 對最新至強處理器的其它特性顯然非常樂于分享,她特別介紹了三個特性。
首先,第三代至強可擴展處理器是英特爾的第一個主流雙插槽并啟用 SGX 英特爾軟件防護擴展技術(shù)的數(shù)據(jù)中心處理器。
據(jù)了解,SGX 已經(jīng)上市好幾年了,但是這是第一次應(yīng)用到至強 E 平臺。雙插槽平臺可以用于增強安全性,增加指定位址空間大小和驅(qū)動基于云的機密計算環(huán)境。數(shù)據(jù)中心處理器在插槽內(nèi)外的性能拓展,從根本上取決于相關(guān)架構(gòu)的效率。第三代至強處理器增加了總體共享緩存,同時新的 Sunny cove 架構(gòu)以及緩存架構(gòu)升級,可以實現(xiàn)八個內(nèi)存通道和最高 3200 的內(nèi)存速度。
第二,作為仍然是目前唯一內(nèi)置 AI 加速的數(shù)據(jù)中心處理器,英特爾增強了 AI 性能。這得益于英特爾在軟件和指令集方面的投資,最新的至強處理器引入了 DL Boost 和 VNNI 指令集,可以對指令數(shù)量進行 4:1 或者是 3:1 的壓縮。體現(xiàn)在性能上,比如 Mobilenet 模型處理能力提升了 66%,BERT 語言模型處理提升了 74%。
第三,第三代至強可擴展處理器內(nèi)置英特爾密碼操作硬件加速。“大家都在爭先恐后的去加密用戶數(shù)據(jù),想走在威脅前面,這必然會帶來一些‘性能稅’,我們通過創(chuàng)新指令,降低算法成本,最新的至強處理器可以為很多重要的加密算法包括公鑰對稱加密、哈希法等提供突破性的性能。”Lisa Spelman 表示。
英特爾與 AMD 第三代 CPU 的性能對決
升級后的第三代至強,與幾周前發(fā)布的 AMD 第三代 EPYC 對比有哪些優(yōu)勢?英特爾的技術(shù)專家給出了兩者從架構(gòu)、內(nèi)存到工作負載的對比數(shù)據(jù)。首先是內(nèi)存時延,無論是 L1、L2 還是 L3 級緩存,第三代至強比第三代 AMD EPYC 都有一定程度的優(yōu)勢。
“至強處理器可以直接訪問統(tǒng)一的緩存,從而獲得一致的響應(yīng)時間和訪問數(shù)據(jù)時間。競爭對手的產(chǎn)品有 8 個不同的計算芯片,每個都有獨立緩存,如果數(shù)據(jù)在本地緩存,響應(yīng)時間會很短,但數(shù)據(jù)不在本地緩存就需要到另一個芯片檢索數(shù)據(jù),因此本地緩存訪問和遠程訪問響應(yīng)的時間會差很多。”英特爾技術(shù)專家解釋。
內(nèi)存能力方面,第三代至強可以支持兩條 DIMM 在最高 3200 的頻率下運行,AMD 三代 EPYC 只能單通道運行 3200 的頻率,這將會降低內(nèi)存的吞吐量。DRAM 的時延,也因為架構(gòu)的差別有所差異,至強在芯片旁邊就是內(nèi)存控制器,所以本地插槽延時更短,可以實現(xiàn)最高 30% 的性能提升。特別是,最新至強配容量可達 6TB 的傲騰持久內(nèi)存,能夠更好地實現(xiàn)快速訪問。
接下來看在工作負載方面的提升。英特爾技術(shù)專家表示:“工作負載加速器指令就好比性能倍增器,它提供的增益要比僅向處理器添加核心所能帶來的增益高很多。”這是至強 40 個核心能比 64 核心 EPYC 有更高性能的關(guān)鍵。
根據(jù)技術(shù)專家給出的數(shù)據(jù),在高性能計算中,在至強 AVX-512 指令集的優(yōu)化作用下,EPYC 的性能只達到 1,第三代至強的性能都在 1 之上。這種優(yōu)化對于生命科學、化學、金融領(lǐng)域等的工作負載加速都有積極意義。
在云服務(wù)器和基礎(chǔ)架構(gòu)服務(wù)的工作負載中,第三代至強的加密指令可以顯著提升速度,在網(wǎng)絡(luò)交易庫可以實現(xiàn) 2-3 倍的性能提升,對于云基礎(chǔ)設(shè)施的新工作負載云專家等都能體現(xiàn)出優(yōu)勢。
對比 AI 推理能力,至強比 EPYC 的優(yōu)勢也十分明顯,單一 AI 負載可以比 64 核 EPYC 高 25 倍。英特爾技術(shù)專家指出,“許多應(yīng)用是在產(chǎn)品發(fā)布之后通過客戶軟件來持續(xù)提升,這種提升非常驚人,在一些 AI 推理中可以達到 30 倍的性能提升,一些應(yīng)用時延降低了 10 倍。”
Lisa Spelman 說:“幾年前開始我們就開始早早投資指令集和軟件,這個戰(zhàn)略正在產(chǎn)生巨大的回報。”
有意思的是,至強展現(xiàn)出的架構(gòu)、時延的優(yōu)勢,其關(guān)鍵是傳統(tǒng)架構(gòu)與小芯片架構(gòu)之間的差異。英特爾也在推動小芯片和先進封裝技術(shù)的發(fā)展,未來也會將小芯片架構(gòu)應(yīng)用到至強處理器中,英特爾如何解決小芯片帶來的挑戰(zhàn)值得關(guān)注。
強調(diào)組合產(chǎn)品優(yōu)勢,英特爾至強出貨有保證
“CPU 是客戶購買決策的關(guān)鍵部分,但是這不是唯一的因素,其中最酷的因素之一就是讓客戶看到我們提供的整個產(chǎn)品組合。通過使用整個產(chǎn)品組合,客戶能完成復(fù)雜而重要的購買決策。”Lisa Spelman 表示。
英特爾公司市場營銷集團副總裁、中國區(qū)數(shù)據(jù)中心銷售總經(jīng)理陳葆立也說:“我們之前做過一些調(diào)查,企業(yè)購買一個服務(wù)器最關(guān)心的是可靠性、穩(wěn)定性、大規(guī)模部署的實力。至強已經(jīng)有 5000 萬顆的出貨量,非常多軟件開發(fā)商已經(jīng)有很多版本的優(yōu)化軟件,這對客戶來而言是非常大的一個吸引力。對于至強或者是 x86 的競爭力,我們都非常有信心。”
因此,英特爾發(fā)布第三代至強可擴展處理器的同時,還發(fā)布了傲騰持久內(nèi)存 200 系列,內(nèi)存帶寬增加 32%,每個插槽內(nèi)存容量最高可以達到 6TB。
同時,號稱世界上最快的數(shù)據(jù)中心固態(tài)硬盤傲騰 P5800X 也正式發(fā)布,IOPS 提升 4 倍,滿足高速網(wǎng)絡(luò)需求,TOS 最高提升 6 倍,滿足最嚴苛 SLA 要求,相較 NAND 固態(tài)硬盤,延遲降低 13 倍。
除此之外,英特爾還發(fā)布了最新的以太網(wǎng)適配器 800 系列,吞吐量最高為 200GB/s,適合高性能 vRAN、NFV 轉(zhuǎn)發(fā)面、存儲、高性能計算、云和 CDN 等應(yīng)用場景,能夠為虛擬機的密度提供最多兩倍的資源。
2019 年宣布的 Agilex FPGA 也在此次發(fā)布會上正式發(fā)布。Lisa Spelman 解釋,由于對靈活性和敏捷性的要求都很高,所以 FPGA 的研發(fā)需要漫長的時間。采用英特爾 10 納米 SuperFin 工藝的 Agilex FPGA,搭配 Quartus Prime 軟件,與競爭對手的 7 納米 FPGA 相比,能實現(xiàn)高于 2 倍的每瓦性能。
英特爾的組合產(chǎn)品在傳統(tǒng)的零售等領(lǐng)域都展現(xiàn)出了優(yōu)勢。
“在某些情況下,通過軟件優(yōu)化,我們的處理器的性能會比發(fā)布的時候有所提升。對我們來說,關(guān)鍵的改變重點和戰(zhàn)略是在我們交付的產(chǎn)品性能基礎(chǔ)之上進行部署優(yōu)化,而不是讓我們的客戶或者是解決方案團隊直接轉(zhuǎn)移到下一代產(chǎn)品的開發(fā)上去。”Lisa Spelma 同時表示。
陳葆立也提到:“頭部客戶我們直接和他們合作,一起做優(yōu)化;中小企業(yè)更多是和方案商合作,我們?nèi)蛴?500 個英特爾精選解決方案,我們還會繼續(xù)投資,聚焦邊緣網(wǎng)絡(luò)、云、高性能計算、HPC 和傳統(tǒng)的企業(yè)工作負載提供精選解決方案。”
頭部客戶的需求讓至強在正式發(fā)布之前就已經(jīng)出貨了 20 萬顆。陳葆立透露:“已經(jīng)出貨的 20 萬顆至強第三代可擴展處理器,主要是一些重點客戶,可以進行早期驗證,包括他們內(nèi)部的工作負載。”
Lisa 透露,第三代至強處理器在 2020 年底投入生產(chǎn),2021 年一季度一直在加大生產(chǎn)力度。“我們打算利用自身 OEM 的優(yōu)勢最大限度滿足市場對第三代產(chǎn)品的需求。所有主要的云服務(wù)提供商都計劃部署 Ice Lake 的服務(wù),他們會在 4 月份首次推出此類服務(wù)。我們有超過 50 個優(yōu)秀的 OEM、ODM 預(yù)計將向市場推出超過 250 個基于 Ice Lake 的設(shè)計。“
英特爾公司副總裁兼中國區(qū)總經(jīng)理王銳表示:“至強處理器的出貨有保證,特別是數(shù)據(jù)中心。我們在全力提升產(chǎn)能,實際的提升比計劃更高。”
小結(jié)
2015 年就開啟并購布局 XPU 的英特爾,如今看來又一次引領(lǐng)了異構(gòu)計算的時代。因此,在外界看來英特爾面臨著 AMD 的挑戰(zhàn)之時,英特爾依然能夠憑借全面的產(chǎn)品組合來應(yīng)對當下的競爭。當然也可以看到,在激烈的市場競爭之下,英特爾也愿意直接拿出詳細的產(chǎn)品性能對比數(shù)據(jù)來證明自己的實力。
AMD 憑借選用臺積電的先進工藝制程,以及更早使用小芯片設(shè)計贏得了再次搶奪英特爾 CPU 市場份額的機會,但在全球芯片缺貨的背景下,產(chǎn)能搶奪成了純芯片設(shè)計公司最具挑戰(zhàn)的問題,同時,英特爾也從性能對比中指出了小芯片設(shè)計的不足,并且強調(diào)了至強獨一無二的 AI 性能優(yōu)勢。在這樣的情況下,擁有芯片工廠的英特爾也迎來了壓制住 AMD 的好時機。
但是,面對來勢洶洶的 Arm 和 RISC-V,以及大數(shù)據(jù)和 AI 時代更加多樣化的需求,英特爾也無法高枕無憂,這或許也是英特爾更加重視定制化方案,與最終用戶走的更近的原因所在。
迎來新任 CEO 以及進入 IDM 2.0 時代的英特爾,還能給我們帶來驚喜嗎?