經過近十年的生態建設之后,Arm 高性能 CPU 終于在服務器市場嶄露頭角,亞馬遜、Marvell 都已經將 Arm 架構應用于云端,華為海思也推出了基于 Neoverse N1 設計的鯤鵬系列服務器,Ampere Computing 在去年推出了首款云原生服務器 CPU,已經展現出了性能和功耗的優勢。
近日,Ampere 在 2022 年度戰略和產品路線圖更新的分享中透露,Ampere 將在今年發布自研核心的 5nm CPU AmpereOne。
Ampere Computing 首席產品官 Jeff Wittich 告訴雷峰網:“AmpereOne 也是以 ARM ISA 為基礎??蛻裘磕甓计诖行阅芨?、能效更好,擴展性更好的 CPU,通過開發和推出自研核 CPU,能夠幫助我們把所有的注意力和重心都放在客戶的需求方面,也能夠去滿足他們相應的要求。”
也就是說,在獲得包括微軟 Azure、阿里云、騰訊云等全球七大超大規模的數據中心客戶的認可之后,Ampere 要將其 CPU 的性能和功耗表現進一步提升。作為 Arm 高性能服務器 CPU 提供商的代表,Ampere 進一步提升的產品也意味著Arm 服務器 CPU 與 x86 服務器 CPU 的差距將進一步擴大。
靠高性能、低功耗、云原生搶食 x86 服務器市場
Arm 架構服務器 CPU 相比 x86 服務器 CPU 一個顯著的特征就是更高性能和更低功耗。根據 Ampere 給出的數據,其 CPU 的性能超越傳統 x86 處理器 3 倍,性能功耗比領先近 4 倍。
與 x86 服務器 CPU 相比,Ampere Altra 系列可用 50% 的能耗,提供 200% 的性能。
Altra CPU 能夠實現高性能的關鍵是高核數。
Jeff Wittich 解釋,“我們 128 核的產品目前在業內領先,是其它 CPU 的兩倍。每個核上僅運行一個單線程,并保持以一致的高頻率全核運行。同時,我們為每個核提供大容量低延遲的專用緩存,借助智能高帶寬 Mesh 互聯結構,將所有高性能核都連接在一起,打破了傳統的 CPU 在需求增加時會產生遞減回報的使用瓶頸。還采用先進的 DDR 和 PCIe 技術設計,可實現最大容量,擴展內存和 I / O 的帶寬。能夠有效避免用戶之間的相互干擾,同時提供優秀的可擴展性能,最終達到最大利用率。”
還有非常關鍵的一點,Ampere Altra 系列是為云計算而生,作為云原生 CPU,Ampere 為了優化功耗和面積,去除了傳統架構不受云歡迎的特性,實現單核功耗比比傳統 CPU 低 67% 以上。
“傳統 x86 最大的一個劣勢是,它們并不是專門為數據中心所設計,也不是專門為云端、云業務所設計,過去被用于數據中心,也是由于當時除了 x86 CPU 沒有更好的選擇。” Jeff Wittich。
云原生處理器的優勢具體可以體現為,由于擁有高核心數量的優勢,每一個核心僅運行一個單線程,可以表現出比較好的性能和安全性,不用擔心工作負載數量、壓力的增加而導致性能的下降,也可以抵御很多用戶干擾。
Altra CPU 也有比 x86 CPU 更好的可擴展性,對于云計算客戶也十分有用。
進一步拉大與 x86 CPU 的性能差距
Ampere Computing 董事長 Renee James 透露,“我們已經就產品的性能和功能申請了數百項專利,最新的產品 AmpereOne 采用 Ampere Computing 自研核,基于 5nm 工藝,支持 PCIgen5 和 DDR5。新產品已經開始送樣,非常期待客戶的反饋。”
“我們即將推出的自研核 AmpereOne,也是以 Arm ISA 為基礎,微架構與 Arm 提供的 Neoverse 有非常多區別,但目前還不能提供過多信息。”Jeff Wittich 透露,“自研核 AmpereOne 能夠完美地與我們現在的產品 Altra 和 Altra Max 云原生處理器互相兼容。從用戶的角度,他們針對 Ampere Altra/ Altra Max 實現的優化,在我們的 AmpereOne 上也可以是完美適用的。除此之外,我們還與編譯器,例如 GCC 和 LLVM 進行過相應的合作,進一步確保我們所有產品的適配性。”
雖然還沒有更具體的信息,但 Ampere 的 CPU 會進一步提升性能和功耗,這無疑會進一步拉大與 x86 CPU 的差距。
不過,Arm 高性能 CPU 還有一個明顯的短板,那就是軟件生態。
生態仍是 Arm 服務器 CPU 短板
要完善 Arm 高性能計算生態,軟硬件都需要不斷提升,Ampere 除了與云平臺以及硬件的 ODM 和 OEM 合作外,也和技嘉和凌華科技等合作伙伴的開發套件,用于人工智能和自動駕駛等多個場景,拓展應用場景。
Ampere 強調,其高性能、低功耗的邊緣云原生處理器,還可將功率降至超低的 40W (32C) 或低于 70W (64C)。意味著 Ampere Computing 32 核處理器的功耗比同等的 x86 CPU 低 4.6 倍,能夠開辟其他競爭對手無法涉足的新領地,如 Cruise 的自動駕駛汽車。
當然,Ampere 也在探索 AI 以及混合量子計算的方向。
另外,Ampere 通過設立 Ampere Developer Program 開發者計劃,希望吸引更多開發者,在開發者社區提供 130 多個應用程序,并且每天在網站上進行回歸和更新,從數據庫到 AI 推理的各種解決方案。
“通過回歸測試,可以保證我們廣泛的適配性,同時在適配性的基礎上確保高性能的效果。” Jeff Wittich 表示。
但無論如何,Ampere 所選擇的 Arm 高性能計算生態,還需要更多企業和開發者共同建設,才能真正與 x86 CPU 在服務器市場一較高下。
全球綜合數據資料庫 Statista 預測,到 2028 年,Arm 架構處理器在數據中心和云的市場規模將達到 580 億美元,是 2019 年的 14 倍多,市場份額也將從 2019 年的 5% 增長到 25%。
Arm 在數據中心的云市場仍然還有一段路要走。