當前位置:首頁 > 專訪 > 付斌
[導讀]9月23日,Arm宣佈Neoverse新增Arm Neoverse V1平台以及第二代的N系列平台Neoverse N2,兩款新品使得Neoverse再度進階,而新產品直指的目標則是超級計算機和數據中心。

雲計算和邊緣計算這兩個詞是近幾年被電子行業提及頻次最高的詞,伴隨相關應用逐步融入社會各個領域,數據處理便成為了行業首當其衝的領域。

此前,騰訊宣佈TARS微服務開發框架已成功移植至Arm CPU架構;百度在其數據中心採用了基於Arm架構的智能計算;亞馬遜AWS雲在自己的雲服務器上做了一個基於Arm架構的自研項目……

事實上,Arm架構服務器由於其高性能以及自身具備的低功耗素質,已成為數據中心基礎設施建設的焦點。

9月23日,Arm宣佈Neoverse新增Arm Neoverse V1平台以及第二代的N系列平台Neoverse N2,兩款新品使得Neoverse再度進階,而新產品直指的目標則是超級計算機和數據中心。21ic中國電子網記者受邀參加此次新品發佈的在線研討會,揭祕Neoverse處理器IP背後的發展。

01

翻倍,性能衝刺之路

首先,Arm新發布的這兩款Neoverse平台究竟有多強?直接上數據。通過Arm給出的數據,相比去年推出的Neoverse N1,代號為“Zeus”的Neoverse V1比N1單線程性能提升50%,代號為“Perseus”的Neoverse N2在相同水平的功率和麪積之下比N1單線程性能提升40%。

另外,會議上,Neoverse平台的最新路線圖也一併被披露,圖示顯示Neoverse目前處於製程節點7/5nm上,支持PCle Gen5、DDR5、HBM2e和CCIX 1.1;至2021年將全面進入5nm製程節點,支持HBM3、CCIX 2.0、CXL 2.0;至2022年將進入5/3nm製程節點,支持CCIX next和CXL next。

值得一提的是,會議上,Arm承諾後續的Neoverse產品在2022年以後,每年也都會有30%的性能提升。Arm基礎設施事業部高級副總裁兼總經理Chris Bergey表示,這與Arm工程團隊的努力和投入是分不開的,另一方面,能夠保持穩定的性能提升與Arm自身軟件生態的逐漸成熟有很大關係,例如很多雲原生的軟件現在可以比較無縫運行在Arm架構上面。

圖1:Arm Neoverse最新技術發展路線圖

在核心和線程上,以雲工作負載為例,可以看出Neoverse V1在96核96線程下擁有極佳的處理能力,可以在核心數更少的情況下發揮更好的性能;Neoverse N2則可以多達128核128線程的設計,擁有極強的擴展性,並在同樣的擴展能力下擁有比N1更強的性能。

圖2:雲工作負載使用內核數量

文行至此,可能大家並沒有感受到本次發佈的Neoverse V1和N2的強大?那麼從Neoverse從初版發佈到現如今推出產品的歷史來看起。

Neoverse處理器IP首次亮相於2018年10月18日,同為Arm指令集的IP產品,不同於Cortex系列,Neoverse面向的是高性能計算市場。當時Neoverse平台產品中代號“Cosmos”的產品是基於16nm工藝,A72、A75核心的產品。當時公佈的路線圖中,Arm提出了每年每代產品的30%的單線程性能提升,每一代提升30%也是Arm的“老傳統”。

圖3:2018年Arm公佈的Neoverse發展路線圖

但時間推移到下一代產品發佈時間2019年2月21日,Neoverse N1和E1平台被公佈出來後,一切預測都被推翻了。屬於7nm工藝時代的Neoverse N1相比A72的“Cosmos”單線程性能提升了60%,超出預計整整一倍,關鍵雲端負載性能則提升了高達2.5倍。Neoverse E1作為低功耗和低面積的代表,也擁有不俗的實力,與Arm前幾代方案相比,吞吐量性能提升超過2.7倍,吞吐效率提升超2.4倍,計算性能提升超2倍。

圖4:2019年Arm公佈的Neoverse發展路線圖

上文有提到,V1比N1單線程性能提升50%,N2比N1單線程性能提升40%,而這一切的基礎都是在N1超出前一代60%的基礎上完成的。換言之,也就是説V1比“Cosmos”單線程性能出140%,N2比“Cosmos”單線程性能高出124%,超額兩倍完成了2018的初版路線規劃。

02

定位,面向不同市場

Neoverse平台系列幾經周折,現如今形成了三個定位,這種定位也與現今數據中心市場相符合。另一方面,也與Arm的Cortex的最新定位相呼應,即無視面積和功耗、純粹注重高性能的Cortex-X1、PPA(功率、性能、面積)最大化的Cortex-A78。

1、V系列:追求終極性能的系列產品,性能優先於面積和功耗。擁有最高的帶寬和性能表現,以及最大的Buffers(緩衝區)、Caches(緩存)、Windows(窗口)和Queues(隊列),隨之而來的是最大的面積和功耗。

2、N系列:滿足橫向擴展性能需求的系列產品,最大化PPA,即在性能、功耗和麪積上保持平衡。擁有更強的擴展性,更加平衡的性能,同樣面積或TDP下更多的核心數。因為支持更多的線程,因此在橫跨雲、智能網卡(SmartNICs)、企業網絡、邊緣設備上都擁有非常廣闊的應用的場景。

3、E系列:低功耗小面積系列產品,面積和功耗優先於性能。擁有更好的效率、吞吐量和線程數,當然最重要的是在面積和功耗上擁有最好的優化。另外,E1還支持同步多線程(SMT)技術,能夠提供網絡效果優化。

圖5:三個系列不同的定位

市場方面,Chris Bergey告訴記者,V系列、N系列、E系列會根據合作伙伴和客户對於功耗、性能和麪積上不同需求進行配置,假若客户更看重線程,N系列便是首先,假若客户需要高性能計算工作負載,V系列就能提供更大的價值。

值得一提的是,Neoverse V1和N2均支持可伸縮矢量擴展(Scalable Vector Extensions, SVE),而SVE則可基於未知寬度向量單元的軟件編程模型,執行單指令流多數據流(SIMD)整數、bfloat16、浮點指令。另外,SVE還可確保軟件編碼的可移植性與使用壽命,同時兼顧高效的執行。

利用SVE,半導體邯鄲到香港物流可以對SVE電壓和頻率過渡實施控制,開發者可以在窄矢量和寬矢量之間隨意混合代碼。

SiPearl公司營銷副總裁Craig Prunty表示:“Neoverse路線圖上的SVE為HPC和ML帶來了巨大的潛力,我們非常看好這項技術對未來Arm生態系統的發展。”

03

生態,軟硬件鑰匙

在硬件生態方面,支持重要的兩個技術便是CCIX(針對加速器的緩存一致性互聯)和CXL(開放互聯技術)。CCIX主要用於跨芯片間互連,用於打造異構封裝系統,支持完整緩存一致性;CXL則是基於PCle 5.0的規範,可讓CPU與GPU、FPGA等加速器更好地連接,帶來更好地帶寬和內存一致性,簡化硬件設計難度,降低系統成本。

當然,異構計算已逐漸成為現在數據發展的重要“根據地”,事實上,這也是生態中的一環。數據中心無論是存儲還是數據加速,整體趨勢是分佈式的,這便對性能和功耗提出嚴苛的要求。Chris Bergey表示,Arm已看到很多異構計算的產品與方案目前都開始基於Arm的架構,例如存儲控制器、智能網卡中用到的計算CPU。

在異構計算方面,對於Arm來説,如何提供緊耦合或是定製化的能力,甚至是通過多核封裝或多芯片組裝技術,將來自生態系統、IP技術與雲邯鄲到香港物流的需求與技術整合在一起,是很大的機遇。不論是基於FPGA、GPU、TPU單元的加速器,數據的移動是必不可少的,Arm架構的可擴展性便是優異的解決方案。

圖6:CCIX和CXL領導智能未來

在軟件生態方面,Chris Bergey為記者介紹,Arm將軟件分為兩種類型,一是雲原生的軟件,二是傳統的企業級軟件。雲原生軟件是Arm一直以來重視的領域,在這個領域Arm現在是擁有最大的持續集成/持續交付(CI / CD)平台的一等公民,並在大多數編程語言的生態環境中,Arm都扮演着核心角色,同時Arm也看到雲原生技術在邊緣計算領域變得越來越重要,在這一領域我們推出了Project Cassini項目。

此外,隨着V-RAN、O-RAN等項目的崛起,雲原生軟件也將成為5G未來發展的一個重要組成部分。 另一方面,傳統企業軟件領域出現了“軟件即服務”(SaaS)的發展趨勢。面對這一趨勢,由於在Arm架構之上能夠創造非常有利的軟件即服務產品,因此很多獨立軟件開發商(ISV)都對Arm表現出濃厚的興趣,紛紛投入Arm陣營,在中國市場這一趨勢尤其顯著。

圖7:Arm支持的軟件生態

“Arm認為軟件生態系統,特別在基礎設施這個市場上,是非常重要的。” 根據Chris Bergey的介紹,現如今,Arm處理器核在性能方面的優勢,不僅獲得了美國的大型互聯網公司的認可,在中國的大型互聯網公司以及廣大的軟件生態系統層面,也獲得了很多的進展。另外,Arm也很樂於與國內外邯鄲到香港物流攜手,利用Neoverse N1和V1來幫助客户交付相關項目。

換一批

延伸閲讀

[OFweek維科網] 英偉達要收購ARM?華為説不行!

英偉達收購ARM之路註定一波三折,反對之聲愈演愈烈。 自從英偉達(Nvidia)計劃斥資400億美元收購Arm以來,此事備受市場關注,並且該筆交易目前仍需得到中國、英國、歐盟以及美國監管機構的...

關鍵字: 芯片 ARM 英偉達

[嵌入式分享] 淺析arm歷史和交叉編譯鏈選擇

淺析arm歷史和交叉編譯鏈選擇

眾所周知ARM的設計是艾康計算機公司於1983年開始的開發項目。這個團隊由RogerWilson和SteveFurber帶領,着手開發一種類似高級6502架構的處理器。Acorn計算機有一大堆建構在6502處理器上的計算機,因此能設計出...

關鍵字: 交叉編譯鏈 ARM

[嵌入式分享] 突破!Arm通過64位計算,突破移動終端的性能與安全侷限

突破!Arm通過64位計算,突破移動終端的性能與安全侷限

2020年10月份,為了推動移動創新的進一步發展,Arm近日宣佈從2022年開始,所有面向市場的Cortex-A大核都將僅支持64位。這項計劃作為Arm專注於“全面計算(TotalCompute)”的一部分,旨在突破計算性能、安全性和優...

關鍵字: 移動終端 ARM

[半導體] 英偉達收購Arm引發華為等國企的強烈擔憂

英偉達收購Arm引發華為等國企的強烈擔憂

有知情人士透露,中國幾家最有影響力的科技公司一直在遊説國家市場監管局,要麼拒絕這筆交易,要麼附加條件,以確保中國公司能夠繼續使用Arm的技術。包括華為技術有限公司在內的中國科技公司已向當地監管機構表達了對英偉達公司收購Arm的強烈擔憂。...

關鍵字: 華為 ARM 英偉達

技術子站

關閉