close

0.png

上一代的 OCTEON TX 和 OCTEON TX2,僅被 Marvel 稱作“基礎架構處理器”。而最新的 OCTEON 10 平臺,則被該公司稱作 DPU 加速器。這種類型的多功能芯片,旨在幫助移動和處理那些通過網絡傳輸的數據。

1.png

在 OCTEON 10 身上,我們不僅看到瞭與上一代相同的多功能構建塊陣列,還看到瞭某些先進的 IP、以及一些新功能。比如集成機器學習推理的引擎、內聯加密處理器、以及矢量數據包處理器,且它們都能夠以虛擬化方式運行。

2.png

值得一提的是,OCTEON 10 也是 Marvell 首款采用臺積電 N5P 工藝制造的 DPU 芯片。其不僅率先集成瞭 ARM 的 Neoverse N2 CPU 核心,還支持最新的 PCIe 5.0 I/O 與 DDR5 內存。

作為 DPU 的重要補充,Marvell 還為 OCTEON 10 引入瞭內部機器學習(ML)引擎。盡管去年完成的早期 IP,最初是為專用型的推理加速應用而打造的。

但在激烈的市場競爭面前,該公司還是決定暫時按下不表,直到將 ML 加速器集成到最新的 OCTEON DPU 芯片中。

3.png

Marvel 指出,將推理加速器放到同一芯片、並直接集成到數據管道中,對於此類數據流用例所需的高吞吐量 / 低延遲處理至關重要。

與此同時,Marvel 正在為英偉達下一代 BlueField-3 DPU 提供優於競爭對手的解決方案,尤其在 AI 處理性能和產能等方面。

據悉,首批 OCTEON 10 產品預計將於 2021 年底前出樣,而英偉達 BF2 則要等到 2022 年。

4.png

此外 OCTEON 10 新系列引入瞭矢量數據包處理引擎,與當前一代的標量處理引擎相比,它能夠將數據包的處理吞吐量,大幅提升至 5 倍。

如前所述,OCTEON 10 DPU 系列是首款公開宣佈采用 ARM 最新的 Neoverse N2 基礎架構的 CPU IP 設計。

AnandTech 在數月前介紹過 N2 與面向高性能計算的 HPC V1,可知與亞馬遜 Graviton2 或 Ampere Altra 相比,其承諾帶來 40% 的性能提升。

5.png

對於 Marvell 而言,在從 TX CPU 核心切換到 N2 之後,其單線程性能亦有望提升 3 倍。2020 年底的時候,該公司已宣佈停用自傢的 CPU IP,轉而支持 ARM 的 Neoverse 內核。

從 DPU 用例來看,這款 Armv9 CPU 也支持 SVE2,其中包含瞭有利於數據處理和機器學習功能的重要指令,這點較英偉達 BlueField3 DPU 設計具有很大的優勢(後者仍停留在 Armv8.2+ 的 Cortex-A78 內核)。

6.png

Marvel 還為 N2 配備瞭完整的緩存選項,包括 64KB L1I 和 L1D 緩存,以及完整的 1MB L2 緩存。不過在網狀網絡解決方案上,Marvell 還是選擇瞭為該 SoC 集成自傢的設計。

這部分的規格相當高,網狀網絡中提供瞭 256-bit 數據路徑,輔以 2MB 的 L3 共享緩存,並且能夠隨著核心數量的增加而加大。

7.png

在交換集成和網絡吞吐量方面,Marvell 結合瞭 1 Tbps 交換與多達 16 路 50G MAC 整合到瞭一起,盡管實際產品 SKU 還是會針對特定場景而有所區分。

AnandTech 指出,OCTEON 10 系列涵蓋瞭廣泛的應用,從 4G / 5G RAN 數字 / 中央單元、到前傳網關 vRAN 卸載處理器等。

在雲和數據中心用例上,這些解決方案可在計算與網絡吞吐量性能方面,提供廣泛的多功能性。對於企業而言,OCTEON 10 系列亦可提供深度集成的數據包處理和安全加速特性。

8.png

首個 OCTEON 10 產品將基於 CN106XX 設計,在 PCIe 5.0 外形尺寸上提供瞭 24 個 N2 內核 + 雙路 100GbE QSFP56 端口,

目前 CN106XX 已經完成流片,預計將於 2021 下半年出樣,且有望在 4 季度上市。規格方面,Marvell 對 OCTEON 10 系列的各種設計進行瞭細分。

比如本文介紹的 DDR5 控制器特指 40-bit 通道(含 8-bit ECC),輔以 SPECint2006 基準測試的性能參考數據。

9.png

此外 Marvell 準備瞭另外三款 OCTEON 10 SKU,包括僅配備 8 個 N2 內核、TDP 低至 10-25W 的入門級 CN103XX,兩款改進網絡連接的高端款 CN106XXS,以及多達 32 個 N2 內核、運算能力和網絡連接吞吐量都最高的旗艦級 DPU400 。

好消息是,即便是規格最強的產品,其熱設計功耗也隻有 60W,遠低於當前一代 CN98XX Octeon TX2 旗艦 SKU 的 80-120W。不過這些產品尚未流片,預計出樣時間為 2022 年。

Marvell 總結道,該公司在 DPU 出貨量方面一直處於行業領先地位,且在所有大型數據中心都有廣泛的部署。隨著全新一代 OCTEON 10 系列產品的到來,其將在性能和效率方面擁有更顯著的競爭優勢。

arrow
arrow
    全站熱搜
    創作者介紹
    創作者 Ken641228 的頭像
    Ken641228

    Ken641228的部落格

    Ken641228 發表在 痞客邦 留言(0) 人氣()