close


首先是AMD RDNA2、NVIDIA Ampere兩傢最新架構的比拼,代表是RX 6900 XT、RTX 3090,前者在幾乎所有階段都完勝。

RNDA2架構創新性地加入瞭Infinity Cache無限緩存,提升帶寬的同時,延遲也可圈可點,二級緩存命中率上隻增加瞭大約20ns的延遲,明顯低於Ampere。

更驚人的是,RDNA2顯存延遲和Ampere幾乎一模一樣,但是別忘瞭,Ampere隻有兩個層級的緩存,RDNA2卻有四個。

Ampere的緩存架構更加傳統,SM陣列私有一級緩存到二級緩存要增加超過100ns的延遲,RDNA2從零級緩存到二級緩存則隻增加瞭約66ns。看起來,GA102核心面積過大,也直接增加瞭延遲。

這正好可以解釋AMD RDNA2架構在低分辨率下性能、能效更優秀,因為二級緩存、三級緩存延遲很低,更適合執行較小的負載。Ampere則相反,高負載下優勢明顯,比如說4K分辨率。

說完瞭GPU之間的對比,那麼GPU、CPU放在一起怎麼樣呢?這裡以RX 6900 XT、Intel四代酷睿i7-4770為例來看看。

CPU的緩存自然不是一個級別的,所以這裡Y軸用瞭線性數據,可以看到全程大大低於RDNA2,搭配DDR3-1600 CL9內存延遲隻有63ns,RX 6900 XT、GDDR6的組合則有226ns,另外末級緩存平均延遲分別是53.42ns、123.2ns。

再看看前幾代的NVIDIA GPU,包括Maxwell架構的GTX 980 Ti、Pascal架構的GTX 1080、Turing架構的RTX 2060 Mobile。

Maxwell、Pascal其實差不多,前者整體略高一些,可能是受制於芯片面積較大、核心頻率較低。

Turing則已經有瞭Ampere的樣子,一級緩存延遲低得多,二級差不多,奇怪的是顯存延遲在32MB之後偏高,原因未知。

AMD考察瞭TeraScale架構的HD 5850/6950、GCN架構的HD 7970,再加上RX 6900 XT,很明顯在逐代降低,而且是各級緩存都在同時進步。

arrow
arrow
    全站熱搜
    創作者介紹
    創作者 Ken641228 的頭像
    Ken641228

    Ken641228的部落格

    Ken641228 發表在 痞客邦 留言(0) 人氣()