2020年的最後一天,AMD向美國專利商標局提交瞭一項新專利,勾勒瞭未來的GPU小芯片設計。
chiplet小芯片,AMD已經玩兒得很溜
AMD首先指出,傳統的多GPU設計存在諸多問題(包括AMD自己的CrossFire),比如GPU編程模型不適合多路GPU,很難在多個GPU之間並行分配負載,多重GPU之間緩存內容同步極為復雜,等等。
AMD的思路是利用“高帶寬被動交聯”(high bandwidth passive crosslink)來解決這些障礙,將第一個GPU小芯片與CPU處理器直接耦合在一起(communicably coupled),而其他GPU小芯片都通過被動交聯與第一個GPU小芯片耦合,而所有的GPU小芯片都放置在同一個中介層(interposer)之上。
這樣一來,整個GPU陣列就被視為單獨一個SoC,然後劃分成不同功能的子芯片。
傳統的GPU設計中,每個GPU都有自己的末級緩存,但為瞭避免同步難題,AMD也重新設計瞭緩存體系,每個GPU依然有自己的末級緩存,但是這些緩存和物理資源耦合在一起,因此所有緩存在所有GPU之間依然是統一的、一致性的。
聽起來很難懂對吧?確實如此,畢竟一般在專利文件中,廠商往往都會故意隱藏具體設計細節,甚至可能存在一些故意使之難以理解、甚至誤導的描述。
AMD沒有透露是否正在實際進行GPU小芯片設計,但早先就有傳聞稱,下一代的RNA3架構就會引入多芯片,這份專利正提供瞭進一步佐證。
可以預料,RDNA3架構如果真的上小芯片設計,核心規模必然會急劇膨脹,一兩萬個流處理器都是小意思。
AMD也不是唯一有此想法的人。Intel Xe HP、Xe HPC高性能架構就將采取基於Tile區塊的設計,今年晚些時候問世,直奔高性能計算、數據中心而去。
NVIDIA據說會在Hopper(霍珀)架構上采用MCM多芯封裝設計,而在那之前還有一代“Ada Lovelace”(阿達·洛夫萊斯),有望上5nm工藝,並堆到多達18432個流處理器。