AMD Instinct MI200 系列 GPU 也是今日 HPC 主題的其中一個環節。
美國時間 11 月 8 日活動上,基於新的 CDNA 2 架構,AMD 推出 MI200 家族,而現階段這系列產品已經開始出貨給美國能源部(Department of Energy)的 Frontier 超級電腦使用。今天公布的 Instinct MI200 家族中,包含最高階的 MI250X,MI250 以及沒有提到的任何規劃的 MI210;原則上 MI210 屬於 PCIe 規格,MI250X 與 MI250 則為 OAM(開放加速模組)規格。
MI250X | MI250 | |
---|---|---|
Compute Units | 2 x 110 | 2 x 104 |
Matrix Cores | 2 x 440 | 2 x 416 |
Boost Clock | 1700MHz | 1700MHz |
FP64 Vector | 47.9 TFLOPS | 45.3 TFLOPS |
FP32 Vector | 47.9 TFLOPS | 45.3 TFLOPS |
FP64 Matrix | 95.7 TFLOPS | 90.5 TFLOPS |
FP32 Matrix | 95.7 TFLOPS | 90.5 TFLOPS |
FP16 Matrix | 383 TFLOPS | 362 TFLOPS |
INT8 Matrix | 383 TOPS | 362.1 TOPS |
Memory Clock | 3.2Gbps HBM2E | 3.2Gbps HBM2E |
Memory Bandwidth | 3.2TBps | 3.2TBps |
VRAM | 128GB | 128GB |
ECC | Yes | Yes |
Infinity Fabric Links | 8 | 8 |
CPU Coherency | Yes | No |
TDP | 560W | 560W |
Process | TSMC N6 | TSMC N6 |
Architecture | CDNA 2 | CDNA 2 |
Form Factor | OAM | OAM |
最高階的 MI250X 集結 AMD 所有的選項,則包含 220 CUs(2 x 110)、128GB VRAM(每 GCD 由 4 個 16GB HBM2E 組成)、8 個 Infinity Fabric Links 以及 CPU Coherency 功能;MI250 的 Infinity Fabric Links 降低至 6 個,同時也沒有 CPU Coherency 功能。
MI250X 與 MI250 的規格相當強大,但這樣強大的前提下,犧牲的就是功耗。AMD 提供的資訊中顯示,採用 TSMC N6 製程的 Instinct MI250X 與 MI250 TGP 高達 560W,預計採用水冷才能讓如此高功耗的運算裝置發揮其效能;一般正常空冷最大解熱能力介於 500W 左右。
沒有意外的,AMD Instinct MI200 系列產品鎖定的對手會是 Intel Ponte Vecchio,Aurora 超級電腦的核心。當然,我們也預計 NVIDIA 不會在這場戰役中缺席,可以期待台灣時間 11 月 9 日下午,老黃在 GTC 上會給我們帶來什麼新玩意吧。