忙碌的 9 月因為我們迎接了 Ampere 架構的 NVIDIA GeForce RTX 3080 顯示卡,同時也見到 NVIDIA GeForce RTX 3090 顯示卡的來到。
NVIDIA GeForce RTX 3090 是整個 GeForce RTX 30 系列的大哥,晶片代號 GA102-200,與 NVIDIA GeForce RTX 3080 的 GA102-300 不同,且想要以為 NVIDIA GeForce RTX 3090 效能會有如 NVIDIA GeForce RTX 3080 和 GeForce RTX 2080 Super 般大幅度成長的,那你可能會有點失望。
就 NVIDIA 給出的資料,24GB GDDR6X 記憶體配置的 NVIDIA GeForce RTX 3090 是對應到 NVIDIA Titan RTX(2,499 USD),但大家應該清楚知道沒有「GeForce」字樣的顯示卡並不是針對遊戲應用市場推出,也因為如此,NVIDIA GeForce RTX 3090 嚴格來說也不是一張鎖定遊戲市場推出的 GeForce 顯示卡。
GeForce Titan RTX | GeForce RTX 3090 | |
---|---|---|
GPU Codename | TU102 | GA102 |
GPU Architecture | Turing | Ampere |
GPCs | 6 | 7 |
TPCs | 36 | 41 |
SMs | 72 | 82 |
CUDA Cores / SM | 64 | 128 |
CUDA Cores / GPU | 4608 | 10496 |
Tensor Cores / SM | 8(2nd Gen) | 4(3rd Gen) |
Tensor Cores / GPU | 576(2nd Gen) | 328(3rd Gen) |
RT Cores | 72(1st Gen) | 82(2nd Gen) |
GPU Boost Clock | 1770MHz | 1695MHz |
Peak FP32 TFLOPs(non-Tensor) | 16.3 | 35.6 |
Peak FP16 TFLOPs(non-Tensor) | 32.6 | 35.6 |
Peak BF16 TFLOPs(non-Tensor) | NA | 35.6 |
Peak INT32 TFLOPs(non-Tensor) | 16.3 | 17.8 |
Peak FP16 Tensor TFLOPs with FP16 Accumulate | 130.5 | 142 / 238 |
Peak FP16 Tensor TFLOPs with FP32 Accumulate | 65.2 | 71 / 142 |
Peak BF16 Tensor TFLOPs with FP32 Accumulate | NA | 71 / 142 |
Peak TF32 Tensor TFLOPs | NA | 35.6 / 71 |
Peak INT8 Tensor TOPs | 261 | 284 / 568 |
Peak INT4 Tensor TOPs | 522 | 568 / 1136 |
Memory | 24GB GDDR6 | 24GB GDDR6X |
Memory Interface | 384-bit | 384-bit |
Memory Clock | 14Gbps | 19.5Gbps |
Memory Bandwidth | 672GB/s | 936GB/s |
ROPs | 96 | 112 |
Pixel Fill-rate(Gp/s) | 169.9 | 193 |
Texture Units | 288 | 328 |
Texel Fill-rate(Gp/s) | 509.8 | 566 |
L1 Data Cache / Shared Memory | 6912KB | 10496KB |
L2 Cache | 6144KB | 6144KB |
Register File Size | 18432KB | 20992KB |
TGP | 280W | 350W |
Transistor Count | 18.6B | 28.3B |
Die Size | 754mm2 | 628.4mm2 |
Process Node | TSMC 12nm FFN(FinFET NVIDIA) | Samsung 8nm(8N NVIDIA Custom Process) |
完整的 GA102 擁有 7 個 GPCs、41 個 TPCs、82 個 SMs,也就是 10496 CUDA Cores(128 個 SM)、82 個 RT Cores 以及 328 Tensor Cores(4 SM),其最大功耗(TGP)為 350W,稍微留意的話,不難發現到 GeForce RTX 3080 10GB 功耗(TGP)為 320W,與 NVIDIA GeForce RTX 3090 的 僅差 30W,這中間差異有非常大的可能是 14 顆 GDDR6X 記憶體所帶來的。
NVIDIA GeForce RTX 3090 Founders Edition
這次 NVIDIA GeForce RTX 3090 搭配的 GDDR6X Memory Clock 在 19.5Gbps,較 NVIDIA GeForce RTX 3080 10GB 的 19Gbps 高;Micron GDDR6X 記憶體規格的 Memory Clock 最高為 21Gbps,何時設定在 19Gbps 或者是 19.5Gbps,也許跟產品定位有關聯。
NVIDIA GeForce RTX 3090 與 GeForce RTX 3080 有著一個很大的不同,那就是 GeForce RTX 3090 支援 NVLink,而這一代的 NVLink 在 2 卡間的傳輸頻寬可以達到 112.5GB/s。
需要留意的是,3 Way 或者是 4 Way SLI 是不支援的。
其實也不用想太多,因為以 NVIDIA GeForce RTX 3090 Founders Edition 來說,用 Zenith II Extreme Alpha 主機板也至多能安裝 2 張而已,因此支援 3 Way 或者是 4 Way 也沒什麼意義啊。更不要說,目前 SLI 效能並沒有什麼值得期待的部分。
4K Gaming 部分,我們在 NVIDIA GeForce RTX 3080 Founders Edition 測試過,這次 NVIDIA GeForce RTX 3090 Founders Edition 部分,我們也提供 4K Gaming 的數據,同時加入 8K Gaming 的數據提供大家參考。
然而,我們這次是透過 Dynamic Super Resolution(DSR, 動態超解析度)模式進行 8K Gaming 的測試;DSR 是 NVIDIA 在 Maxwell 架構是推出的技術,它能將遊戲畫面以更高、更細緻的解析度渲染,透過運算以螢幕最高支援的解析度呈現畫面,也就是使用 4K 解析度的螢幕可以呈現 8K 遊戲畫面。
測試平台這次我們換用 AMD Ryzen Threadripper 3990X 與 ROG Zenith II Extreme Alpha 進行,同時我們也找來 NVIDIA Titan RTX 進行測試對比。
Titan RTX | GeForce RTX 3090 Founders Edition | ||
---|---|---|---|
Time Spy | 11811 | 12023 | 1.76% |
Time Spy Extreme | 7781 | 10247 | 24.07% |
Fire Strike | 23838 | 27016 | 11.76% |
Fire Strike Extreme | 16193 | 20563 | 21.25% |
Fire Strike Ultra | 8769 | 12105 | 27.56% |
Port Royal | 9381 | 12632 | 25.74% |
與 NVIDIA Titan RTX 在 4K 解析度下以特效全開的模式,雖然 NVIDIA Titan RTX 真的不是一張遊戲用顯示卡,但還是比一比提供數據讓大家參考。
Titan RTX | GeForce RTX 3090 Founders Edition | ||
---|---|---|---|
Borderlands 3 | 50 | 69 | 27.54% |
Tom Clancy's The Division | 46.11 | 68.97 | 33.14% |
Tom Clancy's The Division 2 | 58.8 | 79 | 27.84% |
Metro Exodus | 57 | 50.35 | 16.66% |
Crysis Remastered | 36.81 | 40.33 | 8.73% |
Far Cry 5 | 46 | 54 | 14.81% |
Hitman 2 | 66.28 | 86.2 | 23.1% |
Horizon Zero Dawn | 59 | 82 | 28.05% |
Shadow of the Tomb Raider | 61 | 81 | 24.69% |
World War Z | 201 | 211 | 4.74% |
8K DSR 模式的 Gaming 測試;就 NVIDIA 給我們的參考資料,以 8K DSR 模式和真正原生的 8K 解析度進行遊戲,這中間的 FPS 損失大概在 2 ~ 5% 左右,因為測試時間關係以及台灣目前的 8K 電視還沒法獲得韌體更新,因此我們尚未法針對這部份進行測試;8K DLSS 對於顯示卡記憶體需求有著相當大的要求,這也是 GeForce RTX 3090 24GB GDDR6X 出現的一個原因。
現階段支援 NVIDIA 8K HDR Gaming 的電視機種如下:
● LG – NANO099 Series, NANO098 Series, NANO097 Series, NANO095 Series
● Samsung – Q900T Series, Q800T Series (Firmware updates coming soon!)
● Sony – Master Series Z9H
功耗與溫度表現我們用 3DMark 的 Time Spy Extreme Stress Test 進行;設定 30 個迴圈,然後透過 PCAT 以及 GPU-Z 進行數據側錄觀察 NVIDIA GeForce RTX 3090 的 TGP、PCIe 8 Pin 抽電以及 GPU 溫度和時脈變化。NVIDIA GeForce RTX 3090 Founders Edition 的 TGP 設定在 350W,透過 PCAT 監測的數據也大致維持在這個區間,只是可以見到其 Peak 值可以到 400W;至於 PCIe 8 Pin 供電的話可以見到平均值在 11.768A 以及 12.152A 這個中間值。
溫度部分大致在 68 度左右徘徊,而 GPU Boost 時脈平均值是在 1771MHz;NVIDIA GeForce RTX 3090 Founders Edition 的 GPU Boost 時脈為 1695MHz。
AIDA64 內的 GPGPU Benchmark。
Blender Benchmark 在 7 月份加入 NVIDIA Optix 技術,大幅度透過使用 GPU 來減少渲染所需要的時間;透過 NVIDIA GeForce RTX 3090 Founders Edition、AMD Ryzen Threadripper 3990X 在 Blender Benchmark 下以 CUDA、Optix 和 CPU 模式下獲得 3 種數據。
▼ CUDA;
▼ Optix;
▼ CPU;
可以見到透過 CUDA 進行渲染的速度已經相當快,但使用 NVIDIA Optix 技術的情況更大幅減少渲染所需時間。
另外,我們也使用 VRAY 4 Benchmark 比較 NVIDIA GeForce RTX 3090 Founders Edition 與 NVIDIA Titan RTX 的差異。
▼ NVIDIA Titan RTX;
▼ NVIDIA GeForce RTX 3090 Founders Edition;
NVIDIA GeForce RTX 3090 表現基本上已經將 Turing 架構的 NVIDIA Titan RTX 遠拋在後,加上價格優勢,若不入手一張取代 Titan RTX,根本就說不過去啊!然而,以 NVIDIA GeForce RTX 3080 的首波銷售狀況,想要入手 NVIDIA GeForce RTX 3090 可能…
不管如何,單純想要使用 NVIDIA GeForce RTX 3090 作為遊戲用顯示卡並不是不行,而是與 GeForce RTX 3080 的表現差距與價格對比,顯然有點不合適,但你想要這樣做,我們也不會拒絕就是。
接近 2.2kg 重的 NVIDIA GeForce RTX 3090 Founders Edition 在散熱方面相當優異,功耗部分也較 GeForce RTX 3080 Founders Edition 高出 30W 而已,算是一張非常優異的旗艦顯示卡,但它的用途卻不單單只是遊戲而已,我們更想將它定位在工作與遊戲兼具的一張 GeForce RTX 顯示卡。
這之後,我們會使用 NVIDIA GeForce RTX 3090 搭配 RTX Studio Driver 與影音工作室合作,針對影音剪輯、後製部分進行測試,透過這樣的方式了解 Titan RTX、GeForce RTX 3080 以及 GeForce RTX 3090 到底能對他們日常的工作上會有多大幫助。