從 GeForce RTX 4090 Founders Edition 開始,歡迎 Ada Lovelace 架構。

隨著 Ada Lovelace 架構在 GTC 2022 的宣告,NVIDIA GeForce RTX 30 系列準備將棒子交接 GeForce RTX 40 系列,但這並不意味著市場將全面轉換至 GeForce RTX 40 系列。

就 NVIDIA 的佈局,GeForce RTX 3080、RTX 3070、RTX 3060 與 RTX 3050 將持續在市場上販售。

至於 GeForce RTX 3090 Ti 與 GeForce RTX 3090 則不會再供應新的晶片組給 AIC 合作夥伴,這也就表示通路上的庫存售完為止。

也許因為如此,NVIDIA GeForce RTX 4090 與 GeForce RTX 4080 系列顯示卡才會分別於 10 與 11 月份相繼上市。

10 月 11 日,我們率先見到 NVIDIA GeForce RTX 4090 Founders Edition 的效能解禁。

維持與 GeForce RTX 30 Founders Edition 系列的設計風格,導入 12VHPWR 接頭,讓顯示卡尚未開賣就在網路上引發不少話題,我們也更大家一樣好奇這接頭的耐用度,後面會有更多測試提供大家參考。

NVIDIA GeForce RTX 4090 Founders Edition 採用 AD102 晶片,擁有 11 個 Graphics Processing Clustes、64 個 Texture Processing Clusters、128 Streaming Multiprocessors、16384 CUDA Cores、512 個 Tensor Cores(4th Gen)、128 個 RT Cores(3rd Gen)、512 個 Texture Units、176 個 ROPs 與 24GB GDDR6x 記憶體配置。

與 GeForce RTX 3090 Ti 的規格差異可以參考下表:

GeForce RTX 3090 TiGeForce RTX 4090
Graphics Processing Clusters711
Texture Processing Clusters4264
Streaming Microprocessors84128
CUDA Cores1075216384
Tensor Cores336(3rd Gen)512(4th Gen)
RT Cores84 (2nd Gen)128(3rd Gen)
Texture Units336512
ROPs112176
Boost Clock1860MHz2520MHz
Memory Clock10500MHz10501MHz
Memory Data Rate21Gbps21Gbps
L2 Cache Size6144KB73728KB
Memory24GB GDDR6x24GB GDDR6x

記憶體容量、頻寬、介面與時脈並沒有太大的提升,但因為從 Ampere 架構轉換至 Ada Lovelace 的因素,讓 24GB GDDR6x 記憶體配置有著更佳的發揮能力。

此外,也因為 TSMC 4N 製程的因素,讓 AD102 的 Boost Clock 與 GA102 有了很大的差異,甚至網路上也可以見到不少 3.0GHz 的 Boost Clock 時脈出現,這部分我們在後續的自製卡上會做更多說明。

Ada Lovelace 架構的 GeForce RTX 40 系列有好幾個重點:

1. 全新的 Streaming Multiprocessors(SM)
2. 4th Gen Tensor Cores 與 Optical Flow
3. 3rd Gen RT Cores
4. Shader Execution Reordering(SER)
5. DLSS 3
6. NVIDIA Studio
7. AV1 Encoders

GeForce RTX 4090 擁有 83 Shader-TFLOPS、191 RT FLOPS 與 1.3 Tensor petaFLOPS 的預算能力,其中 72MB 的 L2 Cache 更是 GeForce RTX 3090 Ti 的 12 倍。

透過 Shader Execution Reordering(SER)、全新的 RT Core 引擎與 DLSS 3 技術,讓 Ada Lovelace 在 Ray Tracing 遊戲表現上更勝 Ampere 架構 4 倍,這部分的前提是 RT On + DLSS 3,後續測試也會提供數據讓大家做個參考。

DLSS 3 涵蓋 DLSS 2 技術,但只有 Ada Lovelace 架構才能完整支援 DLSS 3。

更清楚地說明 DLSS 3 的話,它涵蓋 Optical Multi Frame Generation、Super Resolution 與 NVIDIA Reflex 技術。NVIDIA Reflex 技術從 GeForce GTX 900 系列顯示卡開支援,跟著 Super Resolution 則是從 GeForce RTX 20 系列顯示卡開始,最後 Optical Multi Frame Generation 目前就只有 Ada Lovelace 架構的 GeForce RTX 40 系列支援。

現階段,NVIDIA 已經宣布有 35 款遊戲支援 DLSS 3 技術,裡面包含 Cyberpunk 2077、Microsoft Flight Simulator、F1 22 以及 Justice 在內;另一方面,Unity 與 Unreal 遊戲引擎也開始針對 DLSS 3 分別推出 Enemies Demo 與 Lyra Demo,相信未來會很快導入到更多遊戲中。

至於 DLSS 2 部分更有超過 200 款遊戲與應用支援。

遊戲部分的強化外,Ada Lovelace 架構也在 Video Encoder 部分有所強化。

這次 Ada Lovelace 架構導入了 Dual AV1 Video Encoders,這涵蓋 NVENC H.264 與 NVENC AV1;如果與 Ampere 架構比較的話,Ada Lovelace 架構在 H.264 有著 40% 的提升。

GeForce RTX 4090 與 GeForce RTX 3090 的散熱器造型相當類似,但這裡面藏了很多細節。

最初應該就是 12VHPWR 接頭,這次 GeForce RTX 4090 用的有 12 + 4 PIN 供電設計,與 GeForce RTX 3090 的 12 PIN 設計不同。4 PIN 部分主要是訊號,搭配顯示卡附贈的 4x 8 PIN Adapter,若只有接上 3x 8 PIN 的話,最高只能提供 450W,想要 600W 供電則需將 4x 8 PIN 都接上。至於顯示卡本身是否能夠運行 600W,目前應該沒有多少張可以跑到 600W…

不過,對於只附上 3x 8 PIN Adapter 的顯示卡,我們也只能夠用「有趣」來形容。

接下來就是 GeForce RTX 4090 Founders Edition 的風扇葉片更改為 7 葉設計(尺寸從 110mm 放大至 116mm);GeForce RTX 3090 Founders Edition 為 9 葉設計,而且 GeForce RTX 4090 Founders Edition 的葉片厚度從 1.7mm 增加至 2.0mm,這樣的作法讓風扇增加了 20% 的風流。

既然提到風扇,那也必須提到這次 NVIDIA 為了降低噪音,將原本在 GeForce RTX 3090 Founders Edition 使用的 Double Ball Bearing 風扇更改為 Fluid Dynamic Bearing,雖然有助於降低噪音,只是從某個程度來說,我們感覺到 NVIDIA 有點在 Cost Down,畢竟 Double Ball Bearing 耐用度上要高於 Fluid Dynamic Bearing 不少。

散熱器本身厚度部分則是從 2.7 提升至 3.0 slots,然而長度部分則是從過去的 31.242cm 縮短至 30.48cm。

此外,GDDR6x 記憶體用的 Thermal Pad 也有所更改,過去為 2.0mm,GeForce RTX 4090 Founders Edition 厚度則是 1.5mm。

散熱鰭片密度並沒有太大改變,但熱導管配置有些許更改。

主要在於東側部分從原本的 4 根熱導管提升至 6 根,不過由於 Vapor Camber 的參數做了更動(增加更多水量),讓西側的熱導管減少 2 根,雖然有所增減,但整體的熱導管數與 GeForce RTX 3090 Founders Edition 相同。

就 NVIDIA 提供的資料顯示,GeForce RTX 4090 Founders Edition 所使用的散熱器,其 Qmax 可以到 650W。

上面提到的是散熱器部分,實際上這次 GeForce RTX 4090 Founders Edition 的 PCB 從過去的 12L 提升至 14L,主要是為了提高電源效率,同時核心供電部分從 16 相增加至 20 相。

至於 NVLink 拿掉,其主要原因在於遊戲開發者對於 SLI 相關開發興趣缺缺,這當然也可能是單卡效能一直提升所致。

接下來就是 GeForce RTX 4090 Founders Edition 的效能實測,顯然我們很想使用最新的 Intel Core i9-13900K 進行相關測試,但礙於相關處理器解禁時間是 10 月 20 日,因此這次測試我們選擇了 AMD Ryzen 9 7950X 搭配 ROG Crosshair X670E Extreme 主機板與 G.SKILL DDR5 6000MT/s 進行。

3DMark:

3DMarkGeForce RTX 3090 Ti Founders EditionGeForce RTX 4090 Founders Edition
TIme Spy202813074734.039%
Graphic score212783607141.011%
CPU score16026167444.288%
Time Spy Extreme113231783136.498%
Graphic score110711909042.006%
CPU score1300112981-0.154%
Fire Strike452685601219.182%
Graphic score516237305529.337%
Physics score45717472803.306%
Combo score2335922654-3.112%
Fire Strike Extreme261464082435.954%
Graphic score266444420339.724%
Physics score4553045427-0.227%
Combo score147002366337.878%
Fire Strike Ultra143372423340.837%
Graphic score139652430342.538%
Physics score4578745347-0.970%
Combo score78331409044.407%
Port Royal143842552843.654%
Ray Tracing69.98135.6748.419%
DLSS feature test
DLSS off31.856.5143.727%
DLSS3 Performance0171.18100%
DLSS2 Performance83.19136.6539.122%

4K Gaming:

4K GAMINGGeForce RTX 3090 Ti Founders EditionGeForce RTX 4090 Founders Edition
Assassin Creed Vahalla7312039.167%
Borderlands 3 : bad ass78.24127.1338.457%
Cyberpunk 207751.5780.3335.802%
Cyberpunk 2077
(RT Ultra)
24.0643.344.434%
Tom Clancy’s The Division 29415438.961%
Metro Exodus83.67132.5936.896%
Metro Exodus
(RT_high)
61.41102.3439.994%
Metro Exodus
(RT_high_DLSS_UltraPerformance)
129.7131.031.015%
F1 2022
(Ultra High)
499246.739%
Far Cry 68612832.813%
Far Cry 6
(RT)
7410831.481%
Horizon Zero Dawn10115836.076%
Shadow of the Tomb Raider
(Highest)
10818240.659%
Shadow of the Tomb Raider
(RT Ultra)
6912142.975%
Total War: Troy9715738.217%
Watch Dog Legion6811440.351%
Watch Dog Legion
(RT_Ultra)
386440.625%

1440p Gaming:

1440p GamingGeForce RTX 3090 Ti Founders EditionGeForce RTX 4090 Founders Edition
Assassin Creed Vahalla10417139.181%
Borderlands 3 : bad ass137.04218.6337.319%
Cyberpunk 207797.36138.5529.729%
Cyberpunk 2077
(RT Ultra)
47.9283.9742.932%
Tom Clancy’s The Division 216725033.200%
Metro Exodus122.85174.3129.522%
Metro Exodus
(RT_high)
100.49148.5432.348%
F1 2022
(Ultra High)
9214436.111%
Far Cry 612614010.000%
Far Cry 6
(RT)
1081156.087%
Horizon Zero Dawn16222227.027%
Shadow of the Tomb Raider
(Highest)
18128336.042%
Shadow of the Tomb Raider
(RT Ultra)
12124751.012%
Total War: Troy150.3235.736.232%
Watch Dog Legion10514125.532%
Watch Dog Legion
(RT_Ultra)
6510236.275%

Ada Lovelace 架構的一個重要特色 – DLSS 3,但 F1 2022 的 4K 解析度 Latency 可能是因為驅動尚未優化完成,因此抓出的數據可能有些錯誤,然而可以見到開啟 DLSS 3 的情況下,遊戲的 1% Low FPS 與 FPS 都較沒有開啟 DLSS 3 要好許多。

eSport 的 Fornite 測試 PC Latency 與 1% Low FPS 表現,可以見到大批餓 GeForce RTX 4090 顯示卡的 PC 表現都要比較好;處理器使用的是 AMD Ryzen 9 7950X 搭配 DDR5 6000 MT/s。

Creator GeForce RTX 3090 Ti Founders EditionGeForce RTX 4090 Founders Edition
Blender
Monster3188.8642450.361%
Junk Store1802.62976.939.447%
fishy_cat1563.53001.347.906%
Indigo Bench
Bedroom21.60932.76834.055%
Supercar54.63374.77326.935%
Davinci Resolve
(Lower is better)
50% retime29329.375%
Bride_FaceRefine_Selective color2219-15.789%
SuperScale 4x7048-45.833%
SuperScale 2X1610-60.000%
Wedding_heavy_style3021-42.857%
ProRes 4K to H.26535350
ProRes 8K to H.2651341340
ProRes 4K to AV1-35-
ProRes 8K to AV1-134-

跟著我們就要看看 GeForce RTX 4090 Founders Edition 的顯示卡的預設功耗。這次 NVIDIA 沒有提供 12 + 4 PIN 用的 PCAT,因此我們沒法透過該工具提供更精準的數據讓大家參考,不過透過 GPU-Z 與 Furmark,我們也抓出了一些數據供大家參考。

以 NVIDIA GeForce RTX 4090 Founders Edition 預設條件下,其平均 TGP(Total Graphics Power)會在 442.2W,此時的 GPU 平均抽了 408.7W,至於時脈、溫度分別是 2655MHz、GPU 的 69.9°C 與 GPU Hot Spot 的 79.1°C。

跟著我們透過工具將 NVIDIA GeForce RTX 4090 Founders Edition 的功耗解放,也就是將 NVVDD Offset 與 Power Target 拉到最大值。

在這樣的條件下,NVIDIA GeForce RTX 4090 Founders Edition 的功耗幾乎接近到 600W,但其平均值在 587.5W,至於 GPU 抽電平均值為 552.5W。

以接近 600W 的前提下,GeForce RTX 4090 Founders Edition 的時脈平均維持在 2775MHz,GPU 平均溫度與 GPU Hot Spot 平均溫度則分別來到 79.4°C 與 GPU Hot Spot 的 90.7°C。

450W 的 Furmark 條件下,我們透過 ASUS Thor 1200W 的 OLED 監測最大功耗在 542W,至於接近 600W 的條件下,使用 GeForce RTX 4090 Founders Edition 在 Furmark 的壓榨下,PSU 最高可以抽取到 742W 的供電。

對於新架構、新產品的推出,我們一直都是相當的激動。

NVIDIA 新推出的 Ada Lovelace 架構會是消費性顯示卡市場的主力,從現階段的 GeForce RTX 4090,緊接著要上市的 GeForce RTX 4080 16GB 與 GeForce RTX 4080 12GB,到明年的 GeForce RTX 4070 與 GeForce RTX 4060,勢必會讓整個顯示卡市場有不一樣的新變化。

GeForce RTX 40 系列變化指的是 Ray Tracing 的強化,以及 DLSS 3 技術的加入,讓遊戲體驗往前再邁進一大步。

另一方面,Intel Arc A 系列顯示卡也推出市場,擁有類似 DLSS 技術的 Xe Super Sampling(XeSS)技術,其實也是讓遊戲開發者繼續在同一塊領域深耕。當然 AMD Radeon 也擁有 FidlityFX Super Resolution(FSR)技術,但架構上與 NVIDIA DLSS 和 Intel XeSS 有點差異,是否會在 Navi 3x 架構的 Radeon RX 7000 系列向兩家靠攏,讓遊戲開發者少點麻煩,是個值得關注的事情。

扣除掉 DLSS 3 部分的表現,Ada Lovelace 架構的 GeForce RTX 4090 與 Ampere 架構的 GeForce RTX 3090 Ti 也可以見到明顯的差距。

官方給出 450W 的 TGP(Total Graphics Power / Total Board Power),對於些許人來說確實不低,然而對於有如此龐大運算能力需求的使用者,用功耗所換取的效能表現應該相當超值。

與當初 1,999 美元的 GeForce RTX 3090 Ti 相比較的話,GeForce RTX 4090 不論是在效能,或者是定價方面,可以用完勝來形容之;至於與 GeForce RTX 3090 相比較的話,兩者的 MSRP 只有 100 美元的差異(1,499 vs 1,599),但遠超 GeForce RTX 3090 與 GeForce RTX 3090 Ti 的效能表現,這樣的定價是相當超值的。

前提是,你對如果強大的顯示卡有所追求。畢竟除了效能的提升外,同時還有 AV1 Encoders 的強化。

以跨世代產品來說,Ada Lovelace 的體驗,更勝於過去 Ampere、Turing、Pascal 以及 Maxwell 架構產品。隨著後續驅動的更完整,以及遊戲開發商對 DLSS 3 的更多投入,Ada Lovelace 架構的 GeForce RTX 40 系列顯示卡優勢也會更為顯著。

NVIDIA GeForce RTX 4090 Founders Edition 的測試到此暫告一段落,這之後則是各家 AIC 合作夥伴的 GeForce RTX 4090 實測。