未來又多了一個可以測試顯示卡的項目。

UL 推出的 Procyon Benchmark 在近期更新,這次更新主要是加入 AI Image Generation Benchmark。

新推出的 UL Procyon AI Image Generation Benchmark 是為了更好地衡量中階、中高階與高階獨立顯示卡的效能而推出,它包含 2 個測試項目,分別是 Stable Diffusion XL(FP16)與 Stable Diffusion 1.5(FP16)。

Stable Diffusion XL(FP16)與 Stable Diffusion 1.5(FP16)測試項目提供 3 中 AI Inference Engine 進行測試,這包含 TensorRT、Intel OpenVINO 與 ONNX Runtime。

在 Stable Diffusion XL(FP16)中,TensorRT 最低需要 10GB VRAM,OpenVINO 需要 16GB VRAM,至於 ONNX Runtime 最低則是 16GB VRAM;至於針對中高階顯示卡的 Stable Diffusion 1.5(FP16)最低則需要 8GB VRAM。

我們選擇了以下顯示卡進行測試:

AMD
– Radeon RX 7900 XTX 24GB MBA
– Radeon RX 7900 XT 20GB MBA
– Sapphire Radeon RX 7900 GRE 20GB Nitro+
– Radeon RX 7800 XT 16GB MBA
– Radeon RX 7700 XT 12GB Pulse

Intel
– Intel Arc A770 16GB Limited Edition

NVIDIA
– GeForce RTX 4090 24GB Founders Edition
– GeForce RTX 4080 16GB Founders Edition
– TUF Gaming GeForce RTX 4070 Ti 16GB
– GeForce RTX 4070 12GB Founders Edition

測試部分先看看 TensorRT 這個 AI Inference Engine 的數據,這部分就只有 NVIDIA GeForce 顯示卡能夠執行。

Overall Time
(sec)
Image Generation Speeds
(Image / sec)
Score
Stable Diffusion XL(FP16)
GeForce RTX 4090126.4177.9014746
GeForce RTX 4080193.20212.0753105
GeForce RTX 4070 Ti234.96914.6862553
GeForce RTX 4070346.40821.6511732
Stable Diffusion 1.5(FP16)
GeForce RTX 409018.4131.1515430
GeForce RTX 408028.4571.7793514
GeForce RTX 4070 Ti37.8592.3652641
GeForce RTX 407050.5073.1571979

跟著就是 Intel OpenVINO 部分,但因為 Stable Diffusion XL(FP16)最低要求為 16GB,因此我們沒有將 8GB 的 Intel Arc A750 與 Intel Arc A580 加入測試。

Overall Time
(sec)
Image Generation Speeds
(Image / sec)
Score
Stable Diffusion XL(FP16)
Intel Arc A770817.79451.112733
Stable Diffusion 1.5(FP16)
Intel Arc A770144.9089.057690

最後是 ONNX Runtim AI Inference Engine 的測試數據。

Overall Time
(sec)
Image Generation Speeds
(Image / sec)
Score
Stable Diffusion XL(FP16)
GeForce RTX 4090172.30910.7693482
GeForce RTX 4080264.61916.5392267
GeForce RTX 4070 Ti330.06420.6291817
Radeon RX 7900 XTX382.36123.8981569
GeForce RTX 4070431.60126.9751390
Radeon RX 7900 XT439.65127.4781364
Radeon RX 7900 GRE479.45329.9661251
Radeon RX 7800 XT628.80939.301954
Radeon RX 7700 XT665.66641.604901
Intel Arc A7702755.363172.21217
Stable Diffusion 1.5(FP16)
GeForce RTX 409027.351.7093656
GeForce RTX 408040.592.5372463
GeForce RTX 4070 Ti50.4763.1551981
Radeon RX 7900 XTX51.7153.2321933
Radeon RX 7900 XT59.9133.7451669
GeForce RTX 4070 Ti65.8794.1171517
Radeon RX 7900 GRE67.3194.2071485
Radeon RX 7800 XT82.5085.1571211
Radeon RX 7700 XT90.8295.6771100
Intel Arc A770351.15921.947284

Intel Arc 在 UL Procyon AI Benchmark 的表現實在不怎樣,如果用「不入流」來形容它,應該不太好,但 Intel Arc A770 在測試所需要的時間最久,若想要使用 Intel Arc A770 執行 Stable Diffusion 可能要好好思考一下。

至於 Intel 會不會在未來的驅動程式強化,就讓我們繼續觀望吧。

整體來說,Ada Lovelace GPU 架構的 GeForce RTX 40 系列表現依舊優異,在 TensorRT AI Inference Engine 方面,更能輕易看到其優勢。