3DMark 的持有者 UL,再為 Procyon 測試軟體加入新項目 – Procyon AI Text Generation。

Procyon AI Text Generation(文本生成)測試基準是為了大型語言模型(LLMs,Large Language Model)在本地端的人生智慧文本生成性能測試而進行設計;除了 AI Text Generation 外,Procyon 早前也提供了 AI Computer Vision 與 AI Image Generation 測試項目,所所有測試項目都是為了讓我們更好了解電腦硬體的實際效能。

嚴格來說,Procyon 這幾個測試項目都有其測試目的與支援的作業系統:

AI Computer Vision:INT8,Windows、Windows on Arm、mac OS;
AI Image Generation:FP16,Windows Only;
AI Text Generation:INT 4,Windows Only;

LLMs 千百種,而 Procyon AI Text Generation 所使用的參數範圍介於 3.5B 至 13B,這包含 Microsoft 的 Phi-3.5-mini-instruct,Mistral AI 的 Mistral-7B-Instruct 以及 Meta 的 Llama-3.1-8B-Instruct 和 Llama-2-13B-chat-hf。

每一個 LLMs 都有測試負載與目標硬體:

Phi-3.5-mini-Instruct:Light,iGPU;
Mistral-7B-Instruct:Medium,iGPU 與獨立顯示卡;
Llama-3.1-8B-Instruct:Medium,iGPU 與獨立顯示卡;
Llama-2-13B-chat-hf:Heavy,高階獨立顯示卡

測試部分,我們使用了多張顯示卡進行,這裡面包含 AMD Radeon RX 7000 系列與 NVIDIA GeForce RTX 40 系列。

Procyon AI Text Generation

Phi-3.5-mini-Instruct(Token) Mistral-7B-Instruct(Token) Llama-3.1-8B-Instruct(Token) Llama-2-13B-chat-hf(Token)
Radeon RX 7600 56.3 49.8 49.16 29.49
Radeon RX 7600 XT 85.61 56.66 47.23 29.53
Radeon RX 7800 XT 131.01 88.5 76.48 52.98
Radeon RX 7900 GRE 122.03 84.52 72.74 50.6
GeForce RTX 4060 Ti 93.96 63.24 52.06 11.25
GeForce RTX 4070 139.8 91.13 75.97 50.69
GeForce RTX 4080 193.45 135.58 112.31 71.46
GeForce RTX 4090 248.75 182.81 151.01 93.99

Benchmark 中可以使用的 7 個問題如下:

Prompt 1:
Creative writing Write a long poem in 200 lines about the capitals of all countries in Europe.

Prompt 2:
Code review and optimization Identify the given algorithm and give four suggestions to improve the following code’s performance.

Prompt 3:
Identifying sentiment Perform sentiment analysis on the provided text and assign one of the labels = {positive, negative, neutral}. Explain in detail and step-by-step why you assigned the specific label.

Prompt 4(RAG Query):
Document summarization. Give a detailed summary of Procyon AI benchmark suite in 500 words based on the provided context.

Prompt 5(RAG Query):
Document analysis How can UL Benchmarks help retailers? Answer based on the context provided.

Prompt 6(RAG Query):
Document analysis and search Give me an example computer performance score with Office Productivity Benchmark MP score in Level 2 system based on the provided context.

Prompt 7(RAG Query):Document analysis & creating informative text. How can benchmarking save time and money for my organization? How to choose a reference benchmark score for RFPs? Summarize how to efficiently test the performance of PCs for Enterprise IT. Answer based on the context provided.

快速提供多張 AMD Radeon RX 7000 與 NVIDIA GeForce RTX 40 系列顯示卡的測試數據供大家參考。

未來,Battlemage 世代的 Intel Arc B 系列、RDNA 4 GPU 架構的 AMD Radeon RX 系列與 Blackwell GPU 架構的 NVIDIA GeForce RTX 50 系列顯示卡,都會加入 Procyon AI Text Generation 測試項目。