3DMark 的持有者 UL,再為 Procyon 測試軟體加入新項目 – Procyon AI Text Generation。
Procyon AI Text Generation(文本生成)測試基準是為了大型語言模型(LLMs,Large Language Model)在本地端的人生智慧文本生成性能測試而進行設計;除了 AI Text Generation 外,Procyon 早前也提供了 AI Computer Vision 與 AI Image Generation 測試項目,所所有測試項目都是為了讓我們更好了解電腦硬體的實際效能。
嚴格來說,Procyon 這幾個測試項目都有其測試目的與支援的作業系統:
AI Computer Vision:INT8,Windows、Windows on Arm、mac OS;
AI Image Generation:FP16,Windows Only;
AI Text Generation:INT 4,Windows Only;
LLMs 千百種,而 Procyon AI Text Generation 所使用的參數範圍介於 3.5B 至 13B,這包含 Microsoft 的 Phi-3.5-mini-instruct,Mistral AI 的 Mistral-7B-Instruct 以及 Meta 的 Llama-3.1-8B-Instruct 和 Llama-2-13B-chat-hf。
每一個 LLMs 都有測試負載與目標硬體:
Phi-3.5-mini-Instruct:Light,iGPU;
Mistral-7B-Instruct:Medium,iGPU 與獨立顯示卡;
Llama-3.1-8B-Instruct:Medium,iGPU 與獨立顯示卡;
Llama-2-13B-chat-hf:Heavy,高階獨立顯示卡
測試部分,我們使用了多張顯示卡進行,這裡面包含 AMD Radeon RX 7000 系列與 NVIDIA GeForce RTX 40 系列。
Procyon AI Text Generation
Phi-3.5-mini-Instruct(Token) | Mistral-7B-Instruct(Token) | Llama-3.1-8B-Instruct(Token) | Llama-2-13B-chat-hf(Token) | |
Radeon RX 7600 | 56.3 | 49.8 | 49.16 | 29.49 |
Radeon RX 7600 XT | 85.61 | 56.66 | 47.23 | 29.53 |
Radeon RX 7800 XT | 131.01 | 88.5 | 76.48 | 52.98 |
Radeon RX 7900 GRE | 122.03 | 84.52 | 72.74 | 50.6 |
GeForce RTX 4060 Ti | 93.96 | 63.24 | 52.06 | 11.25 |
GeForce RTX 4070 | 139.8 | 91.13 | 75.97 | 50.69 |
GeForce RTX 4080 | 193.45 | 135.58 | 112.31 | 71.46 |
GeForce RTX 4090 | 248.75 | 182.81 | 151.01 | 93.99 |
Benchmark 中可以使用的 7 個問題如下:
Prompt 1:
Creative writing Write a long poem in 200 lines about the capitals of all countries in Europe.Prompt 2:
Code review and optimization Identify the given algorithm and give four suggestions to improve the following code’s performance.Prompt 3:
Identifying sentiment Perform sentiment analysis on the provided text and assign one of the labels = {positive, negative, neutral}. Explain in detail and step-by-step why you assigned the specific label.Prompt 4(RAG Query):
Document summarization. Give a detailed summary of Procyon AI benchmark suite in 500 words based on the provided context.Prompt 5(RAG Query):
Document analysis How can UL Benchmarks help retailers? Answer based on the context provided.Prompt 6(RAG Query):
Document analysis and search Give me an example computer performance score with Office Productivity Benchmark MP score in Level 2 system based on the provided context.Prompt 7(RAG Query):Document analysis & creating informative text. How can benchmarking save time and money for my organization? How to choose a reference benchmark score for RFPs? Summarize how to efficiently test the performance of PCs for Enterprise IT. Answer based on the context provided.
快速提供多張 AMD Radeon RX 7000 與 NVIDIA GeForce RTX 40 系列顯示卡的測試數據供大家參考。
未來,Battlemage 世代的 Intel Arc B 系列、RDNA 4 GPU 架構的 AMD Radeon RX 系列與 Blackwell GPU 架構的 NVIDIA GeForce RTX 50 系列顯示卡,都會加入 Procyon AI Text Generation 測試項目。