基於 Pascal 架構,NVIDIA 針對類神經網路運算市場推出新的 Tesla 運算卡。

Tesla P40 與 Tesla P4,是 NVIDIA 在北京 GTC 公佈的兩款新品;從產品定位來看,兩款新的運算卡分別將替代過 Maxwell 架構的 Tesla M40 與 Tesla M4。

tesla-p40

tesla-p4

類神經網路(Neural Network),或者是深度學習(Deep Learning)是 NVIDIA 目前重心。

主要是透過 GPU 運算,其表現能夠比 FPGA 或者是 CPU 要有更佳的表現,而這部分可以透過 NVIDIA 的簡報得知。就 Intel E5-2690v4 這顆 14 核心的處理器來說,執行運算需要 260ms,但使用 Tesla P4 降到 11ms,而使用 Tesla P40 僅僅用了 6ms,這中間的差異相當明顯。

tensorrt

不過,這部分是搭配 NVIDIA TensorRT 資料庫與 DeepStream SDK。

NVIDIA TensorRT 與 DeepStream SDK 是搭配 Tesla P40 與 Tesla P4 一併推出的產品。TensorRT 在這之前為 GPU Inference Engine(G.I.E),而 DeeoStream SDK 則是影像處理資料庫,曾在 GTC 2016 上提到。

由於走的是純運算,因此兩款運算卡都是被動式散熱,其中 Tesla P40 為 GP102,而 Tesla P4 為 GP104,均使用 GDDR5 記憶體。

p4

p40

NVIDIA Tesla P40 會率先在 10 月出貨,至於 NVIDIA Tesla P4 則會晚一個月,也就是 11 月才會供貨給合作夥伴。