Pascal 架構(gòu)帶來巨大的性能飛躍
NVIDIA Pascal 架構(gòu)使 Tesla P100 能為 HPC 和超大規(guī)模工作負(fù)載提供卓越性能。憑借每秒超過 21 萬億次的 16 位浮點(diǎn) (FP16) 運(yùn)算性能,經(jīng)過優(yōu)化的 Pascal 為深度學(xué)習(xí)應(yīng)用程序帶來了令人興奮的新可能。Pascal 還可為 HPC 工作負(fù)載提供超過 5 萬億次的雙精度浮點(diǎn)運(yùn)算和 10 萬億次的單精度浮點(diǎn)運(yùn)算能力。
通過采用 HBM2 的 CoWoS 技術(shù)實(shí)現(xiàn)更高效率
通過加入采用 HBM2 的晶圓基底芯片 (CoWoS) 技術(shù),Tesla P100 將計(jì)算性能和數(shù)據(jù)緊密集成在同一個(gè)程序包內(nèi),提供的內(nèi)存性能是 NVIDIA Maxwell? 架構(gòu)的三倍以上。這大幅縮短了為數(shù)據(jù)密集型應(yīng)用程序算出解決方案的時(shí)間。
NVIDIA NVLink 讓超大規(guī)模的應(yīng)用成為現(xiàn)實(shí)
互連技術(shù)通常制約著性能。創(chuàng)新的 NVIDIA NVLink 高速雙向互連技術(shù)能跨越多個(gè) GPU 擴(kuò)展應(yīng)用程序,其性能比當(dāng)今的技術(shù)高 5 倍。
頁面遷移引擎使編程更簡(jiǎn)單
頁面遷移引擎可使開發(fā)人員從管理數(shù)據(jù)移動(dòng)的工作中騰出時(shí)間,將精力更多地放在計(jì)算性能的調(diào)整上。應(yīng)用程序現(xiàn)在可以突破 GPU 物理顯存的容量限制,達(dá)到幾乎無限量的顯存。
適用于具備強(qiáng)擴(kuò)展能力的 HPC 的 NVIDIA Tesla P100
利用搭載 NVIDIA NVLink 技術(shù)的 Tesla P100,快如閃電的節(jié)點(diǎn)可以顯著縮短為具備強(qiáng)擴(kuò)展能力的應(yīng)用程序提供解決方案的時(shí)間。采用 NVLink 技術(shù)的服務(wù)器節(jié)點(diǎn)可以 5 倍的 PCIe 帶寬互聯(lián)多達(dá)八個(gè) Tesla P100。這種設(shè)計(jì)旨在幫助解決在 HPC 和深度學(xué)習(xí)領(lǐng)域擁有計(jì)算需求的全球重大挑戰(zhàn)。