尼克?斯塔姆強(qiáng)調(diào),其實(shí)不只是構(gòu)架與制程的更新,NVIDIA在Pascal上還投注了高度的工藝技術(shù)心血,讓該構(gòu)架達(dá)到前所未有的效益。他透露,原本Pascal構(gòu)架芯片在開發(fā)初期的增幅時(shí)脈只能達(dá)到1325MHz,但是在整體電路布局最佳化的努力之下,最后達(dá)到1733MHz,提升了30%之多。因此工藝技術(shù)的投入,是不亞于新構(gòu)架與新制程的關(guān)鍵之一。
GTX 1080采用代號(hào)GP104的圖型處理器核心,由72億晶體管構(gòu)成,搭載2560個(gè)單精度浮點(diǎn)數(shù)CUDA核心,提供約9TFLOPS的單精度浮點(diǎn)數(shù)運(yùn)算性能。由于是針對(duì)3D圖形處理應(yīng)用,因此倍精度浮點(diǎn)數(shù)運(yùn)算性能只有單精度的1/32,比例比高效能運(yùn)算用途的Tesla P100采用的GP100核心低很多(1/3),不過(guò)GP100的晶體管高達(dá)153億個(gè),兩者的規(guī)模相差很大。
在Preemption(搶占式多工)的部分,Pascal首度支持像素(Pixel)單位的多工切換,GPU可以在繪制多邊形內(nèi)部單一像素時(shí)暫停此一工作切換到其他工作,之后再切回來(lái)繼續(xù)處理。DX12數(shù)值計(jì)算則能以線程單位切換,CUDA運(yùn)算則是能以更細(xì)微的指令為單位切換。切換的延遲低于100微秒(100µs,即萬(wàn)分之一秒)。藉由高速多工切換的特性,Pascal在VR應(yīng)用下能更快速在圖形處理與非同步時(shí)間調(diào)整(Asynchronous Timewarp)兩個(gè)工作之間切換,減少性能閑置。