NVIDIA的GTX Titan X顯卡保密工作做的很好,國內(nèi)一直沒給技術(shù)文檔(害怕GTX 970重演嗎?),價格也是發(fā)布后10多個小時才確定,7999元的價格跟前代Titan顯卡是一樣的。不過之前GK110大核心的Titan顯卡相比GK104核心做了很多改進,增加了1/3的雙精度浮點單元,所以首先發(fā)布于Tesla產(chǎn)品線上,但這次的GM200核心首先就用于桌面了,Tesla方面很低調(diào),其中很大一個原因可能是GTX Titan X的雙精度浮點性能相比之前的GK110核心退步太多了。
昨天GTC大會開幕式上,NVIDIA CEO黃仁勛正式發(fā)布了GTX Titan X,背后的PPT上公布了GTX Titan X的浮點性能——單精度7TFLOPS,但雙精度浮點性能只有0.2TFLOPS,算起來是1/32的單雙精度比,跟GTX 980的GM204核心是一樣的,比GK104核心的1/24比例還要低,跟GTX 780 Ti的GK110-425核心的1/8相比也差了很多,而跟GTX Titan的GK110-400/430核心的1/3更無法相提并論了。
回顧之前的GK110核心,其晶體管從35億暴增到71億的原因之一就在于GK110核心多了1/3的雙精度浮點運算單元(每個SMX單元中有192個單精度單元,64個雙精度單元),這對服務(wù)器級應(yīng)用大有裨益,所以GTX Titan及后面的GTX Titan Black的雙精度浮點性能非常強大,前者達到了1TFLOPS以上,后者也有1.3TFLOPS,是GTX Titan X的5-6倍還多。
當然,雙精度性能提升也有相當大的代價——占用龐大的晶體管不說,功耗和發(fā)熱也會隨之提升,第一代GTX Titan上NVIDIA實際上默認禁止了這1/3的雙精度性能,需要在驅(qū)動程序中打開,我們之前也做過詳細測試:聰明的“選擇”,GTX Titan通用計算性能及其影響。
但是這次的GTX Titan X顯卡中筆者并沒有找到CUDA——雙精度的選擇開關(guān),這以為這GTX Titan X顯卡實際上就沒有這樣的功能,這次的GM200核心并沒有如GTX Titan那樣設(shè)計1/3的雙精度單元,只是GM204核心的放大。
GPU通用計算對桌面玩家來說實用意義不是很大,我們的評測中跑了Luxmark及Computemak兩個項目做參考,而且這部分不會計入成績。對于部分兼顧開發(fā)的用戶來說,這里提供Anandtech及Computerbase兩家網(wǎng)站的GTX Titan X顯卡GPU計算性能。
蛋白質(zhì)折疊的單精度性能測試
蛋白質(zhì)折疊的雙精度浮點測試
雙精度性能大砍的結(jié)果在蛋白質(zhì)折疊測試中得到了展示,單精度性能中運算能力為每天344.4納秒,大大高于GTX 980、R9 290X及GTX Titan顯卡,但雙精度性能中GTX Titan X的性能就要落后于絕大多數(shù)旗艦顯卡了,甚至還跑不過爺爺輩的GTX 580,只比GTX 980好點,后面Computerbase網(wǎng)站做的測試中也有單精度及雙精度的差異。
總之,GTX Titan X雖然單精度浮點性能提升到了7TFLOPS,但雙精度浮點性能并沒有達到GK110核心那樣的高度。NVIDIA這么做顯然是為了某種平衡——同樣28nm工藝下,GK110核心晶體管從GK104的35億翻倍到71億,GM200核心沒有這么多的雙精度單元就已經(jīng)是80億晶體管了,如果按照同樣比例增加1/3雙精度單元,恐怕核心和晶體管數(shù)量又要增大一個量級了,其功耗及發(fā)熱控制都是個問題了。