不止于設(shè)計專業(yè),搭載了NVIDIA Turing™ GPU的GeForce筆記本能夠依靠強勁的GPU性能,對STEM(科學(xué)、技術(shù)、工程和數(shù)學(xué))專業(yè)課程的學(xué)習(xí)也能帶來助力:如,GeForce筆記本可提供更快性能、更大顯存和其他高級功能,強大的GPU運算能夠幫助學(xué)生更加輕松的完成課業(yè)。
數(shù)學(xué)與計算機領(lǐng)域
隨著科技的發(fā)展,圖形處理器所能處理的工作由圖形任務(wù)擴展到了通用計算方面,GPU計算已經(jīng)深入各種領(lǐng)域。為了讓開發(fā)者更好地利用GPU工作,NVIDIA推出了CUDA(Compute Unified Device Architecture),也就是屬于NVIDIA自己的GPU計算環(huán)境。
CUDA™是一種由NVIDIA推出的通用并行計算架構(gòu),該架構(gòu)使GPU能夠解決復(fù)雜的計算問題。 它包含了CUDA指令集架構(gòu)(ISA)以及GPU內(nèi)部的并行計算引擎。機械師F117-X搭載的2070顯卡,擁有2304個CUDA核心,絕對可以滿足數(shù)學(xué)與計算機專業(yè)學(xué)生的需求。
開發(fā)人員可以使用C語言來為CUDA™架構(gòu)編寫程序,C語言是應(yīng)用最廣泛的一種高級編程語言。所編寫出的程序可以在支持CUDA™的處理器上以超高性能運行。5月,NVIDIA提出CUDA 11 ,引入了基于 NVIDIA 安培架構(gòu)、Arm 服務(wù)器處理器、性能優(yōu)化庫以及新的開發(fā)人員工具和 A100 改進的新 NVIDIA A100 支持。CUDA 11提供以下功能以及更多功能:
新型第三代 Tensor Core 可加速不同數(shù)據(jù)類型的混合精度矩陣操作,包括 TF32 和 Bfloat16。用于線性代數(shù)、FFT、矩陣乘法、JPEG 解碼等的庫性能優(yōu)化、CUDA C++增強功能等等。
對于理工科的學(xué)生來講,MATLAB(矩陣實驗室)是一款極其重要的軟件,筆者的畢業(yè)設(shè)計便是用MATLAB制作模擬物理光學(xué)的交互程序。
MATLAB目前只支持NVIDIA的顯卡。MATLAB可謂工程計算中的神器,一方面它自帶豐富的函數(shù)庫,另一方面它所有的數(shù)據(jù)都是內(nèi)建的矩陣類型,最后畫圖也方便,因此解決一些小規(guī)模的計算問題如果對性能要求不高的話開發(fā)效率遠(yuǎn)大于C++ FORTRAN之類傳統(tǒng)手段。不過受限于PC的計算能力,對于一些大規(guī)模數(shù)據(jù)處理它就力不從心了。Matlab開發(fā)了cuda的wrapper,計算能力因而上升了一個數(shù)量級。
說了這些,讓筆者用一種更直觀的方式帶你了解一下吧:使用Matlab進行神經(jīng)網(wǎng)絡(luò)訓(xùn)練。筆者使用的Matlab版本為Matlab 2019a,提供了很多關(guān)于深度學(xué)習(xí)(常見的卷積神經(jīng)網(wǎng)絡(luò)和循環(huán)神經(jīng)網(wǎng)絡(luò))的接口。
matlab 2019a Neural Network Toolbox關(guān)于深度神經(jīng)網(wǎng)絡(luò)在GPU上的加速計算有以下要求:
Using a GPU requires a CUDA® enabled NVIDIA® GPU with compute capability 3.0 or higher.
即需要一個計算能力在3.0以上的帶CUDA驅(qū)動的NVIDIA系列GPU才能實現(xiàn)GPU加速,在Matlab命令行窗口內(nèi)通過‘gpuDevice’調(diào)用顯卡信息,查看顯卡是否具備加速功能,機械師F117-X搭載的顯卡計算能力為7.5,遠(yuǎn)超最低要求。
也可以在官網(wǎng)通過產(chǎn)品說明書查到:
通過代碼對深度神經(jīng)網(wǎng)絡(luò)訓(xùn)練過程的加速計算,我們可以看到,通過CPU的訓(xùn)練過程用時18s,而通過GPU進行加速之后,整個訓(xùn)練過程提升至14s。
玩家和粉絲買賬才是硬道理。
君の偽中國語本當(dāng)上手
大伙真是不管多少歲都有一顆叛逆的心啊。