GPU也叫圖形處理器(英語:Graphics Processing Unit,縮寫:GPU),又稱顯示核心、視覺處理器、顯示芯片,是一種專門在個人電腦、工作站、游戲機和一些移動設(shè)備(如平板電腦、智能手機等)上圖像運算工作的微處理器。
用途是將計算機系統(tǒng)所需要的顯示信息進行轉(zhuǎn)換驅(qū)動,并向顯示器提供行掃描信號,控制顯示器的正確顯示,是連接顯示器和個人電腦主板的重要元件,也是“人機對話”的重要設(shè)備之一。顯卡作為電腦主機里的一個重要組成部分,承擔輸出顯示圖形的任務(wù),對于從事專業(yè)圖形設(shè)計的人來說顯卡非常重要。
功能作用
顯卡的處理器稱為圖形處理器(GPU),它是顯卡的“心臟”,與CPU類似,只不過GPU是專為執(zhí)行復(fù)雜的數(shù)學(xué)和幾何計算而設(shè)計的,這些計算是圖形渲染所必需的。某些最快速的GPU集成的晶體管數(shù)甚至超過了普通CPU。
時下的GPU多數(shù)擁有2D或3D圖形加速功能。如果CPU想畫一個二維圖形,只需要發(fā)個指令給GPU,如“在坐標位置(x, y)處畫個長和寬為a×b大小的長方形”,GPU就可以迅速計算出該圖形的所有像素,并在顯示器上指定位置畫出相應(yīng)的圖形,畫完后就通知CPU “我畫完了”,然后等待CPU發(fā)出下一條圖形指令。
有了GPU,CPU就從圖形處理的任務(wù)中解放出來,可以執(zhí)行其他更多的系統(tǒng)任務(wù),這樣可以大大提高計算機的整體性能。
GPU會產(chǎn)生大量熱量,所以它的上方通常安裝有散熱器或風扇。
GPU是顯示卡的“大腦”,GPU決定了該顯卡的檔次和大部分性能,同時GPU也是2D顯示卡和3D顯示卡的區(qū)別依據(jù)。2D顯示芯片在處理3D圖像與特效時主要依賴CPU的處理能力,稱為軟加速。3D顯示芯片是把三維圖像和特效處理功能集中在顯示芯片內(nèi),也就是所謂的“硬件加速”功能。顯示芯片一般是顯示卡上最大的芯片(也是引腳最多的)。時下市場上的顯卡大多采用NVIDIA和 AMD-ATI 兩家公司的圖形處理芯片。
GPU已經(jīng)不再局限于3D圖形處理了,GPU通用計算技術(shù)發(fā)展已經(jīng)引起業(yè)界不少的關(guān)注,事實也證明在浮點運算、并行計算等部分計算方面,GPU可以提供數(shù)十倍乃至于上百倍于CPU的性能,如此強悍的“新星”難免會讓CPU廠商老大英特爾為未來而緊張, NVIDIA和英特爾也經(jīng)常為CPU和GPU誰更重要而展開口水戰(zhàn)。GPU通用計算方面的標準目前有OpenCL、CUDA、ATI STREAM。其中,OpenCL(全稱Open Computing Language,開放運算語言)是第一個面向異構(gòu)系統(tǒng)通用目的并行編程的開放式、免費標準,也是一個統(tǒng)一的編程環(huán)境,便于軟件開發(fā)人員為高性能計算服務(wù)器、桌面計算系統(tǒng)、手持設(shè)備編寫高效輕便的代碼,而且廣泛適用于多核心處理器(CPU)、圖形處理器(GPU)、Cell類型架構(gòu)以及數(shù)字信號處理器(DSP)等其他并行處理器,在游戲、娛樂、科研、醫(yī)療等各種領(lǐng)域都有廣闊的發(fā)展前景,AMD-ATI、NVIDIA時下的產(chǎn)品都支持OPEN CL。
1985年 8月20日 ATi公司成立,同年10月ATi使用ASIC技術(shù)開發(fā)出了第一款圖形芯片和圖形卡,1992年 4月 ATi發(fā)布了 Mach32 圖形卡集成了圖形加速功能,1998年 4月 ATi被IDC評選為圖形芯片工業(yè)的市場領(lǐng)導(dǎo)者,但那時候這種芯片還沒有GPU的稱號,很長的一段時間ATI都是把圖形處理器稱為VPU,直到AMD收購ATI之后其圖形芯片才正式采用GPU的名字。
NVIDIA公司在1999年發(fā)布GeForce 256圖形處理芯片時首先提出GPU的概念。從此NV顯卡的芯就用這個新名字GPU來稱呼。GPU使顯卡削減了對CPU的依賴,并實行部分原本CPU的工作,更加是在3D圖形處理時。GPU所采用的核心技術(shù)有硬體T&L、立方環(huán)境材質(zhì)貼圖與頂點混合、紋理壓縮及凹凸映射貼圖、雙重紋理四像素256位渲染引擎等,而硬體T&L技術(shù)能夠說是GPU的標志。
工作原理
簡單說GPU就是能夠從硬件上支持T&L(Transform and Lighting,多邊形轉(zhuǎn)換和光源處理)的顯示芯片,由于T&L是3D渲染中的一個重要部分,其作用是計算多邊形的3D位置與處理動態(tài)光線效果,也能稱為“幾何處理”。一個好的T&L單元,能提供細致的3D物體和高級的光線特效;只不過大多數(shù)PC中,T&L的大部分運算是交由CPU處理的(這就也就是所謂軟件T&L),因為CPU的任務(wù)繁多,除了T&L之外,還要做內(nèi)存管理和輸入響應(yīng)等非3D圖形處理工作,所以在實際運算的時候性能會大打折扣,一般出現(xiàn)顯卡等待CPU數(shù)據(jù)的情況,CPU運算速度遠跟不上時下復(fù)雜三維游戲的要求。即使CPU的工作頻率超出1GHz或更高,對它的幫助也不大,因為這是PC本身設(shè)計造成的問題,與CPU的速度無太大關(guān)系。
產(chǎn)品區(qū)別
GPU在幾個主要方面有別于DSP(Digital Signal Processing,簡稱DSP,數(shù)字信號處理)架構(gòu)。其所有計算均使用浮點算法,而且此刻還沒有位或整數(shù)運算指令。此外,由于GPU專為圖像處理設(shè)計,因此存儲系統(tǒng)實際上是一個二維的分段存儲空間,包括一個區(qū)段號(從中讀取圖像)和二維地址(圖像中的X、Y坐標)。此外,沒有任何間接寫指令。輸出寫地址由光柵處理器確定,而且不能由程序改變。這對于自然分布在存儲器之中的算法而言是極大的挑戰(zhàn)。最后一點,不同碎片的處理過程間不允許通信。實際上,碎片處理器是一個SIMD數(shù)據(jù)并行執(zhí)行單元,在所有碎片中獨立執(zhí)行代碼。
盡管有上述約束,但是GPU還是可以有效地執(zhí)行多種運算,從線性代數(shù)和信號處理到數(shù)值仿真。雖然概念簡單,但新用戶在使用GPU計算時還是會感到迷惑,因為GPU需要專有的圖形知識。這種情況下,一些軟件工具可以提供幫助。兩種高級描影語言CG和HLSL能夠讓用戶編寫類似C的代碼,隨后編譯成碎片程序匯編語言。Brook是專為GPU計算設(shè)計,且不需要圖形知識的高級語言。因此對第一次使用GPU進行開發(fā)的工作人員而言,它可以算是一個很好的起點。Brook是C語言的延伸,整合了可以直接映射到GPU的簡單數(shù)據(jù)并行編程構(gòu)造。經(jīng) GPU存儲和操作的數(shù)據(jù)被形象地比喻成“流”(stream),類似于標準C中的數(shù)組。核心(Kernel)是在流上操作的函數(shù)。在一系列輸入流上調(diào)用一個核心函數(shù)意味著在流元素上實施了隱含的循環(huán),即對每一個流元素調(diào)用核心體。Brook還提供了約簡機制,例如對一個流中所有的元素進行和、最大值或乘積計算。Brook還完全隱藏了圖形API的所有細節(jié),并把GPU中類似二維存儲器系統(tǒng)這樣許多用戶不熟悉的部分進行了虛擬化處理。用Brook編寫的應(yīng)用程序包括線性代數(shù)子程序、快速傅立葉轉(zhuǎn)換、光線追蹤和圖像處理。利用ATI的X800XT和Nvidia的GeForce 6800 Ultra型GPU,在相同高速緩存、SSE匯編優(yōu)化Pentium 4執(zhí)行條件下,許多此類應(yīng)用的速度提升高達7倍之多。
對GPU計算感興趣的用戶努力將算法映射到圖形基本元素。類似Brook這樣的高級編程語言的問世使編程新手也能夠很容易就掌握GPU的性能優(yōu)勢。訪問GPU計算功能的便利性也使得GPU的演變將繼續(xù)下去,不僅僅作為繪制引擎,而是會成為個人計算機的主要計算引擎。