對極致性能的追求可謂是顯卡界的主旋律,就像運動員刷新世界紀錄一樣,每一次的顯卡性能紀錄刷新都能讓玩家和從業者內心澎湃。隨著Pascal顯卡家族的誕生,業界的最強神話在短短一年不到的時間里一次又一次地被打破,我還記得去年5月老黃手舉GTX 1080大聲宣布:“a new king borned!”;我也記得去年7月,老黃在斯坦福大學的AI會議上公布NVIDIA TITAN X時驕傲的笑容;就在本月,最強游戲顯卡的紀錄再次刷新,新卡皇在本月初正式降臨!
2017年3月1日,NVIDIA發布了玩家們期待已久的GeForce GTX 1080 Ti顯卡,老黃在GDC 2017大會上明確聲稱,該卡的性能強于NVIDIA TITAN X,是“Ultimate GeForce”,翻譯過來就是最強最極致的GeForce顯卡。在GTX 1080 Ti未發布之前,很多人以為該卡會在NVIDIA TITAN X的基礎上再削減一部分流處理器來區分定位,但意外的是,GTX 1080 Ti同樣擁有3584個CUDA處理器,核心上一刀未動,可謂是開創了X80 Ti和TITAN間關系的先河。
GP102-350核心和二代G5X顯存
畢竟GTX 1080 Ti還是要比TITAN X low一些的,因此NVIDIA破天荒地閹割掉了1GB顯存以區分定位,與之對應的,顯存位寬減少了32-bit、ROPs單元少了8個、L2少了256KB??赡苁羌屹Y歷尚淺,我從來沒見過這種“閹割”方式,11GB的顯存也算是活久見了,不得不讓人懷疑GTX 1080 Ti是不是老黃臨時趕工,把TITAN X少焊一顆顯存便當成GTX 1080 Ti賣了。機智的老黃顯然會猜到我們這么想,所以老黃在會上說,GTX 1080 Ti只是性能上強于TITAN X?乃們太天真了!
“就問你怕不怕?”(設計臺詞)
當然,老黃原話肯定不是這么說的,不過想表達的意思確實是GTX 1080 Ti對比TITAN X是全方位的提升,那么此話怎講?老黃在會上稱,GTX 1080 Ti使用了第二代G5X顯存,經過優化后頻率從10GHz上升至11GHz;供電部分也得到了強化,采用全新7相雙FET設計,這使得整卡性能和超頻潛力要遠大于TITAN X;散熱方面,GTX 1080 Ti搭載了全新設計的真空腔均熱板,照比之前散熱面積擴大了一倍,同GTX 1080比同溫下噪音降低2.5dB,同噪音下溫度降低5℃。
GeForce GTX 1080 Ti Founders Edition
如此多的改進表明了NVIDIA的誠意,那些觀望許久的高端玩家們已經準備好入手這款新旗艦,不過與此同時,那些已經購買了GTX 1080和NVIDIA TITAN X的玩家們則表達出了強烈的不滿。新旗艦的發布自然會導致老旗艦的降價,老黃宣布GTX 1080下調100美元,在國內的反應便是非公版GTX 1080的售價普遍下調了1000元人民幣,那些年初購買GTX 1080的玩家們簡直上吊的心都有了。NVIDIA TITAN X作為信仰級顯卡,售價高達9499元,性能做工等各方面卻都落后于GTX 1080 Ti,這讓購買了TITAN X的資深N飯們深深地體會到了什么叫“信仰被無情地踐踏”。
GeForce GTX 1080 Ti顯卡開箱視頻
盡管AMD Ryzen是現在PC界最受關注的對象,但GTX 1080 Ti的發布搶了Ryzen不少風頭,可見玩家們對這款新旗艦是非常感興趣的。相信正在看這篇文章的你一定非常想知道測試的結果,所以我就先給大家透個底:GTX 1080 Ti的綜合性能的確超越了TITAN X,但并不是每一項測試都勝過后者。此外,吉吉我會在本文結尾向大家詳細闡釋NVIDIA讓GTX 1080 Ti勝過NVIDIA TITAN X的意義以及本人根據小道消息的一些猜想。那么GTX 1080 Ti究竟超越GTX 1080和NVIDIA TITAN X多少,又是哪些測試不敵前任游戲卡王?就讓我們一起揭曉答案吧!
Attention!為了感謝各位讀者長期以來的厚愛,吉吉我將會抽取評論區的三位幸運讀者,分別送出NVIDIA紀念鼠標墊一個、NVIDIA平板支架一個和NVIDIA多功能雙肩電腦包一個,望大家踴躍參與評論,說出你對NVIDIA新旗艦的看法。
具體規則為:截至文章發布24小時為止,在第180樓、380樓和580樓回復的網友獲獎,每個ID僅能獲獎一次,禁止連續回復三次以上,一經發現將取消該ID獲獎資格,獎品順延至下一符合要求的樓層。
GP102-350核心解析
GeForce GTX 1080 Ti采用全新16nm制程的Pascal架構,核心代號為GP102,具體型號為GP102-350-K1-A1,而NVIDIA TITAN X的核心代號為GP102-400-A1。GP102核心面積約為471平方毫米,得益于16nm的制程優勢,核心內集成了12億晶體管,是GTX 980 Ti晶體管數量的1.5倍,核心面積卻僅為GTX TITAN X的78.4%。
注:表中售價均為官方首發限價
基于Pascal架構的GP102-400芯片運算資源總量為3584個ALU,于GP102-400相同;GP102-350的TMUs數量為224個,后端的ROPs數量為88個,5個帶寬為64bit的雙通道顯存和1個帶寬為32bit的單通道內存控制器組成了總量為352bit的顯存控制單元,大小為11GB。同NVIDIA TITAN X相比,其各項參數基本相同,不過顯存位寬下降32-bit,顯存帶寬從505GB/s下降至484GB/s,ROPs單元數量也下降了8個。
GP102-350架構圖
我們可以看到,GTX 1080 Ti的默認核心頻率為1480MHz,Boost頻率為1582MHz,比NVIDIA TITAN X的頻率要高出60MHz左右,其中顯存頻率提升較大,由于G5X顯存升級換代,等效頻率提高了足足1GHz,因此單精度浮點運算性能比后者還要高出0.5 TFLOPS。GTX 1080 Ti的默認Pixel Fillrate能力達到了142.2Gpiexls/S,默認Texture Fillrate能力為331.5Gtexels/S,照比NVIDIA TITAN X均有所降低。最后需要說明的是,在TDP相同的情況下,GTX 1080 Ti擁有11.5 TFLOPS的超高單精度浮點運算能力,照比GTX 980 Ti提升了80%,能耗比驚人,為目前單精度浮點運算性能最高的單芯游戲顯卡。
新老“X80 Ti”顯卡詳細參數對比
Pascal架構GP104-350芯片由以下主要的部分組成:
1、基于TSMC的16nm FinFET Plus工藝,相比28nm HPM提升了65%的性能或者減少了70%的能耗,同時晶體管密度翻倍。
2、6單元的宏觀并行結構,30組SMs單元被分為6個GPC,每個GPC包含5組SMs,但砍掉了2組SMs單元,因此總量為28個,相對應地,紋理單元縮減為224個。
3、28組全新設計的,包含了幾何引擎、光柵化引擎以及線程仲裁管理機制的SMs單元。每個SMs單元包含一組負責處理幾何任務需求的PolyMorph Engine,同時均下轄5組更基本的SM單元,每個SMs單元包含8個負責處理材質以及特種運算任務如卷積、快速傅里葉變換等的Texture Array,四組并行的二級線程管理機制以及對應的shared+Unified Cache等緩沖體系。
4、GP102-350擁有11個32位顯存控制器,總計352位,每個32位顯存控制器包含8個ROPs單元和256KB二級緩存,共計88個ROPs單元和2816KB二級緩存。
5、改進型的4.0版本PolyMorph Engine,包含了為VR設計的The Simultaneous Multi-Projection Engine,在極端情況下,SMP引擎可以減少32倍VR所需的幾何渲染工作量。
新一代GDDR5X顯存
為了進一步提高性能,GeForce GTX 1080 Ti配備了以11 Gbps運行的新一代GDDR5X顯存,這是目前顯存所能達到的單端IO信號傳輸的最快速度。NVIDIA與顯存供應商傾力協作,改進顯存的數據通道,使用先進的均衡技術減少物理接口的不利影響,并使抖動和噪聲達到最小,實現更高的數據傳輸速率。
上圖為顯存工作時的數據眼圖,左側的圖像顯示了以11 Gbps運行的原始GDDR5X顯存,右側為新一代GDDR5X@11 Gbps顯存,我們可以看到,左圖采樣數據的中心與轉換中的數據混淆在一起,因此無法可靠地捕獲數據,而右圖顯示新的GDDR5X顯存具有顯著改進的數據眼,結合Pascal強大的IO設計,使顯存IO速度達到了一個新高度。
圖塊緩存技術(Tiled Caching)
NVIDIA最新的GPU采用了旨在放大原始內存帶寬并為GPU核心提供更高有效內存帶寬的技術,該技術被稱為區塊緩存。傳統的渲染架構分為兩種,高端桌面級GPU使用的是立即式渲染器,如左圖所示;絕大多數移動級GPU使用的是圖塊式渲染架構,如右圖所示:
傳統渲染架構
在立即式渲染架構中,輸入命令列表中的每個命令按序執行并完成,例如當輸入三角形時,在開始下一個三角形的繪制之前先繪制之前的整個三角形。此架構的優勢包括只讀取一次輸入的幾何數據,并且能夠在復雜輸入時節約資源。缺點是在具有高透明度的區域中,相同的像素被多次讀取和寫入,增加了存儲器帶寬的消耗。
圖塊式渲染器的工作原理是屏幕被分成許多單獨的區塊,并且進行兩次渲染,第一次處理幾何數據并確定每個三角形覆蓋哪些區塊,并將該信息寫入DRAM;第二次為每個區塊再添加幾何列表,每次一個區塊,在移動到下一個區塊之前渲染完成之前的區塊。這樣做的好處是所有渲染都在芯片內發生,最終只有顏色信息被寫入DRAM。
圖塊緩存技術
與立即式渲染相比,圖塊式渲染有兩個明顯的限制:首先,對于合并通道的需求增加了數據延遲和復雜性;第二,保存和讀取合并通道信息所需的顯存帶寬是與渲染場景中幾何形狀的量成正比,如果每像素帶寬節省超過合并帶寬量,則圖塊渲染是相對節省帶寬的。對于那些相對簡單,幾何復雜度低的場景,例如移動端游戲是可行的,但對于具有豐富幾何形狀的桌面級游戲,圖塊式渲染對帶寬的需求可能要比立即式渲染更高。
圖塊式渲染與立即式渲染對比
從Maxwell架構開始,NVIDIA便一直都在使用不同于以上兩種傳統渲染方式的渲染技術,其名為“圖塊渲染”,這種技術在Pascal架構中演變得更加成熟。這種渲染技術的基本理論是“化整為零”,將整個屏幕劃分為一個個16*16或者32*32的小區域,然后以每一個小區塊為基礎對整個畫面進行光柵化處理。Maxwell和Pascal GPU可以動態地評估每個幀所需的圖塊大小,根據場景的復雜度隨時調整。
圖塊緩存的優勢
“化整為零”的好處是GPU需要處理的單位畫面數據變少,也就是說待渲染數據可以被暫時存儲在GPU的L2高速緩存當中。這意味著GPU不必在更大、更慢的顯存池中大海撈針,從而減少了顯存系統的負載,增加可用于其他任務的可用顯存,同時加速渲染速度和渲染質量。此外,這種圖塊化的渲染方式也很符合GPU的并行運算邏輯,GPU可以根據可用資源同時處理許多獨立的圖塊,在多路顯卡系統中的優勢更加明顯。
從上面的解釋中我們不難看出,圖塊渲染的核心就在于L2緩存,更大的L2緩存將能夠提供更多的渲染畫面數據存儲,于是我們看到由Kepler升級至Maxwell時,L2緩存被增加了8倍,從256KB大幅攀升至2MB,而從Maxwell升級至Pascal時,GP102核心L2容量達到了3MB,再次大幅提升。
顯卡拆解賞析
從外形上可以看出,除了其散熱器外殼、顯卡名稱和散熱鰭片顏色互相對調以外,其他地方GTX 1080 Ti和NVIDIA TITAN X是相同的。
顯卡正面外觀
GTX 1080 Ti Founders Edition采用公版標配的渦輪散熱器,渦輪將熱空氣經I/O區散熱孔中吹出,渦輪扇的最大轉速被限制在55%,也就是2300轉左右,這點跟TITAN X的渦輪扇相同。
顯卡背板
拆分式背板
老黃稱GTX 980 Ti沒有背板是為了讓多卡SLI有更好的散熱,這點顯然不會被玩家所認可,所以GTX 1080 Ti上搭載了全新設計的背板,在組建SLI平臺時,可以卸掉一半背板來增加氣流量,以此來增強散熱效果。
散熱器外殼部分
拆掉散熱器外殼
真空腔均熱板散熱模塊
GTX 1080 Ti搭載了全新設計的真空腔均熱板,照比GTX 1080的真空腔均熱板,散熱面積擴大了一倍,同GTX 1080比同溫下噪音降低2.5dB,同噪音下溫度降低5℃。
顯卡中框和渦輪扇
GTX 1080 Ti的全金屬中框既可以加固顯卡,又可以起到一定的輔助散熱作用,在中框上貼有導熱墊,輔助顯存等高發熱部位散熱。顯卡搭載的渦輪扇十分靜音,即使在高負載情況下,風噪聲也不是很明顯。
顯卡PCB設計
與NVIDIA TITAN X相比,GTX 1080 Ti多了很多MOS管,基本上不存在空焊位,從做工上的確可以看出NVIDIA在新旗艦的設計上十分用心。此外,由于GTX 1080 Ti的顯存容量為11GB,所以有正面一處顯存空焊位。
顯卡供電設計
NVIDIA TITAN X的供電設計采用了7+1+1相雙FET供電設計,相比之前GTX 1080的5+1強了不少,也比TITAN X的7+1+1相單FET供電更加豪華。就料件的品質來說,高品質貼片電感、鉭電容等高檔元器件是沒什么值得挑剔的,旗艦范十足。
新聞熱點
疑難解答
圖片精選