当前位置 : 首页  评测体验 正文

能耗比的新胜利 NVIDIA GeForce GTX 960评测(上)

2018-05-17 15:58 来源:网络 作者:网络

本评测由玩家堂原创。

前言:

nvidia geforce gtx

NVIDIA在步入麦克斯韦时代之后新品推出的步子似乎一下子慢了下来,在GeForce GTX 980和GeForce GTX 970发布四个月后,NVIDIA终于发布了全新GeForce GTX 960来取代老款产品,填补GeForce GTX 970和GeForce GTX 750 Ti间新架构产品的巨大空缺。

GeForce GTX 960采用了全新的GM206核心,在架构上还是基于GeForce GTX 980和GeForce GTX 970上的新一代麦克斯韦,主打的还是“能耗比”,只是规格要比两位老大哥的GM204精简不少。这颗GM206可以算是一颗小核心,根据今天新发布的 GPU-Z 0.8.1版提供的数据看Die Size为228平方毫米,尺寸很接近GK106的221平方毫米。规格方面,GeForce GTX 960拥有1024个CUDA处理器,公版预设核心频率1127-1178MHz,搭配2GB/128bit、频率7010MHz的显存,最大功耗仅 120W,需单6pin外接供电。

GeForce GTX 960的型号略有迷惑性,它最后的定价为199美元/人民币1499元,定位要比前两代GeForce GTX 760和GeForce GTX 660上市时(都是1799元)都要低一些。GeForce GTX 960上市后将会和AMD的R9 280系列三款产品展开血拼,在售的三款旧产品GeForce GTX 760、GeForce GTX 770和GeForce GTX 660何去何从NVIDIA没有说明、还要再看。在GeForce GTX 960和GeForce GTX 970之间还是有1000块钱的空档,后期应该还会有新产品来填补。

nvidia geforce gtx

麦克斯韦架构GM206核心:

GeForce GTX 960使用了全新的GM206核心,编号GM206-300-A1,28nm新一代麦克斯韦架构,这颗核心简单来说就是GeForce GTX 980的GM204砍半而来。GeForce GTX 980的GM204拥有4组GPC和4个64bit显存控制器,砍半之后的GM206核心有2组GPC、2个64bit显存控制器和每组GPC对应的2组 ROP单元(一组单元8个,一共32个),外加二级高速缓存(2048KB)。然后每个GPC内部包含的SMM数量为4个,整个核心一共有8个SMM,构 成了1024个CUDA核心/128个纹理单元的规格,搭配128bit的显存位宽。

nvidia geforce gtx

▲Maxwell架构GM206核心架构示意图

由于SMM内部未发生任何变化,所以直接复制一下GeForce GTX 980评测时的SMM设计简析:

nvidia geforce gtx

Maxwell架构SMM的设计依然和SMX一样,由PolyMorph引擎(3.0)、CUDA核心、 Load/Store单元、SFU、Warp调度器和分发单元、Register File、纹理定址/拾取单元、纹理缓存、指令缓存等等组成。最主要的变化是,在PolyMorph引擎(2.0)和指令缓存区之下,Maxwell架构 将一个SM分为四个独立的处理块,每个独立的处理块拥有自己的指令缓冲区、调度器、32个CUDA核心,以及Load/Store和SFU单元。 Kepler架构一个SMX里的纹理高速缓存和64KB共享显存/一级高速显存组合也发生了变化,一对处理块共享四个纹理过滤单元和一个纹理高速缓存,然 后64KB共享显存成为独立单元,被四个块共享。在SMM外,Maxwell架构还将核心的二级高速缓存配置从GK107(同样是一组GPC、两组显存控 制器)的256KB一下子提升到了2048KB,用以降低显存带宽需求。

除了使用全新的布局,Maxwell架构也在控制逻辑分区、负荷均衡、时钟门控粒度、编译器调度、每时钟周期发出指令条 数等方面进行了改进。这样Maxwell架构一改Kepler架构的SMX主要大量堆CUDA计算核心,架构效率会受到一定程度的影响的做法,核心降低了 SM 尺寸,提高SM数量及调度逻辑单元数量,以“简化设计与调度逻辑、节省了面积与功耗、降低计算延迟”。

新一代麦克斯韦架构特性和NVENC的改进:

nvidia geforce gtx

因为是同样的架构,GeForce GTX 960同样支持在《令人惊叹的功耗设计 NVIDIA GeForce GTX 980/970评测》中 提到的新一代麦克斯韦核心所带来的DSR、MFAA、VXGI和VR等特性,其中MFAA和全新的显存压缩技术对于核心规模小不少的GeForce GTX 960会更重要一些。MFAA可以使用2xMSAA的资源消耗即可达到4xMSAA的画质,且号称4xMFAA在游戏中的效率要比4xMSAA高30%。 根据NVIDIA的说明,包括《FIFA15》、《龙腾世纪3:审判》、《FARCRY4》、《武装突袭3》、《战争雷霆》等都已经支持MFAA。而全新 的显存压缩技术,NVIDIA的说明是“GM206渲染每一帧图像产生的数据量比上一代Kepler架构少大约25%,从而增强了显存带宽的利用率”,甚 至给出了“其7.0Gbps的显存频率等效于Kepler架构下9.3Gbps的显存频率、GTX 960的等效显存带宽的148.8GB/s”的参数。

nvidia geforce gtx

在以上这些之外,随着GeForce GTX 960的发布NVIDIA还对视频编码单元NVENC进行了改进,NVIDIA说“与GTX 980相比,GTX 960全新的视频单元已经可以完整支持H.265(HEVC)的编码和解码,相对于GTX 980增加了解码功能。”。同时原来只应用于Shadowplay的改进版硬件H.264视频编码器NVENC,之后可以用于YY旗下的直播网站虎牙直播 (huya.com)的视频直播。就NVIDIA的介绍来看,用NVENC进行虎牙直播游戏视频流的录制、上传,会和Shadowplay一样有占用资源 低的特性,在游戏同时直播时的CPU占用率、游戏帧数方面都要比传统使用CPU进行编码、上传的方案好不少(演示的是Dota2,占用率从90%以上降至 70%多,帧数分别是60fps+和90fps+)。反正游戏直播对画质细节方面的要求并不苛刻,这个可以降低CPU负载和要求、游戏帧数损失小的方案, 应该会受到游戏主播们的欢迎。

技嘉 N960 G1 Gaming:

这次NVIDIA并没有提供公版的GeForce GTX 960,发布前收到了两款非公版显卡,先给大家进行一下解析。首先是技嘉N960 G1 Gaming,主打风之力3X散热器和超耐久用料,核心频率1241-1304MHz,搭配2GB/128bit显存,显存频率7010MHz。

N960 G1 Gaming的包装延续了上代的设计,附件只有安装说明、软件光盘(驱动程序需要自己去网上下载)和两条双D口转6pin转换线。

nvidia geforce gtx

N960 G1 Gaming的外观采用了和技嘉GTX980/GTX970同样的设计,黑色金属材质带大面积镂空外壳三风扇散热器。显卡重815克,双槽厚,整体长29.845厘米(11.75英寸),PCB仅长24厘米,散热器要长出PCB一大截。

nvidia geforce gtx

顶部视图,可以明显的看出显卡的散热器有一大截鳍片是长于PCB的,因此显卡的双6pin供电接口也并未处在显卡真正的尾端。

nvidia geforce gtx

显卡的顶部设计有“WINDFORCE”字样的装饰灯(蓝色),此外N960 G1 Gaming还和我们之前见过的一些显卡一样,设计有低负载风扇停转功能。在“WINDFORCE”装饰灯两侧加装了“风扇智能启停指示灯”,当风扇停转 时,“Silent”和“STOP”字样的指示灯会亮起以告知玩家。

nvidia geforce gtx

显卡背面设计有带有大量镂空的金属背板

nvidia geforce gtx

N960 G1 Gaming提供了两个DVI接口(DVI-I/DVI-D)、三个DisplayPort1.2接口和一个HDMI2.0接口(支持4K@60Hz),挡板上几乎没有设计出风口。

nvidia geforce gtx

N960 G1 Gaming的PCB,长度要比散热器短的多,采用了GPU和显存在中、核心供电及显存供电分居两侧的设计。

nvidia geforce gtx

N960 G1 Gaming的PCB背面,BIOS、核心供电电路的主控、Driver等芯片都被挤到了这面。此外显存采用正反各两颗的设计,正反一组颗粒对应一路 64bit显存控制器好理解。可是显卡上还留有第3组显存空焊位,莫非这个PCB方案还会用在拥有192bit显存位宽的新产品上?亦或是GM206核心 是屏蔽过什么之后的产物?

nvidia geforce gtx

显卡的GM206-300-A1核心和三星K4G41325FC-HC28 GDDR5显存颗粒,GPU拥有1024个CUDA核心,频率1241-304MHz;2GB/128bit显存,频率7010MHz。

nvidia geforce gtx

N960 G1 Gaming的供电采用6+1相设计,核心供电和显存供电分居核心两侧。核心供电的主控是一颗安森美的NCP81174,支持4/3/2相,然后通过倍相 芯片(应该是背面的3颗81162)和6颗MOSFET Driver来达成6相控制。MOSFET采用了每相1上桥加2下桥的配置,芯片来自Alpha & Omega,上桥是6414A(30V 50A 8mΩ@10V/10.5mΩ@4.5V/),下桥是6508(30V 32A 3.2mΩ@10V/5mΩ@4.5V/)。此外供电部分还有nichicon LF系列固态电容和MAGIC的贴片式电感。显存的1相供电用料配置和核心基本一致。

nvidia geforce gtx

N960 G1 Gaming上所用的还是新版的风之力3X散热器,散热器本体采用了4x6mm热管、大面积铝鳍片、热管直触设计,对应显存和供电的位置都加焊有一个底座以便和鳍片相连进行散热。

nvidia geforce gtx

单独拆下来的散热器本体,鳍片部分被拆成了三组,左侧的部分照顾供电,右侧的部分会长出PCB一截上下直通(下面没有PCB挡着),4根6mm热管横贯三组鳍片。

nvidia geforce gtx

散热器的三把8cm风扇,来自POWER LOGIC,型号PLD08010SA2H,参数12V 0.25A。风扇采用了技嘉称之为“稳压刀锋扇叶”的设计,也就是叶片上设计有导流槽。此外N960 G1 Gaming也加上了“风扇低负载停转”的设计,技嘉的具体设置是核心温度低于43℃且核心功耗低于32W时风扇停转,然后当核心温度高于62℃或核心功 耗高于60W风扇启转。

七彩虹 iGame960 烈焰战神X:

然后是我们收到的另外一片非公版GeForce GTX 960——七彩虹iGame960 烈焰战神X,主打特色依然是iGame系列引以为傲的高规格散热、超高一键超频和高规格供电等。显卡和之前的iGame显卡一样拥有双BIOS设计,公版 模式下的核心频率为1127-1178MHz;一键超频模式下,核心频率1228-1291MHz。2GB/128bit的显存频率都为7010MHz。

nvidia geforce gtx nvidia geforce gtx

iGame960 烈焰战神X的包装采用了竖立式的设计,包装内的附件包括说明手册、2年升3年质保升级卡、软件光盘、DVI-VGA转换头和双D口转6pin转换线。

nvidia geforce gtx

iGame960 烈焰战神X采用了与iGame970 烈焰战神X完全一样的外观设计,黑色金属磨砂质感外壳加装红色金属装饰的三风扇散热器。显卡重量达到了1110克,双槽厚,整体长度28.5厘米、PCB部分长26厘米。

nvidia geforce gtx

显卡顶部视图

nvidia geforce gtx

顶部设计有iGame logo的红色呼吸灯,尾部双6pin外接供电接口采用了方便用户插拔的反转设计。

nvidia geforce gtx

显卡背面设计有带有大量通风孔、可以覆盖整张PCB的金属背板

nvidia geforce gtx

iGame960 烈焰战神X的输出接口采用了标准配置,包括一个DVI-D、三个DisplayPort1.2接口和一个HDMI2.0接口(支持4K@60Hz),此外还有iGame显卡标配的双BIOS切换/一键超频键。

nvidia geforce gtx

iGame960 烈焰战神X的PCB,非公版设计,很普通的供电全集中在尾端的布局,同时同样留有第三组显存颗粒空焊位。

nvidia geforce gtx

iGame960 烈焰战神X的PCB背面,除了两颗显存颗粒外,还有供核心滤波的两颗SP-CAP以及核心和显存供电的主控+MOSFET驱动芯片。

nvidia geforce gtx

iGame960 烈焰战神X的GM206-300-A1核心和三星K4G41325FC-HC28 GDDR5显存颗粒,GPU拥有1024个CUDA核心,公版模式下,核心频率为1127-1178MHz;一键超频模式下,核心频率 1228-1291MHz。显存规格2GB/128bit,频率7010MHz。

nvidia geforce gtx

iGame960 烈焰战神X的供电部分是采用6+2相设计的“iPP至纯供电系统”(七彩虹给供电部分起的好听的名字)。核心的6相供电主控同样是安森美的 NCP81174,然后搭配倍相芯片和MOSFET驱动达成6相控制。每相搭配一上桥两下桥MOSFET、FPCAP固态电容及印有IPP的封闭式电感。 显存的2相供电主控是 一颗uP1605,用料和核心供电相同,只是MOSFET配置减为一上一下组合。 供电的MOSFET是安森美的4C08N(30V 52A 5.8mOhm)和4C06N(30V 69A 4mOhm),电容是FPCAP的16V 270uf和2.5V 820uf。

nvidia geforce gtx

在供电MOSFET上显卡设计有Air-Kit的安装槽,不安装时也能当散热片用,安装时将Air-Kit的两根热管上 涂好硅脂,噗嗤往里一插即可,还是挺方便的。不过iGame970 烈焰战神X上有提供的显存散热片可能是因为iGame960 烈焰战神X显存颗粒少且分居PCB两面的缘故而取消了。

nvidia geforce gtx

iGame960 烈焰战神X的散热器,整体镀镍、4x6mm热管、大面积散热鳍片、铝底座、三风扇。

nvidia geforce gtx

拆下来的散热器本体,四根6mm热管各两根照顾左右两部分鳍片,鳍片和热管间采用回流焊工艺,鳍片和鳍片间的扣FIN工艺做的不错,整体比较紧固。

nvidia geforce gtx

iGame960 烈焰战神散热器的三把8cm风扇,依然没有详细参数,不过这次同样加上了低负载风扇停转的技术,风扇背面贴有“0%-7%不转”字样的贴纸。

测试平台信息及测试说明:

nvidia geforce gtx

测试平台信息

nvidia geforce gtx

技嘉 N960 G1 GAMING GPU-Z信息

nvidia geforce gtx

七彩虹 iGame960烈焰战神X GPU-Z信息

测试方法还是老样子,使用多款基准性能测试软件和主流游戏大作对NVIDIA GeForce GTX 960进行测试,测试分辨率选择显卡对付的了的2560x1440和1920x1080,4K压力太大就算了。

测试用卡GeForce GTX 960用七彩虹的iGame960 烈焰战神X(在公版频率BIOS下进行测试,1127-1178/7010MHz)。对比的样卡秉着有什么用什么的原则,使用我手上有的一些的非公版卡, 分别是华硕 圣骑士 Strix GTX970(1114-1253/7010MHz)、七彩虹 iGame770 烈焰战神X(公版频率BIOS,1046-1085/7010MHz)、华硕 圣骑士 GTX760-DC2OC(1006-1072/6008MHz)、华硕 冰骑士 R9 280X DirectCU II TOP(970-1070/6400MHz)、华硕 R9 280 DirectCU II(874-980/5200MHz)和不愿意透露姓名的Radeon R9 285(918/5500MHz)。

因时间关系,只有几张显卡性能的成绩总体对比表格,不贴出各项测试的单独对比柱状图和折线图。测试项目的场景、设置说明如下:
3DMARK:Fire Strike/Fire Strike Extreme(所列分数为图形分数)
3DMARK 11:Performance/Extreme(所列分数为图形分数)
UNiGiNE Heaven Benchmark:DirectX 11/Ultra/Extreme/4xAA/1920x1080
UNiGiNE Valley Benchmark:DirectX 11/Ultra/4xAA/1920x1080
Battlefield 4:飓风拦截开始场景/1080p+Ultra/1440p+High
Crysis 3:人类灭绝后开始场景/1080p+VeryHigh+FXAA/1440p+High+FXAA
Hitman 5: Absolution:Benchmark/1080p+Ultra+FXAA/1440p+Ultra+FXAA
Metro:Last Light:Benchmark/1080p+VeryHigh+SSAA/1440p+High+noAA
Total War: Rome II:Benchmark“Forest”/1080p+Extreme/1440p+Ultra
DiRT:Showdown:Benchmark/1080p+VeryHigh+8xMSAA/1440p+VeryHigh+8xMSAA
Tomb Raider:Benchmark/1080p+Ultimate/1440p+Ultra
Watch Dogs:第一场景开始阶段/1080p+Ultra+FXAA/1440p+High+FXAA
Dragon Age 3:Inquisition:选择在嘶鸣荒野(hissing wastes)进行实际屠龙战斗2分钟/1080p+Ultra/1440p+High
Call Of Duty:Advanced Warfare:最后一个场景开始阶段/1080p+High+FXAA+4xSSAA/1440p+High+FXAA+2xSSAA

GeForce GTX 960性能测试:

nvidia geforce gtx

先是自己内部的对比,公版频率GeForce GTX 960对比略预超频的GeForce GTX 760。最后的结果是流处理器数量和显存位宽都不占优势的GeForce GTX 960可以整体赢11.17%,纯游戏部分赢12.23%。这个比例和当初GeForce GTX 760发布时与GeForce GTX 660 Ti间的性能差距很相似。以流畅优先,大部分游戏的2560x1440的高分辨我并没保持和1920x1080一样的超高特效,最后结果看128bit位 宽的影响不太明显,但《Hitman5:Absoulution》和《Tomb Raider》中1440p下测试的成绩差还是要比1080p下低不少的。

nvidia geforce gtx

然后是公版频率GeForce GTX 960对比公版频率的GeForce GTX 770,面对这个现在售价还在2000元左右的对手,GeForce GTX 960就实在没有什么胜算了,所有游戏和基准测试中只有《DiRT:Showdown》赢了,剩下全军覆没。最后结果GeForce GTX 960要差GeForce GTX 770整体10.54%,游戏部分差9.85%,差距不算大、也比较符合两张卡现在的定位。

nvidia geforce gtx

公版频率GeForce GTX 960对比预超频的GeForce GTX 970,两者同架构,GeForce GTX 960要少640个CUDA处理器(超过1/3),显存容量和位宽也只有一半。最后GeForce GTX 960的整体性能要差GeForce GTX 970 33.67%,游戏部分差32.73%,正好对应核心规模间的差距。

nvidia geforce gtx

然后是和竞品的对比,公版频率GeForce GTX 960对比略预超频的Radeon R9 280,根据测试项目的不同还是会各有输赢,最后算下来GeForce GTX 960会输Radeon R9 280整体1.66%、纯游戏部分2.53%,考虑到测试用的Radeon R9 280略有超频,可以说GeForce GTX 960和Radeon R9 280性能在同一水平线上 。不过在测试中即便1440p下大部分游戏已经比1080p降了一档画质,还是会有6-7款游戏可以看出在1440p下两张卡的差距会比1080p下更大 一些。

nvidia geforce gtx

对比和Radeon R9 280性能相近的Radeon R9 285(跑在公版频率下),GeForce GTX 960最后算下来整体只输了0.1%、纯游戏部分只输了0.13%,两者的性能同样在一个水平线上。

nvidia geforce gtx

对比预超频的Radeon R9 280X,公版频率GeForce GTX 960在测试中包括计算测试在内的所有项目都要差一些,最后平均下来整体差了14.65%、纯游戏部分差了15%。

显卡功耗测试:

测试方法依然是我们的传统方法,即使用PCIe插座来引出PCIe的12V和3.3V供电,加上显卡的6pin外接供电,使用万用表和卡钳测量显卡的电压和电流值,计算得出显卡的整体功耗。

测试场景有5个,其中有桌面待机、Furmark烤机(1280x800极端烤机)、游戏测试:《Metro:Last Light》(Benchmark,DX11,1920x1080,VeryHigh,AF 16x,Tesselation=High,PhysX=Off)、游戏测试:《Tomb Raider》(Benchmark,DX11,1920x1080,Ultimate,FXAA,TressFX=On)和3DMARK测试 (Fire Strike Extreme场景1) 。

技嘉 N960 G1 GAMING:

nvidia geforce gtx

N960 G1 GAMING的基准和游戏功耗测试结果和NVIDIA给GeForce GTX 960设置的功耗值120W很接近,而Furmark测试则会远超120W的功耗值达到了144.78W。在这个功耗表现下核心频率可以一直维持在一个较 高的水准上,基准和游戏测试中核心频率可以加速并维持在1380MHz上,而Furmark测试中频率则会保持在1291-1304MHz上。

另外技嘉还在发稿前发给我一个新版的、用于出货的BIOS,主要是提升满载下的Boost频率,因为时间关系刷新 BIOS后我只加测了一次Fumark(也就是Furmark+)。在新BIOS下,显卡的核心频率可以跑Furmark时跑到 1405-1418MHz,相应的功耗达到了156.65W。

七彩虹 iGame960 烈焰战神X:

nvidia geforce gtx

在公版频率BIOS下,显卡的功耗表现非常低,其中基准和游戏测试的功耗只有95~105W,Furmark测试也只有 114W,全都没超过NVIDIA给GeForce GTX 960设置的功耗值120W。对应的频率情况则是,基准和游戏测试都能跑到1278MHz;Furmark时的频率1165-1177MHz,也还在显卡 预设基础频率和Boost频率之间。

nvidia geforce gtx

换到超频BIOS后,显卡的功耗表现略有上升。基准和游戏测试的功耗表现增长并不多,还只有101-107W;而 Furmark测试的功耗有了大幅增长,远超120W的公版功耗值达到了146.43W。在这个功耗表现下,显卡的对应核心频率也全都提升到了 1380MHz,包括Furmark在内、不掉频。

nvidia geforce gtx

把两张显卡的Furmark测试结果放到我之前测过的数据之中,iGame960 烈焰战神X在公版频率下的最高功耗值远低于GeForce GTX 760和R9 280/285,比我当初测过的绝大多数GeForce GTX 660还要低,和曾经的功耗性能比标杆产品Radeon HD 6850接近。不过两张显卡在超频模式下为了保证高负载不掉频或掉频的比较厉害,跑出的最大功耗值已经和我之前iGame970 烈焰战神U(154.08W)差不多了。

以上词条内容均来源网络,均系原作者观点及所有,仅供参考,不代表京东立场,感谢您对京东的支持,祝您购物愉快!

热门推荐文章
品类齐全,轻松购物 多仓直发,极速配送 正品行货,精致服务 天天低价,畅选无忧
购物指南
购物流程
会员介绍
生活旅行/团购
常见问题
大家电
联系客服
配送方式
上门自提
211限时达
配送服务查询
配送费收取标准
海外配送
支付方式
货到付款
在线支付
分期付款
邮局汇款
公司转账
售后服务
售后政策
价格保护
退款说明
返修/退换货
取消订单
特色服务
夺宝岛
DIY装机
延保服务
京东E卡
京东通信
京东JD+