高端显卡一直是受玩家关注的产品。作为代表显卡技术发展高发展水准的高端显卡,就像皇冠上的宝石。不过,技术的发展永无止境,俗话也说“长江后浪推前浪,前浪死在沙滩上”。那么,过往的顶级型号在面对新的3D游戏大作时又能有什么样的表现呢?笔者特收集了近几代顶级显卡代表,让它们在同平台下进行性能角逐,从纵向对比的角度来看高端显卡发展都有怎样的变化。
相信大家常看的都是显卡的横向对比,不过今天笔者的想法是给大家来个纵向“大餐”。怎么纵向呢?笔者收集了从2006年初到现在几乎所有的NVIDIA高端显卡型号(PS:在这还真得感谢借给我GeForce 7900 GTX的兄弟,这个我还真没有!),一方面用于对比这些显卡的性能,另一方面通过性能来考察它们在架构上的变化。那么有哪些当时的高端显卡出场呢?这些“当年”的奢侈品到如今又能有怎样的表现呢?请继续往下看。
就笔者个人的观点,GeForce 7900 GTX显卡并不是NVIDIA历史上富有创新性的一款显卡,但却是第一次跨出了“半代”旗舰之路,之后的GeForce 9800 GTX到GeForce 9800 GTX+,GeForce GTX 280到GeForce GTX 285都无不受这种思路的影响。笔者所谓的“半代”旗舰是指类似GeForce 7900 GTX(核心代号G71)这样,基本上可以算成是GeForce 7800 GTX(核心代号G70)的工艺进化小改版的型号。而G71相比G70,晶体管数目不增反降,核心面积也仅有196平方毫米,堪称NVIDIA的“小核心”显卡。
经典的GeForce 7900GTX,是多少人曾经的梦想!
不过,如果你仅仅因为核心面积小,就小看GeForce 7900 GTX,显然是不对的。要知道,这款显卡的架构继承于经典的GeForce 6系列,而且也进行了相当大的改进。虽然依旧属于经典的DirectX 9.0c时代的顶点和管线分离式渲染架构,但是作为此架构的后一代产品,它也是成熟和有代表性的。8个顶点处理引擎和24个像素处理引擎,以及依靠新制程带来的高频率,这样的规格参数在那个年代堪称“骄傲”。
很少有旗舰产品相比上代能提升100%以上的性能,但GeForce 8800 Ultra做到了!虽然GeForce 8800 Ultra并非G80核心的首款产品,但是GeForce 8800 Ultra肯定是采用G80核心的强显卡。其实它是NVIDIA当时为了对阵ATI即将推出的Radeon HD 2900 XT而推出的高频率版本G80。不过,由于ATI这一代产品设计失误并未给NVIDIA带来任何实质性的威胁。GeForce 8800 Ultra的推出,也成为NVIDIA强势地位的象征。
奠定NVIDIA王者地位的就是它了——GeForce 8800 Ultra,AMD(ATI)就没能在同代单核心产品上胜过NVIDIA。
而且,GeForce 8800 Ultra所采用的G80核心是NVIDIA首次革命性变化的产品。G80核心的架构设计大的特点是采用了后来被称为“CUDA核心”的Stream Processors(俗称为流处理器),NVIDIA的单个流处理器就是一个全功能的ALU,再加上彻底标量化的处理引擎,NVIDIA的这种设计能保证整个显卡在任何时候都有极高的晶体管利用率。就笔者的经验和测试来看,相比ATI的SIMD(单指令多数据流)架构而言,NVIDIA显卡的流处理器效率确实要高得多。不过这样的架构缺点也很明显,首先是MIMD(多指令多数据流)1D架构的ALU由于彻底标量化,在不理想的情况下需要更多的时钟周期才能处理完SIMD矢量ALU一个时钟周期就能完成的数据,因此NVIDIA采用了更高的Shader核心频率来解决这个问题;其次则是1D标量ALU耗费晶体管数量较多,所以我们看到之后的NVIDIA显卡基本上都是以大核心甚至“巨核心”的形象出现在消费者面前。也就是从G80开始,NVIDIA彻底抛弃了传统显卡的SIMD架构,和ATI在显卡的技术发展思路上分道扬镳,渐行渐远。
G92是NVIDIA历史上经典的核心。这颗核心在功耗、性能、前瞻性设计以及可扩展性方面都极为优秀。甚至一时间G92核心横跨了NVIDIA上至1399元,下至399元的广阔市场。当然,其中耀眼的就是GeForce 9800 GTX+。
重新拿起历史上出名的跳水王——GeForce 9800 GTX+,笔者现在依旧很郁闷,早买了那么半个月!
从市场角度来看,GeForce 9800 GX2更像NVIDIA为了对付AMD推出的双卡皇者Radeon HD 3870 X2而推出的双核心显卡,其较小的显存配置也让它的性能表现颇为尴尬。但即使如此,GeForce 9800 GX2还是为NVIDIA立下了汗马功劳,成功帮助NVIDIA保住了显卡性能王座。
NVIDIA在MIMD 1D流处理器架构上越走越远,同时在GPGPU计算方面也大放异彩。GT200核心就是NVIDIA首次尝试同时为3D计算和通用计算设计的一颗GPU(随后推出的GT200b,则是更新制程的版本,本质技术并无变化)。
相比起试水般的双芯显卡GeForce 7950GX2,GeForce 9800GX2显卡的并联效率获得大幅提升,也得到了大多数游戏的兼容,帮助NVIDIA成功获得显卡王者地位。
无论是GT200还是GT200b,都堪称显卡发展史上的巨大核心,也首次将GPU封装更处理器一样(加上了金属外壳)。这款核心采用了规模惊人的512bit GDDR3显存控制器,内置了240个流处理器,核心面积高达470平方毫米。无论从哪个角度来看,这款显卡都是史无前例的。不过大核心带来的强大性能和优秀表现,也让人们看到了NVIDIA无与伦比的技术研发实力。在实际的测试中,GeForce GTX 285完胜竞争对手的全部单核心产品,确立了自己GPU之王的称号。
面对公版的GeForce GTX 285显卡,笔者忍住了。但是面对性价比更好的非公版,笔者还是没忍住。
单核心称王了,双核心自然也不会放弃。很快,NVIDIA利用两颗规格小改的G200b打造了一款双核心显卡——GeForce GTX 295,这款显卡的规格即使是现在看起来依旧觉得恐怖:480个流处理器,每核心896MB GDDR3显存(共计1.6GB),TDP也高达289W。
其实随着SLI效能的不断提高和游戏兼容性的不断改善,今天的GeForce GTX 295显卡才真正发挥出了应有的性能。只可惜曾今,笔者只是拿它跑跑分而已。
在实际测试中,NVIDIA利用GeForce GTX 295彻底打倒了AMD的双芯Radeon HD 4870 X2,再次抢回了性能王者的帽子。
NVIDIA的DirectX 11显卡进度相比AMD更慢一些,不过俗话也说:慢工出细活。在真正看到代号为Fermi的GeForce GTX 480后,我们还是感到惊讶:NVIDIA再次重新设计了一颗巨大的核心,对DirectX 11做出了充分优化,并提供了迄今好的通用计算支持。
GeForce GTX 480是一颗完全基于DirectX 11的需求和特性,重新设计的产品。它大幅度增强了曲面细分效能,在DirectCompute上给予更优秀的支持。另外,GeForce GTX 480采用了更先进的模块化设计,增强了缓存设计,带来了全新的可读写缓存,大大提升了双精度计算的性能。
不得不承认,NVIDIA在GF100上做足了通用计算功夫,不过它相对较低的游戏效能和过高的功耗、发热量让笔者放弃了升级第一代DirectX 11显卡。直接入手了新的“半代”旗舰GeForce GTX 580。
上述所有的设计,都带来了GeForce GTX 480强悍的性能表现以及完美的通用计算效能。不过GeForce GTX 480还有一些缺憾,比如温度过高,并未打开全部流处理器等。因此,NVIDIA随后又对GF100核心进行改进,重新流片制造了GF110核心。而以它为基础打造的全新GeForce GTX 580显卡在效能、功耗和频率上有了不小的改进。
为了对比这几代高端显卡在同环境下的性能表现,我们搭建了如下测试平台:
处理器 | Core i7 870(关闭睿频) |
主板 | 技嘉GA-P55-UD6 |
内存 | 金邦黑龙DDR3 1600 4GB@1333 |
硬盘 | 希捷酷鱼7200.12 1TB |
操作系统 | Windows 7 64位旗舰版 |
驱动程序 |
除GeForce GTX 580使用Forceware 263.09版本驱动外,
其他显卡均使用Forceware 260.99版本驱动。
|
各显卡实测数据表
型号 |
3DMark
Vantage
P模式GPU
成绩
|
《星际
争霸2》
成绩1920×
1080+超高
|
《使命
召唤7》
成绩1920×
1080+
高纹理
|
《荣誉
勋章》
1920×
1080
|
《Caysis》
1920×
1080
+4AA
|
FurMark
拷机平
台功耗
|
GeForce
7900 GTX
|
N/A | 32.73 | 20.46 | N/A | 5.2 | 230W |
GeForce
8800 Ultra
|
7659 | 53.87 | 55.78 | 49.29 | 21.13 | 320W |
GeForce
9800 GTX+
|
6453 | 52.42 | 54.13 | 46.98 | 20.87 | 275W |
GeForce
9800 GX2
|
9455 | 59.87 | 42.84 | 70.22 | 24.13 | 295W |
GeForce
GRX 285
|
12724 | 69.21 | 82.74 | 78.35 | 23.77 | 320W |
GeForce
GTX 295
|
18480 | 62.03 | 99.33 | 103.41 | 28.88 | 345W |
GeForce
GTX 480
|
18752 | 61.59 | 98.31 | 106.64 | 32.52 | 440W |
GeForce
GTX 580
|
23213 | 63.52 | 99.05 | 120.25 | 37.89 | 390W |
如果你没有兴趣看那些复杂而烦人的数据,可以直接跳过数据部分看结论。
在数据分析阶段,我们将GeForce 8800 Ultra的数据作为标准数据,也就是“1”,用GeForce 8800 Ultra在各个测试中的成绩作为分母,再去和其他显卡做比较。
之所以选择GeForce 8800 Ultra,是基于下列考虑:
1.GeForce 8800 Ultra是NVIDIA更换为统一渲染架构后的第一代旗舰,随后的显卡都采用统一渲染架构设计,以它为基准对比意义比较强。
2.GeForce 8800 Ultra可以完整的跑完所有的测试数据,相比之下GeForce 7900 GTX就不行。
在经过数据处理后,我们得到了下列表格:
型号 |
3DMark
Vantage P
模式GPU成绩
|
《星际
争霸2》
|
《使命
召唤7》
|
《荣誉
勋章》
|
《Caysis》 | 平均 |
GeForce
7900 GTX
|
0.44* | 0.61 | 0.37 | N/A | 0.25 | 0.42 |
GeForce
8800 Ultra
|
1.00 | 1.00 | 1.00 | 1.00 | 1.00 | 1.00 |
GeForce
9800 GTX+
|
0.84 | 0.97 | 0.97 | 0.95 | 0.99 | 0.93 |
GeForce
9800 GX2
|
1.23 | 1.11 | 0.77 | 1.42 | 1.14 | 1.13 |
GeForce
GTX 285
|
1.66 | 1.28 | 1.48 | 1.59 | 1.12 | 1.50 |
GeForce
GTX 295
|
2.41 | 1.15 | 1.78 | 2.10 | 1.37 | 1.76 |
GeForce
GTX 480
|
2.45 | 1.14 | 1.76 | 2.16 | 1.54 | 1.88 |
GeForce
GTX 580
|
3.03 | 1.18 | 1.77 | 2.44 | 1.79 | 2.11 |
*号处成绩是GeForce 7900 GTX显卡对比的GeForce 8800 Ultra显卡在3DMark 06中的成绩,前者获得了6706分,后者获得了15227分。
通过对这些顶级显卡的测试,我们发现3DMark Vantage能较好的反映显卡的理论性能表现。比如GeForce GTX 285的性能比GeForce 8800 Ultra在3DMark Vantage的测试中高约66%,GeForce GTX 580性能约是GeForce 8800 Ultra的3倍左右。这些数据基本上都符合NVIDIA历来描述的换代性能提升幅度。不过GeForce 9系列单芯旗舰GeForce 9800 GTX+在3DMark Vantage测试中却不敌上代的GeForce 8800 Ultra。这使得晶体管更多的G92“原形毕露”,毕竟相比G80核心,它在显存位宽上做了大幅简化,而这将直接影响它在高负载应用中的表现。
不过如基准测试这样泾渭分明的档次划分,却并不能很明显地体现在游戏体验中。高3倍的理论差距在游戏里平均不会超过2倍,我想,除了一些比较老的游戏,在我们的测试条件下已经无法给予显卡更多的计算压力外;还有一些游戏比如《星际争霸2》它的计算瓶颈应该不在显卡上了,而是将整个系统的压力转移至CPU上。而这样也就能解释为何在《使命召唤7》中,从GeForce GTX 295到GeForce GTX 580的实际游戏性能基本没有变化。同时,它也从侧面告诉大家,新游戏并不一定是显卡杀手,至少喜欢《使命召唤》系列的玩家可以放缓自己的显卡换代步伐了。
虽然笔者测试的游戏不算多,但是都是当前热门或者“BT”的项目。从测试成绩表中我们可以看到,当前顶级的GeForce GTX 580能流畅运行的游戏,GeForce 8800 Ultra也可以流畅运行;而GeForce 8800 Ultra跑着较卡的《孤岛危机》,GeForce GTX 580也别想多流畅。就这个意义上来讲初现MIMD架构的GeForce 8800 Ultra还真是老当益壮,当然不支持DirectX 11是它永远的硬伤。此外,NVIDIA的第三代双芯型号GeForce GTX 295显卡的表现更是突出,在笔者的测试中基本上和GeForce GTX 480不分上下。这一方面得归功于软件对SLI的支持越来越成熟,而另一方面我们得承认GT200核心的流处理器效率确实出色。要是不遇到对多卡渲染有明显兼容问题的游戏,我们手持GeForce GTX 295显卡的玩家依然可以独步天下,换代还是等“开普勒”(NVIDIA下代显卡研发代号)吧。当然要是你是一个铁杆的DirectX 11游戏Fans,请无视上句话。此外,测试结果也告诉我们,还拥有GeForce 7900 GTX,守着DirectX 9的朋友们该升级了。经典的GeForce 7900 GTX也摆脱不了被淘汰的命运,新游戏要么运行不了,要么卡顿甚至“上映幻灯片”。这应该不是玩家想要的。
纵向对比来看,GeForce GTX 285 在频率低于GeForce 9800 GTX+的情况下,3DMark Vantage性能约为后者的2倍——这和流处理器数目进步幅度基本相当,意味着GeForce GTX 285在这款测试软件中效率比较高。但GeForce GTX 580规模是GeForce 9800 GTX+的四倍,频率也比后者更高,但3DMark Vantage测试中相比GeForce 9800GTX+,成绩只提升了3.6倍,略有衰减。
虽然这样比较并不足够公平,因为GeForce GTX 580的是针对DirectX 11而设计,而3DMark Vantage则是DirectX 10的基准测试软件,况且还有CPU影响等因素。但这也可以从一个侧面看出,源自GF110架构的GPU在DirectX 10应用中,相比老架构GPU在流处理器数目相近似的情况下,并不会有太明显的优势。我们也可以在其他产品中看到这样的情况,比如GeForce GTS 450和GeForce 9800GTX+,前者流处理器数目都比后者要高出50%。但实际上GeForce GTS 450仅领先GeForce 9800GTX+约20%,实际性能差距比规格差距小得多。
从笔者的测试情况来看,显卡伴随着制造工艺升级,核心技术、架构和规模一直在积极进化中。显卡的每次大规模升级和核心规模扩展都能带来理论上的性能大幅度增加,但是在实际测试中,这些性能进步可能会受到软件、系统其他配件等各种因素影响而终表现不出来足够的性能差距。而硬件设计的“提前量”就让很多经典显卡显得越发出彩,比如第一代统一渲染架构的G80核心,即使是4年多以后的今天,它的表现也依然很给力。
而且基于它进化而来的很多核心也表现出了超高的计算效率,这可以看作是当前软件才跟上DirectX 10硬件的超前步伐,充分展现出了DirectX 10硬件的潜力。相反的,大改架构后的GF1x0核心的产品流处理器效能表现并不可观。笔者以为这可能是遇到了换代阵痛期的问题,当代软件还无法完全发挥出显卡的性能(就像当年的G80核心一样)。
图2
不过,这也跟NVIDIA设计产品时的思路改变关系密切。至GF100核心以来,NVIDIA将更多的精力花在了通用计算领域,游戏计算上的效能提升出现了明显的降低,当然也不排除以后的架构会修正或者兼顾。或者说,笔者希望NVIDIA兼顾玩家们的感受,因为对我等玩家来说,游戏计算仍旧是当前需要的功能。
图3