|
在我们详细讨论GeForce 8600/8500之前,先来看一下NV的产品线划分,以便能够更好的了解整个情况。
|
核心代号 |
工艺制程 |
SP数量 |
TA/TF |
显存数据 |
显存容量 |
ROP数量 |
核心频率 |
显存频率 |
SP频率 |
GeForce 8800GTX |
G80 |
90nm |
128 |
32/64 |
384bit GDDR3 |
768MB |
24 |
575MHz |
1.8GHz |
1.35GHz |
GeForce 8800GTS |
G80 |
90nm |
96 |
32/64 |
320bit GDDR3 |
640MB |
20 |
500MHz |
1.6GHz |
1.2GHz |
GeForce 8800GTS |
G80 |
90nm |
96 |
32/64 |
320bit GDDR3 |
320MB |
20 |
500MHz |
1.6GHz |
1.2GHz |
GeForce 8600GTS |
G84 |
80nm |
32 |
8/16 |
128bit GDDR3 |
256MB |
8 |
675MHz |
2.0GHz |
1.45GHz |
GeForce 8600GT |
G84 |
80nm |
32 |
8/16 |
128bit GDDR3 |
256MB |
8 |
540MHz |
1.4GHz |
1.2GHz |
GeForce 8500GT |
G86 |
80nm |
16 |
4/8 |
128bit GDDR2 |
256MB |
8 |
450MHz |
800MHz |
900MHz |
自从两个月前发布GeForce 8800系列产品以来,NVIDIA已经确立了领先地位。GeForce 8800占领了高端显卡市场。但其余的那部分涵盖了大部分消费者的市场却成为一个大问题。本来GeForce 7系列应是针对这一市场的,但它已经老了,新的对手如ATi RV560/570正在夺取它的主导地位,这正是开发GeForce 8600/8500的原因之一。GeForce 8600/8500将替代GeForce 7家族的产品成为主流解决方案,该芯片具有多种设置选项,使生产商可侧重不同的关键领域,由极低价位的显卡到中等价位的多媒体产品,还可能是移动产品。现在我们开始仔细分析一下这枚立意深远的芯片。
用红线标出的就是G84的渲染架构

从核心代号就能够看出,G84/G86继承了高端G80的血统,属于NV的主流DX10产品线。简单的说,新的GeForce 8600/8500芯片使用了GeForce 8800的设计,拥有全新的统一渲染单元(Unified Shader), 同样能够支持DX10。但针对多功能性,价格和主流消费者的需要作了一些改动。G84/G86由新的TSMC 80nm工艺制造,拥有较高的核心频率,渲染结构上相对高端的G80做了较大精简。这种不同之处减少了耗电量和生产成本,但同时也削弱了GPU的性能。下面的表格给出了它们的规格。插入《表格 G8X规格》
我们已经知道,G80具有128个1D scalar流处理单元 ,每16个一组构成一个TPC,每个TCP搭配8个Texture Filtering Unit(浮点纹理过滤单元)和4个Texture address Unit(浮点纹理寻址单元)。单元的工作频率为1350MHz,外围的TF和TA以及L2 Cache以低于一半的速度(575MHz)工作。所有这些单元配合设计合理的Cache和管理仲裁架构结合在一起就成为一个强力渲染引擎。不过,到了G84身上,负责主要算术运算功能的流处理单元被削减为32个,与之搭配的Texture Filtering Unit和Texture address Unit分别为16个和8个,都只有G80的1/4。它们一共被分成2个TCP,工作在1.45GHz。这样的大规模缩水肯定会严重影响到GeForce 8600的实际性能表现,不过好在我们还有高达1.45GHz的Shader工作频率,能够弥补一些运算单元削减带来的不足。G8X面向最低端和OEM市场的G86在G84的基础上将所有的资源再度减半,也就是说它只有G80的1/8,SP/TF/TA/ROP分别是16、8、4、8个。不过G86依然保持了128bit的显存位宽。小熊在线www.beareyes.com.cn
让我们感到欣慰的是,与运算单元方面的大幅度缩水不同,G84和G86都完全继承了G8X在流水线管理和运算单元效率方面的优秀基因。它们同样都具备基于TPC的渲染结构,线程管理调度器与On-Chip Memory一应俱全。也就是说G84和G86是按G80等比例缩水而已,功能并没有减少。这样它们等于也都继承了G8X高效率的流水线。
G84 G86的TCP结构与G80是一样的

G84和G86的显存接口依然保持在历代中端卡标准的128bit,这有些让人失望,因为较低的显存带宽将影响GPU在高分辨率和全凭抗锯齿下的性能表现。不过通过搭配高频率的GDDR3或GDDR4,显存带宽相比前代也能获得可观的提升,至少可以保证不会成为核心处理能力的瓶颈。小熊在线www.beareyes.com.cn
G84/86最大的特色还是在中低端GPU上提供了对DX10的支持。也许有人会指出它们本身的处理能力限制将导致它们难以运行那些要求极高的DX10游戏,但必须明白DX10带来的不只是特效的升级。DX10引入的很多新特性都将为游戏推波助澜。比如更多的临时寄存器(Temp Register)能更好的掩盖流水线延迟,减少复杂shader的性能损失;DX10丰富的浮点纹理格式支持,使HDR效果能更加广泛的被使用;更加灵活、可编程度更高的流水线让在DX9时代受到限制的各种shader都能顺利运行。即使是DX9游戏,也会因为DX10硬件更加丰富的辅助资源而受益。而G8X系列本身的新特性也对性能提升有所帮助。如硬件化的通用渲染架构平衡了流水线中不同指令的分布,全新的1D scalar流处理单元能减少指令之间的依存性,提高指令的执行效率。更强的分支新性能让通用计算受益,等等。一个典型的例子就是,理论浮点运算能力相近的G80和R580图形芯片,在执行一些新游戏,如彩虹6号拉斯维加斯,上古卷轴4等游戏时产生了巨大差别。小熊在线www.beareyes.com.cn
DX10提供更多的通用寄存器能显著提高流水线效率

不过,很快的(据说就在5月份),G84/G86将失去“唯一的主流DX10 GPU”的头衔,因为AMD(ATi)公司的新一代RV630/RV610系列DX10图形芯片也已经蓄势待发,它们直指主流市场,与G84/G86的定位完全相同。其中,RV630具备24个5D US渲染单元,128bit显存位宽,700MHz以上的核心频率,RV610有64和128bit的不同版本,渲染单元较RV630有缩水。前者主要针对G84,后者直接对上G86。RV610和RV630都采用TSMC 65nm工艺,能提供更好的性能/成本比,而且AMD(ATi)表示R6XX全系列都支持新一代的UVD视频解码技术,能大大降低高清视频回放时的CPU占用率。R6XX家族甚至还全系列支持HDMI音频接口,AMD(ATi)在数字消费领域做出了一些有益尝试。按照市场定位来看,一场DX10主流GPU大战即将爆发。小熊在线www.beareyes.com.cn

传说中Rv610/630的芯片

为了对新一代DX10 API提供支持,G80的die size已经达到了前所未有的484mm^2,这样就注定了它昂贵的身价。为了加速新一代产品的普及,NV在G84/G86的成本控制方面花费了非常大的心思。G84的最终成品的die size只有161mm^2,与前代G73 125mm^2的核心面积相比,G84已经为DX10付出了相当大的代价,也超过了历代中端150mm^2这个“黄金分割线”。也许你会对G84的规格失望,但就现在的工艺而言,它确实已经尽力了。小熊在线www.beareyes.com.cn
G8X R6XX die size

2007年04月18日 于上海
版权作品 未经许可 请勿转载
|