出 色 资 讯  快 人 一 线
  首页 | 市场行情 | 新闻动态 | 产品评测 | 硬件文萃 | 数码时尚 | 虬江路二手 | 论坛 | 小熊推荐店
 首页 → 硬件评测
 
文章搜索: 类别:
 

NV新一代中端8600详尽测试与技术指导

【原创】 作者:小熊在线_WolStame

【文章简介】
NV新一代中端8600详尽测试与技术指导.... (31750 字)


第14页:GeForce 8的标量化渲染单元(2)


对于一个4D vector ALU来说,指令的执行只有有限的几种方式。一般来说最常见的是3D+1D的指令,如
CODE:
add r0.xyz,r0,r1
rsq r2.w,r3.w

或者是一条4D算术指令绑定执行比如
CODE:
add r0,r0,r1

上面举例的这些指令,3D+1D的ALU能单周期完成;但这样的机会不是时刻都能保证的。我们首先要明白co-issue的含义。所谓co-issue,既指令并行,一个4D ALU能并行的同时执行一条3D vector指令和一条1D scalar指令(比如常见的RGB+A色彩渲染)就属于co-issue。对于一个支持co-issue的4D vector ALU,跑
CODE:
add r0,r0,r1
实际上实际相当于3D+1D co-issue的特殊情况:
CODE:
add r0.xyz,r0,r1
add r0.w,r0,r1

对于普通3D+1D ALU的GPU来说,必须将纹理和算术指令配对,否则因为指令限制将出现严重的ALU空闲


co-issue至少要是前后各一个指令,所以shader compiler通常会做特定sorting,这也是实用性比较低的一个原因 因为绘图很难实际做到OOO(Out of order,乱序执行)。如果连续两组1D指令,普通的co-issue 3D+1D ALU应该就会遇上3D闲置的状况,因为arbiter没有连续OOO能力。小熊在线www.beareyes.com.cn

co-issue对指令进行并行处理

所以co-issue并不是每时每刻都有效的,传统流水线的GPU,在内部指令执行方面都有一定限制。比如,NV4X、G7X、R4XX、R5XX都要求程序对RGB+Alpha的co-issue进行配对优化;R580这种非对称架构需要着色器指令的顺序针对不同的过滤方式、不同的纹理格式使用不同的TMU、ALU指令配对比例;G7X要求nrm_pp指令紧挨着TMU指令执行....等等等等。一旦出现不符合它们“胃口”的Shader顺序或者指令搭配方式,那么它们的理论指标就会大打折扣。也就是说,支持co-issue的4D ALU存在指令限制。小熊在线www.beareyes.com.cn

要使co-issue发生,指令有严格的要求

而GPU的编译器即使经过大量优化,编译出来的Shader也指令也会长短不一,五花八门,操作数既有4D,也有1D、2D、3D(例如rsq这样复杂的branch指令需要多个周期才能完成。而且流水线中本身也存在很多诸如blending、2D贴图坐标运算等非4D/3D指令)。对于通常执行能力为4D的ALU来说,让它跑1D或者2D指令,而由于SIMD天生的单发射端口限制,不可能同时跑两个或多个,而跑一个单周期内它的运算能力就填不饱。这样就很“划不来”了。这就是SIMD的指令并行性问题。面对复杂的Shader环境,co-issue不可能是每时每刻都有效的,因此通常的4D ALU在这里就存在一个浪费问题。而对于1D ALU,就不存在上述问题了。
比如一段4D vector算术指令
CODE:
add r1,r2,r3

到了G8X的线程管理调度器里,就被编译变成
CODE:
add r1.x,r2.x,r3.x
add r1.y,r2.y,r3.y
add r1.z,r2.z,r3.z
add r1.w,r2.w,r3.w

虽然1条指令变成了4条,但正好由1个4D ALU切割成的4个1D ALU分别执行,依然是一个周期(期间多出的一条控制指令的周期会被线程管理调度器掩盖掉)。因为各个ALU都有自己的指令发射端口和控制资源,只要线程控制器设计得当,理论上能保证非常高的执行效率。而普通的3D+1D vector只有在co-issue成功的情况下才能保证最高执行效率。在G80上,NV率先引入了这种高效的1D纯标量渲染单元,所以G8X家族的底层执行单元被称做MIMD(多指令多数据流)架构。说得通俗一点,传统4D vector ALU管线的GPU,通过编译器和程序本身去寻找Shader中的并行性,而G8X则通过硬件本身来寻找Shader中的并行性。传统管线的GPU强调ALU的理论浮点运算能力(Flops),而G8X体系则强调ALU的运算效率。

《GeForce 8的模块化频率异步架构》...继续下一页>>

《GeForce 8的标量化渲染单元(1)》...返回上一页<<


[1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] [24] [25] [26] [27] [28] [29] [30] [31] [32] [33] [34] [35] [36] [37] [38] [39] [40] [41] [42] [43] [44] [45] [46] [上一页] [下一页]

《NV新一代中端8600详尽测试与技术指导》分页索引


第1页:DX10 API
第2页:DX10先进特性介绍
第3页:DX10 先进特性介绍 续
第4页:DX10王牌游戏《孤岛危机》
第5页:另一款大牌DX10游戏
第6页:历代NVIDIA经典显卡回顾
第7页:从TNT到GeForce
第8页:步入shader纪元
第9页:王者归来
第10页:重新定义真实,全新的设计思想-革命性的G8x登场
第11页:GeForce 8的多执行诸体系(1)
第12页:GeForce 8的多执行诸体系(2)
第13页:GeForce 8的标量化渲染单元(1)
第14页:GeForce 8的标量化渲染单元(2)
第15页:GeForce 8的模块化频率异步架构
第16页:GeForce 8对DirextX 10的支持
第17页:GeForce 8在通用计算方面的潜力
第18页:G84-NV中端DX10的支撑
第19页:影响中端GPU的因素-市场竞技最为激烈的地方
第20页:来自DX10的其它竞争者-RV630
第21页:Gf8600/8500具体规格以及公版PCB介绍
第22页:G84最大变革-第二代硬件解码PureVideo
第23页:参测显卡七彩虹逸彩8600GT-GD3 CF黄金版 256M(1)
第24页:参测显卡七彩虹逸彩8600GT-GD3 CF黄金版 256M(2)
第25页:参测显卡迅景8800GTS介绍
第26页:参测显卡热管版超酷技嘉8600GT
第27页:参测显卡影驰8600GT介绍
第28页:参测显卡华硕静音版8600GT介绍
第29页:参测显卡精英8600GTS介绍
第30页:参测显卡金鹰8600GT/8500GT介绍
第31页:参测显卡双敏速配PCX8628GTS玩家版介绍
第32页:3D性能测试平台介绍
第33页:Banchmark测试——3Dmark01
第34页:Banchmark测试——3Dmark05
第35页:Banchmark测试——3Dmark06
第36页:3D GAME测试——FARCRY
第37页:3D GAME测试——FEAR
第38页:3D GAME测试——NFS10
第39页:3D GAME测试——Prey
第40页:3D GAME测试——Quake4
第41页:3D GAME测试——STALKER Shadow of Chernobyl
第42页:3D GAME测试——Company of Heroes
第43页:3D GAME测试——Test Drive Unlimited以及3D性能测试总结
第44页:PureVideo效能详细实测
第45页:GF8600GT超频测试
第46页:结论与及总结

全文

2007年04月18日 于上海

版权作品 未经许可 请勿转载 

配件
CPU
内存
硬盘
显示卡
主板
显示器
声卡
音箱/耳机
光驱
刻录机
机箱
电源
散热器
Modem
网卡/网络
键盘/手写板
鼠标/轨迹球
外设
移动存储
投影机
电视/视频
扫描仪
摄像头
打印机/耗材
手柄摇杆游戏

USB/1394/串并口
其他
整机/服务器 笔记本 数码相机 数码摄像机
MP3/MD随身听
掌上电脑/记事本
手机 家电



 

网友评论 (仅供参考与本站立场无关)


请发表您的观点 (可以匿名发表,记录IP限定1000字内)
 
姓名:  密码: 新用户注册
 

相关文章              更多相关文章看这里...


NV新一代中端8600详尽测试与技术指导 2007.04.17
魅力依旧,索尼新款卡片机W35细致评测 2007.04.17
游戏人生,万元主流游戏平台配置推荐 2007.04.16
诠释性价比,5500元攒机玩转游戏配置 2007.04.16
实用为上,3300元学生电脑配置推荐 2007.04.15
畅享音乐之声!51耳机网上海烧友聚会纪实 2007.04.14
每日一贫:硕泰克--再见终是再不相见 2007.04.13
百仕通新品NV-608亮相国际汽车用品展 2007.04.10

 

Copyright © 2003 - 2005 www.shbear.com .All Rights Received.