出 色 资 讯  快 人 一 线
  首页 | 市场行情 | 新闻动态 | 产品评测 | 硬件文萃 | 数码时尚 | 虬江路二手 | 论坛 | 小熊推荐店
 首页 → 硬件评测
 
文章搜索: 类别:
 

NV新一代中端8600详尽测试与技术指导

【原创】 作者:小熊在线_WolStame

【文章简介】
NV新一代中端8600详尽测试与技术指导.... (31750 字)


第11页:GeForce 8的多执行诸体系(1)

前面我们已经提到,存储器的延迟绑住了GPU的手脚,而越来越非线性化的shader更让单纯依靠增加平行管线提升性能的GPU举步维艰,那么GPU要如何来避开这两个障碍呢?答案就是多执行诸体系(Multi-Threading Computing Pipeline),多执行绪是提高各个核心或流水线的执行效率,隐藏内存存取的延迟的有效途径。实际上,第一个基于多执行诸体系的GPU并非G80。早在NV40和R400(R520的前身,与我们熟悉的R420是完全不同的体系)上,为了掩盖存储器延迟,提高Shader执行效率,ATi和NV就已经引入了比较完善的Multi-Threading架构。让我们来看一看Multi-Threading架构到底是如何工作的。小熊在线www.beareyes.com.cn

多执行诸架构

由于GPU本身的工作环境就很容易平行化,所以对GPU而言引入Multi-Threading其实要比CPU简单。在支持Multi-Threading的GPU工作的时候,线程管理调度器会对所有刚进入流水线的shader做如下分配:1.计算能同时存在多少个Thread。这个数量一般是总的寄存器资源除以每个thread的寄存器数量然后向下取整;2.将可用的任务分配到所有的thread上;3.每个Thread包在执行的时候,标记它的stall(停顿,一个典型的停顿是一段包含Texture Fetch指令的shader,因为Texture Fetch指令要把纹理数据从显存种读到流水线里来,是非常长的一个pass), 如果有stall,线程管理调度器就在读取纹理数据的时间段内先暂停这个Thread,然后切换到另一个thread包(warp or bank)送给ALU,让其它指令以Thread的方式持续执行,不会为了存储器延迟而将整个Shader停止。如果分辨率是1600x1200 Pixel的话,就相当于有这么多的task得做。每个Pixel本身都是独立的,所以可以做成彼此不依存的平行化(实际上受成本的影响不可能做这么细,现在的GPU一般是将数个Pixel合在一起称为一个Block,每个Block作为一个分支来执行)。小熊在线www.beareyes.com.cn

G8X架构的将Shader转化为平行线程的处理流程

相比之下,CPU通常只需要执行一个、顶多两个的task,主要需要进行的工作通常只有一个。所以CPU通常希望某个Thread的指令1执行之后,马上可以在之后执行指令2。也就是说,CPU执行的软件thread平行度很低,需要执行的Thread数量不大,所以希望单一个Thread可以尽量不停顿地不停执行,而演变成可以快速地执行一个Thread的结构;而GPU执行的软件则因为Thread平行度很高,就变成了某个Thread要是停顿就立刻换到其它Thread执行的结构。需要执行的Thread数量很大-所以不停地在执行绪间切换。所以对GPU而言,采用多执行绪是很自然的事情。小熊在线www.beareyes.com.cn

Multi-Threading掩盖存储器延迟的实例

实际上,Multi-threading的本质思想与增加管线是一致的,那就是提高GPU的并行性,让GPU在同一个周期里能够执行更多的指令。只不过单纯增加渲染管线提高的是执行单元本身的并行性,而Multi-threading提高的是线程级并行性,后者更为灵活实用。小熊在线www.beareyes.com.cn

作为最新一代GPU,G8X最大的特点之一就是摒弃了已往单纯通过增加平行管线数量来提高整体平行度的做法,而是通过提高线程级并行性,改善平行管线本身的平行度来提高效率,提高总体平行度。小熊在线www.beareyes.com.cn

《GeForce 8的多执行诸体系(2)》...继续下一页>>

《重新定义真实,全新的设计思想-革命性的G8x登场》...返回上一页<<


[1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] [24] [25] [26] [27] [28] [29] [30] [31] [32] [33] [34] [35] [36] [37] [38] [39] [40] [41] [42] [43] [44] [45] [46] [上一页] [下一页]

《NV新一代中端8600详尽测试与技术指导》分页索引


第1页:DX10 API
第2页:DX10先进特性介绍
第3页:DX10 先进特性介绍 续
第4页:DX10王牌游戏《孤岛危机》
第5页:另一款大牌DX10游戏
第6页:历代NVIDIA经典显卡回顾
第7页:从TNT到GeForce
第8页:步入shader纪元
第9页:王者归来
第10页:重新定义真实,全新的设计思想-革命性的G8x登场
第11页:GeForce 8的多执行诸体系(1)
第12页:GeForce 8的多执行诸体系(2)
第13页:GeForce 8的标量化渲染单元(1)
第14页:GeForce 8的标量化渲染单元(2)
第15页:GeForce 8的模块化频率异步架构
第16页:GeForce 8对DirextX 10的支持
第17页:GeForce 8在通用计算方面的潜力
第18页:G84-NV中端DX10的支撑
第19页:影响中端GPU的因素-市场竞技最为激烈的地方
第20页:来自DX10的其它竞争者-RV630
第21页:Gf8600/8500具体规格以及公版PCB介绍
第22页:G84最大变革-第二代硬件解码PureVideo
第23页:参测显卡七彩虹逸彩8600GT-GD3 CF黄金版 256M(1)
第24页:参测显卡七彩虹逸彩8600GT-GD3 CF黄金版 256M(2)
第25页:参测显卡迅景8800GTS介绍
第26页:参测显卡热管版超酷技嘉8600GT
第27页:参测显卡影驰8600GT介绍
第28页:参测显卡华硕静音版8600GT介绍
第29页:参测显卡精英8600GTS介绍
第30页:参测显卡金鹰8600GT/8500GT介绍
第31页:参测显卡双敏速配PCX8628GTS玩家版介绍
第32页:3D性能测试平台介绍
第33页:Banchmark测试——3Dmark01
第34页:Banchmark测试——3Dmark05
第35页:Banchmark测试——3Dmark06
第36页:3D GAME测试——FARCRY
第37页:3D GAME测试——FEAR
第38页:3D GAME测试——NFS10
第39页:3D GAME测试——Prey
第40页:3D GAME测试——Quake4
第41页:3D GAME测试——STALKER Shadow of Chernobyl
第42页:3D GAME测试——Company of Heroes
第43页:3D GAME测试——Test Drive Unlimited以及3D性能测试总结
第44页:PureVideo效能详细实测
第45页:GF8600GT超频测试
第46页:结论与及总结

全文

2007年04月18日 于上海

版权作品 未经许可 请勿转载 

配件
CPU
内存
硬盘
显示卡
主板
显示器
声卡
音箱/耳机
光驱
刻录机
机箱
电源
散热器
Modem
网卡/网络
键盘/手写板
鼠标/轨迹球
外设
移动存储
投影机
电视/视频
扫描仪
摄像头
打印机/耗材
手柄摇杆游戏

USB/1394/串并口
其他
整机/服务器 笔记本 数码相机 数码摄像机
MP3/MD随身听
掌上电脑/记事本
手机 家电



 

网友评论 (仅供参考与本站立场无关)


请发表您的观点 (可以匿名发表,记录IP限定1000字内)
 
姓名:  密码: 新用户注册
 

相关文章              更多相关文章看这里...


NV新一代中端8600详尽测试与技术指导 2007.04.17
魅力依旧,索尼新款卡片机W35细致评测 2007.04.17
游戏人生,万元主流游戏平台配置推荐 2007.04.16
诠释性价比,5500元攒机玩转游戏配置 2007.04.16
实用为上,3300元学生电脑配置推荐 2007.04.15
畅享音乐之声!51耳机网上海烧友聚会纪实 2007.04.14
每日一贫:硕泰克--再见终是再不相见 2007.04.13
百仕通新品NV-608亮相国际汽车用品展 2007.04.10

 

Copyright © 2003 - 2005 www.shbear.com .All Rights Received.