正在阅读:问鼎显卡性能之王!NV旗舰GTX280全球同步首发问鼎显卡性能之王!NV旗舰GTX280全球同步首发

2008-06-16 22:53 出处:PConline原创 作者:PConline评测室·刷子| 责任编辑:luoqi

第4章 并行处理架构:GPU将比CPU更主要

  除了在图形处理方面的升级,GeForce GTX 280同样是一款非常出色处理器并行架构处理器。跟上代产品相比,GT 200是一款更纯粹的为并行计算优化的核心,浮点运算能力也达到了933GFlops,是目前CPU处理器的10倍左右。而NVIDIA提出的CPU+GPU的异构运算平台在目前众多领域有着非常大的优势。随着越来越多的应用程序对GPU并行运算的支持,相信未来GPU重要性超过CPU也并非天方夜谭。

图片
并行处理器在各个方面都有优势

  NVIDIA方面,上代G8X图形核心就采用了先进的统一渲染架构,拥有多达128个流处理器,引入几何着色器功能……这一切简直就是专为GPGPU运算而生!为了最大程度的发挥几何着色器的威力,G80还专门设置了一个名为流输出层(Stream Output State)的部件来配合它使用。这个层的功能是将Vertex Shader和Pixel Shader处理完成的数据输出给用户,由用户进行处理后再反馈给流水线继续处理。它可以直接读写本地显存。我们可以通过Stream Out把GPU拆成两段,只利用前面的一段几何运算单元。对某些科学研究,也可以通过stream out来利用GPU的数学运算能力,等于在CPU之外又平白多得了一个数学协处理器。我们可以这样理解G80图形核心的几何着色器和Stream Out单元:GS提供了改变图形数量的能力,Stream out提供了硬件Multi-pass的支持。可以预见,今后围绕这些全新的功能,又会有一批新的GPU通用计算程序出台。

图片

    GeForce GTX 280的推出,再次把并行运算带到了新的高度。从GeForce GTX 280的并行计算架构来看,与图形运算最大的区别在于,顶部省掉了专为图形处理的几何着色器(Geometry Shader)、Vertex Shader和Pixel Shader单元,取而代之的是一个基于硬件的线程管理器在顶部通过TPCs管理调度全部的线程。也就是说全部的线程都是由硬件管理调度的,而且在每个SM(流处理器组)里面都包含了一个本地高速16K的缓存,便于数据的交换。在架构的底部去掉了跟图形有关的ROPs(光栅化引擎),但仍然保留了tex L2缓存与显存接口,用于数据与显存间的交换。而且额外增加了一个Atomic单元,用于处理器数据间的冲突。

  GeForce GTX 280的统一架构还提供了2种不同的处理器类型,例如,对于整个TPCs来说,它的构造是一个MIMD(多指令流多数据流)模型,这是一种全面的并行处理,典型的是多处理机。而对于内部的SMs来说,是一个SIMT(单指令多线程)结构。SIMT在纯SIMD(单指令多)设计的性能和编程应用性上都有所提高。除此之外,从程序员的角度来看, 由于采用硬件方面管理,SIMT还允许每个线程采用自己独立的路径和分支,所以没有必要手动管理分支内部的矢量宽度。

  上代产品不支持双精度的问题也得到了解决,GeForce GTX 280支持双精度浮点运算,符合IEEE 754精度规范。

键盘也能翻页,试试“← →”键
本文导航
第1页:前言
第2页:第1节 G80/G92第一代统一处理架构回顾
第3页:1.2 传统Pipeline模型 VS Unified Shader模型
第4页:1.3 为什么需要Unified shader架构?
第5页:1.4 G80里面的核心部件-Streaming Processors
第6页:1.5 Geometry shader(几何着色器)
第7页:1.6 Texture和math-相互没有关联的多线程操作
第8页:1.7 Early-Z技术
第9页:1.8 G80的填充率计算:
第10页:1.9 G80的ROP(Raster Operation partitions)
第11页:第2节 GT200第二代统一架构特点
第12页:第3节 图形处理器:性能成倍提升
第13页:3.2 提升几何着色器及Stream Output的表现
第14页:3.3 加倍的寄存器文件
第15页:3.4 升级ROPs(光栅化处理器)
第16页:3.5 提高了纹理表现
第17页:第4节 并行处理架构:GPU将比CPU更主要
第18页:第5节 面向未来:CUDA应用方向
第19页:BadaBoom视频压缩——最快的视频编码软件
第20页:Folding@home性能是CPU的100倍!
第21页:Photoshop CS4支持GPU加速
第22页:IE小插件Piclens让2D变3D
第23页:连PDF都需要GPU加速
第24页:Google Earth独显与集显也有区别
第25页:Google picasa显卡加速更强大
第26页:PICTOMIO速度更快
第27页:第6节 GTX280:最先进的物理特效
第28页:第7节 新的代言人:美杜莎DEMO欣赏
第29页:第8节 最强DX10显卡GTX280揭秘
第30页:第9节 GTX280内部结构惊人
第31页:第10节 正式版GTX280显卡鉴赏—讯景首款GTX280
第32页:映众GeForce GTX 280鉴赏
第33页:影驰超频版GTX280鉴赏
第34页:丽台GTX280显卡鉴赏
第35页:盈通GTX280显卡鉴赏
第36页:第11节 评测平台及评测方法简介
第37页:第12节 GTX280显卡3DMarkVantage测试对比
第38页:对比评测-3DMark06性能评测
第39页:《孤岛危机》Crysis性能对比评测
第40页:英雄连《Company Of Heroes》性能对比评测
第41页:DX10游戏对比评测:《ASSASSINS CREED》
第42页:DX10游戏性能评测:《冲突世界》
第43页:DX10游戏:《PT Boats》鱼雷快艇:海洋骑士
第44页:《使命召唤4》Call OF Duty 4对比测试
第45页:《半条命2:第二章》详细对比评测
第46页:《极品飞车11》性能详细对比评测
第47页:《Unreal Tournament 3》详细对比评测
第48页:F.E.A.R性能对比测试
第49页:第13节 GTX280功耗方面的改进
第50页:显卡功耗对比评测
第51页:PConline评测室总结:

为您推荐

加载更多
加载更多
加载更多
加载更多
加载更多
加载更多
加载更多
加载更多
加载更多
热门排行

DIY论坛帖子排行

最高点击 最高回复 最新
最新资讯离线随时看 聊天吐槽赢奖品