以核为贵?量体裁衣巧选CPU 以合为贵

2010-03-23 16:15  出处:PConline原创  作者:无悠   责任编辑:mengxiaodong 

一、多核背后的真相:

1

  人多手杂,尾大不掉,处理资源分配不合理,核心沟通效率低下,已经成为不单是多核CPU,也是多GPU并联工作时,需要首先解决的问题。在多数人的眼里,多核技术就是一个CPU封装中含有多个核,其实远远不是这么简单。因为多核这种尖端的技术除了核的数目以外还有核与核以及核与内存间的连接问题。不同的连接方式使得他们的效率大不相同。尤其是当内核的数目提高后,这点就更加明显。 另外,当内核的数目上升时,不是整体的效率一定提高,比如内核的数量大余60以上时,效率倒可能会下降。这就如同我们的组织,不是人越多越好,而是要有一个限度。因为当核再往上增加时,你还要解决好处理器中内核之间的数据通信和内存共享问题。这与机场调度的原理是一样的。一个塔台,能够流畅的处理飞机的起落时间安排;两个塔台,在调度开始前还必须进行任务分工和完成进度间的交流。而当四个塔台同时管理一个机场,会大幅增加信息互通的时间和对任务进行合理的资源分配的难度,结果只能事倍功半。

  当然,在软件应用层面上也有事情可做。从原理上说,如果你的关键业务根本不能被拆分成并行计算,那你采用单核也多核的效率是一样的,不会有改变。所以,现在多核的普及最主要的问题是并行计算程序的编写和优化。

  看到这里,读者朋友们可能要问了:windows 7不是一个典型的能够完善对多核优化的系统代表么?这证明在OS层面上,的确是核越多越好的。但是,微软Windows核心操作系统部门内核设计师戴夫·普罗伯特(Dave Probert)却不这么认为,他说,随着处理器集成的内核数量不断增多,当前操作系统的基本设计需要改变。当前操作系统利用多核处理器处理能力的 方法非常复杂,不够完美。关键问题不是在并行编程方面投入更多资源,而是重新考虑操作系统的基本设计。目前的计算机并没有充分发挥多核处理器的处理能力。

  那么,工程师们如何实现对多核资源的更有效、更充分的利用呢?

2
i7-980X采用的QPI直连总线技术

1、QPI总线:Intel的QPI总线构架是个不错的解决方案。 它可以使多核间的互传资料不用经过芯片组。QPI总线可实现多核处理器内部的直接互联,而无须像以前那样还要再经过FSB进行连接。例如,针对服务器的Nehalem架构的处理器拥有至少4组QPI传输,可至少组成包括4颗处理器的4路高端服务器系统(也就是16颗运算内核至少32线程并行运作)。而且在多处理器作业下,每颗处理器可以互相传送资料,并不需要经过芯片组,从而大幅提升整体系统性能。随着未来Nehalem架构的处理器集成内存控制器、PCI-E 2.0图形接口乃至图形核心的出现,QPI架构的优势见进一步发挥出来。

2、睿频加速:

3

  “睿频”是在i7-860和i5-750上首次投入应用的智能管理技术,对于普通消费者来说,还是相当陌生的。那么,首先让我们来了解什么叫睿频(Turbo Boost)。顾名思义,Turbo boost就是加速技术,它是基于Nehalem架构的电源管理技术,通过分析当前CPU的负载情况,智能地完全关闭一些用不上的核心,把能源留给正在使用的核心,并使它们运行在更高的频率,进一步提升性能;相反,需要多个核心时,动态开启相应的核心,智能调整频率。这样,在不影响CPU的TDP(热功耗设计)情况下,能把核心工作频率调得更高。

  举个简单的例子,如果某个游戏或软件只用到一个核心,Turbo Boost技术就会自动关闭其他三个核心,把正在运行游戏或软件的那个核心的频率提高,也就是自动超频,在不浪费能源的情况下获得更好的性能。也就是说,睿频技术能够合理分配CPU资源。

3、AMD桌面级六核心的C-状态性能加速

333

  AMD的Thuban具备六个处理核心、四个HT总线接口、北桥和HT总线开关、128-bit双通道DDR2/3内存控制器、6×512KB二级缓存、6MB三级缓存、两个三级缓存标记(L3 Tag),以及尺寸:长度21.4毫米、宽度13.7毫米、面积294平方毫米,与英特尔高度集成性的westmere构架有异曲同工之妙,好事一箩筐,增加了核心之间的沟通效率。除了高度的集成性,AMD的六核心处理器还将采用某种形式的基于硬件的动态加速技术。这种技术名为“C-state performance boost”(C-状态性能加速),与某些Core i5和i7处理器中的“Turbo Boost”功能类似。

  4、AMD的K10架构的三级缓存。K10(巴塞罗那)处理器采用三级缓存架构设计。或许有玩家认为这没什么大不了,因为就连英特尔奔腾4 3.46处理器也正式使用过。不过这里的三级缓存架构设计却有很大的不同。三级缓存对单核处理器来说帮助并不是很明显,这点已基本得到证实。其次AMD K10架构四核处理器引入的三级缓存架构,是在供给所有二级缓存共享的基础上搭建,也就是说其具备和英特尔Core架构共享式缓存一样的原理:即不再需要对四个核心共用的数据进行同步,而是共同在三级缓存中直接调用即可,这样就可以大幅减少延迟,进一步提高核心利用率。

  通过以上分析,我们看到了多核背后的尴尬——利用效率,并且如今的解决方案还很有限,而某些游戏又只对高频和具有大缓存容量的CPU敏感。例如即将通过审批的《巫妖王之怒》和最新的质量效应2、极品飞车13等游戏。

键盘也能翻页,试试“← →”键
IT热词