本文翻译自http://www.anandtech.com/cpuchipsets/intel/showdoc.aspx?i=3184&p=1,如有翻译错误,欢迎网友指出。 前言 在此前的七代英特尔CPU制程中,CPU所选用的制作材料都是金属氧化物半导体(MOS)二氧化硅(SiO2) 和其他聚合物。这种物质的使用的跨度非常广,从Pentium的0.6微米(600纳米)节点技术到一部分65纳米的Core 2 Duo/Quad的CPU都是使用这类物质。然而在接近40年前,英特尔第一次使用这种物质的时候,英特尔已经不断变更这些用于晶体管制造方面的化合物成分。二氧话铪(HfO2)已经取代了二氧化硅成为基本的栅介质材料,同时还有其他细心挑选过的新材料用于制作PMOS和NMOS晶体管的门电极。这些新材料的相互配合,使处理器的运行速度上升了数十倍,同时在把晶体管所消耗的能源下降了惊人的30%。这些进步的结果是更低的运行温度,更高的效能和更强大的性能。
在节点制成技术发展到越来越细的过程中,有两种潜在的事会发生。首先是良品率会提高,生产商的成本降低,最终产品价格下降,使更多的消费者买得起。其次,随着晶体管集约化程度越来越高,设计者能可以借助新的制造技术研发新一代的产品,在面积不变的情况下集成更多的晶体管。更小的晶体管同时也使英特尔能够推动晶体管能源消耗向下到达极限。这些都是真的,但是随着晶体管小到一定程度时,功率会出现泄漏,甚至晶体管会自我关闭。从这个点来看,如果要摩尔定律能够继续下去,有些技术必须要改变。 在大张旗鼓地宣传后,英特尔在短短几个星期前如很多人预计一样发布了Core 2 Extreme QX9650处理器。虽然英特尔也明白高昂的价格会让不少对性能有极高要求的发烧级玩家止步,但是英特尔仍旧把这款处理器卖得非常贵。对于一般的用户相信最早要等到2008年初才能体验到较低价格的新款CPU。正如以往一样,我们马上为你带来关于QX9650的第一手资料,向你展现这款处理器的潜在性能。虽然我们在实验的过程中也碰到了不少问题,接下来我们将把我们在这个实验中的惊喜与问题与大家更详细地分享。在此之前,我们还是必须夸奖一下英特尔在处理器发展中所作出的贡献。毫无疑问,这块QX9650是一款非常成功的产品。 英特尔的这款QX9650处理器能达到的性能,对于目前所以其他处理器来说,如果仅仅通过水冷辅助散热是不可能达到的,我们发现自己已经沉溺于这种速度之中了。实际上,要在实际应用中发掘出这个处理器近乎变态的性能是非常困难的。目前只有很少程序能使双核发挥真正的作用,更别说是四核处理器了。但是我们可以通过特别的使用方法以发现这个处理器的能力。特殊并行处理能力将因为多任务处理获益最多。很好的例子包括视频(以及在较小的音频)编辑,渲染,光线追踪,三维实体造型,DivX/Xvid编码操作,当然还包括游戏(有适当编码,并没有GPU的限制)。 我们希望我们对QX9650超频性能的深入探讨能够为大家,包括那些一直以来在这方面很有研究的发烧友,提供一些新的信息。对于其他一般玩家,特别是那些即将打算自己动手对那些超过保修期的处理器进行超频的玩家,应该能够学习到绝大部分在超频前需要掌握的知识,同时我们相信你也会慢慢沉溺于超频的乐趣中。扣紧散热片,调整电压,与我们一起,开始我们的超频Party吧。 最近有不少人展开了关于Intel和AMD在处理器电能消耗方面的讨论。有相当一部分的讨论是围绕哪些方法能更精确地反映出处理器的电能消耗。事实上,我们能看到两个平台有各自的优点,然而对于消费者来说哪一个更好则是很大程度上在于消费者的个人观念。 直到今天,英特尔仍然以TDP(发热和性能比)作为评定处理器的一个标准。英特尔这样做的原因主要是希望研究发热方面的工程师能够在实际产品情况中取得用以继续研究的数据。英特尔明白很多公司要求他们的电脑能够在繁忙工作中保持一定性能和一定的温度,不会希望机器超过能承受的温度导致系统不稳定。 然而AMD关注的点却非常不一样。他们希望把发热方面的数据变成营销上的工具。通过把精力放在处理器的APC(平均性能消耗)上,AMD希望能够取得那些希望通过低成本达到机器稳定的企业的订单。虽然大多数终端用户发现在实际的每月电费上反映出来的成本下降并不明显,但是对于那些拥有数百甚至数千台工作站的企业用户来说,这个费用就非常的大了。同时,那些拥有上千工作站的的企业通常也有其他忧虑。他们会担心每月$5,000-$10,000的工作人员的工资还是每月$10-$30的一台工作站的能源投资呢?企业更大的忧虑是这些机器的性能是否能够满足工作站的日常需要而不是在电力资源方面的开支。 在这个层面上,我们通常会认为AMD是在为大众市民服务,而Intel是在为企业服务。无论大家如何看待这个问题,我们都相信一点:无论哪一种方案你认为更加正确,如果没有可靠的数据支持,这些理论都是没有意义的。 让我们惊奇的是,英特尔选择了让QX9650的TDP保持与耗电130W的65nm的QX6850的TDP一致。这让我们对于英特尔关于45nm处理器的技术改进报告上关于效能提升30%,同时晶体管漏电降低10倍的论调产生了怀疑。难道是一些基本的核心性能提升,如新的SSE4的应用,就让CPU的性能有所降低吗?我们不是这样认为的。明显地,我们认为有更多的东西在里面。可能是QX6850的TDP被大大地低估了,又或者是QX9650的实际表现要比英特尔的说明要好更多。或者提高对QX9650的TDP的评定会使英特尔能够在未来发热方面的进步有更大的空间。我们随即对这个45nm的CPU在TDP方面进行计算,但是我们计算出来的值大概在100W左右,比英特尔的研发团队计算出来的值要低30W,也就是在热电效能方面要比官方数据高30%。 计算TDP的值的难度要远远比所有人想象的高。有一些不同的方法可以对这些值进行评估,有一个方法要求在核心超频状态下进行计算,但是这些不会影响我们的计算,特别是在我们还是相信英特尔关于QX9650的TDP值正确的情况下。这个TDP值我们认为是在一定程度上没有反映出实际的工作情况,相反,我们决定用创新的改进方法进行评估。这个概念相当简单,我们将测定功率耗损,减去"静态"消耗部分,我们就能得到正确的电源效率,然后计算出一个平均数以确定哪些部分是CPU所消耗的。然而最大的挑战将是如何制定一种手段,以准确确定这个临界点。 选择正确的电源对于我们的任务来说是非常重要的,我们采用了海盗船(Corsair)的产品,以使我们可以利用已公布的效率曲线。借助我们来自P3 International的Kill-A-Watt,监视并记录整个系统的能源消耗对我们来说变得非常容易。最后,我们将计算刚刚有多少电源是用于静态设备的(风扇,水泵,硬盘等等),这些并不会很困难。实际上,设计一个方法以减去主板、内存和显卡的电源消耗才是最值得思考的。 我们的解决方案可说是相当有特色的:我们调节CPU频率和电压,然后根据计算得出下表。 把这条线向下延伸,我们就能计算出Y轴的轴距。从数学上来说,线上的每一个点反映的是CPU的频率和功率之间的关系。没有太多的争论,我们发现我们能够发现的CPU最低能量消耗(大约为240MHz)。 然后,我们的设计出基本系统闲置功率(全部功率减去静态载荷闲置,即电源效率)相对于同一套的频率。我们创造一个最佳的方程,并在解决最小耗电量和频率的点时发现,在上面的图形中,我们的系统电源消耗与CPU的其最小能源消耗(近为零)数值比较接近,我们可以以此定量测定主板,内存,显卡的闲置功率消耗总和。最终我们计算出了华硕P5E3主板,4GB的OCZ的DDR3内存,和一个正在以500MHz频率运行一个2D桌面的8800Ultra一共需要110W的电源。耗电极大的GPU和超强的X38芯片是主要的用电元件。 最后我们得出下图。 这幅图片可以说是融入了我们丰富的知识和不懈的努力。但是需要说明的是这个数据是我们这一块处理器所测试出来的,我们的测试方式很精确,但是每一块CPU都可能有一些不一样,因此对于其他的CPU只能作为参考之用。 我们取得了最后这个图,并获得了我们的CPU满负荷功率消耗/频率的数据点,从这个数字上,根据我们的测试,该CPU的超频最终频率最少为3.9GHz。通过升级散热系统,将最大程度地使这个四核处理器达到更高的性能。 发掘45nm硅的极限 在我们测试的过程中,我们发现了一些相当有趣的东西。一般来说,CPU频率有一点潜在的规则。计算过程中我们发现,在3.0GHz到4.0GHz之间,我们的处理器需要约0.3mV(0.0003V)的电压提升以实现核心频率的1MHz的提升。由于我们的QX9650能够在惊人的0.98V电压下以3.0GHz的速度运行,这表示如果要在3.6GHz的超频状态下运行,则需要0.98V + (0.3mV/MHz)(600MHz) = 1.16V的电压。这种趋势一直到大约到4.0GHz都能实现,在4.0GHz的频率下,稳定电压仅仅只有1.28V。我们情不自禁地对这个英特尔新型的45nm处理器感动激动,特别是考虑到它只是一个还不成熟的产品。 把频率降到3.0GHz以下,我们能够有机会尝试世界标准的低电压(LV)和超低电压(ULV)频率。2.4GHz的频率仅仅需要0.90V的电压。同时,我们测试发现在ASUS P5E3出现了最低的核心运行频率6X200MHz=1.20GHz,运行于这个频率仅需要0.81V的电压。这个非常有趣,这个也是目前能够让CPU运行的最低电压。 正如我们所预期的,把QX9650的频率推上4.0GHz,虽然是可行的,但是需要比我们原本计算出来的更高的核心电压。实际上,要把频率突破这个界限,需要指数级的电压增加。在这个时候,性能收益变得很小,而增加的电能消耗却是十分巨大,因此是不值得的。明显地,更高的运行频率需要更好的散热系统。奇迹地,在我们首次用水冷对四核心处理器进行散热的时候,我们感觉到发热并不是主要的限制因素。为此我们决定要找出其他制约处理器运行的因素。 通过对比处理器的电源消耗值,我们开始我们的研究。这些数值惊人地预见了我们所测试出来的最低运行频率,但是当频率向上使,这个规律被快速地打破。 虽然我们无法解释为什么电容在高运行频率时会变成一个巨大的制约因素,但是我们认为核心温度可能会是一个原因。这个看法会很好地解释什么微处理器当处于超级低温的时候在运行速度上会有巨幅提升。典型地,在液氮冷却的情况下,一个CPU只需要很低的电压就能运行,然而在风冷或者水冷的条件下,运行一样的频率就要更高的电压。实际上,根据我们的看法,这个45nm处理器应该是对于那些希望找到硅的临界点的人来说最佳的研究对象。在过去,我们常常认为更大的散热片,更强的风扇和更优秀的水冷装置就能拥有更高的频率,但是在45nm的处理器中,这个法则将不复存在。 在高频率中没有预见到的性能损失 我们的测试能够帮助我们发掘出QX9650的所有潜力。当我们把这个处理器的频率超到4.25GHz的时候,我们发现一些无法预计的性能表现问题。这个问题似乎出于当CPU在一段时间中连续100%负荷工作后,处理器拒绝以满负荷工作。我们第一个发现的问题是当这个CPU在运行Prime95的时候,曾经出现处理器的核心温度快速变动。根据我们的观察发现,这个情况主要出现在核心1。 因为传统的处理器频率评定工具没有办法实时显示出频率的真实变化,因此我们认为核心时钟信号在某种程度上受到了周期性的调控。这个现象与我们已经知道的核心2热保护机制有冲突,这让我们感到很困扰。尽管英特尔处理器的确有这么一个特点,旨在降低处理器的功率消耗以免核心太热,这就意味着所有内核将受到影响,不只是一个。此外,核心温度都受到控制,QX9650的最大允许温度极限是105 ℃ 。 我们首先怀疑我们当CPU处于高负荷的时候,主板上的电压调节系统(VRM)电路可能已经过热。若情况真的如我们所料,PWM IC将调节内部时钟信号,调节每一个核心,从而人为地降低负荷,以达到VRM降温。故障意味着VRM由于热而执行自我保护,挽救各个部件不受硬伤害。遭受挫折的我们尝试改变我们的主板电路以截断控制信号。令人遗憾的是,这个情况没有改变。 我们讨论开发了一个erratum可能性,我们认为或许有些内部控制逻辑是错的。ADP3228 PWM控制器被应用在华硕p5e3主板上,在设计符合英特尔的新vrm 11.1规格,其中包括一个新的电源管理功能,旨在当负载较低时提高电源效率。当CPU执行任务时,VRM可能把8个电力传输装置中的4个停止运行,直至CPU回复正常。 (这是不是不像概念性地投入使用,在汽车行业,巡航可以提高燃油经济性。) ,但我们不能完全排除这种可能的不相容,因为没有人知道如何去禁用此功能。 实际上,我们相信我们发现的可能不仅仅是一个CPU保护装置。第二个核心的保护是极端有弹性的。在实际报告中,因为电压或电流过载而导致损坏是极端罕见的。这些保护装置能把电压限制在安全的范围里以免对处理器造成永久的损害。进一步的检测显示,我们通过某种程度的控制,以"节流"似乎略为降低,因此,在把CPU的供电电压,我们都可以完成测试,在一些相同的频率没有显着性能减弱问题。我们找到了处理器的保护极限。一般情况下,这种发现是靠的那些冻结他们的CPU与一个或一个以上的旋转式压缩机,或大量的液态氮中。由于巨大的电力增加,可以找到更高的速度,由于可能是一个处理器电容的影响,我们不能做到,但的确很想知道这些新的限制是不是英特尔的45奈米制程CPU所独有的。 如果我们相信的都是真的话,这个影响将是十分巨大的。首先,高性能的散热系统对于超频界来说变得不是那么重要。如果花很多钱买一个效能很高的散热片但是效果并不明显,那么你会怎样想呢?我们相信一个全新的CPU超频发展方向将会在不久的将来出现在我们面前。以后我们测试CPU的基准不再是频率,而是运行时的负载效率。英特尔可能想告诉我们一些事情。 英特尔处理器功率传输指南(1) 如果你以前曾经尝试过系统超频,相信你也会曾经面临过电压突然骤降的问题。有些玩家会感到忧虑,为什么在BIOS设置好了之后在系统实际表现中会表现反复呢?他们有时会认为是主板的问题,但是有些人会发现,其实这个问题的关键在于CPU负载的变化。 在目前的实际应用中,系统的负载在不同的时候会有较大的不同。电压调节系统(VRM)会根据CPU的不同负荷调节电压。其过程大致为先通过感应器感应CPU的负荷,然后通过MOSFET调节LC电路。LC电路会根据具体情况向CPU供电。如果VRM感应到电压供给正在下降,那么它就会提供更多的电源给CPU,相反亦然。这个感应-更正的周期性动作被称为负向反馈,它能够根据处理器的具体频率最高在一秒钟之类运行数十亿次。
CPU的VID设计确定了处理器能够允许的瞬间最大电压值,但是在设计上没有针对闲置电压。同时,Vdroop和Voffset能够对高或低负荷时的CPU电压峰值进行很好的控制。如果你决定要用1.17V电压,正如上面所说,当CPU的负荷较小时这是不可能做到的。单单增加CPU的VID是不足够的。我们尝试把Voffset移除。 正如我们所见,无论CPU处于高负荷或低负荷,系统都能超越最大电压限制。我们发现移除了Voffset后,VID将完全失去作用。 英特尔处理器功率传输指南(2) 接下来,我们把Vdroop移除了,看看有些什么事情发生。正如我们的模型所示,移除Vdroop后,空载到满载的电压振幅都没有减少,但是VRM回复正常工作的时间和最终回复的最终电压提高了。在没有Voffest的时候,我们能够突破CPU的最高电压限制(VID),明显地,通过移除Vdroop,我们除了麻烦,什么都没有获得。 那么,如果把Voffest和Vdroop一起移除呢?这个答案很简单:失败。虽然正负电压之间的波幅是一样的,几个突破CPU VID的限制的事会发生。如果你想知道究竟是什么问题,那么你可以考虑一下如果CPU VID是1.60000V,(主要是因为用户感觉这个是他们能够接受的绝对高电压),,你觉得CPU的电压在高负荷状态会去到一个怎样的高度呢?没有很详细的资料我们很难给出一个确切的答复,但是我们可以肯定的是CPU的电压会超越1.6V。这个时候你的感受会跟你在测试即将完成时电脑崩溃的感觉是一样的。 最后,让我了解一下Vdroop。华硕把Vdroop成为标准配置,在Bios上标志为Load Line Calibration,这个配备被配置在他们最新的主板生产线上,这有几个值得我们关注的原因。首先,通过这个设计,在负荷较低的时候CPU将有低一点的电压而反之亦然。想象一下,我们通过努力奋斗让我们的Prime95系统稳定运行了几天,然而还是在没有负载的时候垮掉了。还有,虽然没有droop和其他未知的原因,通过这个设计我们能够让CPU在1.28V到1.33V的电压下达到4GHz的频率。因此,我们的系统使用了比一般应用更多的能源。这与我们希望降低CPU电压的初衷有所违背。我们不但没有减少系统总的功率消耗,而且还把电压提高了20W。 通过禁用Bios里的Load Line Calibration,我们可以把一个VID为1.38750的CPU设置为无负载时1.34V而满负载时1.28V。开启这个设置我们可以不看CPU负载而马上把电压调整为1.35000V。把VID设置得很低的话我们在Windows启动的时候就会蓝屏。闲置电压仍然保持在1.33-1.34V之间不变,但是在高负荷中电压将增加50mV而没有任何好处。由此各位可以猜想,我们建议你把这个选项禁用。 通过Prime95测试系统稳定性 加载到处理器上的负载是很重的(一般来说,windows现实都每一个核心都100%),如果系统有任何缺陷,Prime95都能很快地找到他们并向使用者发出警告。其次,更新的版本会自动检测使用者系统的核心个数并针对性地进行运算,确保每一个核心都能基本不通过使用者操作而达到满负荷运行。有一个问题很重要,高负荷会使系统的电源、主板电源电路元件,以及其他辅助电源系统进行自我调节。最终,使用者能计算出任意时间的系统用电。 错误出现的原因从简单的循环错误和系统锁定到复杂的关机、重启都有。由于Prime95测试是内存和处理器都同时测试,因此我们有时不是很清楚究竟是哪一个部件首先出现问题。虽然你可能会马上尝试寻找CPU最大的稳定频率,但你最好先把这个想法留着。首先你应该尝试把注意力集中在主板内存子系统的限制上。如果忽略了这一点,有可能会导致整个系统的不稳定。 我们一开始先根据系统参数确定限制。通过设置好各种参数,我们可以避免在这个过程中造成不必要的硬件损害或者其他更坏的情况。在绝大部分时候,通过检测和限制这些数值,我们可以保证在测试的过程中不出现重大错误。 整个系统的电源消耗:也就是说整个系统所需要的电量供给。所有配件都要通过电源装置,把家用的AC电流转换为现在的DC电流进而供给系统。P3 International为我们搞了一个非常好而价钱很低的产品 Kill-A-Watt ,通过这个产品我们可以瞬时地知道系统的功率耗损(瓦) ,伏特-安培(VA)的输入,电源输入电压(V),电源输入电流(A),和功率的使用。 对于目前高转换效率的电源来说,一般的转换效率为80%,也就是说整个系统的电源有20%是在电源本身所损耗的(虽然电源效率的真实值是随着系统的负载而变化的,但是我们现在把这个问题简化成电源效率为恒定不变)。通过这样,我们就能预测得到我们的系统真正使用的电力,和有多少电力变成了热能而损耗。例如,你的系统电源是300W,那么实际能用的就只有240W(0.8X300W),电源变成热能的损耗为60W(300W-240W)。我们需要知道的是电源真实的最大输出功率而不是最大输入功率。 通过上面的介绍,我们就能够计算出任意电源的最大输出功率。想想一个高品质600W电源,同时稳定的电源效率为80%。首先,先把输出功率乘以90%(0.9X600W=540W),这可以让我们更好地了解这个电源的最大负荷。然后我们把这个功率除以0.8,则有540W/0.8=675W。对于一个好的600W电源,我们可以通过Kill-A-Watt读出它的最大功率为675W(当然,这个数值是建立在一个好的电源品质之上的,对于一些普通的或者质量一般的电源,这个效率可能只有70%左右,也就是说最大功率约为643W。除非你的配件所需要的功率远远小于电源的实际功率,否则电源也会发出很高的热量。这就是为什么绝大部分的超频玩家都需要一个好的电源)。 必须记住,单单在CPU测试上的电源消耗不能反映出整个系统在显卡高负荷时的电源消耗,例如在玩3D游戏的时候,GPU也会消耗非常大量的电源。必须确保你已经计算好你的系统的最大耗电量。买一个更强大的电源也是一个好方法。 核心电压和核心温度:随着节电技术的发展,节电大小越来越小,核心电压也在逐步降低。更好的散热系统有时候能允许更高的频率,但是仅仅限于温度还在控制之内。即使采用高端的水冷散热系统,45nm四核CPU如果电压超过1.42V,那也也会造成极端高的CPU满载核心温度,特别当我们把CPU频率推到4.2GHz或以上。对于那些传统的风冷散热,核心电压的极限只能达到1.36V甚至更低。 Intel的Core 2家族的处理器在电压上有令人难以置信的弹性,要让核心电压突破最大限制进而损坏处理器也是一件不容易做到的事。有些情况下,热量也会成为性能被限制的原因。在下面的文章中,我们将更详细地讨论核心温度对频率和电压的影响。 内存温度:与CPU不同,目前内存模块对于电压条件非常敏感,只要进行一些很小的错误操作就能让内存崩溃。绝大部分的高性能内存制造商都需要很长的测试时间以测定产品能承受的最大电压。我们长期都建议,必须对这个东西多加关注。一般来说,DDR2的最高电压为2.4V,DDR3的最高电压为2.1V。超过这个电压的话,你将加速系统的崩溃。记住,即使你的BIOS允许你把内存电压调到很高,但是这不等于你需要把他们通通都使用。 北桥电压:记忆体中央控制器(MCH),有些时候被称为北桥,是为I/O和CPU的外部数据服务的。它的接口包括前段总线(FSB),通过PCI Express控制的显卡,还有南桥使用的窄带DMI。MCH与FSB的比值是1:1,2:1和甚至4:1,当我们对CPU进行超频的时候,提高FSB的同时也会提高对MCH的要求。 若MCH的电压超过1.7V(对于X38来说),一些老式的主板将肯定会损坏。由于X38采用的是90nm制程技术,我们发现它能承受的电压要比65/45nm的CPU要高。在我们测试X38的过程中,我们发现这个芯片在运行两条DIMM banks(2X1GB),在400MHz FSB的时候,默认电压是1.25V,而当内存数量增加到4X1GB的时候,电压也上升到1.45V。除了FSB和内存插槽数目外,还有一些其他设置可以很大地影响MCH的最低电压需求,包括静读控制延误(Static Read Control Delay),也被称为Performance Level - Command Rate selection (1N versus 2N),和内存异步。我们的建议是当你在寻找最高频率时保持这些数值在1.6V以下。 静读控制延误(tRD)的缘由 在过去一年的对Core 2家族处理器超频的经历中,我们学会了一些东西。其中最重要的是我们学会了更高的FSB设置不一定会导致更好的性能表现。或者这个现实会让不少人感到震惊。出于某些原因,有不少非常著名的超频玩家都把提高FSB值放在很重要的位置。但是根据我们所知道的情况,我们通常把MCH超频到相同的地方400MHz FSB,同时tRD为6。其他仅有的值得考虑的MCH值为450MHz,而tRD为7,而这个设置只能用于极端高内存速度或者最高倍频非常低的CPU上。我们通过具体试验来说明这个问题。 当MCH进入超频状态,MCH就像一个杂交的品质。就像CPU一样,它有最高频率的限制,而更高的电压可以经常突破这个限制。在另一方面,因为它与内存有内部传输,因此它也经常像一个有内部时钟的内存,同时这个绝对值受FSB所影响。 设想一下,内存频率在DDR-800,CAS为3的情况下运行,我们可以很容易计算出绝对CAS(Column Address Strobe)延迟。DDR800的数据传输其实两倍于它的名字所示,它的基本运行频率是400Mhz或者4亿次每秒。我们可以从它的参数反推出这个结论(2.50ns)。最后,乘以它的CAS我们就能得到总的延迟为7.5ns(3X2.5ns)。就像如此,设置一个CAS值为4则会导致绝对CAS延迟为10ns。我们可以发现为什么高CAS值会压缩内存带宽。在以上说的哪个例子中,相比于CAS设置为4的时候,MCH要花费更多的时间“等待”。 可以说,影响MCH最大的参数应该是Static Read Control Delay(tRD)值。就像内存的CAS(CL),这个值是受FSB影响的。举一个例子,假设tRD为6,其他按照上面的例子一样计算,我们将得到结果是当FSB为400MHz时读取延迟为15ns。这就是说当CPU需要处理一个从内存到MCH的命令的时候,MCH要花时间处理内存的传输和命令,同时还需要等待数据,MCH在把信息反馈到CPU之前,会花费另外的15ns在等待信息的核实。明显地,任何能够缩短这个等待时间的举动都能改进内存的读取带宽,同时有可能提升系统的整体性能。 直到最近为止,人为地控制tRD都认为是不可能的。增加内存子系统性能的唯一途径就是提高FSB的设计,同时降低主内存的延迟。在某些时候,MCH设计师团队会与CPU的设计师沟通。 第一次更改tRD设置出现在几个超频者发现降低MCH"straps"可以达到更高的内存带宽。但是他们当时不知道的是他们无意中发现的正是tRD。一块800FSB的主板配备一颗200MHz外频的CPU,这时tRD值将低于一块FSB为1066的主板配备一颗266MHz的CPU。最后,当对系统进行超频时,我们又会得到相同的效果。总的来说,一个更低的strap会导致一个FSB最大值下降。MCH的tRD值,就像一个内存时序,必须有所损失才能达到更高的数量级。就像在一个内存中,更高的电压有些时候能够允许MCH以更低的时序运行更高的速度。 最后,下一个不可避免的步骤变成了现实。把tRD与MCH异步变成了所有超频者最爱。今天,MCH捆绑设置已经不再困难。虽然tRD调整在现在很多BIOS中变得可能,但是某些主板厂商选择模糊其真正性质,赋予设置混乱,例如把他们改名为"Transaction Booster"之类。不要被这些名称迷惑了你,最终他们还是做相同的事:调整tRD。 调整内存子系统的性能 在前面,我们说过了关于在测试CPU前先测试主板内存的重要性。如果没有这些信息,让你在测试系统时出现错误的话你将无所适从。由于CPU和内存的稳定性都与FSB有联系,我们需要把FSB调整到我们需要的目标值。这个调整能够在你的BIOS里通过设置完成(我们建议你的起点为400MHz)。然后把你的CPU的倍频调低,以对系统进行测试。接着,设置内存电压制最大的值。假设你的系统能良好地工作,我们现在能够观察MCH设置或者其他设置的错误。 启动机器,进入windows并运行Prime95。在目录中选择"Options",然后按"Torture Test...",接着点一下default,最后就可以按OK进行测试了。这个测试会运行大量的FFT数据,也就是说处理器在保存和检索中间计算结果时必须严重依赖内存子系统。虽然一个完整的系统稳定性测试需要很多个小时的连续测试,但是由于对于时间非常宝贵的我们只打算让程序运行30分钟。 如果你在一直运行的过程中都没有出现错误,你可以认为内存子系统是稳定的。如果出现错误或者其他,可以退出windows,进入BIOS,尝试微微增加MCH的电压。重复这个过程直道你最终实现30分钟运行没有错误。如果出于某些原因你发现调整MCH的电压似乎对系统的稳定性没有帮助,或者你已经达到了MCH允许的电压极限,你可以尝试让调整其他设置。例如更改tRD,减少运行的内存的数量等等都可能会有作用。如果你发现修改这些项目可以完成整个Prime95测试,那么你应该尝试降低MCH的电压直到你找到能够驱动它运行的最低电压。 另一方面,如果你发现通过格外的MCH电压调整你可以轻松地完成整个测试,那么无论你是否打算一直以超频状态进行日常操作,恭喜你已经让你的系统实现了更高的性能。一般来说,更高的性能需要更高的电压,这也意味着更高的热量,更高的温度和更高的工作成本。如果电能效率是你所关注的,那么你可能会希望就此停止,进行下一个调试。如果系统性能是你唯一的关注,尝试降低tRD以提高内存带宽,同时提高MCH的电压。 在最后,只要系统是稳定的,你就可以继续下一步。至于具体的调整,归根到底都是要靠实际经验,我们没有办法告诉你太多,只要多加尝试,你也能掌握好这些技能。 选择内存分频并设置时序 最新一代的英特尔内存控制提供一个比以往都要好的,用途非常广泛的内存分频器。一般来说,我们只用三个。首先是1:1。也就是内存同步。必须记住FSB是四倍,而内存是两倍的数据传输速率。例如,当FSB设置为400MHz的时候就能有1.6GHz(4X400)的传输效率,而此时DDR-800则是(2X400)。如果你选择的事5:4,则选择在FSB为400MHz的时候,内存就是DDR1000(5/4x2x400)。除了1:1和5:4两个分频外,对于DDR3内存我们推荐选择为2:1。 把这个比率调整为大于1:1后,我们发现实际的性能增长并不大。虽然对于一些测试软件来说,你的确能获得更高的读写带宽,但是在实际应用中,只有极少程序在内存存取方面面临瓶项。如果我们打算花时间去研究DDR2-800 CAS3和DDR2-1000 CAS的差别的话,我们会发现整体内存传输时间实际上在提高。这与我们一般的看法有差异。 开始你的下一步调整的时候,你需要再次进入BIOS并选择正确的内存分频。就像上面所推荐的,虽然在分频方面有很多选择,如果你正在用DDR2可以选择,我们还是建议你选择1:1或者5:4。若是DDR3则选择2:1。下一个就是要选择其他基础的时序。一般来说,即使最差的高性能内存都能在DDR-800频率上达到CAS3,在DDR2-1075达到CAS4,CAS5则其他更高的频率了。其实关于内存频率只有一个大致的范围,这结果根据你的主板的内存系统,你的内存质量和你设置的电压有很大的关系。你可能会发现通常最简单的设置都是全部时序一样(CL-tRCD-tRP),例如4-4-4,5-5-5之类。对于tRAS,如果是DDR2则应该不低于tRCD+TRP+2,而对于DDR3则应该把这个值设置在15到18之间,包含15和18。 在调整内存参数后开机失败(POST)通常有几个原因:A)你的设置超过了内存最大的可能频率。你可以尝试变更内存分频。B)你设置的时序太低,尝试提高内存时序。C)频率和时序都是可能的,但是电压不足,你可以提升电压看看有没有改善。不是所有的POST都有解决办法。有些主板会简单地拒绝采用已经设置的内存分频,同时我们最近发现了越来越多能够在比以往的内存以更低时序运行的产品。 能够进入windows的桌面通常都是一个好兆头,起码说明了你的设置已经离稳定近了。然后再次运行Prime95,运行最少30分钟。如果出错,特别是循环出错,那么就是内存出问题的信号。如果出现错误,重启系统并尝试微微增加内存电压,必须记住要有一个特别的界限,如果你继续出现错误,可以忽略内存电压,你应该提高内存时序并继续进行测试。一但你的系统能够运行Prime30分钟以上的话,你就可以进入下一步,超频CPU。 对CPU进行超频 处理好内存和内存子系统后,我们就准备好看看我们的处理器的潜在性能如何了。因为我们已经决定好我们的目标FSB,因此CPU的频率也必须与FSB的设置进行关联。CPU的倍频只会对CPU的频率有影响。如果CPU的频率为8X400时内存稳定,那么当CPU频率调整为9X400时内存也必定稳定。假设我们选择好内存分频1:1,那么不管CPU频率如何,内存还是能稳定在DDR-800的频率上。接下来,我们能调整最终的频率以调整FSB。 再一次,进入你的主板BIOS,这次调整的只是CPU的倍频和CPU的电压至一个可能的频率。运用自备的水冷散热装置,我们可以测算出Q9650的数据。请记住,每一个CPU的电压、频率和其他东西都是不同的。你的处理器可能在相同条件下表现好一点或者差一点,这些都是正常的,我们的这些具体数据只具有参考的价值。(以下的数据是在CPU满载,同时没有VID设置的情况下得出的) 在启动windows到桌面后,再次运行Prime95,这次选择运行小量FFT,因为这样的设计能使CPU达到最大的负荷和最高的温度。就像以往一样,运行最少30分钟看看是否出现错误。这时通常有可能出现的错误会有所不同,如果出错的话,小窗口的图标会从绿色变成红色。通常地,对于45nm处理器来说,一般都是内存错误,但是由于我们已经知道内存在这个状态下应该是稳定的,因此我们还是需要检查CPU。在这个情况下,正确的做法是把CPU VID一步一步地微调。如果系统死机或者死机后自动快速重启,你就需要增加CPU的电压和进一步调整VID了。把出现错误的时候的整个设置记录下来,同时增加CPU电压0.05V或更多,再次尝试。最后把核心电压逐步降低至可以驱动CPU运作。 根据散热系统的选择,你将能发现超频的温度限制。QX9650的最高温度限制是64.5°C,但是实际上在70°C以前,发热都不是影响CPU性能的主要原因。除了核心温度外,电压调整模块(VRM) 45nm的Core2家族处理器的其中一个重要的特性是能够支持非整数的倍频调整。有些时候通过半倍倍频的调整,我们能够以半步半步的方式来调整FSB。超频玩家如果希望用400MHz FSB,现在可以通过设置10.5X倍频使CPU频率达到4.2GHz,从而使频率突破4.0GHz(当4.4GHz达不到的时候),这样的做法没有变动FSB。你能很容易想象到通过这样的设置能给系统带来多大的性能提升! 用测试软件测试超频成绩
当我们把成绩与65nm的QX6850进行对比的时候,我们发现相同频率下差别小于1%。然而,45nm的QX9650能够达到比QX6850更高的频率,达到4.4GHz,我们还没有需要调整显卡的频率就把3D Mark的分数突破了16,000分。在这个速度下,如果配搭一个超频后的8800GTX/Ultra显卡,相信突破18,000分是绝对可能的。 Futuremark 最新的系统测试软件,PCMark Vantage弥补了PCMark05的缺陷。花费了数年时间的开发,这个软件具有了测试系统任何可以想象得到的方面的能力,包括单独各个部件或者整体系统都可以。因为Vantage只针对一个操作系统(Vista),因此我们在64-bit系统下和32-bit系统下都进行了测试。因为Vantage(X64)比其他测试软件能做到更全面的测试,因此这个成绩所包含的要比单独一个CPU进行测试的内容要多。鉴于这些原因,我们在每次测试前都把FSB的设置记录了下来。由更高的内存频率导致的额外的内存带宽的增加的确对整体系统的测试有所影响。 Cinebench R10时另外一个测试软件,而且它在Windows XP和Vista操作系统下的表现完全不相同。MAXON的开发者花费了大量的时间来优化64-bit环境下的运算核心,同时它展现出来的,与上面的显卡测试不同,我们发现在Vista系统下的优势非常明显。因此我们可以发现,额外的核心和更高的频率在CINEBENCH R10中表现更加出色。 当我们把QX9650的成绩与QX6850的成绩进行对比时,我们发现QX9650相对于QX6850的性能提升变得十分明显。在这个情况中,由于核心频率的大幅提高,新款增强型的Core 2处理器能够在性能上取得领先。 TechARP最近发布了一个很好的x264测试软件,它能测试系统将一个短的,DVD品质,720x480分辨率的MPEG-2流视频压缩成为一个高品质x264文件的时间。这个成绩可以显示每秒的帧数,同时能够计算出总的编码时间(精确到秒以下)。这个x264 CODEC能够让多核心处理器高效运行,同时也受处理器本身的性能影响很大,因此这个测试软件能能够很好地反映出CPU的性能。虽然CODEC没有对SSE4,一个Penryn的新特行进行优化,但是QX9650仍然轻松地击败了QX6850。 我们希望在未来的测试中继续加入实际的游戏成绩,这些成绩包括最新的热门游戏,例如Crysis,Call of Duty4:Modern Warfare, Unreal Tournament 3和Gears of War。同时我们希望能用这个CPU搭配上其他品牌的主板进行对比,例如华硕、技嘉、微星、升技、DFI和富士康之类。 最后的思考 虽然我们没有能够把所有关于超频的技术向大家说明,然而我们的内容已经在比较短的篇幅中涵盖了大部分的内容。我们探讨了QX9650的电源消耗,突出了Intel和AMD发布的参数并非最精确的值。对处理器频率与电压之间的关系的学习让我们明白,超频的路还有很长,需要研究的东西还有很多。 我们也学习了如何把CPU的性能发挥到最大,有时候能够找到性能与电源效率之间的平衡要比单纯的追求高性能要好。好的超频不等于要把频率推到最高点,相反,我们比较建议“理性超频”,也就是说找到最适合实际应用的频率,然后停止继续向上推进,在那个点进行详细的调试。在本文中我们提供了许多帮助我们做到这些事的工具,现在你需要做的是你自己动手让这些事在你手上变成现实。 鉴于在这个测试过程中我们发现了不少问题,我们的对答案的追求并不会停止。我们在这个让人有极深印象的产品中这么早地发现这个产品的问题不得不说是一种遗憾。在某种程度上,这个产品颠覆了我们的传统看法。如果我们的假设是正确的,我们也许会促进散热工业的重大变革。如果我们能够发现更多,那么你也可以做到。同时我们没有找到任何理由拒绝向超频玩家推荐这款CPU的理由。 英特尔的QX9650只是开始,革新每天都会发生,同时设计的改进也会同时发生。当我们对45nm的处理器进行测试后,我们不禁对下一代产品的到来感到十分激动。更便宜的45nm处理器,例如Q9450就是我们最关注的处理器之一,同时很自然地,我们也十分期待AMD如何面对英特尔最新的挑战。AMD的45nm技术能够达到相似的水平吗?我们目前只能期待!
|
鏀惰棌鎴愬姛鏌ョ湅鏀惰棌>>
正在阅读:打破传统!Intel最新45nm顶级CPU QX9650超频研究打破传统!Intel最新45nm顶级CPU QX9650超频研究
2007-12-26 11:41
出处:PConline
责任编辑:pangjingxin