1回顶部 2003年,Intel的865PE芯片把双通道内存技术带到广大消费者面前。依靠更大的FSB设计原理(Intel的FSB为CPU外频的四倍),双通道系统的intel整机性能比单通道平台大致有20-30%的性能提升,双通道平台由此受到DIY玩家接受,并成为业界基本标准。最终大大刺激了内存产业的兴旺。五年过去了,过完令人激动的双通道逐渐不能满足DIY用户的需求,性能更强的DDR3 三通道技术应运而生。 首先支持三通道DDR3内存技术的处理器是intel最新发布的I7系列处理器,无论是“入门级”的I7 920处理器还是顶级的I7 Exetreme 965处理器均完整支持三通道DDR3内存技术,配合三条通道DDR3内存,整体性能更上一层楼。 Core i7的改进:内存控制器+三通道技术
内存控制器(Memory Controller)相信大家不会感到陌生,竞争对手AMD早在2003年K8时代CPU已经集成了内存控制器,能大幅提升内存性能。而Intel方面则表示由于时机还不适合,即使是2006年推出的Core2处理器也没有集成内存控制器,这也使得优秀Core 2在内存性能上一直处于Athlon 64 X2与Phenom系列的下风。 Intel当然不允许内存性能处于下风的局面一直存在,2008年推出的Core i7终于拥有集成内存控制器IMC(Integrated Memory Controller),而且可以支持三通道的DDR3内存,运行在DDR3-1333(支持XMP技术的内存更可运行在1600MHz的频率),内存位宽从128位提升到192位,这样总共的峰值带宽就可以达到32GB/s,达到了Core 2的2-4倍。处理器采用了集成内存控制器后,它就能直接与物理存储器阵列相连接,从而极大程度上减少了内存延迟的现象。 2回顶部 Core i7旧延续了LGA 775的封装方式,采用铜质顶盖保护CPU核心,同时提供更大的散热面积。从图片可以看出,Core i7面积明显要Core 2大一点。缺口位置也发生改变,从Core 2的上下缺口改为左右两侧缺口。根据Intel官方资料显示,该处理器一共集成了7.31亿个晶体管。 Core i7采用全新的LGA 1366接口设计,从图上可以看出,金属点更多更密集,形象为椭圆型。 侧面对比两颗CPU,图中左边的Core i7稍高一点。 与Core 2不同,Core i7正面同样有很多金属点。 Core i7的改进:超线程技术回归
超线程技术(Hyper-Threading,HT),最早出现在130nm的Pentium 4上,超线程技术就是利用特殊的硬件指令,把两个逻辑内核模拟成两个物理芯片,让单个处理器都能使用线程级并行计算,进而兼容多线程操作系统和软件,减少了CPU的闲置时间,提高的CPU的运行效率。超线程技术使得Pentium 4单核CPU也拥有较出色的多任务性能,现在通过改进后的超线程技术再次回归到Core i7处理器上。而超线程技术又称为同步多线程技术(Simultaneous Multi-Threading,SMT)。 同步多线程(Simultaneous Multi-Threading,SMT)是2-way的,每核心可以同时执行2个线程。对于执行引擎来说,在多线程任务的情况下,就可以掩盖单个线程的延迟。SMT功能的好处是只需要消耗很小的核心面积代价,就可以在多任务的情况下提供显著的性能提升,比起完全再添加一个物理核心来说要划算得多。比起Pentium 4的超线程技术,Core i7的优势是有更大的缓存和更大的内存带宽,这样就更能够有效的发挥多线程的作用。按照Intel的说法,Nehalem的SMT可以在增加很少能耗的情况下,让性能提升20-30%。 为什么Core 2没有使用SMT?很显然,它是可以做到的。SMT是在节省电力的基础上增加了性能,而且软件支持的基础建设也早就有了。有两个原因:一是Core 2可能没有足够的内存带宽和CPU内部带宽来利用SMT获得优势。通常,SMT能够提升内存级并行(memory level parallelism,MLP),但是对于内存带宽已经成为瓶颈的系统则是个负担。而更有可能的原因则是SMT的设计、生效等是很麻烦的,而当初设计SMT是由Intel的Hillsboro小组主持,而并非是Haifa小组(Core 2是由这个小组负责的)。这样Core 2不使用SMT就避免了冒险。 Core i7的改进:自动超频,核心加速
Turbo Mode,故名思义,就是加速模式,它是基于Nehalem架构的电源管理技术,通过分析当前CPU的负载情况,智能地完全关闭一些用不上的核心,把能源留给正在使用的核心,并使它们运行在更高的频率,进一步提升性能;相反,需要多个核心时,动态开启相应的核心,智能调整频率。这样,在不影响CPU的TDP情况下,能把核心工作频率调得更高。 举个简单的例子,如果游戏只用到一个核心,Turbo Mode就会把其他三个核心自动关闭,把正在运行游戏的那个核心的频率提高,也就是自动超频,在不浪费能源的情况下获得更好的性能。Core 2时代,即使是运行只支持单核的程序,其他核心仍会全速运行,得不到性能提升的同时,也造成了能源的浪费。 Turbo Boost默认是开启的,通过自动调高CPU的倍频提高性能。在Intel原厂X58主板上,低负载时默认调高1-2个倍频。例如Core i7 920默认频率为2.66G,在Turbo Boost默认是开启的情况下,运行Super PI是以单核2.8G来跑,这样单线程性能也就得到提升。 超频爱好者也许会想到,Turbo Mode自动提升的那个频率可以手动调整吗?如果可以,不就能利用它进行超频吗?答案是可以的,只要是Exterme Edition CPU,就可以手动调整,好好利用,新的超频方式从此诞生诞生,这将在后面超频部分详细说明。完整的SSE 4(Streaming SIMD Extensions 4,流式单指令多数据流扩张)指令集共包含54条指令,其中的47条指令已在45nm的Core 2上实现,称为SSE 4.1。SSE 4.1指令的引入,进一步增强了CPU在视频编码/解码、图形处理以及游戏等多媒体应用上的性能。其余的7条指令在Core i7中也得以实现了,称为SSE 4.2。SSE 4.2是对SSE 4.1的补充,主要针对的是对XML文本的字符串操作、存储校验CRC32的处理等。 3回顶部 原厂X58主板赏析:
4回顶部 评测平台及评测说明
本次Core i7家族的920、940和965对比评测,我们加入了Intel Core 2中最顶级的Core 2 QX9770作为参考对象。测试项目包括CPU理论性能测试、3D渲染与视频压缩多线程测试、多媒体性能测试、内存性能测试以及3D游戏测试。 为了避免3D效能成为瓶颈,我们选择顶级单芯显卡GeForce GTX 280作为评测显卡使用,由于是测试CPU的游戏性能,我们采用了较低的分辨率1024x768,这样才能更充分体现CPU在游戏的中性能差距。 虽然Core i7 965 Extreme Edition支持DDR3 1333甚至是DDR3 1600(XMP)内存,但为了平台的一致性,以及更好地反映CPU在相同条件下的性能差距,我们一致采用DDR3 1066内存。测试过程默认开启Turbo Boost和超线程技术,CPU会按情况自动提高1-2个倍频。 5回顶部 14 Core i7在CPU-Z中的详细信息
6回顶部 15 全面超越!CPU理论性能评测 SUPER PI MOD 1.4性能测试: SuperPI是由东京大学Kanada Lab.所制作的一款通过计算圆周率的来检测处理器性能的工具,在测试里面可以有效的反映包括CPU在内的运算性能。在玩家群中,Super PI更是一个衡量CPU性能的标尺之一。 在Super PI的测试中,Core i7家族的表现较为出色,940已领先Core 2 QX9770一秒多,965更是领先两秒。在SUPER PI接近10秒关口之际,一秒的差距是不少的。 WinRAR 3.71性能测试: WinRAR作为一款目前非常流行的压缩软件,我们使用了它内置的评测功能。评测的结果可以有效的反映CPU的性能。 在WinRAR的评测中,集成内存控制器+三通道+超线程的Core i7锋芒毕露,大幅度抛离Core 2 QX9770。 Fritz Chess性能测试: Fritz Chess Benchmark主要用于测试处理器的多线程处理能力。 国际象棋主要考察CPU的多线程运算能力,拥有出色多线程性能的Core i7家族,成绩非常理想。 7回顶部 16 提升接近100%!内存性能评测 Everest内存性能测试: Everest作为一个系统检测软件,其前身是Aida32,它可以详细的显示出PC每一个方面的信息。支持上千种(3400+)主板,支持上百种(360+)显卡,支持对各式各样的处理器的侦测。软件自带的Memory Latency评测,可以通过对内存延时的评测,直观显示出内存子系统的效能。 自从AMD的K8处理器集成内存控制器后,内存性能便一直成了Intel CPU的弱项。今天,Core i7要给这个弱项画上句号了,集成内存控制器后,同频的Core i7比Core 2 Quad提升接近100%。 8回顶部 17 八线程的威力!3D渲染与视频压缩评测 Cinebench R10多媒体性能测试: CINEBENCH R10为目前最新版的Cinebench系列测试软件,它采用了3D设计软件CINEMA 4D的3D引擎,可以用来评测显示卡、处理器的效能。 在CINEBENCH R10的测试中,单线程渲染时,Core 2 QX9770处于Core i7 940与965之间。当进行多线程渲染时,Core i7以8个线程同时渲染,表现相当出色,只有4个线程的QX9770只能垫底了。 TMPGEnc视频转换测试: TMPGEnc 是日本人堀浩行开发的一套MPEG编码/工具软件,支持VCD、SVCD、DVD等各种格式。TMPGENc 3.0 xPress相对于旧版本在MPEG编码上作了不少的优化,例如加入的超线程和多核心的优化选项,尤其是其加入了SSE3指令集的支持,能使拥有该指令集的CPU发挥出更好的性能,减少大量的编码时间。 在我们的首发评测中,Core i7在TMPGEnc这个测试项目表现异常,原因是超线程与软件存在兼容性问题。本次测试采用最新版的软件,解决了该问题,Core i7的表现较为满意。 Core i7对市场的影响: Intel在将在11月中先推出三款Core i7处理器,分别是Core i7 920、Core i7 940和Core i7 965 Extreme Edition,用于取代当前的Core 2 QX9770、Q9650等高端CPU,因此i7的消费对象主要是高端用户群体,对当前主流级市场不会造成太大影响。由于购买Core i7必须搭配昂贵的X58主板和高价的DDR3内存,整套平台价值不菲,普通用户还是持观望态度吧。根据Intel最新的路线图,面向主流级的Core i7要到09年第三季度才会上市,45nm Core 2还会占据主流市场相当长的时间。 未来发展的预测: Core i7即将发布,届时将正式取代当前顶级的Core 2 Quad QX9770与Q9650,把高端CPU的性能带到前所未有的高度,更把对手AMD当前顶级的Phenom X4 9950远远抛离。虽然AMD的45nm Phenom X4 20000系列也将在09年1月发布,但反观现在Phenom系列与Core 2系列的性能差距、Core i7领先Core 2的幅度,45nm Phenom X4 20000要重新夺回性能皇座的可能性不大。尽管Core i7系列性能非常强大,但平台昂贵的价钱是它普及的瓶颈,平民化LGA 1156的Core i7和P55主板要到明年第三季度才发布,未来一年内,Core 2仍然是主流产品。 Core i7是一款基于全新Nehalem架构的CPU,采用全新的LGA 1366接口,集众多先进技术于一身,如集成内存控制器、三通道技术支持、全新QPI总线以及超线程技术的回归等。Nehalem是Intel继Core架构之后又一款具有划时代意义的微架构。我们PConline评测室通过神秘渠道,第一时间拿到Core i7和X58工程样板,并第一时间为大家送上详细的评测(具体请参阅《再现王者本色!Intel次世代CPU全国首测》)。 内存控制器相信大家不会感到陌生,竞争对手AMD早在K8时代CPU已经集成了内存控制器,能大幅提升内存性能,而Intel方面则表示由于时机还不合适,因此没有在Core2中使用。现在最新的Core i7终于拥有集成内存控制器IMC(Integrated Memory Controller),可以支持三通道的DDR3内存,运行在DDR3-1333,内存位宽从128位提升到192位,这样总共的峰值带宽就可以达到32GB/s,达到了Core 2的2-4倍。处理器采用了集成内存控制器后,它就能直接与物理存储器阵列相连接,从而极大程度上减少了内存延迟的现象。 留意图中的“Triple”字样,表示成功组建了三通道模式。内存在继容量和频率之外,再次找到新的突破点。 不过也许大家都习惯了成倍增长的方式,认为有了双核之后应该是有四核,双通道之后就应该是四通道,对三核处理器和三通道内存总觉得是有点异类的感觉。撇开技术层面先不说,Intel为什么要推出三通道内存技术呢?下面,笔者将从各种方面进行分析,欢迎广大网友踊跃发表评论。 9回顶部 三通道对性能提升有多大? 三通道使得内存位宽从128位提升到192位,这样总共的峰值带宽就可以达到32GB/s,达到了Core 2的2-4倍。从理论上来说,更高的带宽会带来相应的性能提升,只是结果真的如此吗?从PConline评测室的评测结果来看,事实却事与愿违……(详情请参阅《三通道竟是鸡肋?Core i7全国首测后篇》) 这样的结果着实让人大跌眼镜,只是再回过头来看看AMD集成的内存控制器的表现,其性能对双通道亦是不甚敏感。如此看来,三通道对比双通道未能带来性能提升似乎也说得过去,不过这并不足以解释Core i7双通道比单通道带来明显的性能提升的原因。 Core i7的双通道比单通道性能上有了不少的提升,但三通道比起双通道提升却不明显,以两者有1G内存差距来看,甚至可以把提升看成是容量的功劳。当然导致这样的结果产生并不能排除工程样板的关系和评测软件未对三通道进行优化的原因。毕竟从理论上来说,三通道带来内存带宽的提升是有积极作用的。Intel对整个行业的发展所起的作用不言而喻,且由DDR2过渡到DDR3的趋势较为明朗,笔者有理由相信,在Intel的号召下随着低阶LGA 1366平台的出现,三通道内存技术要普及并非难事。 10回顶部 随着内存白菜价时代的来临,“2G不嫌少,4G不嫌多!”的观点被消费者普遍接受,只是内存厂商的日子并不好过了。对DIY市场关注较多的网友不难发现,现在无论是上游内存颗粒生产商还是下游内存封装厂商的经营状况大多数都处于亏损,造成这种情况的原因主要对市场分析过于乐观,纷纷增加产量而市场反应却远远低于预期,造成供过于求的市场状况,内存价格纷纷跳水反而刺激了消费者对大容量内存的需求。 由于目前廉价内存时代在一定程度上阻碍了DDR3内存的普及,但却刺激了内存厂商将重心转向DDR3内存发展的决心。不过,DDR3内存的生产工艺远不如DDR2成熟,成本自然要高一些。虽然有预计说DDR3内存普及要等到明年下半年,不过到时内存白菜价时代将不复存在。要刺激消费者购买DDR3内存的欲望,并让消费者接受较高DDR3内存的价格,单单依靠内存厂商的努力是不够的。 Intel作为全球最大的PC芯片生产商对整个PC硬件的发展起着举足轻重的作用,内存市场的不健康发展对整个业界而言都不是件好事,Intel作为龙头大哥有必要为混乱的内存市场挺身而出。照目前的发展形势来看,内存厂商要加速将重心转移到DDR3,自然少不了平台的支持。 从目前内存发展的形势来看,对个人用户而言内存容量问题已经退居次席,4G内存对于绝大部分消费者而言是绝对够用,甚至是过剩。且目前主流32位操作系统并不能完全使用4G内存。笔者估计,在未来两年内DDR3的价格仍不可能与目前的DDR2的售价相当,单单靠低价来普及DDR3内存是厂商最不愿意看到的,但也是不得不走的一条老路,只不过是时间问题罢了。Core i7集成DDR3内存控制器和三通道内存技术正可以缓解这个矛盾,相信3*1G DDR3的内存配置不仅在性能上满足绝大部分消费者的需求,同时也是一个延缓大容量DDR3内存降价不错的解决方案。对厂商而言,三通道无疑是一个很好的卖点,毕竟能多卖出一条内存也就意味着多赚一点,假如大家都习惯了三条内存组成三通道的消费习惯,从理论上来说,内存总体销量将有50%的提升。 硬件市场上的价格竞争越演越烈,微利时代的来临对于生产厂商而言面临的最大挑战是产量和销量的矛盾。虽然PC硬件市场的主旋律是降价,但厂商通过不断缩短产品更新周期和开发新技术来不断刺激消费者的购买欲望,使其在降价的浪潮中不至于处在风尖浪口的位置,以维持一定的利润。与两年前的DIY市场相比,3000元的配置仍然属于主流,虽然性能提升不少但消费者购买PC的成本并没有因此获得相应降低。于是我们不难发现,三通道内存的用意了。 附DDR内存优势: DDR3内存的发布时间,相对来说是比较早的,早在2002年6月28日,JEDEC就宣布开始开发DDR3内存标准,但在5年后的今天,我们在市场上也没有见到DDR3的身影,DDR3内存迟迟不肯面世也是有原因的,目前DDR2内存无论性能还是稳定性都已能满足用户的需求,凭借DDR2内存已经成熟的生产工艺,价格也是一落千丈。可以说,DDR2内存让大家享受到了大容量内存的甜头。而DDR3内存方面,虽然拥有更加优秀的电气性能,但生产工艺以及市场需要都还不成熟。目前市面上的DDR3内存也是雷声大雨点小。价格也属天价。随着处理器外频的进一步提升,DDR2内存带宽已经捉襟见肘,如何提升内存频率又成为大家重新思考的问题。受限于目前DDR2内的电气性能,1066MHz频率的DDR2内存已经是接近极限,而且受产能制约,价格只能高高在上。在这种情况下,DDR3内存才开始其普及之路。 半导体市场调查机构iSuppli也曾预测DDR3内存将会在2008年替代DDR2成为市场上的主流产品,iSuppli认为在那个时候DDR3的市场份额将达到55%。不过,就具体的设计来看,DDR3与DDR2的基础架构并没有本质的不同。从某种角度讲,DDR3是为了解决DDR2发展所面临的限制而催生的产物。 ● 提升带宽是重点 从内存的发展过程来看,DDR内存每代的升级都是以提升带宽为目的,DDR3面世也是为了进一步地提升内存带宽,为FSB越来越高的CPU提供足够的匹配指标。DDR2内存虽然也可以突破1066MHz的极限频率,但它的良率及成本都不理想,造成价格一直无法降低。这也是其一直在高端发烧用户中徘徊的原因。
要用低成本切入到更高的频率的话,新一代的解决方案也就应运而生,这也就是DDR3内存出世的原因。从技术指标上看,DDR3内存的起跑频率就已经在1066MHz上了,尽管延时参数方面没法与DDR2内存相抗衡,但是将来推出的1600/2000MHz产品的内存带宽肯定大幅度抛离DDR2内存,以DDR3 2000MHz为例,其带宽可以达到16GB/s(双通道内存方案则可以达到32GB/s的理论带宽值),所以将来DDR3内存肯定成为用户唯一的高带宽选择。 ●DDR3内存提升频率的关键技术 其实DDR3内存提升有效频率的关键依然是旧招数,就是提高预取设计位数,这与DDR2采用的提升频率的方案是类似的。我们知道,DDR2的预取设计位数是4Bit,也就是说DRAM内核的频率只有接口频率的1/4,所以DDR2-800内存的核心工作频率为200MHz的,而DDR3内存的预取设计位数提升至8Bit,其DRAM内核的频率达到了接口频率的1/8,如此一来同样运行在200MHz核心工作频率的DRAM内存就可以达到1600MHz的等值频率,这种“翻倍”的效果在DDR3上依然非常有效。 ● 低功耗是未来发展的趋势 随着电脑技术的飞速发展,多核芯片的迅速普及,电脑的功耗成倍增长,而在有限的能源下如何去降低功耗这也成为了目前越来越多的用户关注的问题,所以目前,新标准要想获得更多用户的认可必须要从低功耗方面发展。全球的PC数量每年都在飞速增长。每年PC的耗电量也是相当惊人的,即使是每台PC减低1W的幅度,其省电量都是非常可观的。
DDR3内存在达到高带宽的同时,其功耗反而可以降低,其核心工作电压从DDR2的1.8V降至1.5V,相关数据预测DDR3将比现时DDR2节省30%的功耗,当然发热量我们也不需要担心。就带宽和功耗之间作个平衡,对比现有的DDR2-800产品,DDR3-800、1066及1333的功耗比分别为0.72X、0.83X及0.95X,不但内存带宽大幅提升,功耗比表现也比上代更好。 |
正在阅读:速度急速提升!三通道内存应用详细指南速度急速提升!三通道内存应用详细指南
2008-12-24 10:00
出处:PConline原创
责任编辑:DIY