1 前言 2006年,Intel正式发布了酷睿2/Core 2处理器,同时宣布了每年更新CPU的“Tick-Tock”计划,“Tick”代表CPU制作工艺上的改进,而“Tock”则代表CPU架构上的更新。作为“Tock”计划的65nm Core 2,先进的Core架构使得其拥有强大的性能与更好的能耗比,一直处于领先水平。2007年,“Tick”计划的45nm Core 2(Penryn)如期发布,性能继续保持领先。2008年,“Tock”计划如期到来,采用全新Nehalem架构的CPU即将发布,那就是Core i7。
Core i7是一款基于全新Nehalem架构的CPU,采用LGA 1366接口,集众多先进技术于一身,如集成内存控制器、三通道技术支持、全新QPI总线、超线程技术的回归、Turbo Mode内核加速等。早在九月底,我们PConline评测室就已抢先其它媒体,为大家送上了Core i7 940的全国首测,使大家对Core i7有了初步了解。
最新步进的Core i7家族已全体到达我们PConline评测室,我们将从新技术介绍,到详细对比评测,全面为大家解密Core i7。集众多先进技术于一身,光是技术上Core i7就让人激动,那么两代旗舰的对比,Core i7 965 Extreme Edition相比Core 2 Quad QX9770有多大性能的提升呢?Core i7的发布对市场有怎样的影响?AMD如何应对来势汹汹的Core i7?本次深度评测将会为大家解答,首先进入技术介绍部分,为大家介绍Core i7的新技术。 2 革新架构!从Core 2到Core i7的变化 Core i7采用的是全新Nehalem架构,虽然是新架构,但Nehalem还建立在Core微架构(Core Microarchitecture)的基础上,通过大幅增强改进而来的,外加增添了超线程(HT)、三级Cache、TLB和分支预测的等级化、集成内存控制器(IMC)、QPI总线和支持DDR3等技术。比起从Pentium 4的NetBurst架构到Core 微架构的较大变化来说,从Core 微架到Nehalem架构的基本核心部分的变化则要小一些,因为Nehalem还是4指令宽度的解码/重命名/撤销。 Nehalem的核心部分比Core微架构改进了以下部分: 全新缓存设计:采用三级缓存设计,L1的设计与Core微架构一样为内核缓存;L2采用超低延迟的设计,每个核心各拥有256KB的L2缓存,同时L2缓存也是内核缓存;L3则是采用共享式设计,被所有核心共享使用。 集成了内存控制器(IMC):内存控制器从北桥芯片组上转移到CPU片上,支持三通道DDR3内存,内存读取延迟大幅减少,内存带宽则大幅提升,最多可达三倍。 快速通道互联(QPI):取代前端总线(FSB)的一种点到点连接技术,20位宽的QPI连接其带宽可达惊人的每秒25.6GB,远超过原来的FSB。QPI最初能够发放异彩的是支持多个处理器的服务器平台,QPI可以用于多处理器之间的互联。 Nehalem的核心部分比Core微架构新增加的功能主要有以下几方面: New SSE4.2 Instructions (新增加SSE4.2指令) 3 Core i7的改进:原生四核+全新缓存设计
我们知道,Core 2 Quad系列四核处理器其实是把两个Core 2 Duo处理器封装在一起,并非原生的四核设计,通过狭窄的前端总线FSB来通信,这样的缺点是数据延迟问题比较严重,性能并不尽如人意。Core i7则采用了原生四核设计,采用先进的QPI(QuickPath Interconnect,下面将进行介绍)总线进行通讯,传输速度是FSB的5倍。 Core i7采用全新三级缓存设计,L1和L2缓存为内核缓存,具有超低延迟,其中L1缓存由32KB指令缓存+32KB数据缓存组成。Core i7的L2缓存和Core 2的L2缓存并不相同,Core i7的L2与L1均为内核缓存,每个内核256KB(256KB x 4)。L3采用共享式设计,被片上所有内核共享,容量为8MB。 4 Core i7的改进:采用全新QPI总线 Core i7的Nehalem架构最大的改进在前端总线(FSB)上,传统的并行传输方式被彻底废弃,转而采用类似于PCI Express串行点对点传输技术的通用系统接口(CSI),Intel称之为QuickPath Interconnect(QPI)总线技术。QuickPath的传输速率为6.4Gbps,这样一条32bit的QuickPath带宽就能达到25.6GB/sec。QuickPath的传输速率是FSB 1333MHz的5倍,前者虽然数据位宽较窄,但传输带宽仍然是后者的2.5倍。更高带宽的DDR3内存加上三通道技术的引入,FSB的传输带宽已经完全不能满足要求,成为系统瓶颈,因此全新的QPI总线引入势在必行。通过QPI总线,可以有效地降低了处理器和各个硬件之间数据传输的延迟,能有效地提高系统性能。 不难看出,AMD在2003年推出HyperTransport高速串行总线,并逐渐在高性能运算领域建立优势之后,Intel也迎头赶上,全新的QPI总线会把Core i7以及后续处理器的性能提升到新高度。 5 Core i7的改进:内存控制器+三通道技术
内存控制器(Memory Controller)相信大家不会感到陌生,竞争对手AMD早在2003年K8时代CPU已经集成了内存控制器,能大幅提升内存性能。而Intel方面则表示由于时机还不适合,即使是2006年推出的Core2处理器也没有集成内存控制器,这也使得优秀Core 2在内存性能上一直处于Athlon 64 X2与Phenom系列的下风。 Intel当然不允许内存性能处于下风的局面一直存在,2008年推出的Core i7终于拥有集成内存控制器IMC(Integrated Memory Controller),而且可以支持三通道的DDR3内存,运行在DDR3-1333(支持XMP技术的内存更可运行在1600MHz的频率),内存位宽从128位提升到192位,这样总共的峰值带宽就可以达到32GB/s,达到了Core 2的2-4倍。处理器采用了集成内存控制器后,它就能直接与物理存储器阵列相连接,从而极大程度上减少了内存延迟的现象。 6 Core i7的改进:超线程技术回归
超线程技术(Hyper-Threading,HT),最早出现在130nm的Pentium 4上,超线程技术就是利用特殊的硬件指令,把两个逻辑内核模拟成两个物理芯片,让单个处理器都能使用线程级并行计算,进而兼容多线程操作系统和软件,减少了CPU的闲置时间,提高的CPU的运行效率。超线程技术使得Pentium 4单核CPU也拥有较出色的多任务性能,现在通过改进后的超线程技术再次回归到Core i7处理器上。而超线程技术又称为同步多线程技术(Simultaneous Multi-Threading,SMT)。 同步多线程(Simultaneous Multi-Threading,SMT)是2-way的,每核心可以同时执行2个线程。对于执行引擎来说,在多线程任务的情况下,就可以掩盖单个线程的延迟。SMT功能的好处是只需要消耗很小的核心面积代价,就可以在多任务的情况下提供显著的性能提升,比起完全再添加一个物理核心来说要划算得多。比起Pentium 4的超线程技术,Core i7的优势是有更大的缓存和更大的内存带宽,这样就更能够有效的发挥多线程的作用。按照Intel的说法,Nehalem的SMT可以在增加很少能耗的情况下,让性能提升20-30%。 为什么Core 2没有使用SMT?很显然,它是可以做到的。SMT是在节省电力的基础上增加了性能,而且软件支持的基础建设也早就有了。有两个原因:一是Core 2可能没有足够的内存带宽和CPU内部带宽来利用SMT获得优势。通常,SMT能够提升内存级并行(memory level parallelism,MLP),但是对于内存带宽已经成为瓶颈的系统则是个负担。而更有可能的原因则是SMT的设计、生效等是很麻烦的,而当初设计SMT是由Intel的Hillsboro小组主持,而并非是Haifa小组(Core 2是由这个小组负责的)。这样Core 2不使用SMT就避免了冒险。 7 Core i7的改进:自动超频,核心加速
Turbo Mode,故名思义,就是加速模式,它是基于Nehalem架构的电源管理技术,通过分析当前CPU的负载情况,智能地完全关闭一些用不上的核心,把能源留给正在使用的核心,并使它们运行在更高的频率,进一步提升性能;相反,需要多个核心时,动态开启相应的核心,智能调整频率。这样,在不影响CPU的TDP情况下,能把核心工作频率调得更高。 举个简单的例子,如果游戏只用到一个核心,Turbo Mode就会把其他三个核心自动关闭,把正在运行游戏的那个核心的频率提高,也就是自动超频,在不浪费能源的情况下获得更好的性能。Core 2时代,即使是运行只支持单核的程序,其他核心仍会全速运行,得不到性能提升的同时,也造成了能源的浪费。
Turbo Boost默认是开启的,通过自动调高CPU的倍频提高性能。在Intel原厂X58主板上,低负载时默认调高1-2个倍频。例如Core i7 920默认频率为2.66G,在Turbo Boost默认是开启的情况下,运行Super PI是以单核2.8G来跑,这样单线程性能也就得到提升。 超频爱好者也许会想到,Turbo Mode自动提升的那个频率可以手动调整吗?如果可以,不就能利用它进行超频吗?答案是可以的,只要是Exterme Edition CPU,就可以手动调整,好好利用,新的超频方式从此诞生诞生,这将在后面超频部分详细说明。 8 文本处理再提速!完整SSE4指令支持
完整的SSE 4(Streaming SIMD Extensions 4,流式单指令多数据流扩张)指令集共包含54条指令,其中的47条指令已在45nm的Core 2上实现,称为SSE 4.1。SSE 4.1指令的引入,进一步增强了CPU在视频编码/解码、图形处理以及游戏等多媒体应用上的性能。其余的7条指令在Core i7中也得以实现了,称为SSE 4.2。SSE 4.2是对SSE 4.1的补充,主要针对的是对XML文本的字符串操作、存储校验CRC32的处理等。 9 Core i7家族精彩图赏 Core i7旧延续了LGA 775的封装方式,采用铜质顶盖保护CPU核心,同时提供更大的散热面积。从图片可以看出,Core i7面积明显要Core 2大一点。缺口位置也发生改变,从Core 2的上下缺口改为左右两侧缺口。根据Intel官方资料显示,该处理器一共集成了7.31亿个晶体管。 Core i7采用全新的LGA 1366接口设计,从图上可以看出,金属点更多更密集,形象为椭圆型。 侧面对比两颗CPU,图中左边的Core i7稍高一点。 与Core 2不同,Core i7正面同样有很多金属点。
本次Core i7家族的920、940和965对比评测,我们加入了Intel Core 2中最顶级的Core 2 QX9770作为参考对象。测试项目包括CPU理论性能测试、3D渲染与视频压缩多线程测试、多媒体性能测试、内存性能测试以及3D游戏测试。 为了避免3D效能成为瓶颈,我们选择顶级单芯显卡GeForce GTX 280作为评测显卡使用,由于是测试CPU的游戏性能,我们采用了较低的分辨率1024x768,这样才能更充分体现CPU在游戏的中性能差距。 虽然Core i7 965 Extreme Edition支持DDR3 1333甚至是DDR3 1600(XMP)内存,但为了平台的一致性,以及更好地反映CPU在相同条件下的性能差距,我们一致采用DDR3 1066内存。测试过程默认开启Turbo Boost和超线程技术,CPU会按情况自动提高1-2个倍频。 14 Core i7在CPU-Z中的详细信息
15 全面超越!CPU理论性能评测 SUPER PI MOD 1.4性能测试: SuperPI是由东京大学Kanada Lab.所制作的一款通过计算圆周率的来检测处理器性能的工具,在测试里面可以有效的反映包括CPU在内的运算性能。在玩家群中,Super PI更是一个衡量CPU性能的标尺之一。 在Super PI的测试中,Core i7家族的表现较为出色,940已领先Core 2 QX9770一秒多,965更是领先两秒。在SUPER PI接近10秒关口之际,一秒的差距是不少的。 WinRAR 3.71性能测试: WinRAR作为一款目前非常流行的压缩软件,我们使用了它内置的评测功能。评测的结果可以有效的反映CPU的性能。 在WinRAR的评测中,集成内存控制器+三通道+超线程的Core i7锋芒毕露,大幅度抛离Core 2 QX9770。 Fritz Chess性能测试: Fritz Chess Benchmark主要用于测试处理器的多线程处理能力。 国际象棋主要考察CPU的多线程运算能力,拥有出色多线程性能的Core i7家族,成绩非常理想。 16 提升接近100%!内存性能评测 Everest内存性能测试: Everest作为一个系统检测软件,其前身是Aida32,它可以详细的显示出PC每一个方面的信息。支持上千种(3400+)主板,支持上百种(360+)显卡,支持对各式各样的处理器的侦测。软件自带的Memory Latency评测,可以通过对内存延时的评测,直观显示出内存子系统的效能。 自从AMD的K8处理器集成内存控制器后,内存性能便一直成了Intel CPU的弱项。今天,Core i7要给这个弱项画上句号了,集成内存控制器后,同频的Core i7比Core 2 Quad提升接近100%。 17 八线程的威力!3D渲染与视频压缩评测 Cinebench R10多媒体性能测试: CINEBENCH R10为目前最新版的Cinebench系列测试软件,它采用了3D设计软件CINEMA 4D的3D引擎,可以用来评测显示卡、处理器的效能。 在CINEBENCH R10的测试中,单线程渲染时,Core 2 QX9770处于Core i7 940与965之间。当进行多线程渲染时,Core i7以8个线程同时渲染,表现相当出色,只有4个线程的QX9770只能垫底了。 TMPGEnc视频转换测试: TMPGEnc 是日本人堀浩行开发的一套MPEG编码/工具软件,支持VCD、SVCD、DVD等各种格式。TMPGENc 3.0 xPress相对于旧版本在MPEG编码上作了不少的优化,例如加入的超线程和多核心的优化选项,尤其是其加入了SSE3指令集的支持,能使拥有该指令集的CPU发挥出更好的性能,减少大量的编码时间。 在我们的首发评测中,Core i7在TMPGEnc这个测试项目表现异常,原因是超线程与软件存在兼容性问题。本次测试采用最新版的软件,解决了该问题,Core i7的表现较为满意。 18 DX9游戏性能评测 我们选择取了两款主流的DX9游戏,使命召唤4与半条命2:第二章,考察CPU在主流DX9游戏下的性能。 《使命召唤4》测试: 游戏所有特效开至游戏能够支持的最高级别,同时关闭垂直同步,分辨率为1024x768 0AA/0AF。我们选择了大雨滂沱的快乐歌运输号,在直升机至船上的那段场景,用Fraps记下平均帧数。 在使命召唤4的评测中,在相对于首发评测更成熟的条件下,Core i7仍不敌Core 2 QX9770,原因可能与CPU架构有关。当然,在主流分辨率下,主要考验的是显卡性能,而且在将来为多核CPU优化的游戏中,相信这种情况将不复存在。 《半条命2:第二章》测试:
游戏所有特效开到最高,分辨率设置为1024x768 0AA/0AF。我们选择了崖边的场景,测试过程中,我们跑到崖边等待游戏画面的闪光至震荡完毕,用FRAPS记录平均帧数。 同样为DX9游戏,Core i7 QX9770成绩处于Core i7 965与940之间。半条命2作为一个单线程游戏,高频的CPU优势更为明显,因此已不能真实反映现在多核CPU的性能,在默认启动Turbo Boost技术的情况下,频率达到3.33G的Core i7 965领先于QX9770。 19 未来趋势!DX10游戏性能评测 3DMark Vantage测试: 3DMark Vantage主要包括了Graphics Test和CPU Test两个测试部分,它们各自带有两个测试场景,其中Graphic Test包括Jane Nash、New Calico,主要针对显卡的3D图形渲染性能。而CPU Test就包括AI和Physics两个部分,分别测试处理器的AI运算和物理加速性能,在现在的游戏发展中,除了图形3D性能以外AI和物理运算都是游戏中极其重要的部分,在新的3DMark中对这四项目都进行了测试,无疑更能反映整个平台的游戏性能。 3DMark Vantage对多线程做了大量优化,拥有超强多线程处理能力的Core i7大幅抛离QX9770,i7 920领先QX9770达30%,965领先幅度更达到55%!3DMark Vantage反映了未来DX10游戏的发展方向,支持多线程的游戏将越来越多。 《冲突世界》测试: 画面选项设定为非常高(DX10),分辨率为1024x768 0AA/0AF,以自带BenchMark工具测试。 冲突世界对多线程有一定优化,CPU多线程处理能力比频率更重要,Core i7 920 2.66G也比QX 9770 3.2G强。 《英雄连》测试: 画质设定:Shadow Quality设置为DirecetX 10模式、全部特效都开启至最高,分辨率为1024x768 0AA/0AF。 在英雄连的测试中,与首测Core i7 940落后于QX9770不同,本次评测则是940稍微领先。原因是Core i7平台更为成熟,CPU的步进从B0更新为C0,主板BIOS为正式版以及开启了Turbo Mode,性能有了进一步提升。 《失落的星球》测试: 失落的星球《Lost Planet:Extreme Condition》的画质设定:HDR效果、Shadow Quality等所有特效均打开至最高,同时关闭全屏抗锯齿以及各向异性过滤,测试分辨率采用1024x768。CAVE场景支持多线程运算,能更好反映多核CPU之间的性能差距,也是未来游戏的趋势。 失落的星球是一款对多核优化较好的游戏,能更真实反映多核CPU之间的性能差距,这也是未来游戏的发展趋势。拥有高频+更强多线程处理能力的Core i7 965大幅领先QX9770,这表间接表明,以后i7在游戏中的优势会更明显。 20 体验“八核”!超线程带来巨大提升 前面提到了,由于Core i7采用了超线程技术,使得逻辑核心数翻倍,拥有更强大的多任务能力。下面我们来测试一下,超线程技术为我们带来了多大性能的提升。 为验证超线程带来的性能提升,下面我们进行开启关闭超线程进行对比测试。 从上面的多线程测试中可以看出,超线程技术带来了20-30%的性能提升,而功耗只是增加很小。这项出色的技术并没有因Pentium 4退出历史舞台而被埋没,通过优化修改后在Core i7再露锋芒,使其锦上添花。 21 免费提升性能!Core i7加速模式的秘密 前面介绍Turbo Mode已提到,Turbo Boost默认是开启的,通过自动调高CPU的倍频提高性能。在Intel原厂X58主板上,是自动调高1-2个倍频,以在相同TDP下获得更好的性能,下面我们来实测一下。(下面图片可点击放大) Turbo Boost是默认开启的,Core i7 940默认频率为2.93G,通过Turbo Boost,CPU频率达到了3.06G。 关闭Turbo Boost后,Core i7 940频率恢复到默认的2.93G。接下来我们来看开启与关闭Turbo Boost技术后的性能对比。 我们可以看到,Turbo Boost自动超频模式带来了一定的性能提升,在不影响TDP的情况下提供免费性能提升,何乐而不为呢?前面的章节已提到,Core i7 965 Extreme Edition具有更丰富的Turbo Boost选项,如何利用它进行超频呢?马上进入下一章节。 22 活用Turbo Mode,改变传统超频方式
Intel传统的顶级CPU相比其他CPU的最大优势是不锁倍频,给方便用户超频。而Core i7 965 Extreme Edition则是把旗舰CPU的优势扩大到新增的Turbo Boost选项上,Core i7 965具有丰富的调节选项目,可以调节每个核心的最大倍频、CPU最大TDP等。运行中Core i7会分析负载情况,智能调整频率,这是无疑增加了旗舰CPU的优势与可玩性,也是一种全新的超频方式。 传统的超外频提升主频的超频方式仍然保留,对于超频爱好者来说,双管齐下便更好压榨CPU性能。 我们这个Core i7 965的体质不错,核心只加了150mV的电压,TDP调整到140,核心1、2倍频为30,核心3、4为28。跑Super PI是以单核轻载来跑,自动超频到4G,也就是133*30=4G。此时成绩相当不错。 23 更高的能耗比!功耗对比评测 功耗测试部分我们进行的是整个平台的功耗测试,通过考察Core i7和Core 2 QX9770平台空载/满载的功耗差距,间接反映出CPU之间的功耗差距。我们选取的软件是CINEBENCH R10,用多线程模式进行渲染,使多核CPU能尽量满载,而此时显卡不满载。(空载测试开启Intel的EIST节能技术) 从测试结果来看,出现比较有趣的情况,Core i7 920与940,居然是频率更低的920功耗更高,我们经过反复测试均是此结果。Core i7 965比Core 2 QX9770高出10%左右的耗电量,而性能则高出30%以上,也就是说Core i7能提供更好的能耗比/每瓦特性能。 24 PConline评测室总结 Core i7评测性能总结: 从测试结果可以看到,更新步进、平台成熟后的Core i7,性能比我们首发评测中的早期工程样板又有了一定提升。集成内存控制器、支持三通道技术、超线程技术以及Turbo Boost加速等先进技术,把Core i7系列的性能提升到前所未有的高度。其中在多线程性能测试部分,目前i7家族最低端的Core i7 920也比上代顶级的Core 2 QX9770强不少,旗舰级的对决,Core i7 965更是把QX9770远抛在后面,当然,超线程技术是重要的功臣。使人感到震撼的是内存测试部分,集成内存控制器的Core i7,在WinRAR、Everest Memory Benchmark测试中,性能提升50%-100%。更新步进后的Core i7在游戏中表现还算理想,Core i7 965只在《使命召唤4》中落后于QX9770,更多的是i7 965大幅领先,尤其是支持多线程的DX10游戏,这也是未来游戏的发展趋势,拥有强大多线程性能的Core i7在将来的游戏中会有更大优势。综合来说,同频的Core i7比Core 2 Quad至少有20-30%的性能提升,提供更好的每瓦特性能。 Turbo Boost加速技术是一个重要的技术,它能根据CPU负载来管理核心数目的使用与自动超频,多核CPU运行单线程软件/游戏不再浪费能源,同时也改变了传统的超频方式。 Core i7对市场的影响: Intel在将在11月中先推出三款Core i7处理器,分别是Core i7 920、Core i7 940和Core i7 965 Extreme Edition,用于取代当前的Core 2 QX9770、Q9650等高端CPU,因此i7的消费对象主要是高端用户群体,对当前主流级市场不会造成太大影响。由于购买Core i7必须搭配昂贵的X58主板和高价的DDR3内存,整套平台价值不菲,普通用户还是持观望态度吧。根据Intel最新的路线图,面向主流级的Core i7要到09年第三季度才会上市,45nm Core 2还会占据主流市场相当长的时间。 未来发展的预测: Core i7即将发布,届时将正式取代当前顶级的Core 2 Quad QX9770与Q9650,把高端CPU的性能带到前所未有的高度,更把对手AMD当前顶级的Phenom X4 9950远远抛离。虽然AMD的45nm Phenom X4 20000系列也将在09年1月发布,但反观现在Phenom系列与Core 2系列的性能差距、Core i7领先Core 2的幅度,45nm Phenom X4 20000要重新夺回性能皇座的可能性不大。尽管Core i7系列性能非常强大,但平台昂贵的价钱是它普及的瓶颈,平民化LGA 1156的Core i7和P55主板要到明年第三季度才发布,未来一年内,Core 2仍然是主流产品。 |
正在阅读:历史巨轮再度转动!Core i7家族深度评测历史巨轮再度转动!Core i7家族深度评测
2008-11-06 14:04
出处:PConline原创
责任编辑:fanjunhui