正在阅读:三通道是忽悠?Core i7全国首测后篇三通道是忽悠?Core i7全国首测后篇

2008-10-09 09:28 出处:PConline原创 作者:Hero Fan 责任编辑:fanjunhui
1前言回顶部

1 前言

  Core i7作为Intel下一代处理器,集众多先进技术于一身,如集成内存控制器、三通道技术支持、全新QPI总线以及超线程技术的回归等,是继Core 2后又一款划时代处理器,将于今年年底正式推出。我们PConline评测室第一时间拿到这款CPU的工程样板,并抢先进行全国首测,详细可以查看《再现王者本色!Intel次世代CPU全国首测》一文。

Core i7
Core i7 940工程样板(图右)

  在首发评测中我们已对Core i7进行了较详细测试,大部分测试项目表明Core i7带来强大的性能,但也有一些项目甚至比不上同频的Core 2 Quad,某些究竟什么原因使Core i7在某些测试中不如同频的Core 2呢?三通道内存又能带来多少性能提升?同步多线程的威力又是如何?Core i7比Core Quad更耗电吗?围绕这些问题,马上进入Core i7的深入评测后篇。

2从Core 2到Core i7的变化回顶部

2 从Core 2到Core i7的变化

Core 2  Core i7
从Core 2到Core i7

  Core i7采用的是全新Nehalem架构,虽然是新架构,但Nehalem还建立在Core微架构(Core Microarchitecture)的基础上,通过大幅增强改进而来的,外加增添了SMT、3层Cache、TLB和分支预测的等级化、IMC、QPI和支持DDR3等技术。比起从Pentium 4的NetBurst架构到Core 微架构的较大变化来说,从Core 微架到Nehalem架构的基本核心部分的变化则要小一些,因为Nehalem还是4指令宽度的解码/重命名/撤销。

  Nehalem的核心部分比Core微架构改进了以下部分:

  Cache设计:采用三级全内含式Cache设计,L1的设计与Core微架构一样;L2采用超低延迟的设计,每个核心各拥有256KB的L2 Cache;L3则是采用共享式设计,被片上所有核心共享使用。

  集成了内存控制器(IMC):内存控制器从北桥芯片组上转移到CPU片上,支持三通道DDR3内存,内存读取延迟大幅减少,内存带宽则大幅提升,最多可达三倍。

  快速通道互联(QPI):取代前端总线(FSB)的一种点到点连接技术,20位宽的QPI连接其带宽可达惊人的每秒25.6GB,远超过原来的FSB。QPI最初能够发放异彩的是支持多个处理器的服务器平台,QPI可以用于多处理器之间的互联。

  Nehalem的核心部分比Core微架构新增加的功能主要有以下几方面:

  New SSE4.2 Instructions (新增加SSE4.2指令)
  Turbo Mode (内核加速模式)
  Improved Lock Support (改进的锁定支持)
  Additional Caching Hierarchy (新的缓存层次体系)
  Deeper Buffers (更深的缓冲)
  Improved Loop Streaming (改进的循环流)
  Simultaneous Multi-Threading (同步多线程)
  Faster Virtualization (更快的虚拟化)
  Better Branch Prediction (更好的分支预测)

3Core i7的改进:原生四核+三级缓存回顶部

3 Core i7的改进:原生四核+全新缓存设计

Core i7
Core i7内核图

  我们知道,Core 2 Quad系列四核处理器其实是把两个Core 2 Duo处理器封装在一起,并非原生的四核设计,通过狭窄的前端总线FSB来通信,这样的缺点是数据延迟问题比较严重,性能并不尽如人意。Core i7则采用了原生四核设计,采用先进的QPI(QuickPath Interconnect,下面将进行介绍)总线进行通讯,传输速度是FSB的5倍。

  缓存方面也采用了三级内含式Cache设计,L1的设计和Core微架构一样;L2采用超低延迟的设计,每个内核256KB(256x4 KB);L3采用共享式设计,被片上所有内核共享,容量为8MB。

4Core i7的改进:采用全新QPI总线回顶部

4 Core i7的改进:采用全新QPI总线  

Nehalem

  Core i7的Nehalem架构最大的改进在前端总线(FSB)上,传统的并行传输方式被彻底废弃,转而采用基于PCI Express串行点对点传输技术的通用系统接口(CSI),被Intel称为QuickPath。QuickPath的传输速率为6.4Gbps,这样一条32bit的QuickPath带宽就能达到25.6GB/sec。QuickPath的传输速率是FSB 1333MHz的5倍,前者虽然数据位宽较窄,但传输带宽仍然是后者的2.5倍。由于分别用于双处理器和单处理平台,Gainestown有两条QuickPath,而Bloomfield仅有一条。不难看出,在AMD推出HyperTransport高速串行总线,并逐渐在高性能运算领域建立优势之后,Intel也迎头赶上。若干年前,关于串行传输将一统天下的预言已经变成了现实,我们所要等待的是串行内存何时重返市场。

5Core i7的改进:集成内存控制器回顶部

5 Core i7的改进:集成内存控制器

集成内存控制器
集成内存控制器

  内存控制器相信大家不会感到陌生,竞争对手AMD早在K8时代CPU已经集成了内存控制器,能大幅提升内存性能,而Intel方面则表示由于时机还不合适,因此没有在Core2中使用,现在最新的Core i7终于拥有集成内存控制器IMC(Integrated Memory Controller),可以支持三通道的DDR3内存,运行在DDR3-1333,内存位宽从128位提升到192位,这样总共的峰值带宽就可以达到32GB/s,达到了Core 2的2-4倍。处理器采用了集成内存控制器后,它就能直接与物理存储器阵列相连接,从而极大程度上减少了内存延迟的现象。

6Core i7的改进:超线程技术回顶部

6 Core i7的改进:超线程技术

8 Thread
原生四核Core i7有八个逻辑内核

  超线程技术(Hyper-Threading),又称为同步多线程技术(Simultaneous Multi-Threading,SMT)。最早出现在130nm的Pentium 4上,超线程技术就是利用特殊的硬件指令,把两个逻辑内核模拟成两个物理芯片,让单个处理器都能使用线程级并行计算,进而兼容多线程操作系统和软件,减少了CPU的闲置时间,提高的CPU的运行效率。超线程技术使得Pentium 4单核CPU也拥有较出色的多任务性能,现在通过改进后的超线程技术再次回归到Core i7处理器上。

  同步多线程(Simultaneous Multi-Threading,SMT)是2-way的,每核心可以同时执行2个线程。对于执行引擎来说,在多线程任务的情况下,就可以掩盖单个线程的延迟。SMT功能的好处是只需要消耗很小的核心面积代价,就可以在多任务的情况下提供显著的性能提升,比起完全再添加一个物理核心来说要划算得多。比起Pentium 4的超线程技术(Hyper-Threading),Core i7的优势是有更大的缓存和更大的内存带宽,这样就更能够有效的发挥多线程的作用。按照INTEL的说法,Nehalem的SMT可以在增加很少能耗的情况下,让性能提升20-30%。

  为什么Core 2没有使用SMT?很显然,它是可以做到的。SMT是在节省电力的基础上增加了性能,而且软件支持的基础建设也早就有了。有2个可能的原因:一是Core 2可能没有足够的内存带宽和CPU内部带宽来利用SMT获得优势。通常,SMT能够提升内存级并行(memory level parallelism,MLP),但是对于内存带宽已经成为瓶颈的系统则是个麻烦。而更有可能的原因则是SMT的设计、生效等是很麻烦的,而当初设计SMT是由INTEL的Hillsboro小组主持,而并非是Haifa小组(Core 2是由这个小组负责的)。这样Core 2不使用SMT就避免了冒险。

7评测平台及评测说明回顶部

7 评测平台及评测说明

Core 2 评测平台
CPU

Intel Core 2  QX9770(400X8=3.2G、12MB L2 Cache )
Intel Core 2  QX9770(344X8.5=2.93G、12MB L2 Cache )

华硕 X48

内存

宇瞻 DDR3-1333 1GB x 2

硬盘

希捷 7200.10 SATA 500G

GeForce GTX 260 (576/1998MHz,SP:1242MHz)

Core i7 评测平台
CPU

Intel Core i7  940(2.93G、8MB L3 Cache )

主板

Intel X58

内存

宇瞻 DDR3-1333 1GB x 3
宇瞻 DDR3-1333 2GB

硬盘

希捷 7200.10 SATA 500G

显卡

GeForce GTX 260 (576/1998MHz,SP:1242MHz)

软件平台
系统软件

  Windows VISTA Ultimate SP1

驱动程序

    NVIDIA显卡:ForceWare 177.98 For Vista
 Intel芯片组:9.0.0.1011

评测软件

  • System:
  • Super PI 1.4
  • Everest Ultimate 4.6
  • TMPGEnc 4.5
  • WinRAR 3.71
  • CINEBENCH R10
  • Fritz Chess Benchmark
  • 3DMark Vantage Ver:101 (DirectX 10)
  • Game:(DirectX 10)
  • World In Conflict 
  • Company Of Heroes:Opposing Fronts 
  • Crysis
  • Game:(DirectX 9)
  • Call OF Duty 4
  • Half Life 2 EPISODE TWO

  对于全新架构Core i7处理器的对比评测,我们加入了Intel目前零售最为顶级的Core 2 QX9770作为参考对象。Core i7 940处理器频率为2.93G,为了考察两代CPU在同频下的性能差距,我们把QX9770降频到2.93G。

  本次深入评测我们主要测试三双通和多线程技术带来的性能提升,故我们将开启关闭SMT同步多线程进行对比,此时平台为三通道模式。单(Single)、双(Dual)、三通道(Triple)进行对比评测。

  为了避免3D效能成为瓶颈,我们采用了高端显卡nVIDIA GeForce GTX 260作为评测平台使用,由于是测试CPU的游戏性能,我们采用了较低分辨率1024x768,这样才能更充分体现CPU在游戏的中性能差距。

8三通道是最大忽悠?回顶部

8 三通道无用论,与双通道无区别?

  在内存测试部分,单通道和双通道采用的是2G容量的内存,三通道则为3G。

SUPER PI MOD 1.4性能测试:

SUPER PI 1.4
SUPER PI

  SuperPI是由东京大学Kanada Lab.所制作的一款通过计算圆周率的来检测处理器性能的工具,在测试里面可以有效的反映包括CPU在内的运算性能。在玩家群中,Super PI更是一个衡量CPU性能的标尺之一。

Super pi 1.4
(越小越好)

  从评测可知,单通道和双通道区别相对明显,而双通道和三通道区别则不大。

WinRAR 3.71性能测试:

 WinRAR
WinRAR

  WinRAR作为一款目前非常流行的压缩软件,我们使用了它内置的评测功能。评测的结果可以有效的反映CPU的性能。

Everest内存性能测试:

Everest
Everest

  Everest作为一个系统检测软件,其前身是Aida32,它可以详细的显示出PC每一个方面的信息。支持上千种(3400+)主板,支持上百种(360+)显卡,支持对各式各样的处理器的侦测。软件自带的Memory Latency评测,可以通过对内存延时的评测,直观显示出内存子系统的效能。

Everest

  在这个内存理论测试中,双通道和三通道几乎没区别,不排除是软件问题。

《使命召唤4》场景载入时间对比测试:

使命召唤4
载入的测试场景

  游戏所有特效开至游戏能够支持的最高级别,同时关闭垂直同步,分辨率为1024x768 0AA/0AF。载入的场景为快乐歌运输号场景。第一次载入时间由于误差太大,因此我们从第二次载入开始计算,测试三次取平均值。由于是手动操作,因此存在一定误差,测试只作参考

COD4载入时间对比

  双通道相比单通道载入时间快了2秒,三通道相比双通道提升则不明显。

《孤岛危机》场景载入时间对比测试:

Crysis
载入场景为Benchmark的测试场景

  DX10大作Crysis孤岛危机以真实的画面著称。分辨率为1024x768 0AA/0AF,VeryHigh。测试场景为BenchMark自带的,测试三次取平均值。由于是手动操作,因此存在一定误差,测试只作参考

Crysis

  小结:在内存测试中,Core i7的双通道比单通道性能上有了不少的提升,但三通道比起双通道提升不明显,以两者有1G内存差距来看,甚至可以把提升看成是容量的功劳。当然,也有可能是当前软件对三通道支持不好、Core i7带宽不足等原因,未能发挥三通道的威力。这点只能等软件和Core i7平台成熟后再进行探讨了。

9超线程是双刃剑?多线程软件评测回顶部

9 同步多线程是双刃剑?多线程软件评测

  在此评测中,我们将开启和关闭SMT同步多线程进行对比,图表中SMT表示开启动同步多线程,NO SMT表示关闭。

Cinebench R10多媒体性能测试:

CINEBENCH R10
CINEBENCH R10

  CINEBENCH R10为目前最新版的Cinebench系列测试软件,它采用了3D设计软件CINEMA 4D的3D引擎,可以用来评测显示卡、处理器的效能。

Cinebench R10

  Core i7开启SMT后,有17%左右的性能提升,性能超过QX9770 3.2G。 关闭SMT后,性能超过同频的Core 2而弱于3.2G QX9770。

WinRAR 3.71性能测试:

 WinRAR
WinRAR

  WinRAR作为一款目前非常流行的压缩软件,我们使用了它内置的评测功能。评测的结果可以有效的反映CPU的性能。

WinRAR

  在RAR测试中,即使关闭SMT,Core i7的测试成绩也远高于Core 2 QX9770。

Fritz Chess性能测试:

Chess
Fritz Chess Benchmark

  Fritz Chess Benchmark主要用于测试处理器的多线程处理能力。

Chess

TMPGEnc视频转换测试:

TMPGENc 4.5

  TMPGEnc 是日本人堀浩行开发的一套MPEG编码/工具软件,支持VCD、SVCD、DVD等各种格式。TMPGENc 3.0 xPress相对于旧版本在MPEG编码上作了不少的优化,例如加入的超线程和多核心的优化选项,尤其是其加入了SSE3指令集的支持,能使拥有该指令集的CPU发挥出更好的性能,减少大量的编码时间。

TMPGEnc 4.5
(越小越好)

  在首发评测中,Core i7在这款多媒体软件发挥失常,性能甚至比不上同频的Core 2,原因是同步多线程问题,关闭后Core i7表现正常,也超过了Core 2 QX 9770。相信随着软件针对SMT同步多线程技术进行优化升级,以后Core i7 SMT的表现将会更为出色。

  小结:在多线程测试中,开启SMT同步多线程的Core i7性能有了明显提升,在测试软件中,只有TMPGEnc和SMT有兼容性问题,性能明显下降,相信通过以后的版本会解决此问题。

10超线程是双刃剑?游戏评测回顶部

10 同步多线程是双刃剑?游戏评测

3DMark Vantage测试:

3DMark Vantage
3DMARK Vantage

  3DMark Vantage主要包括了Graphics Test和CPU Test两个测试部分,它们各自带有两个测试场景,其中Graphic Test包括Jane Nash、New Calico,主要针对显卡的3D图形渲染性能。而CPU Test就包括AI和Physics两个部分,分别测试处理器的AI运算和物理加速性能,在现在的游戏发展中,除了图形3D性能以外AI和物理运算都是游戏中极其重要的部分,在新的3DMark中对这四项目都进行了测试,无疑更能反映整个平台的游戏性能。

3DMARK Vantage

  对多线程支持良好的3DMARK VANTAGE,带有SMT的Core i7表现很抢眼,提升达50%。

《使命召唤4》测试:

使命召唤4
测试场景

  游戏所有特效开至游戏能够支持的最高级别,同时关闭垂直同步,分辨率为1024x768 0AA/0AF。我们选择了大雨滂沱的快乐歌运输号,在直升机至船上的那段场景,用Fraps记下平均帧数。

Cod4

  在此游戏测试中,Core i7表现不理想,SMT同步多线程反而使测试成绩下降了。即使如此,关闭SMT后成绩还是比不上Core 2。

《半条命2:第二章》测试:

半条命2:第二章
测试场景

  游戏所有特效开到最高,分辨率设置为1024x768 0AA/0AF。我们选择了崖边的场景,测试过程中,我们跑到崖边等待游戏画面的闪光至震荡完毕,用FRAPS记录平均帧数。

HL2

  HL2的引擎已非常成熟,但仍不支持多核处理器,开启与关闭SMT的Core i7成绩相当。

《冲突世界》测试:

WIC

  画面选项设定为非常高(DX10),分辨率为1024x768 0AA/0AF,以自带BenchMark工具测试。

WIC

  在此游戏测试中,关闭SMT后成绩更高。

《英雄连》测试:

COH

  画质设定:Shadow Quality设置为DirecetX 10模式、全部特效都开启至最高,分辨率为1024x768 0AA/0AF。

COH

  在英雄连的测试中,关闭SMT后的Core i7同样能获得一点性能的提升。

  小结:在游戏测试中,开启SMT同步多线程后,对评测成绩有一定的影响,更多游戏是关闭SMT后成绩更高。当然这点FPS的差别在游戏中差别不大,当开高分辨率和高特效下进行游戏时,更多的是体现显卡性能。因此SMT对游戏性能的影响可以忽略。

11功耗对比评测回顶部

11 功耗对比评测

  由于CPU单独的功耗,目前还没有很好的方法能测出。因此功耗测试部分我们进行的是整个平台的功耗测试,通过对比来考察Core i7 940(三通道)和Core 2 QX9770平台空载/满载的功耗差距。我们选取的软件是CINEBENCH R10,用多CPU模式进行渲染,使多核CPU能尽量满载。(空载测试均开启Intel的EIST节能技术)

CINEBENCH R10
功耗评测方法

功耗对比评测

  Core i7改进的节能技术使其表现更佳,在空载的情况下,比Core 2 QX9770要省电。在满载时也仅比QX9770高出6W,通过这两次对Core i7的对比评测可知,Core i7 2.93G在多数测试项目能打败了上代旗舰Core 2 QX9770,尤其是多线程的测试,表明Core i7相比Core 2 Quad有着更为出色的能耗比(每瓦特性能)。

12PConline评测室总结回顶部

12 PConline评测室总结

Intel Roadmap
Core i7将在11月正式发布

从评测结果总结:

  Core i7其中的两大新技术带来了多少性能提升,本次评测给了一个很好的答案。在内存测试方面,三通道并没有给我们带来很大的性能提升,更多的情况是和双通道性能相当。当然,从内存理论性能测试上看,集成内存控制器+双通道的内存性能已经是上代QX9770的两倍了,三通道技术只是锦上添花而已。相信要等更高带宽的Core i7处理器和新版本软件,才能发挥出三通道的真正威力。

  SMT同步多线程测试带来的性能提升,和Intel官方的说法基本吻合,支持多线程的软件性能提升20%左右,它使Core i7的多线程处理能力达到一个前所未有的高度。但是和当年Pentium 4开启超线程的情况类似,SMT目前还是一把双刃剑,部分软件和SMT仍存在兼容性问题,使性能严重下降,相信新版本软件会解决这个问题。而游戏方面,虽然SMT对游戏的FPS有一点影响,但从评测结果可以知,这点FPS下降根本不影响游戏的流畅度,随着分辨率的提高,这点差距将会逐渐消失,更多的是考验显卡性能。综上所得,SMT明显是利远大于弊。

  能耗比方面,Core i7比Core 2 Quad要好不少,每瓦特性能,Intel从Core 2开始就提出的设计理念,同时这是未来CPU发展的方向。

未来市场预测:

  Core i7引入的三通道技术,虽然并未带来很大的性能提升,但无疑是一个很好的卖点,内存厂商也会很高兴,因为追求高性能的用户不得不多购买一条内存。但对广大老百姓而言,三通道还是可望不可及的技术,虽然Core i7在今年11月正式发布,但平民化还有相当长的时间,明年针对主流用户的是Lynnfield处理器,接口为LGA 1160,仅提供双通道的支持。接下来我们等待零售版Core i7和对手AMD的45nm Deneb推出,AMD新工艺带来更高的频率,两大新处理器的推出,肯定会改变当前CPU格局,它们的交锋非常值得期待。消费者必能从中受益,能购买更廉价的高性能处理器。

  关于Core i7的真实性能,通过这两次的详细测试,相信大家也有一定了解,在零售版推出后,我们PConline评测室也会第一时间进行评测,请大家密切留意。

为您推荐

加载更多
加载更多
加载更多
加载更多
加载更多
加载更多
加载更多
加载更多
加载更多
热门排行

DIY论坛帖子排行

最高点击 最高回复 最新
最新资讯离线随时看 聊天吐槽赢奖品