【PConline 应用】从之前泄露的AMD 2012年线路图来看,桌面版本的二代APU(代号“Trinity”)应该早在今年年中就发布的,结果一再跳票,吊足了广大A饭的胃口。其中错综复杂的影响因素我们就不去深入探究了,现在可以确定的是,10月2日桌面版二代APU就能和大家见面。这几个月来陆陆续续泄露的APU资料不算少,今天我们就来作一下汇总,看二代APU为我们带来了哪些新奇的改变。 ●二代APU型号上市型号一览 很明显,如今APU已经成为AMD的产品核心,其风头甚至盖过了旗舰型号推土机FX。“打桩机(Piledriver)”架构也将率先应用在二代APU产品上,按照AMD的发布路线图,二代APU分为A4、A6、A8、A10四个系列,数字编号命名都是以5开头。
1、改变一:抛弃K10.5,CPU部分采用打桩机架构 二代APU的CPU部分从原来的K10.5精简核心升级到第二代“推土机”架构的Piledriver(打桩机)核心,也就是说,二代APU开始将全线采用模块化设计,和“以往”的APU已经是完全不同的产品了。 ●模块化设计的打桩机架构 由于“推土机”的缘故,现在一提到“模块化”设计总会让人联想到那名不符实的CPU性能,不过“打桩机”的出现可能让情况出现好转。二代APU所沿用的打桩机核心,拥有2个模块4个内核,每个模块内共享2MB L2缓存,据AMD的介绍CPU性能与一代APU相比会提高26%。 ●全新指令集的加入 打桩机核心加入了对AVX/AVX1.1、FMA3、AES和F16C指令集的支持。事实上AVX、AES指令集是Intel在Sandy Bridge上的最主要更新,AVX能大幅度提高CPU的浮点运算性能,AMD从“推土机”架构开始就已经支持这项技术。
但从实际指令集来看,AMD根据AVX编码方式扩展出了XOP、FMA等一系列更完善的指令集,在保证了兼容性的基础上,强化了整数运算效能。FMA3可以说是FMA4的简化版,只需用到3个指令,使代码更短且硬件执行上稍微简单一些。>> ●频率更高、功耗不变 第二代APU依然采用32nm工艺制作,虽然晶体管数量也增加到13.03亿,核芯面积大了一些,不过相比一代产品应该成熟了许多:IPC(每周期指令)性能提升、漏电率下降、频率提高。二代APU的默认频率可达3.8-4.2GHz,GPU频率类似,最高800MHz。另一方面,平台功耗却得到了控制,与上一代产品一样保持TDP 65W和100W。当然这只是设计上的数值,具体功耗要实际体验才能知道。 ●AMD Turbo CORE 3.0技术 采用“打桩机”微架构的二代APU支持AMD Turbo CORE 3.0技术,可以对 CPU / GPU 进行协同调度,其中CPU 单核心/多核心、偏重GPU应用以及CPU/GPU同时高负载时候的频率都不尽相同,以此来达到不同应用环境下的最佳性能发挥,这一点倒是和Intel的Turbo Boost 2.0很相似。
以APU移动版本A10-4600M为例,从以上官方的Turbo CORE 3.0功能解说可以看出,在不同的负载情况下,Turbo Core 3.0会对CPU/GPU频率进行调整,A10-4600M的CPU提升幅度可达19%,GPU最高提升幅度20%。前后两代Turbo Core的区别在于Turbo Core 2.0不会对CPU/GPU进行超频。>> 2、改变二:核显部分升级到VLIW4体系 GPU方面,上一代Llano使用的是HD 6800系列的VLIW5体系,最多有5组SIMD阵列,400个流处理器,而Trinity APU使用的是VLIW4体系,流处理器最多只有384个,看起来是减少了,但是效率更高,而且SIMD阵列提高到6组,最高频率也提高到800MHz,远比Llano最高600MHz的频率要高,AMD之前宣称的数值是提升50%,这也是Trinity性能变化最明显的地方。 ●流处理器减少,效率放而提升 二代APU融合的“独显核心”最多只有384个流处理器,但得益于较先进的VLIW4体系(也就是HD 6900系列显卡的架构),性能会比一代APU的VLIW5体系强一些。不过这次更新并没有升级到最新的GCN架构,也许是AMD有自己的考量吧。 ●支持多屏幕数字输出 二代APU支持DP1.2、HDMI、DVI等数字接口,轻松组建多屏显示,UVD功能的升级也让二代APU的视频播放质量进一步改善,包括有视频防抖、视频色彩增强、极速编码、Quick Stream(无中断的流媒体缓冲播放)等主要针对多媒体的功能。 3、改变三:接口更换到FM2 二代APU的总体架构由“K10.5+VLIW5”体系升级到了“Piledriver+VLIW4”,和一代APU已经是完全不同的产品了,接口的互不兼容也可以理解。现在已经确定二代APU的接口将升级到FM2,与FM1互不相容。 Trinity APU与Llano APU的最明显的区别是针脚结构,Trinity APU采用了Socket FM2接口,共计904针,与采用Socket FM1接口、共计905针的Llano APU相比,不仅针脚数不一致,就连针脚的排列都有所不同,因此两代APU平台是互不兼容的,至少不能插在对方的插槽中。
对应的主板方面,除了现有的A55/A75芯片组外,还会有更高级的A85芯片组。目前配备FM1接口的A75/A55不能升级二代APU,而同时配备FM2接口的A85主板,也不能使用一代APU。有趣的是,目前的A75/A55芯片可以换个FM2接口就支持二代APU,也算是AMD对各大主板厂商的特别关照。以后是否会有FM2转FM1或者FM1转FM2的转换器?这个就很难说了。>> 4、总结: ●APU产品逐渐走向成熟,生态圈逐步建立 从AMD的路线来看,二代APU是AMD走向成熟的标志,把GPU核心与模块化架构相结合,在此基础上再逐步进化完善,最终形成异构运算体系。与2011年相比,2012年针对异构运算加速的产品逐渐增多,一个良好的生态圈正在建立。 按计划Windows8将在10月份发布正式版,恰好是二代APU上市的时间段(已经确定二代APU会在10月2日上市)。Windows 8中广泛应用的硬件加速功能,能否让二代APU的优势得以发挥,现在还无法定论,不过从二代APU的更新来看,AMD是下定决心要走异构运算的道路了,模块化设计的APU可以说是异构运算体系的雏形。 ●大家关心的问题:二代APU性能如何 从AMD透露的信息来看,二代APU相比一代产品CPU性能提升26%,GPU性能提升37%;我们对模块化设计的打桩机相比K10.5能否有这么大的性能差距持保留态度,但GPU部分的改进是显而易见的,从VLIW5升级到VLIW4,笔者预计性能提升在20%以上,再加上新增的AVX、AES、FMA3、F16C等一系列完善的指令集,未来APU在整合平台上的优势将更加明显。[返回频道首页] |
鏀惰棌鎴愬姛鏌ョ湅鏀惰棌>>
正在阅读:核心架构全面升级 AMD二代APU层层揭秘核心架构全面升级 AMD二代APU层层揭秘
2012-09-19 00:18
出处:PConline原创
责任编辑:chenziwei