鏀惰棌 (0) +1 璧� (0) +1 韪� (0) +1
鏀惰棌鎴愬姛鏌ョ湅鏀惰棌>>

正在阅读:核心架构全面升级 AMD二代APU层层揭秘核心架构全面升级 AMD二代APU层层揭秘

2012-09-19 00:18 出处:PConline原创 作者:Eric65535 责任编辑:chenziwei
1引入打桩机核心,二代APU采用模块化设计回顶部

  【PConline 应用】从之前泄露的AMD 2012年线路图来看,桌面版本的二代APU(代号“Trinity”)应该早在今年年中就发布的,结果一再跳票,吊足了广大A饭的胃口。其中错综复杂的影响因素我们就不去深入探究了,现在可以确定的是,10月2日桌面版二代APU就能和大家见面。这几个月来陆陆续续泄露的APU资料不算少,今天我们就来作一下汇总,看二代APU为我们带来了哪些新奇的改变。

TRINITY

●二代APU型号上市型号一览

  很明显,如今APU已经成为AMD的产品核心,其风头甚至盖过了旗舰型号推土机FX。“打桩机(Piledriver)”架构也将率先应用在二代APU产品上,按照AMD的发布路线图,二代APU分为A4、A6、A8、A10四个系列,数字编号命名都是以5开头。

AMD APU
二代APU即将到来

“打桩机”架构第二代APU处理器参数对比
型号
CPU
频率
二级
缓存
内置
GPU
GPU
频率
流处理器
TDP
3.8-4.2 GHz
4MB
7660D
800MHz 384
100W
3.4-4.0 GHz
4MB
7660D
760MHz 384
65W
3.6-3.9 GHz
4MB
7560D
760MHz 256
100W
3.2-3.7 GHz
4MB
7560D
760MHz 256
65W
未知
1MB
7540D
未知
192
65W
A4-5300
未知
1MB 7480D
未知
128
65W

1、改变一:抛弃K10.5,CPU部分采用打桩机架构

  二代APU的CPU部分从原来的K10.5精简核心升级到第二代“推土机”架构的Piledriver(打桩机)核心,也就是说,二代APU开始将全线采用模块化设计,和“以往”的APU已经是完全不同的产品了。

Trinity
"打桩机"核心架构解说

●模块化设计的打桩机架构

  由于“推土机”的缘故,现在一提到“模块化”设计总会让人联想到那名不符实的CPU性能,不过“打桩机”的出现可能让情况出现好转。二代APU所沿用的打桩机核心,拥有2个模块4个内核,每个模块内共享2MB L2缓存,据AMD的介绍CPU性能与一代APU相比会提高26%。

Trinity
“打桩机”核心的主要改进

●全新指令集的加入

  打桩机核心加入了对AVX/AVX1.1、FMA3、AES和F16C指令集的支持。事实上AVX、AES指令集是Intel在Sandy Bridge上的最主要更新,AVX能大幅度提高CPU的浮点运算性能,AMD从“推土机”架构开始就已经支持这项技术。

Trinity
大名鼎鼎的AVX、AES指令集其实在推土机核心上就已经被支持

  但从实际指令集来看,AMD根据AVX编码方式扩展出了XOP、FMA等一系列更完善的指令集,在保证了兼容性的基础上,强化了整数运算效能。FMA3可以说是FMA4的简化版,只需用到3个指令,使代码更短且硬件执行上稍微简单一些。>>

232纳米工艺成熟,提升性能更加简单回顶部

●频率更高、功耗不变

Trinity
前后两代APU的改变 

Trinity
二代APU的主要改进点

  第二代APU依然采用32nm工艺制作,虽然晶体管数量也增加到13.03亿,核芯面积大了一些,不过相比一代产品应该成熟了许多:IPC(每周期指令)性能提升、漏电率下降、频率提高。二代APU的默认频率可达3.8-4.2GHz,GPU频率类似,最高800MHz。另一方面,平台功耗却得到了控制,与上一代产品一样保持TDP 65W和100W。当然这只是设计上的数值,具体功耗要实际体验才能知道。

●AMD Turbo CORE 3.0技术

  采用“打桩机”微架构的二代APU支持AMD Turbo CORE 3.0技术,可以对 CPU / GPU 进行协同调度,其中CPU 单核心/多核心、偏重GPU应用以及CPU/GPU同时高负载时候的频率都不尽相同,以此来达到不同应用环境下的最佳性能发挥,这一点倒是和Intel的Turbo Boost 2.0很相似

Turbo Core
Turbo Core 2.0的工作方式

TURBO CORE 3.0
官方文档的Turbo Core 3.0解说

  以APU移动版本A10-4600M为例,从以上官方的Turbo CORE 3.0功能解说可以看出,在不同的负载情况下,Turbo Core 3.0会对CPU/GPU频率进行调整,A10-4600M的CPU提升幅度可达19%,GPU最高提升幅度20%。前后两代Turbo Core的区别在于Turbo Core 2.0不会对CPU/GPU进行超频。>>

3核显性能提升50%?连接口都发生改变回顶部

2、改变二:核显部分升级到VLIW4体系

  GPU方面,上一代Llano使用的是HD 6800系列的VLIW5体系,最多有5组SIMD阵列,400个流处理器,而Trinity APU使用的是VLIW4体系,流处理器最多只有384个,看起来是减少了,但是效率更高,而且SIMD阵列提高到6组,最高频率也提高到800MHz,远比Llano最高600MHz的频率要高,AMD之前宣称的数值是提升50%,这也是Trinity性能变化最明显的地方。

Trinity
二代APU核心架构示意图

●流处理器减少,效率放而提升

  二代APU融合的“独显核心”最多只有384个流处理器,但得益于较先进的VLIW4体系(也就是HD 6900系列显卡的架构),性能会比一代APU的VLIW5体系强一些。不过这次更新并没有升级到最新的GCN架构,也许是AMD有自己的考量吧。

Trinity
VLIW4体系架构示意图

●支持多屏幕数字输出

  二代APU支持DP1.2、HDMI、DVI等数字接口,轻松组建多屏显示,UVD功能的升级也让二代APU的视频播放质量进一步改善,包括有视频防抖、视频色彩增强、极速编码、Quick Stream(无中断的流媒体缓冲播放)等主要针对多媒体的功能。

Trinity

3、改变三:接口更换到FM2

  二代APU的总体架构由“K10.5+VLIW5”体系升级到了“Piledriver+VLIW4”,和一代APU已经是完全不同的产品了,接口的互不兼容也可以理解。现在已经确定二代APU的接口将升级到FM2,与FM1互不相容。

 Trinity
两代APU的接口不同

  Trinity APU与Llano APU的最明显的区别是针脚结构,Trinity APU采用了Socket FM2接口,共计904针,与采用Socket FM1接口、共计905针的Llano APU相比,不仅针脚数不一致,就连针脚的排列都有所不同,因此两代APU平台是互不兼容的,至少不能插在对方的插槽中。

a85
二代APU会配备更高级的A85芯片组

  对应的主板方面,除了现有的A55/A75芯片组外,还会有更高级的A85芯片组。目前配备FM1接口的A75/A55不能升级二代APU,而同时配备FM2接口的A85主板,也不能使用一代APU。有趣的是,目前的A75/A55芯片可以换个FM2接口就支持二代APU,也算是AMD对各大主板厂商的特别关照。以后是否会有FM2转FM1或者FM1转FM2的转换器?这个就很难说了。>>

4总结:二代APU是异构运算的雏形回顶部

4、总结:

TRINITY

●APU产品逐渐走向成熟,生态圈逐步建立

  从AMD的路线来看,二代APU是AMD走向成熟的标志,把GPU核心与模块化架构相结合,在此基础上再逐步进化完善,最终形成异构运算体系。与2011年相比,2012年针对异构运算加速的产品逐渐增多,一个良好的生态圈正在建立。

Trinity
支持APU加速的产品逐渐增多

Trinity
Win8的出现会让APU变得“强势”吗?

  按计划Windows8将在10月份发布正式版,恰好是二代APU上市的时间段(已经确定二代APU会在10月2日上市)。Windows 8中广泛应用的硬件加速功能,能否让二代APU的优势得以发挥,现在还无法定论,不过从二代APU的更新来看,AMD是下定决心要走异构运算的道路了,模块化设计的APU可以说是异构运算体系的雏形。

●大家关心的问题:二代APU性能如何

   从AMD透露的信息来看,二代APU相比一代产品CPU性能提升26%,GPU性能提升37%;我们对模块化设计的打桩机相比K10.5能否有这么大的性能差距持保留态度,但GPU部分的改进是显而易见的,从VLIW5升级到VLIW4,笔者预计性能提升在20%以上,再加上新增的AVX、AES、FMA3、F16C等一系列完善的指令集,未来APU在整合平台上的优势将更加明显。[返回频道首页]

为您推荐

热门排行

DIY论坛帖子排行

最高点击 最高回复 最新
最新资讯离线随时看 聊天吐槽赢奖品
鎵嬫満璁块棶鍥炲埌椤堕儴