英特尔第11代酷睿处理器版本火箭湖-S已经正式发布上市。虽然延续了14nm工艺技术,但火箭湖-S与前代相比发生了翻天覆地的变化。最重要的是,Rocket Lake-S采用了全新的Cypress Cove内核微体系结构,相比延续几代的Skylake微体系结构,在IPC(同频性能)上有了显著提升。
洛克莱克-S诞生的背景
英特尔在2014年底(滴答年)成功大规模生产了14纳米工艺技术,并推出了布罗德韦尔系列核心M系列产品。在2015年(Tock年),英特尔使用产量逐渐成熟的14纳米工艺技术带来了Skylake微体系结构。6代Core全面上市;当时AMD还在泥潭中挣扎。面对Skylake,推土机架构的FX系列可谓“高频率、低能耗、高功耗”,是大火炉的代名词。
如果英特尔能够延续Tick-Tock节奏推动路线图更新产品,那么英特尔将在2016年(Tick年)大规模生产10纳米工艺技术的Cannon Lake(微架构继承Skylake),并在2017年(Tock年)进行下一轮微架构升级,将Ice Lake(Sunny Cove)推向市场,不断压制高性能处理器市场的所有竞争对手.
但是,在当时,也许没有人能够预测到,原本计划服务2-3年的Skylake微体系结构,会在桌面平台上使用长达5年之久。由于10纳米工艺技术的各种问题以及英特尔遵循的“将工艺技术与微体系结构绑定”的原则,英特尔来不及将新体系结构的产品推向桌面市场。第7代Core Kaby Lake-S,第8-9代Core coffe Lak-S,甚至第10代Core Comet Lake-S都有了新的Code Name,但都是Skylake微体系结构的衍生物,核心IPC并没有改变,主要依靠增加核心线程数和增加核心turbo频率来实现性能提升。
不可否认,纵观处理器发展历史,Skylake绝对是一款成功的微架构设计,其衍生产品还包括酷睿i7-8700K、酷睿i9-9900K等经典产品,为英特尔在2015-2019年的市场领先地位做出了巨大贡献;然而英雄走到尽头,时间可以抹去一切。面对竞争对手的不断进步,英特尔已经意识到Skylake微架构“廉颇太老了”。即使耗尽14nm的超频潜力,也很难与采用新微架构设计的竞争对手抗衡。所以基于这样的背景,英特尔台式机处理器的微架构刻不容缓,代号为Rocket Lake-S的第11代酷睿处理器台式机版诞生了!
洛克莱克-S的新微架构和许多新功能
具体来说,火箭湖-S的核心部分采用了一种叫做柏树湾的微建筑。赛普拉斯科夫微体系结构从前端规模、乱序缓冲区到后端执行单元的设计与Ice Lake-U采用的Sunny Cove微体系结构相同,因此与Skylake及其衍生产品相比,赛普拉斯科夫从微体系结构本身来说可以称得上是完全的替代。可以理解为,英特尔将原本基于10纳米工艺技术设计的Sunny Cove微架构背板“反向移植”到了14纳米工艺技术,也就是赛普拉斯Cove。
第11代酷睿处理器的台式机版本火箭湖-S采用LGA 1200插槽,与之前的Z490芯片组主板兼容。当然,除了内核微架构的替换之外,Rocket Lake-S还带来了很多新特性:新设计的Xe LP架构UHD核心显卡,20个直连PCIe 4.0通道,以及新设计的内存控制器(Gear1低延迟模式和
Gear2极限高频模式)、3大AI深度学习加速引擎(AVX-512 VNNI、DP4A、GNA 2.0)、500系列芯片组、新的超频特性等。前面提到过,除了制程工艺不同,Cypress Cove与Sunny Cove从微架构角度来看二者是高度相似的。而在2019年,面向轻薄本的第10代酷睿处理器Ice Lake-U发布时,Intel则对Sunny Cove微架构进行了详细的介绍,总结来说Sunny Cove对比Skylake,做到了更深的流水线、更大的乱序缓冲区、更多的后端执行单元,以及AVX-512指令集(AVX-512F CD、DQ、BW、VL)及其拓展(AVX-512 IFMA、VBMI、FMAPS、VNNI等)支持,是一次完整的架构迭代。
在官方PPT中,可以详细了解Intel从Haswell到Skylake再到Sunny Cove三大微架构的缓冲区及缓存设计异同;而对比Skylake,Sunny Cove微架构自然是做到了全面加强:一级数据缓存增大50%,达到每核心48KB;二级缓存翻倍,从每核心256KB增大到每核心512KB;μop微指令缓存增大50%,由1.5K指令数提高到2.25K指令数;乱序重排缓冲区ROB则增大大了57%,从224提高到352;访存Load/Store乱序缓冲区则从72+56提高到128+72。
而具体到微架构的同频性能也就是IPC,Intel在2019年发布第10代酷睿Ice Lake-U时表示,对比Skylake微架构,Sunny Cove实现了平均18%的IPC提升(测试应用包含SPEC CPU 2006、SPEC CPU 207、SYSmark 2014、WebXPRT、Cinebench R15等)。
而到了2021年,Intel发布第11代酷睿桌面版Rocket Lake-S时,官方表示Cypress Cove对比Skylake的IPC提升达到19%,测试项目为SPEC CPU 2017 Integer,并使用ICC编译器。
对于测试处理器微架构的IPC及提升幅度,变量其实不小,采用不同的测试平台(不同主板BIOS微码、不同内存频率和时序、不同缓存频率等),测试不同的应用项目,都会对测试结果有显著的影响。
而在此前的首测中,受限于时间关系,各大媒体大多只测试了Rocket Lake-S开箱即用的默频性能,大多没有进行单独的同频性能测试,而本次PConline评测室将对Rocket Lake-S与Comet Lake-S进行锁定频率对比测试,来看看全新的Cypress Cove微架构的改进……
测试平台介绍及注意事项
PConline使用酷睿i9-11900K对比酷睿i9-10900K,通过BIOS让酷睿i9-10900K保留8核心16线程(但三级缓存依旧为20MB,高于像酷睿i9-9900K、酷睿i7-10700K这样的标准8核心16线程Skylake微架构处理器),让它的规格和酷睿i9-11900K相同。二者的和核心频率均锁定为4GHz,Ringbus也就是缓存频率也锁定为4GHz。
内存方面为8GB×4,并将频率调整为DDR4-3600MHz,时序设置为CL16-18-18-38,酷睿i9-11900K在测试时通过BIOS调整为Gear1模式,保持内存控制器与内控频率为1:1不分频。
测试平台采用的主板为技嘉Z490 AORUS MASTER,并将BIOS更新至F20d版本,微码0x34,由于目前各主板厂商优先更新Z590芯片组主板的BIOS,Z490主板的BIOS更新较慢,无法使用最新的微码。而0x34这个版本的微码对内存控制器的优化还有些小问题,因此本次测试不包含搭配独立显卡的同频游戏测试。
CypressCove微架构同频性能提升约20%
本次测试包含众多项目,包括Cinebench R20、Cinebench R23、V-Ray 5 Benchmark、Geekbench 5、Blender 2.92、POV-Ray 3.7.1、CPU-Z、Sisoftware Sandra 2021、PCMark 10、3DMark等。未来将加入更多测试项目,并与AMD Zen 3微架构的锐龙5000系列桌面处理器Vermeer、Intel Willow Cove微架构的第11代酷睿处理器高性能移动版Tiger Lake-H45做更详细的同频性能对比。
Cinebench:
先来看一下常见的Cinebench,作为基于Cinema 4D开发的测试软件,Cinebench阴恻测试简单直观而广泛流行,目前已经跟随Cinema 4D一起更新至R23版本。但由于是基于单一软件应用场景的缘故,因此Cinebench并不能完全反应处理器的综合性能。
在R20版本中,基于Cypress Cove的酷睿i9-11900K同频单线程提高约17.1%,同频多线程提高约18.9%;在R23版本中,同频单线程提高约19%,同频多线程提高约18.9%,提升幅度基本一致。
Geekbench 5
Geekbench 5是目前流行的跨平台处理器性能测试软件,分为整数、浮点和加密三个子项目,在Geekbench 5中基于Cypress Cove的酷睿i9-11900K同频单线程提升极大,达到29.9%,同频多线程提升12.7%(或许是因为内存带宽瓶颈,导致支持AVX-512 VAES的加密子项目得分,无法做到随核心数量增加而线性提高)。
POV-Ray 3.7.1
通过以上的一系列测试,我们可以得出结论,即便依旧基于14nm制程工艺打造,但由于Rocket Lake-S采用了全新的Cypress Cove微架构,因此在相同规格相同频率下,Rocket Lake-S的综合性能表现将会与Skylake微架构衍生物(6-10代酷睿桌面端)有着质的不同!
不过将全新Cypress Cove微架构反向移植到14nm制程工艺上,真的就没有一点副作用吗?那答案当然是否定的!Cypress Cove微架构为了提高IPC,每核心的规模也就是晶体管数量相比Skylake微架构做到了显著增加,而采用低密度的14nm制程工艺来制作,势必导致面积及功耗的增长。因此,即便酷睿i9-11900K只有8核心16线程,但面积却比上代10核心20线程的酷睿i9-11900K还要更大,且满载功耗也一点不低……
从2015年的酷睿i7-5775C到今天的酷睿i9-11900K,Intel的14nm制程工艺的睿频上限从3.7GHz到5.3GHz,且历经了Broadwell、Skylake、Cypress Cove三个微架构,潜力已被拉至极限,Rocket Lake-S可以说标志着Intel的14nm制程工艺在桌面平台完成了最后一战......
对于处理器来说,如果想要同时兼顾单线程性能、多线程性能,并提升能效比,那么微架构与制程工艺而在都非常重要,二者缺一不可。因此对于Intel来说,代号为Alder Lake-S的第12代酷睿处理器可以说是重中之重,Alder Lake将采用了进一步优化版的10nm Enhanced SuperFin制程工艺技术,拥有Golden Cove与Gracemont在内的两个全新内核微架构以组成Hybrid混合设计,并首发支持DDR5内存与PCIe 5.0协议,届时能为广大用户带来全面的性能及体验提升……
当然,对于当下的刚需购机用户来说,如果第11代酷睿Rocket Lake-S对比第10代酷睿Comet Lake-S,如果能做到同核心下价格基本相当,结合全新Cypress Cove内核微架构以带来的两位数IPC提升,32EU Xe LP架构的UHD 750、UHD 730核芯显卡,以及支持PCIe 4.0协议等新特性,依旧有很高的购买价值。