您的位置  > 科技

AMD正式发布Zen5/5c架构EPYC 9005:384线程5GHz无敌!4倍性能碾压对手

  Advancing AI 2024大会上,AMD正式发布了第五代EPYC的第一波产品,EPYC 9005系列,代号Turin。

  它基于全新的Zen 5、Zen 5c架构,规格、性能再次双双实现飞跃,即便是Intel正在陆续发布的至强6系列也黯然失色。

  一如消费级的锐龙,AMD EPYC这些年处理器在服务器与数据中心也是大杀四方,一代一代稳步向前,性能持续飙升,份额持续攀升,让Intel的至强一直抬不起头来。

  实在难以现象,AMD只用了7年的时间,就取得了如此傲人的战绩,在一向最为稳定的服务器和数据中心市场上硬生生撕开了一道口子。

  按照第三方市调机构的统计,第一代Naples EPYC 7001系列诞生之时,也就是2017年的时候,AMD在服务器市场上的份额几乎为零。

  加上第二代Rome EPYC 7002系列的连续积累,2020年时AMD已经收获了8%的市场,初步站稳了脚跟。

  之后,随着第三代Milan EPYC 7003系列的到来,AMD迎来爆发阶段,市场份额在2022年达到了惊人的27%。

  第四代EPYC更是达到了空前的高度,市场份额也稳步增加,截止到2024年上半年已经占到34%,也就拿下了三分之一的天下,并且已经有了超过350个OEM平台、950个云实例。

  部署采纳AMD EPYC的企业也越来越多,遍布各个行业,这里只是列举了其中的一部分,看看你都认识谁?

  大家都知道,第四代EPYC扩展出了前所未有的多条产品线,9004/8004/4004三大系列和各种分支(Genoa/Bergamo/Siena),全面覆盖各个市场领域和应用场景。

  第五代也必然延续这一趋势,今天的EPYC 9005这是第一波,比如说新一代3D堆叠缓存就在后边等着呢……

  好了,接下来,我们就看看最新的EPYC 9005到底有多么强大!

  这一次,Zen 5、Zen 5c同时出击,都划分在了EPYC 9005系列之内,在核心数、内存与PCIe连接上有所不同。

  首先,CCD核心制造工艺从5/6nm升级到了最新的3/4nm,IOD部分则是6nm,总晶体管多达1500亿个,因此可以做到更高的集成度,以及更高的频率。

  Zen 5部分,CCD采用4nm工艺,单芯片数量从12个增至16个(继续搭配一个IOD),每个CCD内还是8核心,因此总数从96核心192线程增至128核心256线程。

  Zen 5c部分,CCD采用3nm工艺,单芯片数量从8个增至12个(也搭配一个IOD),每个CCD内仍然是16核心,总计就是空前的192核心384线程。

  Intel能效核版至强6虽然能在未来通过双芯封装做到288核心,但无法支持超线程技术,因此只有288个线程,大大落后于AMD,再考虑到AMD多线程技术的高效率,192核心384线程领先288核心288线程问题不大。

  再说一遍,Zen 5c、Zen 5在架构上是完全一致的,IPC性能、ISA指令集毫无二致,比如都支持完整的AVX-512指令,前者只是三级缓存少一些、频率低一些而已,操作系统和应用软件都不需要特殊适配。

  这与Intel性能核、能效核的异构架构完全是两条路。

  核心数量大增的同时,EPYC 9005系列的最高频率首次做到了5GHz!相比于四代EPYC的最高值增加了足足900MHz,相当的不可思议。

  当然,功耗不可避免地增加了,最高可以达到500W。

  内存方面,最高还是12个通道、单路6TB容量,不过频率从DDR5-4800提高到了DDR5-6400。

  这一代新引入了“动态封装后修复”(PPR),适用于x8/x4 ECC RDIMM,具体情况暂未公布,猜测可以及时修复内存物理错误甚至缺陷,大幅提升稳定性。

  I/O平台连接方面,PCIe 5.0通道最多还是160条,新增了PCIe链接加密功能,并且从CXL 1.1+升级到CXL 2.0。

  安全性方面,新增可信赖I/O(Trusted I/O),以及美国国家标准与技术研究院(NIST)制定的美国联邦密码模块安全标准FIPS 140-3。

  哦对了,EPYC 9005系列依然采用SP5封装接口,无缝兼容EPYC 9004系列,Intel至强6则更换了LGA4710、LGA7529两种新接口。

  EPYC 9005全系型号、规格、价格一览,一共有多达27款,包括22款Zen 5、5款Zen 5c,编号混在一起,确实不太容易区分。

  Zen 5c的覆盖96/128/144/160/192核心,每种一款,其中后三种是Zen 5c独享的。

  旗舰型号EPYC 9965,192核心384线程,384MB三级缓存,主频2.25-3.7GHz,热设计功耗500W,价格达14813美元,约合人民币10.48万元。

  其他四款不再一一介绍,加速频率都是3.7GHz,三级缓存都是384MB,功耗320-400W。

  作为对比,Zen 4c架构的128核心EPYC 97x4系列最高频率才3.1GHz,三级缓存才256MB,当然功耗也低一些340-360W。

  Zen 5的覆盖8/16/24/32/36/48/64/72/96/128核心,其中72核心及以下只有Zen 5,96/128核心则是都有。

  旗舰型号EPYC 9755,128核心256线程,512MB三级缓存,主频2.7-4.1GHz,热设计功耗500W,价格12984美元,约合人民币9.19万元。

  而现有的对应96核心旗舰EPYC 9654最高频率才3.7GHz,三级缓存384MB,功耗360W。

  顺带一说,同样128核心的至强6980P价格高达17800美元,约合人民币12.60万元。

  可以跑到5GHz加速频率的有两款:

  一是64核心的EPYC 9575F,基准频率3.3GHz,三级缓存256MB,功耗400W;

  二是16核心的EPYC 9175F,基准频率4.2GHz,三级缓存则是旗舰之外唯二的512MB,功耗320W。

  其他所有型号的加速频率,也都在4GHz之上,确切地说都不低于4.1GHz。

  性能方面,AMD宣称EPYC 9005系列在企业、云应用中的IPC提升最高为17%,而在HPC、AI应用中的IPC提升最高更是达到惊人的37%!

  当然,具体情况在AI应用中取决于特定场景的优化加速,很容易获得更大幅度的提升。

  接下来是官方性能对比,我们快速过一下。

  192核心EPYC 9965对比128核心EPYC 9754在行业标准的SPEC CPU 2017整数性能对比中提升约60%,更是Intel 64核心五代至强8592+的足足2.7倍。

  是的,没有对比最新的至强6,因为后者刚刚发布,还没有实际部署,也缺乏测试数据。

  同样的32核心,EPYC 9355对比EPYC 9354提升了将近30%。

  当然最高频率也从3.8GHz提高到4.4GHz,这部分理论上可以贡献15%左右的提升幅度,另外至少一半来自架构改进。

  对比五代至强6548Y+,则有40%的领先优势。

  再换个角度,同样的核心数与成本下,EPYC 9575F代际提升约15%,对比竞品领先60%。

  在不同的企业应用、HPC、AI等负载中,包括视频转码、图像渲染、商业程序、数据库、FEA(有限元分析)模拟、CFD(计算流体力学)模拟与建模、开源高性能计算、机器学习、端到端AI、相似性搜索、大语言模型等等,EPYC 9965都能做到遥遥领先。

  它不但对比上代有着质的飞跃,对比竞品64核心的至强8592+更是全程碾压,性能优势最高达4倍之多。

  对于旧平台更新换代,EPYC 9005系列更是上佳之选,比如从非常流行但老旧的二代至强铂金8280升级到EPYC 9665,只需131台服务器就能达到原来1000台的性能水平,节省87%的占地空间。

  同时,功耗可以节省最多68%,三年TCO成本节省最多67%,非常划算。

  CPU处理器搭配GPU加速器组成超高性能的AI计算系统,也是当下的潮流。

  AMD 推荐使用64核心的EPYC 9575F/9554、96核心的EPYC 9655,搭配自家的MI300X、MI325X(刚发布),都支持单路八卡。

  性能上,EPYC 9575F对比至强8592+,训练性能可领先20%,推理性能可领先8%,1000节点集群每秒可以多处理70万个Token。

  当然,大量的NVIDIA GPU计算集群都搭配着EPYC处理器,AMD也做了不同规模的最佳皮牌型号的推荐。

  还是EPYC 9575F对比至强8592+,训练性能可领先15%,推理性能可领先20%,还可以多处理20%的请求,并节省15%的时间。

  这就是新一代EPYC 9005系列,依然是世界上最佳的云服务、企业、HPC、AI处理器,拥有更先进的工艺、更多的核心、更高的频率、更大的三级缓存、更高的性能、更高的性价比、无缝的兼容性。

  Intel全新的至强6,此时也只能默默地叹息一声:既生瑜,何生亮。

  接下来,我们更加期待第五代EPYC在更多的行业生根发芽、落地开花。

  内容转载自:快科技