快科技10月11日美国旧金山现场报道:
Advancing AI 2024大会上,AMD正式发布了第五代EPYC的第一波产品,EPYC 9005系列,代号Turin。
它基于全新的Zen 5、Zen 5c架构,规格、性能再次双双实现飞跃,即便是Intel正在陆续发布的至强6系列也黯然失色。
一如消费级的锐龙,AMD EPYC这些年处理器在服务器与数据中心也是大杀四方,一代一代稳步向前,性能持续飙升,份额持续攀升,让Intel的至强一直抬不起头来。
实在难以现象,AMD只用了7年的时间,就取得了如此傲人的战绩,在一向最为稳定的服务器和数据中心市场上硬生生撕开了一道口子。
按照第三方市调机构的统计,第一代Naples EPYC 7001系列诞生之时,也就是2017年的时候,AMD在服务器市场上的份额几乎为零。
加上第二代Rome EPYC 7002系列的连续积累,2020年时AMD已经收获了8%的市场,初步站稳了脚跟。
之后,随着第三代Milan EPYC 7003系列的到来,AMD迎来爆发阶段,市场份额在2022年达到了惊人的27%。
第四代EPYC更是达到了空前的高度,市场份额也稳步增加,截止到2024年上半年已经占到34%,也就拿下了三分之一的天下,并且已经有了超过350个OEM平台、950个云实例。
部署采纳AMD EPYC的企业也越来越多,遍布各个行业,这里只是列举了其中的一部分,看看你都认识谁?
大家都知道,第四代EPYC扩展出了前所未有的多条产品线,9004/8004/4004三大系列和各种分支(Genoa/Bergamo/Siena),全面覆盖各个市场领域和应用场景。
第五代也必然延续这一趋势,今天的EPYC 9005这是第一波,比如说新一代3D堆叠缓存就在后边等着呢……
好了,接下来,我们就看看最新的EPYC 9005到底有多么强大!
这一次,Zen 5、Zen 5c同时出击,都划分在了EPYC 9005系列之内,在核心数、内存与PCIe连接上有所不同。
首先,CCD核心制造工艺从5/6nm升级到了最新的3/4nm,IOD部分则是6nm,总晶体管多达1500亿个,因此可以做到更高的集成度,以及更高的频率。
Zen 5部分,CCD采用4nm工艺,单芯片数量从12个增至16个(继续搭配一个IOD),每个CCD内还是8核心,因此总数从96核心192线程增至128核心256线程。
Zen 5c部分,CCD采用3nm工艺,单芯片数量从8个增至12个(也搭配一个IOD),每个CCD内仍然是16核心,总计就是空前的192核心384线程。
Intel能效核版至强6虽然能在未来通过双芯封装做到288核心,但无法支持超线程技术,因此只有288个线程,大大落后于AMD,再考虑到AMD多线程技术的高效率,192核心384线程领先288核心288线程问题不大。
再说一遍,Zen 5c、Zen 5在架构上是完全一致的,IPC性能、ISA指令集毫无二致,比如都支持完整的AVX-512指令,前者只是三级缓存少一些、频率低一些而已,操作系统和应用软件都不需要特殊适配。
这与Intel性能核、能效核的异构架构完全是两条路。
核心数量大增的同时,EPYC 9005系列的最高频率首次做到了5GHz!相比于四代EPYC的最高值增加了足足900MHz,相当的不可思议。
当然,功耗不可避免地增加了,最高可以达到500W。
内存方面,最高还是12个通道、单路6TB容量,不过频率从DDR5-4800提高到了DDR5-6400。
这一代新引入了“动态封装后修复”(PPR),适用于x8/x4 ECC RDIMM,具体情况暂未公布,猜测可以及时修复内存物理错误甚至缺陷,大幅提升稳定性。
I/O平台连接方面,PCIe 5.0通道最多还是160条,新增了PCIe链接加密功能,并且从CXL 1.1+升级到CXL 2.0。
安全性方面,新增可信赖I/O(Trusted I/O),以及美国国家标准与技术研究院(NIST)制定的美国联邦密码模块安全标准FIPS 140-3。
哦对了,EPYC 9005系列依然采用SP5封装接口,无缝兼容EPYC 9004系列,Intel至强6则更换了LGA4710、LGA7529两种新接口。
EPYC 9005全系型号、规格、价格一览,一共有多达27款,包括22款Zen 5、5款Zen 5c,编号混在一起,确实不太容易区分。
Zen 5c的覆盖96/128/144/160/192核心,每种一款,其中后三种是Zen 5c独享的。
旗舰型号EPYC 9965,192核心384线程,384MB三级缓存,主频2.25-3.7GHz,热设计功耗500W,价格达14813美元,约合人民币10.48万元。
其他四款不再一一介绍,加速频率都是3.7GHz,三级缓存都是384MB,功耗320-400W。
作为对比,Zen 4c架构的128核心EPYC 97x4系列最高频率才3.1GHz,三级缓存才256MB,当然功耗也低一些340-360W。
Zen 5的覆盖8/16/24/32/36/48/64/72/96/128核心,其中72核心及以下只有Zen 5,96/128核心则是都有。
旗舰型号EPYC 9755,128核心256线程,512MB三级缓存,主频2.7-4.1GHz,热设计功耗500W,价格12984美元,约合人民币9.19万元。
而现有的对应96核心旗舰EPYC 9654最高频率才3.7GHz,三级缓存384MB,功耗360W。
顺带一说,同样128核心的至强6980P价格高达17800美元,约合人民币12.60万元。
可以跑到5GHz加速频率的有两款:
一是64核心的EPYC 9575F,基准频率3.3GHz,三级缓存256MB,功耗400W;
二是16核心的EPYC 9175F,基准频率4.2GHz,三级缓存则是旗舰之外唯二的512MB,功耗320W。
其他所有型号的加速频率,也都在4GHz之上,确切地说都不低于4.1GHz。
性能方面,AMD宣称EPYC 9005系列在企业、云应用中的IPC提升最高为17%,而在HPC、AI应用中的IPC提升最高更是达到惊人的37%!
当然,具体情况在AI应用中取决于特定场景的优化加速,很容易获得更大幅度的提升。
接下来是官方性能对比,我们快速过一下。
192核心EPYC 9965对比128核心EPYC 9754在行业标准的SPEC CPU 2017整数性能对比中提升约60%,更是Intel 64核心五代至强8592+的足足2.7倍。
是的,没有对比最新的至强6,因为后者刚刚发布,还没有实际部署,也缺乏测试数据。
同样的32核心,EPYC 9355对比EPYC 9354提升了将近30%。
当然最高频率也从3.8GHz提高到4.4GHz,这部分理论上可以贡献15%左右的提升幅度,另外至少一半来自架构改进。
对比五代至强6548Y+,则有40%的领先优势。
再换个角度,同样的核心数与成本下,EPYC 9575F代际提升约15%,对比竞品领先60%。
在不同的企业应用、HPC、AI等负载中,包括视频转码、图像渲染、商业程序、数据库、FEA(有限元分析)模拟、CFD(计算流体力学)模拟与建模、开源高性能计算、机器学习、端到端AI、相似性搜索、大语言模型等等,EPYC 9965都能做到遥遥领先。
它不但对比上代有着质的飞跃,对比竞品64核心的至强8592+更是全程碾压,性能优势最高达4倍之多。
对于旧平台更新换代,EPYC 9005系列更是上佳之选,比如从非常流行但老旧的二代至强铂金8280升级到EPYC 9665,只需131台服务器就能达到原来1000台的性能水平,节省87%的占地空间。
同时,功耗可以节省最多68%,三年TCO成本节省最多67%,非常划算。
CPU处理器搭配GPU加速器组成超高性能的AI计算系统,也是当下的潮流。
AMD 推荐使用64核心的EPYC 9575F/9554、96核心的EPYC 9655,搭配自家的MI300X、MI325X(刚发布),都支持单路八卡。
性能上,EPYC 9575F对比至强8592+,训练性能可领先20%,推理性能可领先8%,1000节点集群每秒可以多处理70万个Token。
当然,大量的NVIDIA GPU计算集群都搭配着EPYC处理器,AMD也做了不同规模的最佳皮牌型号的推荐。
还是EPYC 9575F对比至强8592+,训练性能可领先15%,推理性能可领先20%,还可以多处理20%的请求,并节省15%的时间。
这就是新一代EPYC 9005系列,依然是世界上最佳的云服务、企业、HPC、AI处理器,拥有更先进的工艺、更多的核心、更高的频率、更大的三级缓存、更高的性能、更高的性价比、无缝的兼容性。
Intel全新的至强6,此时也只能默默地叹息一声:既生瑜,何生亮。
接下来,我们更加期待第五代EPYC在更多的行业生根发芽、落地开花。