AMD实现处理器效能提升30倍!比原定时间提早一年

  发布时间:2024-12-23 23:17:27   作者:玩站小弟   我要评论
12月13日消息,早在四年前,AMD就曾设定目标,到2025年EPYC系列服务器处理器和Instinct系列AI芯片的能效,较2020年提高30倍。如今,MI300X AI芯片基本上实现目标,时间提了 。

12月13日消息,实时间早在四年前,现处效AMD就曾设定目标,理器到2025年EPYC系列服务器处理器和Instinct系列AI芯片的提升提早能效,较2020年提高30倍。倍比如今,原定MI300X AI芯片基本上实现目标,实时间时间提了早一年。现处效

据THW报道,理器AMD两个64核心EPYC 9575F CPU、提升提早八个Instinct MI300X AI芯片及2304GB DDR5内存的倍比服务器,Llama3.1-70B(vLLM 0.6.1.post2、原定TP8)测试推理性能,实时间用一组复杂计算确定系统能源效率,现处效并与2020年的理器旧机器比较,

AMD实现处理器效能提升30倍!比原定时间提早一年

结果显示,新机能源效率是旧机的28.3倍。

不过,AMD并未透露2020年的旧机是何规格。但大概率是EPYC 7002系列,Zen 2架构,每个CPU最多64个核心,以及CDNA 1架构Instinct MI100 AI芯片。

AMD表示,除了强力硬件改进,更高性能效率是架构进步,加上软件优化结合,是跳跃式进展。

今年10月份的Advancing AI 2024大会上,AMD正式发布了新款AI芯片——GPU加速卡“Instinct MI325X”。它在大获成功的MI300X基础上再进一步,主要是增强了HBM内存部分。

MI325X配备了多达256GB HBM3E内存,相比于MI300X又增加了64GB。

MI325X也支持八块并行组成一个平台,这就有多达2TB HBM3E、48TB/s带宽,总的性能高达FP16 10.4 PFlops(每秒1.04亿亿次)、FP8 20.8 PFlops(每秒2.08亿亿次)。

对比NVIDIA H200,无论单卡还是八卡平台,不同大模型推理的性能都可以领先20-40%

训练性能方面,单卡可领先H200 10%,八卡平台则是持平。

MI325X加速卡和平台将在四季度内投产,而合作伙伴的整机系统、基础架构解决方案,将从明年第一季度起连续推出。

  • Tag:

相关文章

最新评论