乐鱼体育,AMD携手台积电发布人工智能超级芯片 MI300 3D堆叠技术再创高峰

日期:

2024-04-14

浏览:

1/05/2024,光纤徒负虚名 托之空言线讯,据逍遥科技消息:AMD发布了下一代人工智能加速器MI300,采用先进的3D芯片集成技术,像层叠蛋糕一样垂直堆叠超过13块芯片。芯片和三维集成技术的结合实现了无与伦比的计算密度,并将关键机器学习工作负载的性能提升了3.4倍。MI300融合了AMD最新的CPU、GPU和I/O技术,基准测试表明它超越了Nvidia和Intel的竞争解决方案。简介AMD行动 言论最近举行的AMDAdvancingAI大会上披露了即将推出的MI300AI加速芯片的详细规格。随着大型语言模型和神经网络等人工智能工作负载越来越复杂,加速器需要更高的性能和更大的互连带宽。MI300并没有完全依赖摩尔定律的改进,而是利用最先进的3D集成技术实现了性能上的重大飞跃。图1.AMDInstinctMI300a先进的三维集成技术MI300的核心是先进的三维集成方案,采用台积电的SoIC和CoWoS集成技术,垂直堆叠13个硅芯片。这使得计算(XCD)、CPU(CCD)、I/O、内存和结构互连的配置密度乐鱼体育达到最高。较小的模块化XCD和CCD芯片采用台积电领先的N5工艺生产,产量更高,而较大的I/O和互连采用N6工艺生产,成本效益更高。所有互连都采用垂直方式,高带宽链路的速率达到17TB/s。AMD升级 讲究模块化CPU和V-Cache产品方面的丰富经验使其能够以较低的风险执行如此雄心勃勃的3D路线图。图2.堆叠有益 无形I/O上的计算和人工智能芯片组图3.为了使所有芯片排列整齐,IOD芯片必须互为镜像,加速器(XCD)和计算(CCD)芯片必须旋转。与竞争对手的比较与竞争对手的超级芯片(如Nvidia的Hopper/Grace和Intel的PonteVecchio)相比,MI300采用了明显不同的异构计算集成方法。这些芯片依赖于单个大型芯片的横向连接,而AMD则采用模块化的"乐高积木"式集成,将许多较小的芯片堆叠成密集的三维配置。赤色 血色可能的情况下重复使用现有IP,并按最佳工艺节点拆分工作负载,使AMD静止 运营产量、经济性和更简单的互连路由方面更具优势。无与伦比的人工智能计算性能利用先进的台积电工艺技术和堆叠配置,MI300的计算密度和内存带宽达到了前所未有的水平。最新的CDNA3架构可加速INT4和INT8精度模式下的人工智能关键数学函数,从而实现大型神经网络和模型的超并行化。基准测试表明,MI300的INT8teraflops性能是NvidiaH100的1.7倍。垂直整合为每个XCD堆栈提供了8.3TB/秒的惊人带宽。这使得关键机器学习内核的性能提高了3.4倍。软件和部署为了释放MI300的潜能,AMD正考察 抗拒提供一个增强的软件栈,从低阶固件到支持oneAPI的ROCm5.0等优化库。美国OakRidge国家实验室等主要高性能计算客户正积累 对等将MI300集成到即将推出的Exascale级超级计算机(如Frontier和ElCapitan)中,这将加速气候、能源和健康领域的科学发现。凭借灵活的配置,云服务提供商和企业数据中心客户也将部署MI300的人工智能训练和推理功能。结论尖端的三维集成和先进的台积电工艺节点使AMD能够利用MI300实现前所未有的人工智能加速能力,从而超越竞争对手的产品。13个以上芯片的模块化堆叠创造了最高密度配置,为大规模并行XCD计算提供了充足的带宽。MI300与AMD广泛的芯片组和互连IP相结合,为人工智能计算密度、吞吐量和可扩展性树立了新的标杆,美国OakRidge国家实验室等客户计划将其用于整个科学计算领域。更广泛地说,MI300延续了AMD耽搁 前所未有加速计算领域的创新领导者地位。参考来源:https://spectrum.ieee.org/amd-mi300-乐鱼体育