华为发布Atlas350 AI训练推理加速卡

华为发布Atlas350 AI训练推理加速卡

华为发布Atlas350 AI训练推理加速卡

Atlas 350 是昇腾面向 AI 大模型时代的关键产品,以 “单卡强性能 + 灵衢强互联 + 超节点架构” 三重优势,构建国产普惠 AI 算力底座。

一、核心硬件规格
核心芯片:搭载最新 昇腾 950PR NPU 芯片。
算力性能:
FP8 精度:1 PFLOPS
MXFP4 精度:2 PFLOPS
向量算力:较前代提升 2 倍
内存性能:采用 HBM,最大支持128GB
互联特性:
板载 4 个灵衢 (Linqu) 高速端口
支持多卡算力、内存 资源池化
可 4 卡直连协同,构建小型超节点
场景优化:
优化细粒度 Cacheline 访问
推荐推理场景性能提升 2.5 倍
单卡独立运行,支持快速部署

二、关键技术亮点
灵衢高速互联
突破传统 PCIe 限制,实现卡间大带宽、低时延互联,内存统一编址,有效支撑大模型跨卡并行,解决 “显存墙” 问题。
普惠超节点
以标准 PCIe 标卡形态提供超节点能力,小规模服务器即可组建集群,降低企业 AI 算力门槛。
训练推理一体
兼顾大模型微调训练与高并发推理,适配互联网、金融、医疗等主流 AI 场景。
三、产品定位与生态
定位:作为Atlas 850/860等 AI 服务器的核心计算卡,是数据中心与企业级 AI 算力的主力通用加速方案。
生态:兼容昇腾 CANN 异构计算架构与主流深度学习框架,已被宝德、神州数码等伙伴采用,推出高密度服务器方案。
四、与前代对比(Atlas 300I/300T)
算力:950PR 显著超越昇腾 910/310,FP8/MXFP4 低精度算力大幅跃升。
互联:首创灵衢,多卡扩展能力质变。
场景:专为大模型时代推理与微调优化。
形态:标准双宽 PCIe 标卡,兼容现有机架式服务器。

订阅快讯

通过快讯订阅,您将及时收到我们的信息更新通知。