全爱科技 - 华为发布Atlas350 AI训练推理加速卡

华为发布Atlas350 AI训练推理加速卡

Atlas 350 是昇腾面向 AI 大模型时代的关键产品，以 “单卡强性能 + 灵衢强互联 + 超节点架构” 三重优势，构建国产普惠 AI 算力底座。

一、核心硬件规格
核心芯片：搭载最新昇腾 950PR NPU 芯片。
算力性能：
FP8 精度：1 PFLOPS
MXFP4 精度：2 PFLOPS
向量算力：较前代提升 2 倍
内存性能：采用 HBM，最大支持128GB
互联特性：
板载 4 个灵衢 (Linqu) 高速端口
支持多卡算力、内存资源池化
可 4 卡直连协同，构建小型超节点
场景优化：
优化细粒度 Cacheline 访问
推荐推理场景性能提升 2.5 倍
单卡独立运行，支持快速部署

二、关键技术亮点
灵衢高速互联
突破传统 PCIe 限制，实现卡间大带宽、低时延互联，内存统一编址，有效支撑大模型跨卡并行，解决 “显存墙” 问题。
普惠超节点
以标准 PCIe 标卡形态提供超节点能力，小规模服务器即可组建集群，降低企业 AI 算力门槛。
训练推理一体
兼顾大模型微调训练与高并发推理，适配互联网、金融、医疗等主流 AI 场景。
三、产品定位与生态
定位：作为Atlas 850/860等 AI 服务器的核心计算卡，是数据中心与企业级 AI 算力的主力通用加速方案。
生态：兼容昇腾 CANN 异构计算架构与主流深度学习框架，已被宝德、神州数码等伙伴采用，推出高密度服务器方案。
四、与前代对比（Atlas 300I/300T）
算力：950PR 显著超越昇腾 910/310，FP8/MXFP4 低精度算力大幅跃升。
互联：首创灵衢，多卡扩展能力质变。
场景：专为大模型时代推理与微调优化。
形态：标准双宽 PCIe 标卡，兼容现有机架式服务器。