关注我们
荆楚网 > 新闻频道 > 舆情快讯

光合组织大会聚焦算力革新 中科曙光scaleX万卡超集群破局传统算力痛点

发布时间:2025年12月19日17:35 来源:

荆楚网讯(记者 谢宇航)在光合组织2025人工智能创新大会上,中科曙光发布并以真机展示的scaleX万卡超集群,精准瞄准当前传统算力集群的三大“卡脖子”痛点,通过架构与技术创新给出针对性解决方案,为行业规模化AI应用扫清了障碍。

当前,传统算力集群的“卡脖子”难题已成为行业智能化升级的拦路虎。具体体现在三个方面。一是规模越大、效率越低的性能瓶颈。随着大模型训练规模激增,传统千卡、万卡集群的通信延迟高、并行效率低,算力有效利用率难以提升;同时网络、存储性能受限,导致数据跨节点同步不及时、访问易冲突,再加上异构节点性能差异显著,算力管理与协同的难度持续增加。二是厂商壁垒高、选择余地小的生态困境。不同品牌的算力设备互不兼容,形成一个个“算力孤岛”;软件栈也各成体系,企业换用不同集群时,需重新搭建平台、大幅修改应用程序,基础设施成本与管理负担成倍增加,算力资源难以灵活调度。三是稳定差、成本高的运行保障短板。传统集群容错能力弱,单个节点故障易引发全局问题,导致训练任务易中断;同时单机柜功率持续提升,算力中心耗电量居高不下,能耗优化难度大;再加上高性能进口芯片渠道受限,替代产品适配周期长,企业技术应用的风险和成本增加。

针对这些痛点,中科曙光scaleX万卡超集群通过多项创新实现了精准破局。针对规模与效率的矛盾,它搭载国内首款400G类InfiniBand的原生RDMA网卡与交换芯片,实现400Gb/s超高带宽、低于1微秒端侧通信延迟,并结合正交架构设计,让超节点间的通信性能达到业内领先水平,充分释放万卡超集群算力潜力。针对生态壁垒困境,它基于“AI计算开放架构”理念设计,可适配多品牌AI加速卡和主流软件生态,打破了算力孤岛,企业无需重复搭建平台,有效降低了设施成本与应用门槛。针对稳定与成本的短板,它配备智能容错机制,单个节点故障不会影响全局,保障训练任务持续运行。同时采用液冷等技术降低能耗,再结合自主可控的硬件适配能力,既减少了整体拥有成本,也规避了对进口芯片的依赖风险。

曙光scaleX万卡超集群的发布,不仅体现了国产算力在“破卡点”上的技术突破,更让行业看到了算力基础设施从能用到好用,再到可持续发展的全面升级。随着AI从生产工具转向生产要素,中科曙光scaleX万卡超集群的落地,将为科研、工业、金融等领域的智能化转型,提供更高效、更可靠的算力支撑。

【责任编辑:卢霜】