光合组织大会聚焦算力革新中科曙光scaleX万卡超集群破局传统算力痛点

发布时间：2025年12月19日17:35 来源：

荆楚网讯（记者谢宇航）在光合组织2025人工智能创新大会上，中科曙光发布并以真机展示的scaleX万卡超集群，精准瞄准当前传统算力集群的三大“卡脖子”痛点，通过架构与技术创新给出针对性解决方案，为行业规模化AI应用扫清了障碍。

当前，传统算力集群的“卡脖子”难题已成为行业智能化升级的拦路虎。具体体现在三个方面。一是规模越大、效率越低的性能瓶颈。随着大模型训练规模激增，传统千卡、万卡集群的通信延迟高、并行效率低，算力有效利用率难以提升；同时网络、存储性能受限，导致数据跨节点同步不及时、访问易冲突，再加上异构节点性能差异显著，算力管理与协同的难度持续增加。二是厂商壁垒高、选择余地小的生态困境。不同品牌的算力设备互不兼容，形成一个个“算力孤岛”；软件栈也各成体系，企业换用不同集群时，需重新搭建平台、大幅修改应用程序，基础设施成本与管理负担成倍增加，算力资源难以灵活调度。三是稳定差、成本高的运行保障短板。传统集群容错能力弱，单个节点故障易引发全局问题，导致训练任务易中断；同时单机柜功率持续提升，算力中心耗电量居高不下，能耗优化难度大；再加上高性能进口芯片渠道受限，替代产品适配周期长，企业技术应用的风险和成本增加。

针对这些痛点，中科曙光scaleX万卡超集群通过多项创新实现了精准破局。针对规模与效率的矛盾，它搭载国内首款400G类InfiniBand的原生RDMA网卡与交换芯片，实现400Gb/s超高带宽、低于1微秒端侧通信延迟，并结合正交架构设计，让超节点间的通信性能达到业内领先水平，充分释放万卡超集群算力潜力。针对生态壁垒困境，它基于“AI计算开放架构”理念设计，可适配多品牌AI加速卡和主流软件生态，打破了算力孤岛，企业无需重复搭建平台，有效降低了设施成本与应用门槛。针对稳定与成本的短板，它配备智能容错机制，单个节点故障不会影响全局，保障训练任务持续运行。同时采用液冷等技术降低能耗，再结合自主可控的硬件适配能力，既减少了整体拥有成本，也规避了对进口芯片的依赖风险。

曙光scaleX万卡超集群的发布，不仅体现了国产算力在“破卡点”上的技术突破，更让行业看到了算力基础设施从能用到好用，再到可持续发展的全面升级。随着AI从生产工具转向生产要素，中科曙光scaleX万卡超集群的落地，将为科研、工业、金融等领域的智能化转型，提供更高效、更可靠的算力支撑。

【责任编辑:卢霜】

精彩图片

鄂ICP备 13000573号-1 鄂公网安备 42010602000206号

版权为荆楚网 www.cnhubei.com 所有未经同意不得复制或镜像

光合组织大会聚焦算力革新中科曙光scaleX万卡超集群破局传统算力痛点

这所军校的“兵娃娃”46载接力，守护盲人宿舍

宜昌清晨上演绝美 “满江红” 朝霞

“兵娃娃”46载接力守护盲人宿舍

光合组织大会聚焦算力革新 中科曙光scaleX万卡超集群破局传统算力痛点

这所军校的“兵娃娃”46载接力，守护盲人宿舍

宜昌清晨上演绝美 “满江红” 朝霞

“兵娃娃”46载接力守护盲人宿舍

光合组织大会聚焦算力革新中科曙光scaleX万卡超集群破局传统算力痛点