国内首个光互连光交换 GPU 超节点的发布,标志着我国在高性能计算和人工智能基础设施领域迈出关键一步。这一技术突破不仅填补了国内空白,更对全球算力格局、产业链生态和政策导向产生深远影响。
投顾姓名:黎俊 执业编号:A0580624120006
2025-07-28 16:48:22
0

今天7月28日,上海仪电联合曦智科技、壁仞科技、中兴通讯000063)发布国内首个光互连光交换GPU超节点,光跃LightSphere X。

标志着我国在高性能计算和人工智能基础设施领域迈出关键一步。这一技术突破不仅填补了国内空白,更对全球算力格局、产业链生态和政策导向产生深远影响。

一、技术突破:重构算力基础设施的底层逻辑

光互连光交换技术通过硅光芯片实现 GPU 集群的超高速连接,其核心优势体现在三个层面:

  1. 性能跃升:张江实验室研发的光互连芯片支持每秒 38Tb 的数据传输速度,可在 1 秒内完成大模型 4.75 万亿参数传递,较传统电互连带宽提升数十倍。这种能力直接解决了千亿级参数大模型训练中因带宽不足导致的系统延迟和宕机问题

  2. 架构创新:分布式光交换(dOCS)技术实现动态拓扑调整,例如在训练过程中可将未使用的带宽重定向至需求维度,使 GPU 利用率接近 100%,模型训练效率提升 3.37 倍。相比之下,NVIDIA NVL-72 架构的 GPU 浪费率高达 1/9,而光跃 LightSphere X 的 GPU 浪费率几乎为零

  3. 容错能力:光交换技术通过可编程光路绕过故障节点,将单个芯片故障的影响范围缩小至单服务器内,而传统电互连架构中单个交换机故障可能导致整个集群性能下降。例如,在谷歌 TPU V4 集群中,单个 TPU 故障需迁移整个作业,而光互连方案可在秒级完成故障切换并恢复训练

二、产业影响:重塑全球算力竞争格局

  1. 国产替代加速:该超节点采用壁仞科技自研 GPU 与曦智科技硅光芯片,实现从芯片到系统的全栈自主可控。这打破了 NVIDIA、AMD 等国际巨头在高性能计算领域的垄断,尤其在 “东数西算” 等国家战略中,国产方案可避免供应链风险,降低对进口技术的依赖。

  2. 产业链价值重构

    • 上游:光模块、光芯片等核心部件需求激增。全球光互连市场规模预计 2023-2028 年复合增长率达 20.62%,亚太地区贡献 62% 增长。国内企业如曦智科技、光迅科技将直接受益于 1.6T 光模块(2025 年出货量预计突破 100 万台)和 CPO 光电共封装技术的商业化。

    • 下游:智算中心建设成本显著降低。光跃 LightSphere X 支持万卡级弹性扩展,部署成本较传统方案下降 30% 以上,且可分阶段建设以匹配算力需求。上海仪电智算中心的落地案例将成为标杆,带动金融、科研、互联网等行业采购国产方案。

  3. 国际竞争新赛道:国内方案在成本和扩展性上已具备全球竞争力。例如,InfiniteHBD 架构的单位成本仅为 NVIDIA NVL-72 的 31%,且支持动态重构拓扑以适应不同训练任务。这可能迫使国际巨头加速技术迭代,同时为国内企业争取海外市场份额创造机会。

三、政策与市场:双重驱动下的增长红利

  1. 政策红利释放:工信部《算力互联互通行动计划》明确 2028 年实现全国公共算力标准化互联,地方政府如浙江、上海已推出专项补贴和投融资支持。光互连技术作为 “东数西算” 的关键支撑,将优先获得政策倾斜,例如上海仪电智算中心的落地即获地方政府算力调度平台支持

  2. 商业模式创新:算力租赁、智算调度平台等新业态崛起。光跃 LightSphere X 通过动态调整超节点规模,可将算力资源利用率提升至 90% 以上,较传统集群的 50% 显著优化。这为云计算厂商、AI 初创企业提供了低成本、高弹性的算力服务选择。

  3. 投资机会凸显:光互连产业链上下游迎来爆发期。上游光芯片(如硅光调制器、激光器)、光模块(1.6T 速率),中游服务器集成(中兴通讯、浪潮),下游算力服务(阿里云、腾讯云)均将受益。据预测,2025 年国内光互连市场规模将突破 500 亿元,年复合增长率超 30%

四、挑战与未来:技术成熟度与生态协同

  1. 技术挑战:光交换硬件成熟度和系统同步仍需提升。例如,Nvidia 研究指出 OCS 在故障恢复时面临纳秒级同步难题,而国内方案需进一步验证大规模集群下的稳定性。此外,CPO 光电共封装技术虽可降低功耗 70%,但量产良率和成本控制仍是瓶颈。

  2. 生态协同:需构建开放兼容的产业联盟。光跃 LightSphere X 已与中兴通讯、仪电等企业合作,但仍需与主流 AI 框架(如 PyTorch、TensorFlow)和云平台(如华为云、百度智能云)深度适配,以扩大应用场景

  3. 长期趋势:光互连技术将向更高集成度演进。例如,张江实验室的 38Tb/s 芯片和曦智科技的 128x128 光子矩阵,预示未来光计算与光存储的融合。同时,与量子通信、存算一体等技术的结合,可能催生新一代智能算力基础设施。



总结

国内首个光互连光交换 GPU 超节点的发布,是我国从 “算力消费国” 向 “算力输出国” 转型的里程碑。其技术突破、产业带动和政策协同效应,将重塑全球高性能计算市场格局,为人工智能、大数据等战略产业提供底层支撑。未来,随着技术成熟度提升和生态体系完善,光互连技术有望成为我国在数字经济时代的核心竞争力之一,推动 “中国算力” 走向世界舞台中央。

风险提示:以上内容仅供参考和学习使用,不作为买卖依据,投资者应当根据自身情况自主做出投资决策并自行承担投资风险。市场有风险,投资需谨慎!
免责声明:以上内容(包括但不限于图片、文章、音视频等)及操作仅供参考,我司为正规投资咨询经营机构,不指导买卖,不保证收益,投资者应独立决策并自担风险。

相关内容