光模块需求展望及CPO/OIO和NPO路径探讨
时间:2025年12月09日 18:42 (来源:纪要头等座)摘自:新浪财经
一、综述
1、光模块行业需求展望及CPO/OIO与NPO技术路径
在AI算力需求持续增长的背景下,高速光模块作为数据中心关键组件,正面临前所未有的发展机遇。800G光模块已实现大规模出货,主要应用于超大规模数据中心内部互联,2023年全球出货量突破400万只,预计2024年将同比增长超过60%。1.6T光模块进入量产前夜,多家头部厂商已完成样品送测,预计2024年下半年启动小批量交付,2025年有望实现规模化商用。硅光技术在800G及以上速率模块中的渗透率显著提升,已达到约35%,其在成本控制、功耗优化和集成度方面的优势日益凸显。共封装光学(CPO)技术被视为下一代高速互连的路径之一,预计在1.6T及更高速率场景中发挥重要作用,2026年或实现初步商用部署。板上光学(NPO)作为CPO的技术过渡方案,具备较低的技术门槛和较高的可实施性,预计将在2025年前后率先落地。光学I/O(OIO)技术则聚焦于芯片级光互连,致力于替代传统电I/O接口,长期看有望重构计算架构,但目前仍处于实验室研发阶段,产业化时间表尚不明确。供应链方面,VCSEL、EML激光器、硅光芯片、光电探测器等器件的国产化率逐步提高,材料如磷化铟衬底仍依赖进口。能效比成为衡量光模块性能的关键指标之一,行业平均功耗要求从800G时代的每比特1pJ向1.6T时代的0.5pJ演进。
2、光模块行业需求展望与CPO/OIO/NPO技术路径演进
当前光模块行业需求可见度显著提升,尤其在2026年需求已较为明朗的基础上,市场对2027年乃至2028年的需求预期持续上修。这一趋势主要源于海外科技巨头提前沟通未来两至三年的需求规划,反映出产业链上游供给紧张的现实。供给端除光芯片外,电芯片(如DSP)和PIC(光子集成电路)同样存在交付周期长的问题,供应商集中于博通、Marvell及TowerSemiconductor等海外企业。供需紧张背景下,光模块价格与毛利率呈现持续向好趋势,尤其在800G向1.6T升级过程中,硅光方案替代传统EML带来成本结构优化,叠加客户加急费用等因素,进一步支撑利润率超预期表现。网络架构层面,ScaleUp与ScaleOut协议差异显著,前者为高速专有局域网协议,用于卡间协同计算;后者为相对低速公有或半公有协议,支持广域连接。两者并存且不可互通,均需连接至每张AI芯片。为突破性能瓶颈,行业正推进高密度机柜(如NVIDIARubyUltra集成576个单元)和超节点架构(如谷歌I/OSuperPod达9216卡规模)。后者通过光模块实现柜间ScaleUp互联,单机柜配置96个光模块,并配套OCS光交换系统(每Pod约48台300口OCS,实际使用288口),显著提升光通信CAPEX占比。柜内连接目前仍以铜互连为主,但因信号损耗随速率上升而加剧,产业正探索(更多实时纪要加微信:aileesir)用光互联替代铜缆。共封装光学(CPO)被视为潜在解决方案,即将光引擎与交换芯片共封于同一载板,降低功耗与延迟。然而CPO面临良率控制难、故障后不可更换等维护性挑战,导致其确定性下降。相比之下,近封装光学(NPO)将光引擎置于PCB上并通过Socket插接,具备可拆卸优势,便于维修与替换,同时保留低损耗、低功耗特性,且无需DSP即可实现光电转换,降低成本。云厂商更倾向NPO方案,因其生态开放,允许第三方光模块厂商参与,避免依赖英伟达或博通的封闭集成方案。阿里已在UPN512超节点中提出NPO应用构想,另有国际头部科技公司计划落地NPO。尽管CPO曾因英伟达在2025年GTC大会展示而达到预期顶峰,但随着NPO、OCS等替代路径涌现,其中期确定性回落。总体来看,光模块厂商在NPO和OCS方向具备较强适应能力,尤其是头部企业如旭创已投入研发OCS系统设备。鉴于中国企业在光学系统制造领域的全球竞争力,预计将在OCS领域占据优势地位。NPO对光模块厂商构成直接利好,OCS影响中性偏积极,整体推动光模块公司在中期维度生存环境改善,估值逻辑得以重塑。
3、光模块估值提升的技术逻辑与市场判断依据
当前对光模块行业可给予更高估值的原因在于技术演进路径的明确化和市场需求结构的实质性转变。随着AI训练集群规模扩大,数据中心内部互联带宽需求呈指数级增长,800G乃至1.6T光模块成为刚需,推动产品迭代加速和技术壁垒提升。光模块在系统成本中的占比虽小,但其性能直接决定整体算力效率,因而具备极强的价值弹性。同时,技术门槛体现在高速率光器件、封装工艺、材料选择及批量一致性控制等多个环节,形成了较高的进入壁垒。供应链方面,元器件如EML激光器、硅光芯片、高速电容等依赖少数厂商,进一步强化了领先企业的议价能力。此外,北美云厂商资本开支持续向光通信倾斜,验证了长期需求确定性。综合来看,光模块从配套组件升级为决定算力基建上限的关键要素,叠加技术代际跃迁带来的盈利周期上行,构成了支撑更高估值水平的基本面基础。
二、Q&A
Q:1.6T光模块的发展现状与未来商业化进程如何?
A:1.6T光模块目前正处于从研发向量产过渡的阶段,多家领先光模块制造商已完成工程样品的开发并送交客户进行测试验证。该类产品主要面向AI训练集群和高性能计算中心对超高带宽的需求,支持单通道200G波特率的调制技术,采用先进的硅光集成工艺和多通道并行架构。在封装层面,1.6T模块普遍采用COUPE(共封装引擎)思路,为后续向CPO演进奠定基础。当前面临的挑战包括热密度管理、信号完整性保障以及制造良率提升等问题,但技术瓶颈已取得突破。预计2024年下半年将启动小批量交付,主要用于头部云服务商的内部验证和网络适配,2025年开始逐步放量,进入规模商用阶段。与此同时,配套的交换机芯片和系统平台也在同步升级,以支持1.6T端口的接入能力。产业链上下游协同推进使得整体进度符合预期,市场需求强劲,尤其来自北美科技巨头和国内大型AI项目的订单推动明显,未来三年内将成为光模块市场增长的核心驱动力(9.100, 0.00, 0.00%)。
Q:CPO、NPO与OIO三种技术路径之间有何区别与演进关系?
A:CPO(共封装光学)、NPO(近封装光学)和OIO(光学I/O)代表了光互连技术向更高集成度发展的不同阶段。CPO将光引擎直接与交换机ASIC共置于同一封装基板上,极大缩短电气走线长度,降低功耗与延迟,适用于1.6T及以上速率场景,预计2026年实现初步商用,是未来主流发展方向之一。NPO作为CPO的过渡方案,保留独立光模块形态,但将其贴装于PCB主板靠近交换芯片的位置,虽未实现真正意义上的共封装,但仍能显著改善高频信号损耗问题,具备更高的兼容性和可维护性,预计2025年前后率先在高端数据中心部署。OIO则更进一步,旨在将光收发功能直接集成至计算芯片内部,实现芯片级光通信,彻底取代传统的电I/O接口,理论上可带来数量级级别的能效提升和带宽扩展能力,但受限于材料、工艺和集成复杂度,目前仍处于实验室研究阶段,距离实际应用尚有较长周期。三者构成清晰的技术演进路线图:NPO为现阶段可行路径,CPO为中期目标,OIO为远期愿景,共同推动数据中心从“电主导”向“光主导”的架构转型。
Q:为何近年来光模块行业的毛利率预期持续向好,其背后的技术和供应链因素有哪些?
A:光模块行业毛利率预期持续向好的根本原因在于供需格局紧张和技术迭代双重驱动。从供应链角度看,上游材料供应严重受限,尤其是光芯片扩产周期长达一年半以上,设备采购与调试耗时接近两个季度,导致2026年产能已基本预订完毕,2027年产能也被提前锁定,形成卖方市场格局。同时,电芯片(如DSP)依赖博通、Marvell等海外厂商,交付周期长;PIC依赖TowerSemiconductor流片,也存在产能瓶颈。此外,隔离器中的关键部件——法拉第旋光片,主要由美日企业垄断,扩产节奏缓慢,造成原材料短缺并推动价格上行,进一步传导至模块成本结构。在此背景下,客户为确保供应稳定,愿意支付加急费等额外成本,直接提升了模块厂商的议价能力和盈利空间。从技术角度看,随着数据速率从800G向1.6T演进,硅光技术逐步替代传统的EML方案,具有更高的集成度和更低的单位成本,带来毛利率结构性提升。更重要的是,高带宽需求推动网络架构变革,如谷歌I/OSuperPod采用超节点,通过光模块实现柜间ScaleUp互联,单机柜配置高达96个光模块,并引入OCS光交换系统,大幅增加光通信在整个AI集群CAPEX中的比重。这种趋势强化了光模块的战略价值,使其不再只是边缘组件,而是决定系统性能的关键环节,从而支撑更强的定价权。综合来看,供给约束带来的紧缺溢价、客户支付意愿增强以及技术升级带来的成本优化共同作用,使得行业毛利率呈现持续向好趋势,且未来仍有进一步超预期的空间。
Q:NPO相较于CPO在技术路径上的优势体现在哪些方面,为何更受云服务商青睐?
A:NPO(近封装光学)相较于CPO(共封装光学)在技术可行性和商业生态层面展现出多重优势,因而更受云服务商青睐。首先,在技术实现上,CPO要求将光引擎与交换芯片或GPU共同封装在同一载板甚至中介层(interposer)上,虽然能极大缩短电信号传输距离,降低功耗与延迟,但面临严重的良率控制难题。由于光引擎与主芯片必须同步完成封装,一旦任一出现缺陷,整个封装单元即告报废,导致整体良品率下降,制造成本显著上升。此外,CPO方案一旦投入使用后发生故障,无法单独更换光引擎,必须整体替换主板或芯片模组,运维成本极高,这对大规模数据中心而言是难以承受的风险。而NPO则采取“近而不共”的策略,将光引擎独立封装在PCB上,并通过短距离电气连接与主芯片相连,保持了物理上的可分离性。这种设计允许光引擎以Socket插槽形式安装,具备良好的可维护性和可替换性,极大降低了后期运维难度与成本。其次,在功耗与性能方面,NPO虽略逊于CPO,但仍远优于传统光模块。其电气连接路径极短,信号损耗可控,且多数情况下无需配备高功耗的DSP芯片进行信号调理,从而实现了功耗与成本的双重下降。再次,在生态系统开放性上,NPO更具优势。CPO往往由系统厂商(如英伟达、博通)提供高度集成的封闭解决方案,绑定特定硬件平台,限制了云厂商的选择自由。而NPO允许第三方光模块厂商独立开发产品,云服务商可根据需求灵活选型,构建更加开放、多元的供应链体系。例如阿里的UPN512超节点已明确提出采用NPO架构,体现了其对自主可控与生态多样性的追求。最后,考虑到当前CPO在量产可行性、可靠性验证等方面仍处于早期阶段,而NPO基于现有光模块技术演进,成熟度更高,过渡风险小,因此成为更具现实操作性的中期解决方案。综上所述,NPO在可维护性、良率控制、生态开放性及实施可行性方面的综合优势,使其成为当前阶段云服务商更为倾向的技术路径。
Q:为何当前市场对光模块的估值水平可以高于以往?
A:当前市场对光模块估值提升的根本原因在于其在现代数据中心尤其是AI算力架构中战略地位的显著上升。过去市场焦点主要集中于CPU等通用计算单元,而忽视了数据流动效率对整体性能的制约作用。随着大模型训练对算力集群规模和节点间通信带宽提出极高要求,光模块作为实现高密度、低延迟互连的关键组件,其技术先进性和供应能力直接决定了系统的可扩展性与运行效率。800G和1.6T高速光模块的商用进程加快,推动行业进入新一轮技术升级周期,带来单价和毛利率的双重提升。同时,光模块的技术复杂度不断提高,涉及高速光电、先进封装(如CPO)、热管理与信号完整性控制等多领域交叉,形成深厚护城河。主要云服务商加大在光网络方面的资本投入,显示出对其长期价值的认可。这些因素共同促使资本市场重新评估光模块产业的成长性、盈利能力和稀缺性,从而支持更高的估值中枢。
Q:光模块在AI数据中心中的具体作用及其对整体系统性能的影响是什么?
A:光模块在AI数据中心中承担着连接服务器节点、交换机以及存储设备之间的高速数据传输任务,是实现大规模并行计算和分布式训练的基础保障。在AI训练场景下,成千上万的GPU需频繁同步梯度,对网络带宽、延迟和吞吐量提出极高要求。若光模块速率不足或稳定(更多实时纪要加微信:aileesir)性差,将导致通信瓶颈,严重影响训练效率甚至造成算力浪费。例如,从400G升级至800G光模块,可在不增加物理链路数量的前提下翻倍传输能力,显著降低单位比特传输成本和功耗。此外,先进光模块采用相干技术、硅光集成和共封装光学方案,有助于缩小体积、提高端口密度并减少信号衰减。这不仅提升了机柜空间利用率,也增强了系统的可维护性和能效比。因此,高性能光模块的存在直接决定了AI集群的扩展能力、训练速度和运营经济性,已成为制约整体系统性能的关键变量之一。