【观察】光互连VS铜互连,OIO有望成为芯片间互连终极方案

来源:世展网 分类:光电行业资讯 2025-01-20 17:29 阅读:685
分享:

2025年慕尼黑上海光博会LASER Photonics China

2025-03-11-03-13

距离49

导读:

互连基座之光:云厂商自主采购提升也驱动光模块市场在 2025 年仍然保持高速增长。2029年,1.6T、3.2T、LPO 及 CPO 产品合计销售规模将达到 100 亿美元。

互连基座之铜:推理自组网需求增加将带来 Scale Out 网络 AEC 用量增加以及 Scale Up 网络 PCIe 应用增加。推理追求低延迟和高吞吐,CSP自组网趋势下以 UALink 为代表的 Scale Up 协议(基于 PCIE)和 UEC为代表的 Scale Out 协议(以太网)渗透加速,私有协议(IB、NVLink)转到更开放协议(以太网、PCIE),客户采购自主权提升(交换机、光模块、铜缆),第一层互连场景下通过增加 retimer 芯片扩展传输距离的 AEC凭借可靠性稳定性高、功耗及成本低有望被广泛使用。柜内连接方面, PCIE 将成为 NVLink 及 NVSwitch 的替代品。 

01

光互连:推理需求增加大厂自主采购话语权提升,推动 25年可插拔依然高需求,硅光方案渗透率快速提升

1.1. 光模块:下游需求维持高景气,CX8 网卡升级助力 1.6T 光模块放量 

2024 年北美云厂商资本开支维持快速增长且AI 投资意愿高,光模块下游需求持续高景气。2024 年,Alphabet、亚马逊、苹果、Meta 和微软的支出明显高于 2023 年,在 2024 年第三季度五家公司合计支出总额同比增长 59%,且大部分投资都将用于人工智能基础设施:服务器、数据中心和网络设备,也包括其中用到的光连接(光模块、光芯片等)。

大厂资本开支不断增加促使光模块公司出货量持续高增,市场规模保持高速增长。受海内外云厂商等对于 AI 方面投入持续增加,2024 年中际旭创、新易盛等头部光模块公司营收利润保持翻倍以上同比增长,市场规模持续攀升。据 LightCounting 数据,2024 年二季度全球领先光模块供应商总销售额超 30 亿美元,较上年同期增长超10 亿美元,其中以太网光模块因对400G 和800G 的强劲需求而同比增长100%。

根据公司定期报告披露数据,截至 2024 年第三季度,我国光模块头部厂商中际旭创 /新易盛/天孚通信(光引擎)分别实现营业收入 173.13 亿元/51.30 亿元/23.95 亿元,同比增速分别达到 146.26%/145.82%/98.55%,基本均实现翻倍及以上增长,头部公司显著受益 AI 需求提升。LightCounting 预计2024 年全球以太网光模块市场规模将增长 60%,25 年将维持这一高增速。此外,2024 年无线前传和 AOC 市场增速将显著加快。 

光模块需求量持续增加的背后逻辑:推理兴起后大厂自主采购比例提升。据 Light Counting 数据,AI 集群用以太网光模块市场规模 2024 年将翻倍,并将在 2025 年和2026 年保持强劲增长。因4×100G 和 8×100G 光模块需求太过旺盛,LightCounting预计 4×100G 光模块市场规模在 2026 年将达到40 亿美元,8×100G 光模块市场规模在 2026 年将超过70 亿美元。

到 2029 年,1.6T、3.2T、LPO 及 CPO 产品合计销售规模将达到 100 亿美元。推理需求增长后,推理网络建设不再受英伟达打包方案掣肘的谷歌、Meta、亚马逊等 CSP 厂商独立采购需求从 2025 年开始将显著增长,成为以太网光模块市场主要驱动力。英伟达作为IB 网络主要倡导方,在 23 年起也开始推出以太网网络连接方案,以太网作为更加开放、通用的协议标准,未来在AI集群尤其是CSP 厂基于自研ASIC 芯片建设的数据中心中应用将不断增加。 

2025 年光模块速率进一步迭代升级,1.6T 方案有望出货上量。2024 年 3 月 18 日英伟达 GTC 开发者大会上发布了全新 Blackwell 平台系列产品,其中包括 Quantum X800 交换机、CX8 网卡和 Spectrum X800 交换机等方案。全新的 IB 交换机 Quantum-X800 是英伟达第一款采用 200G Serdes 的交换机产品,通过 72 个 OSFP 端口提供144 个 800G 端口,端口能力可达 115.2T。

2025 年随着英伟达 200G Serdes 技术的完善推广和 CX8 网卡组网方案的推出,对配套的 AI 数据中心光模块速率需求升级到1.6T,2025 年将成为 1.6T 光模块上量的元年。1.6T 光模块产时代,具有技术优势、规模效应和成本控制能力的头部光模块企业如中际旭创等将脱颖而出,有望在初期凭借领先的研发量产优势占据更大的市场份额,享受产品迭代初期的红利。 

1.2. 光芯片:EML 供需缺口仍存,1.6T 硅光方案将成为主流 

2024 年全球光芯片市场规模有望增长超 50%。据和弦产业研究中心报告,2023 年全球光芯片市场规模约为 154 亿元人民币,较 2022 年下降 15%,主要源于接入网市场对光芯片需求和价格同步下降。在AI 带动高速率光芯片持续需求下,预计2024年全球光芯片市场将迎来强劲复苏,市场规模增速有望超 50%。

2023 年中国光芯片市场规模约 45 亿元人民币,较 2022 年下降约 21%。随着工业 PON 技术的普及和国内 AI 带动数通市场对于 100G/400G 光模块需求量增长,中国光芯片市场预计将迎来复苏。 

光芯片供需仍存缺口,新兴光芯片厂商迎来发展机遇。2025 年亚马逊、微软、Meta等大厂 800G 光模块采购纷纷上量,整体对800G 光模块需求量将持续高增,同时英伟达和谷歌 1.6T 光模块方案将开始部署,对于100G EML 芯片需求仍较为迫切。

从供给来看,Lumentum 等传统大厂扩产速度较慢且扩产仍需一定时间进行设备采购及良率提升,预计2025 年上半年光芯片环节仍存在供需紧张问题,源杰科技、索尔思光电、AOI 等新兴光芯片厂商有望把握住短期 100G EML 光芯片的供需缺口实现客户导入。 

硅光子产业链不断成熟,高速率场景下优势凸显,渗透率有望快速提升。传统可插拔光模块将电芯片、光芯片、透镜、对准组件和光纤端面等多种光学器件封装集成在一起。硅光模块采用先进的硅光子技术,使用 CMOS 工艺来开发和集成光器件,通过蚀刻和外延生长等微加工技术,精确制备出调制器、接收器等关键光电子器件。

集成度更高,能耗更低,且光器件进一步集成、CW 光源可一拖二或一拖四光路,极大的节省了光芯片的成本,性价比高且在价值量高的高速光芯片场景下优势更加凸显。据LightCounting 预测,基于硅光的光模块市场份额将从 2022 年的24%增加到 2028 年的44%。 

2029 年硅光芯片市场规模将超30 亿美元,年复合增长率约25%。LightCounting 预计,基于GaAs 和InP 的光模块的市场份额将逐步下降,硅光子(SiP)和铌酸锂薄膜(TFLN)光子集成电路的份额将有所上升,LPO 和CPO 的采用也将促进SiP 甚至TFLN 器件的市场份额增长。硅光芯片的销售额将从2023 年的8 亿美元增至2029年的略高于 30 亿美元。采用 TFLN 调制器的 PIC 销售额将从现在的几乎零增长到2029 年的7.5 亿美元。

1.6T 可插拔光模块时代,硅光将成为主流。 

1.3. CPO&OI/O:数据中心光互连未来发展方向,产业侧&技术侧不断成熟 

远期看,可插拔式光模块受限于能耗指数级增长,能够降低功耗的 CPO 将成为未来数据中心光通信领域重要发展方向。根据 Science 杂志文章《Recalibrating global data center energy-use estimates》数据,全球数据中心能耗 2010-2018 年仅增长了 8%,外推到 2022-2023 年仅增长 2%-3%,主要原因在于云厂商将算力从企业级数据中心向超大型数据中心转移提高效率、以及服务器级内存效率稳步提升。从能耗分布来看,数据中心能源消耗主要来自于服务器和基础设施。

随着数据中心 PUE 值降低及效能比提升,服务器电力消耗逐渐成为主要部分。存储消耗占比也有较大提升但占比较低,基础设施消耗占比逐渐下降。网络消耗占比一直处于较低水平, 2012/2018/2022 年数据中心网络侧用电占比分别仅有 1%/2%/3%。

随着 800G 等高速光模块渗透率提升,功耗将呈指数级增长,预计到 2028 年光学部分能耗在数据中心占比将超过 8%,传统可插拔式光模块进一步提速将受到功耗急剧增长限制,而 CPO相比可插拔光模块能够实现 25%-30%的功耗节省。 

OIO 光学互连有望成为芯片间互连终极方案。相比传统方案,OIO 具备高速的数据传输速率,能够显著提升芯片间的数据交互效率,满足如人工智能、大数据处理等对数据传输速度极为严苛的应用场景需求。此外,OIO 采用光传输,不受电磁干扰影响,有望成为芯片间互连的终极方案。

Ayar Labs 的封装内 Optical I/O 解决方案消除了传统铜基系统中的瓶颈,实现了比传统互连(可插拔光模块+电气 Serdes)高 5 至 10 倍的带宽,延迟降低 10 倍,能源效率提高 4 至 8 倍,凭借极强的传输速率优势,OI/O 有望成为算力芯片需求不断迭代下芯片间互连的终极方案。 

向 CPO 及 OIO 技术路线迈进过程中,先进封装将扮演重要角色。当前 CPO 以及OIO 仍处于产业早期发展萌芽期,但各家大厂如博通、台积电均已陆续推出 CPO 方案,CPO 技术难点在于封装和低损耗光线互联,封装企业如台积电已经走到台前,预计在光模块向 CPO 演进的过程中先进封装将扮演重要角色,且因光互连的基础是硅光,在硅光领域领先的厂商有望在 CPO 时代取得一定优势。 

2033 年 CPO 及 OIO 市场规模将达到 26 亿美元。当前 CPO 及 OIO 市场仍处于早期探索发展阶段,市场空间有限,随着技术方案不断成熟,市场空间将快速增长。根据 Yole 预测,2022 年全球数据中心光学互连领域市场空间约 3800 万美元,预计2028 年将达到 1.37 亿美元,2033 年将达到 26 亿美元。 

02

铜互连:英伟达 GB200 铜缆方案引发连接方式变革,推理时代 AISC 崛起 CSP 厂话语权增加带动 AEC 用量增长

2.1. 英伟达 GB200 铜互连方案带动数据中心铜连接需求增长 

GB200 采用铜背板互联方式,AI 服务器柜内场景高速铜互联有望成为趋势。英伟达在 2024GTC 大会上发布 GB200 超级芯片以及 NVL72 机柜方案。其中 NVL72 机柜方案通过 Blackwell 和 Switch 芯片的铜连接使整个机柜变成一个超级 GPU。每个NVL72 机柜主体包含 18 个 compute tray 和 9 个 NVLINK Switch tray,每个 compute tray 中有 2 颗 GB200 超级芯片—2 颗 B200 GPU+1 颗 Grace CPU。

GB200 内部之间通过 NVLINK C2C 连接。每台 NVLINK Switch 则由两颗 NVLink Switch4 芯片组成,每颗 B200 芯片通过 NVLink 共 1800GB/s 双向带宽连接到 18 颗 NVLink Switch上。B200 芯片与 NVLink Switch 的互联为高速铜缆互联主要应用场景。 

NVL72 中 NVSwitch 到 Blackwell 及 Overpass 跳线部分采用铜缆方案创造铜连接增量。NVL72 中采用 NVSwitch 将机柜内的 72 颗 B200 高速连接起来形成一个整体。据 Semianalysis 分析,每个 BlackwellGPU 都连接到一个安费诺 Paladin HD 224G连接器,每个连接器有 72 个差分对(对应每颗 B200 900GB/s*8*2 的 NVLINK 收发带宽),连接到背板 Paladin 连接器后接下来使用了 Skew Clear EXD Gen2 电缆背板连接到 Switch tray 的 Paladin HD 背板连接器(每个连接器有 144 个差分对),再通过OverPass 跳线连接到 NVSwitch 芯片。 

铜互连具备成本、功耗优势,NV 引领带动产业发展。无源铜缆 DAC 相比 AOC 天然具备更加稳定、失效率低的优势。根据 ODCC 白皮书数据,单根 25G DAC 的价格仅为 25G AOC 的 1/3 至 1/4。高速铜缆,无论是 DAC 还是 AEC 相比 AOC 天然的稳定性优势和成本优势对数据中心内整体网络的稳定性和成本的影响非常显著。 

2.2. AEC 将成为云厂商自组网首选方案 

AEC 有源电缆为高速互连时代下 DAC 直连铜缆的升级迭代。早期高速铜缆一般指 DAC(Direct Attach Cable)即直连线缆或直连铜缆,是无源线缆。但是随着所需支持的传输速率的提升,铜缆的损耗过大而无法满足互连长度需求的时候,出现了 ACC(Active Copper Cable)即有源铜缆,其原理是在线缆 Rx 端加入一定能力的线性 Redriver 来提供信号的均衡和整形中继,延长端到端的传输距离。

在 56G-PAM4链路需求到来之时,由于 PAM4 调制模式下较低的 SNR,当前 DAC 和 ACC 能支持的传输距离更有限,AEC(Active Electrical Cable)应运而生,其原理是在线缆两端加入 CDR(时钟数据恢复)对电信号进行重新定时(Retimer)和重新驱动,补偿铜缆损耗能力比 ACC 更强,且可有效阻隔抖动(Jitter)的传递,支持的端到端连接距离比 AC 更长。整体来看,AEC 可传输距离在铜缆中支持传输距离最长。 

AI 应用爆发,未来算力开始强调推理端。2024 年海内外 AI 应用端层出不穷,国内走在前列的字节豆包大模型,5 月发布以来日均 tokens 从 1200 亿激增至 12 月 18 日的 4 万亿,AI 应用端正快速成长。算力侧,根据 IDC 预测,未来 5 年国内训练、推理算力年复合增速分别为超 50%和 190%,2028 年推理算力规模将超过训练算力。

推理兴起+大厂自研 ASIC 芯片背景下,CSP 厂商自主采购话语权增大,AEC 为最优选择,且 PCIE 有望崛起。推理端算力要求降低,自研 AISC 芯片便能够胜任,对于已经组建的万卡、十万卡集群来说,链路稳定性成为重中之重,铜缆方案 AEC天然具备可靠性优势且成本、功耗更低,为 CSP 厂商最优的互连方案。

此外,CSP厂商采购话语权提升后可自主选择交换机、光模块、互连方式等,柜内 PCIE 协议有望去替代英伟达的私有协议 NVLink,PCIE Swtich 有望替代 NV Swtich。此外, Scale Up 网络带宽更高,也意味着柜内高速互连技术需求进一步提升 

未来五年高速线缆市场有望翻三倍,其中 AEC 凭借传输距离优势占比将更高。随着大厂自研 ASIC 组网趋势,AI 数据中心对 AEC 需求带动 AEC 市场空间快速增长。而 DAC 由于无源不耗电,仍将是大多数据中心尤其非 AI 数据中心选择的方案之一。根据 Lightcounting 预测数据,到 2029 年全球高速线缆(DAC+ACC+AEC+AOC)市场规模将达到 67 亿美元。 

03

电源:AI 时代用电需求大幅提升,电源环节有望量价齐升4.1. 算力需求带动用电需求大幅上升

服务器功率是指服务器在运行时消耗的电能,其大小受到多种因素的影响: 

CPU:作为服务器的核心组件,不同型号、核心数量和频率的 CPU 功耗差异较大,约为 220W-270W。

GPU:在需要图形处理或加速计算的服务器中,GPU 功耗不容小觑。例如,英伟达的 A100 GPU 功耗为 300W-400W 左右,而更高级的 H100 GPU 功耗则更高。

内存:内存模块的数量、类型和频率都会影响服务器的功率。一般来说,DDR4内存单条功耗在 5W-10W 左右,DDR5 内存功耗相对更高。

硬盘:硬盘驱动器(HDD)和固态硬盘(SSD)等存储设备也会消耗一定的功率。普通的机械硬盘功耗在 10W-15W 左右,而企业级的高性能 SSD 功耗可能在 5W-10W 之间。

网络接口卡(NIC)和交换机等网络设备:一般每张网卡的功耗在 5W-10W 左右。

服务器实际运行负载:当服务器处于高负载状态,处理大量数据、运行复杂的计算任务或同时服务多个用户时,各个硬件组件的使用率上升,功率也会相应增加。相反,在低负载或空闲状态下,服务器功率则会降低。

服务器的散热系统:需要消耗一定的功率来维持服务器的正常工作温度。风冷散热系统中的风扇需要不断转动来带走热量,其功率一般在几十瓦到上百瓦不等,具体取决于风扇的数量和尺寸。液冷散热系统虽然散热效果更好,但冷却液的循环泵也需要消耗一定的电力。冷却系统占数据中心总电力消耗的 40%,是仅次于服务器本身的第二大电力消耗来源。AI 和高性能计算的发展导致数据中心的芯片、服务器和机架配置越来越密集,这种高密集度需要更强大的冷却系统来确保设备能在安全的温度范围内运行,以维持系统的性能和可靠性。

算力计算效率需求大幅提升,高性能导致功耗上升。随着 AI 大模型的不断更新发展,计算效率得到提升,AI 大模型已然具备复杂的数据处理能力和深度学习能力。但高性能往往意味着高功耗,AI 服务器的核心处理器,包括 CPU、GPU、NPU、 ASIC、FPGA 等,以及内存、网络通信等芯片元器件的性能和功耗水平都在提升。相比于传统的普通服务器,AI 服务器的功率高出将近 6-8 倍,电源的需求也将同步提升 6-8 倍。通用型服务器通常只需要 2 颗 800W 服务器电源,而 AI 服务器的电源需求为 4 颗 1800W 高功率电源,服务器能耗成本从 3100 元直接飙升到 12400 元,约为 3 倍。 

NVIDIA 芯片的更新迭代,功耗持续增长。通过对比 2024 年 NVDIA 发布的基于Blackwell 架构的 B200/ GB200 芯片和先前的产品,包括 H100/ H200/ B100 等, NVIDIA 芯片随着不断更新,额定功率呈现持续增长趋势。B200/ GB200 的功率分别为 1000W/ 2700W,相较 H100/ H200/ B100 700W 的功率呈现大幅增长。 

NVIDIA 根据不同芯片构建的服务器所需电源功率持续增长。通过对比 NVIDIA 基于不同芯片所构建服务器,可以发现服务器所需电源功率伴随更新升级持续增长,今年 GTC 发布的基于 GB200 芯片的 NVL72 架构所需功率相较上一代产品提升了 6倍左右。 

DGX A100 服务器的功率:DGX A100 服务器的额定功率为 8 个单元,每个单元需要 3KW 的功率,总计 24KW。

DGX H100/H200 服务器的功率:DGX H100/H200 服务器的额定功率为 8 个单元,每个单元需要 3.3KW 的功率,总计 26.4KW。

NVL72 架构的功率:NVL72 机架的功耗大约为 120KW,考虑冗余后,总功率可达到 198KW。

 2025 年 AI 产业主要有两个比较大的变化:推理兴起带来的产业链各环节重塑以及国内以字节豆包大模型为代表的国产AI的崛起。推理侧,云厂商自研ASIC芯片用量提升,自组网需求增加将带来 Scale Out 网络 AEC 用量增加以及 Scale Up网络 PCIe 应用增加。此外光模块领域,云厂商自主采购提升也驱动光模块市场在2025 年仍然保持高速增长,而 1.6T 时代硅光将成为主流方案,且硅光还是向下一代光互连技术 CPO 演进的必经之路,硅光领域先发厂商将具备领先卡位优势。

国产AI 兴起侧:推理带来的另一个变化是相比于 AI 大模型的训练,AI 应用的重要性将越来越强。AI 时代所有应用终将倍重写,且 AI 应用是构成 AI 产业链生态的核心一环。相比 AI 训练侧在硬件 GPU 卡等方面的硬差距,中国打造应用的能力是世界顶尖的,有望在应用侧实现追赶甚至弯道超车,国产算力链条存在机会。因此,2025年我们建议关注 AI 算力向推理侧转移带来的新技术、新产品需求,聚焦 AI 产业链边际变化产生的新市场需求上,如 AEC、PCIE、硅光、CPO、液冷、电源等方向。 (参考来源:东北证券)

会务组联系方式  

展会咨询

相关光电行业展会

2025年台湾光电及激光展览会OPTO Taiwan

2025-10-22~10-24 距离274
53189展会热度 评论(0)

2025年中国光博会-深圳光博会CIOECIOE

2025-09-10~09-12 距离232
163601展会热度 评论(0)

2025年慕尼黑上海光博会LASER Photonics China

2025-03-11~03-13 距离49
127995展会热度 评论(0)

2025年深圳国际激光技术展览会LFSZ

2025-06-04~06-06 距离134
54881展会热度 评论(0)

2025年成都西部光电展-成都光博会CCWPE

2025-04-23~04-25 距离92
38191展会热度 评论(0)

2025年台湾雷射展览会Laser Taiwan

2025-08-20~08-23 距离211
43960展会热度 评论(0)

2025年北京光电子产业博览会-北京光子大会INT PHOTONICS EXPO

2025-06-30~07-02 距离160
46014展会热度 评论(0)

2024年深圳华南先进激光及加工应用技术展Laser South China

2024-10-14~10-16 展会结束
35728展会热度 评论(0)
X
客服
电话
13924230066

服务热线

扫一扫

世展网公众号

微信小程序

销售客服

门票客服

TOP
X