隨著AI大模型訓練與推理工作負載的快速增長,數據中心的算力結構正在發生根本性變化。與傳統雲計算相比,AI系統呈現出更高的並行度、更強的節點間通信依賴,以及更加陡峭的帶寬需求曲線。由此帶來的直接結果是,數據中心的性能瓶頸正加速從“計算能力”轉移到“互連能力”。
過去十年,數據中心光互連帶寬從 100G 演進至 400G,目前主流雲廠商已開始規模化部署 800G,並同步規劃 1.6T 乃至更高帶寬的下一代互連方案。然而,這種倍數級帶寬增長本身也正在遭遇嚴峻挑戰。
隨著速率持續提升,電互連功耗快速上升,信號完整性和系統調試複雜度顯著增加;與此同時,光模塊功耗與散熱成本不斷攀升,直接擠壓整機功耗預算並推高長期 TCO(總擁有成本)。
對於以 AI 為核心負載的數據中心而言,這些問題已不再是工程層面的優化細節,而是制約算力規模化擴展的系統性瓶頸。
CPO:數據中心互連範式的轉變
為突破上述瓶頸,CPO(Co-Packaged Optics,共封裝光學)逐漸成為下一代數據中心互連的核心方向。
CPO 通過將光電邊界引入芯片封裝內部,使光引擎與 ASIC 共封裝,將電信號傳輸距離從傳統的米級大幅壓縮至毫米級,從系統層面顯著降低互連功耗,並提升整體能效。行業普遍認為,在理想條件下,CPO 可帶來超過 50% 的系統能效改善。
更重要的是,CPO 不僅是一種封裝形態的變化,而是意味著光從“網絡外設”演進為“邏輯芯片的 I/O”,成為邁向“光互連 SoC 時代”的關鍵橋樑。作為下一代光通信的重要方向,CPO 正在推動全球產業鏈的重新分工,也為中國企業在技術追趕與生態構建中帶來關鍵窗口期。
UCIe:CPO商業化落地的核心引擎
在CPO從技術探索邁向商業驗證的過程中,真正決定其可行性的,不應該是單一光學或封裝技術的突破,而是系統架構是否能夠被模塊化、標準化並具備持續演進能力。在這一層面上,UCIe與Chiplet或許將成為CPO架構中最關鍵的基礎能力。
從最直觀的系統能效角度看,UCIe與Chiplet組合將帶來功耗與帶寬擴展能力的顯著改善。相比傳統板級互連,封裝內的短距互連降低了SerDes功耗,使CPO在1.6T乃至更高帶寬下仍具備相對可控的功耗曲線。這一點直接回應了AI系統中互連能力成為性能瓶頸的現實需求。
同時,Chiplet化設計顯著降低了系統設計與長期演進的複雜度。通過將計算、交換、光電I/O拆分為不同Chiplet,CPO不再依賴高度定制化的單一大芯片方案。不同功能模塊可以獨立設計、驗證和演進,使系統在面對帶寬升級或工藝變化時具備更高的靈活性。
在此基礎上,UCIe提供了統一、可擴展的Die-to-Die互連語言。在CPO場景中,光電I/O Chiplet與主ASIC之間需要極高帶寬、低時延且低功耗的連接方式。UCIe通過標準化的物理層與協議層設計,使高密度互連不再依賴廠商私有接口,從而降低系統集成門檻,併為多廠商協同提供了現實基礎。
更進一步,UCIe與Chiplet為CPO構建了一個更具確定性的產業協作模型。標準化接口使光學、封裝、芯片與IP廠商能夠在相對清晰的分工邊界下協同創新,減少高度定制項目帶來的不確定性。這種生態層面的可複製性,是CPO從小規模試點走向更廣泛部署的前提條件。
不過也要指出,UCIe與Chiplet並不能消除CPO在可維護性和光學器件可靠性方面的挑戰,但它們通過降低系統耦合度和集成風險,使這些問題被限制在可管理的範圍內。
儘管UCIe與Chiplet並非CPO發展落地的唯一方向,但在當前階段展現出更高的商業可行性,讓CPO從高度定制、風險集中的技術嚐試,轉變為可以被評估、被規劃、並逐步放量的系統方案。
作為國內少數能夠提供成經驗證UCIe IP和Chiplet產品的廠商,奎芯科技也建議系統設計方優先考慮成熟的集成方案,這種方式有助於在不同工藝節點和光電 I/O 方案之間保持架構一致性,從而縮短設計週期,降低重複驗證成本。對於需要跨多個代際持續演進的數據中心與芯片公司而言,這一優勢具備直接而明確的商業意義。