星雲智聯發表S1400系列高速互聯方案,深度適配 DeepSeek,大幅提升AI運算集群通訊效率!
6月3日,星雲智聯宣佈在AI智算網路領域實現關鍵技術突破,正式推出S1400系列AI智算高速網路卡。作為完全自主研發的國產化解決方案,該產品針對大模型訓練與推理情境的嚴苛需求,以突破性網路效能重新定義智算集群互聯標準。 目前,產品已成功適配DeepSeek的DeepEP開源通訊庫,大幅提升AI運算集群的通訊效率,為AI應用創新註入強勁動力。
S1400系列AI智算高速互聯網卡具備1x400G或2x200G的網路介面模式,採用PCIe Gen 5.0 x16接口,提供高達雙向100Mpps的RDMA訊息速率。其關鍵特性包括:全面支援RoCEv2協定標準,並相容於NCCL、DeepEP,BCCL等主流集合通訊庫,確保與現有AI生態的無縫對接。
另外,S1400支援先進的GPUDirect技術(GDR、GDA)、用戶態MR(UMR)操作,為大規模AI計算叢集提供了極致的低延遲和高頻寬。特別突出的是,S1400系列AI智算高速互聯網卡自研NBL-SRP協議支援對所有RoCE v2操作(包括Write/Atomic/Send/Read等)的DDP方式的亂序接收和選擇性重傳,並針對GPU側Atomic操作和低延遲Local read進行了特別優化,這些特性進一步彌補了國內生態不足。 S1400系列AI智算高速互聯網卡大幅優化了資料處理流程,顯著提升了AI智算場景下的互聯效率。
在壅塞控制方面,S1400系列搭載了星雲智聯自研的NBL-CC演算法。此演算法基於RTT探測與丟包統計進行主動的端到端擁塞控制,不依賴交換器特定配置,具有參數少、部署便捷、性能優異的特點,能實現快速啟動、快速收斂,並保持交換器低隊列深度與高吞吐量。實際測試數據顯示,NBL-CC相較於傳統的DCQCN演算法,在平均效能上提升50%,99分位效能提升48%,尤其在短流場景下提升幅度高達60%-100%,
有效保障了網路的低隊列擁塞和持續高吞吐。配合自研的NBL-SRP協定(逐包多路徑、DDP亂序接收、選擇性重傳、快速重傳),S1400系列AI智算高速互聯網卡在AI主流場景及有損網絡下都能夠充分發揮接口帶寬潛力,其NCCL通信性能在多個關鍵指標上展現出媲美並且部分超越行業標桿產品,並在特定業務場景中展現出媲美7M + atomic),展現了強大的市場競爭力。
在全球科技競爭加劇的背景下,星雲智聯S1400系列產品的發表不僅是國產高階網路技術的突破,更展現了中國企業在AI基礎設施領域的自主創新能力。透過持續攻克自研晶片與演算法關鍵技術,S1400系列產品的發表標誌著我國在AI基礎設施領域已具備與國際領先水準同台競技的實力,為建構自主可控的AI產業生態鏈提供了關鍵網路支撐。 星雲智聯將堅定不移地加大研發投入,推動國產AI算力網路的技術進步,協助客戶掌握人工智慧時代的戰略機遇,決勝未來。