ICC訊 近日,中國移動研究院公布2025年超節(jié)點試驗裝置采購項目結(jié)果,華為技術(shù)有限公司成唯一中標候選人,不含稅投標報價134617826.25元,擬中標份額100%。本次項目計劃采購超節(jié)點試驗裝置1套(含超節(jié)點智算模塊(含計算及配套網(wǎng)絡(luò)等)48套、超節(jié)點存儲模塊1套)。
近年來,各種GPU和TPU/NPU/XPU/ASIC等算力芯片都需要組成大規(guī)模的高帶寬域,即超節(jié)點來應(yīng)對大模型應(yīng)用的需求,特別是GPU scale-up網(wǎng)絡(luò)需要大節(jié)點數(shù)、高帶寬、低延遲、低成本這四個互相牽制的要求。
當前實現(xiàn)大規(guī)模超節(jié)點的技術(shù)路線主要有三種:全銅纜互聯(lián)、銅光混合互聯(lián)和全光互聯(lián)。不同方案在部署規(guī)模、時延、成本及工程可行性上存在顯著差異:
全銅纜互聯(lián)僅適用于單柜或相鄰雙柜部署,其物理距離限制(≤3m)與單柜內(nèi)高密度GPU引發(fā)的供電、散熱及線纜密度、機房承重等問題,導(dǎo)致工程擴展性和可維護性的巨大挑戰(zhàn)。
銅光混合互聯(lián)雖支持多柜擴展,但依賴“柜內(nèi)銅纜+柜間光互聯(lián)”兩級交換架構(gòu),引入更高時延與更加復(fù)雜的scale up協(xié)議能力要求,并且兩層交換機顯著增加系統(tǒng)成本。
全光互聯(lián)通過每GPU直連光接口與一層HighRadix交換機互聯(lián),當前HighRadix交換機可支持512端口200Gbps,可實現(xiàn)一層交換機512卡超節(jié)點。全光互聯(lián)可以實現(xiàn)較低時延和靈活的部署規(guī)模;其核心挑戰(zhàn)在于光器件成本與可靠性,因此要實現(xiàn)大規(guī)模全光互聯(lián)超節(jié)點仍需針對這些問題完成技術(shù)與產(chǎn)業(yè)突破。
英偉達NVL72 vs 華為CM384
在超節(jié)點方面,華為推出了CloudMatrix 384超節(jié)點產(chǎn)品,依靠華為強大的光互聯(lián)能力,將384塊昇騰910C芯片組合在一起,并通過6912個400G LPO光模塊和3168根光纖構(gòu)建高速互聯(lián)總線,實現(xiàn)了269TB/s的總帶寬。