ICC訊 在OpenAI積極規(guī)劃自建數(shù)據(jù)中心之際,微軟首席執(zhí)行官Satya Nadella通過一則推文向業(yè)界展示了其已投入運營的大規(guī)模AI系統(tǒng)。這套被Nvidia稱為AI“工廠”的系統(tǒng),現(xiàn)已成為微軟Azure全球數(shù)據(jù)中心網(wǎng)絡中運行OpenAI工作負載的首個實例,Nadella明確表示這僅是“眾多同類系統(tǒng)中的第一個”。
該AI工廠集群由超過4600臺Nvidia GB300機架式計算機構成,這些設備搭載了市場需求旺盛的Blackwell Ultra GPU芯片,并通過Nvidia的InfiniBand超高速網(wǎng)絡技術實現(xiàn)互聯(lián)。值得一提的是,Nvidia首席執(zhí)行官Jensen Huang早在2019年就以69億美元收購Mellanox公司,這一前瞻性布局使其在InfiniBand技術領域占據(jù)了市場主導地位。
微軟承諾將在全球范圍內(nèi)部署“數(shù)十萬顆Blackwell Ultra GPU”以擴展這些系統(tǒng)。除了系統(tǒng)規(guī)模令人矚目外,公司還分享了大量技術細節(jié)供硬件愛好者深入研究。此次發(fā)布的時機同樣值得關注——就在此前不久,與其既合作又競爭的OpenAI剛剛與Nvidia和AMD簽署了兩項備受矚目的數(shù)據(jù)中心協(xié)議。
根據(jù)業(yè)內(nèi)估算,OpenAI在2025年已獲得總額約1萬億美元的數(shù)據(jù)中心建設承諾。該公司首席執(zhí)行官Sam Altman本周更表示還將繼續(xù)擴大建設規(guī)模。微軟此時發(fā)布消息,顯然意在向世界表明:公司已在34個國家擁有300多座數(shù)據(jù)中心,這些設施“獨具優(yōu)勢”,能夠“滿足當前前沿AI的需求”。微軟強調(diào),這些巨型AI系統(tǒng)同樣具備運行參數(shù)規(guī)模達“數(shù)萬億級”的下一代模型的能力。
業(yè)界預計本月晚些時候?qū)@悉更多關于微軟提升AI工作負載服務能力的細節(jié)。微軟首席技術官Kevin Scott已確認將在10月27日至29日于舊金山舉行的TechCrunch Disrupt大會上發(fā)表演講。