"AI數(shù)據(jù)中心"這個(gè)術(shù)語(yǔ)在現(xiàn)代數(shù)據(jù)中心討論中出現(xiàn)頻率越來(lái)越高??紤]到現(xiàn)代AI技術(shù)對(duì)數(shù)據(jù)中心及其內(nèi)部基礎(chǔ)設(shè)施提出了全新要求,這并不令人意外。
然而,這個(gè)術(shù)語(yǔ)也可能顯得空洞,因?yàn)锳I數(shù)據(jù)中心與其他數(shù)據(jù)中心的具體區(qū)別仍不明確。在隨意使用這一術(shù)語(yǔ)之前——或者假設(shè)AI工作負(fù)載需要與現(xiàn)有數(shù)據(jù)中心根本不同的設(shè)施之前——澄清這個(gè)術(shù)語(yǔ)的實(shí)際含義非常重要。
什么是AI數(shù)據(jù)中心?
"AI數(shù)據(jù)中心"的簡(jiǎn)短定義是專門為托管AI工作負(fù)載而設(shè)計(jì)的設(shè)施。
然而,這個(gè)定義并不特別令人滿意,因?yàn)锳I工作負(fù)載的需求可能差異很大。因此,沒(méi)有獨(dú)特的數(shù)據(jù)中心特征能夠?qū)⒚嫦駻I的設(shè)施與"常規(guī)"數(shù)據(jù)中心區(qū)分開(kāi)來(lái)。
此外,直到生成式AI隨著2022年ChatGPT的推出而進(jìn)入主流,很少有人談?wù)揂I數(shù)據(jù)中心。正是從那時(shí)起,媒體開(kāi)始將AI數(shù)據(jù)中心作為一種獨(dú)特類型的數(shù)據(jù)中心進(jìn)行討論。在此之前,其他類型的AI工作負(fù)載——如預(yù)測(cè)和描述性分析——在傳統(tǒng)數(shù)據(jù)中心中運(yùn)行得很好,沒(méi)有人建議AI需要根本性的新型數(shù)據(jù)中心。
與其建設(shè)專門的AI設(shè)施,一些組織可能發(fā)現(xiàn)調(diào)整現(xiàn)有數(shù)據(jù)中心基礎(chǔ)設(shè)施以支持不斷發(fā)展的AI工作負(fù)載更有價(jià)值。
AI數(shù)據(jù)中心的關(guān)鍵特征
盡管如此,可以合理地得出結(jié)論:現(xiàn)代AI工作負(fù)載確實(shí)受益于專門設(shè)計(jì)來(lái)滿足其獨(dú)特需求的數(shù)據(jù)中心。數(shù)據(jù)中心實(shí)現(xiàn)這一目標(biāo)的具體方式可能有所不同,但面向AI的數(shù)據(jù)中心的常見(jiàn)特征可能包括:
更大的整體容量。可以說(shuō),這是AI數(shù)據(jù)中心最重要的定義特征:它只是更大——意思是它能提供更多的總功率輸入并容納更多數(shù)量的服務(wù)器——比大多數(shù)傳統(tǒng)數(shù)據(jù)中心都要大。
提供配備GPU或其他硬件設(shè)備的服務(wù)器,這些設(shè)備可以加速某些AI任務(wù),如AI模型訓(xùn)練和推理。
優(yōu)化的網(wǎng)絡(luò)設(shè)備,如DPU,可以幫助非??焖俚靥幚砹髁俊@是許多AI工作負(fù)載的另一個(gè)重要要求,特別是那些需要實(shí)時(shí)處理大量數(shù)據(jù)的工作負(fù)載。
高效的數(shù)據(jù)中心冷卻系統(tǒng),如浸入式冷卻,在某些情況下對(duì)于散發(fā)AI工作負(fù)載產(chǎn)生的大量熱量非常重要。
可能還包括專門的電力系統(tǒng),如計(jì)量后能源解決方案,可以幫助滿足AI工作負(fù)載的高能耗要求。
AI數(shù)據(jù)中心與傳統(tǒng)數(shù)據(jù)中心:模糊的界限
試圖基于上述特征定義AI數(shù)據(jù)中心的棘手之處在于,這些特征都不是AI數(shù)據(jù)中心獨(dú)有的。
例如,超大規(guī)模數(shù)據(jù)中心——意思是在某些情況下能夠容納超過(guò)十萬(wàn)臺(tái)服務(wù)器的超大型設(shè)施——在現(xiàn)代AI出現(xiàn)之前就已經(jīng)存在。AI使大規(guī)模數(shù)據(jù)中心變得更加重要,因?yàn)锳I工作負(fù)載需要龐大的基礎(chǔ)設(shè)施,但這并不意味著在AI興起之前沒(méi)有人建設(shè)大型數(shù)據(jù)中心。
同樣,長(zhǎng)期以來(lái)在數(shù)據(jù)中心部署配備GPU的服務(wù)器就是可能的。AI只是增加了在某些用例中訪問(wèn)GPU的重要性。DPU也是如此,它們已經(jīng)存在多年。
同樣,先進(jìn)的冷卻系統(tǒng)和數(shù)據(jù)中心電力管理的創(chuàng)新方法并非生成式AI時(shí)代獨(dú)有。它們也早于AI數(shù)據(jù)中心出現(xiàn)。
AI數(shù)據(jù)中心到底是什么?
可以說(shuō),AI數(shù)據(jù)中心最終更多地由其功能(托管AI工作負(fù)載)而非實(shí)現(xiàn)方式(使用與任何其他類型數(shù)據(jù)中心相同類型的IT基礎(chǔ)設(shè)施、電力和冷卻系統(tǒng))來(lái)定義。
因此,在糾結(jié)于AI需要投資新一代數(shù)據(jù)中心這個(gè)想法之前,也許更健康的做法是思考如何利用現(xiàn)有數(shù)據(jù)中心來(lái)支持AI工作負(fù)載。這種觀點(diǎn)將幫助行業(yè)避免過(guò)度投資專門為AI設(shè)計(jì)的新數(shù)據(jù)中心的風(fēng)險(xiǎn)——作為額外好處,它可能通過(guò)允許企業(yè)重新利用現(xiàn)有數(shù)據(jù)中心來(lái)滿足AI需求而節(jié)省資金。
Q&A
Q1:AI數(shù)據(jù)中心與傳統(tǒng)數(shù)據(jù)中心有什么本質(zhì)區(qū)別?
A:實(shí)際上AI數(shù)據(jù)中心與傳統(tǒng)數(shù)據(jù)中心在技術(shù)特征上沒(méi)有本質(zhì)區(qū)別。AI數(shù)據(jù)中心主要是由其功能(托管AI工作負(fù)載)而非技術(shù)實(shí)現(xiàn)方式來(lái)定義的,它們使用的IT基礎(chǔ)設(shè)施、電力和冷卻系統(tǒng)與其他類型數(shù)據(jù)中心基本相同。
Q2:為什么AI數(shù)據(jù)中心這個(gè)概念突然變得流行?
A:AI數(shù)據(jù)中心概念的流行主要始于2022年ChatGPT推出后生成式AI進(jìn)入主流。在此之前,其他AI工作負(fù)載如預(yù)測(cè)和描述性分析在傳統(tǒng)數(shù)據(jù)中心中運(yùn)行良好,沒(méi)有人認(rèn)為AI需要根本性的新型數(shù)據(jù)中心。
Q3:企業(yè)是否需要專門建設(shè)AI數(shù)據(jù)中心?
A:不一定需要。與其建設(shè)專門的AI設(shè)施,企業(yè)可能發(fā)現(xiàn)調(diào)整現(xiàn)有數(shù)據(jù)中心基礎(chǔ)設(shè)施更有價(jià)值。這種方法可以避免過(guò)度投資新建數(shù)據(jù)中心的風(fēng)險(xiǎn),同時(shí)通過(guò)重新利用現(xiàn)有設(shè)施來(lái)節(jié)省成本。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.