成人深夜视频网站|日韩高清无码久久|中文a√在线天堂|亚洲黄网站在线看|欧美视频 第二页|日本 久草 天堂|高潮无遮挡黄视频|久久一级内射精品|国产操逼一级视频|五月天婷婷色AV

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

一文看懂“存算一體”

0
分享至

今天這篇文章,我們來聊一個最近幾年很火的概念——存算一體。

█ 為什么會提出“存算一體”?

存算一體,英文叫Compute In Memory,簡稱CIM。顧名思義,就是將存儲和計算放在一起。

大家都知道,存儲和計算,是我們處理數(shù)據(jù)的兩種基本方式。自從計算機誕生以來,我們采用的主流計算架構(gòu),是著名的馮·諾伊曼架構(gòu)。在這個架構(gòu)中,存儲和計算是兩個相對獨立的模塊。存儲負責(zé)數(shù)據(jù)的存取,而計算則負責(zé)運算。


馮·諾依曼架構(gòu)

我們可以把存儲理解為配菜,計算理解為炒菜。兩者配合到位,才能完成菜品的制作(完成計算任務(wù))。

理論上來說,想要出菜的速度更快,一方面,要加快炒菜的速度(通過提升芯片的算力,例如采用更先進的工藝制程),另一方面,也要加快配菜的速度。

這個速度,簡單來說,就是存儲設(shè)備與計算芯片(CPU、GPU等)之間的數(shù)據(jù)傳輸能力。如果配菜太慢,炒菜師傅就要等待,從而影響整體效率。

以前給大家介紹存儲的時候曾經(jīng)說過,計算機的存儲,是典型的分級策略——越靠近處理器(計算單元)的存儲設(shè)備,速度越快,容量越小。有緩存(1級/2級/3級)、內(nèi)存、磁盤(固態(tài)/機械)、外部存儲器(本地磁陣、云存儲)這樣的不同類型存儲設(shè)備(單元)。


這是由存儲設(shè)備的成本決定的。速度越快的存儲設(shè)備,成本越高。全部都用最快的存儲,是不現(xiàn)實的,價格太高昂,所以才有了逐級存儲機制。

馮·諾依曼架構(gòu),我們用了幾十年,因為數(shù)據(jù)存儲和計算是明顯分開的,所以也叫做存算分離。

進入互聯(lián)網(wǎng)時代后,由于數(shù)據(jù)量呈現(xiàn)爆炸式增長,對數(shù)據(jù)計算效率的要求越來越高。這種傳統(tǒng)的架構(gòu)開始暴露出能力上的缺陷。

尤其是最近這些年,AI的崛起,讓數(shù)據(jù)計算強度又躍升了好幾個層級。計算芯片在瘋狂提速,而存儲傳輸速率的提升跟不上,由此產(chǎn)生了著名的兩堵墻——“存儲墻”功耗墻”。

所謂“存儲墻”,是指存儲設(shè)備和處理器之間的數(shù)據(jù)傳輸速度,遠遠跟不上處理器的計算速度。就像炒菜師傅手藝再好,配菜師傅跟不上節(jié)奏,也只能干著急。


業(yè)內(nèi)曾提出,AI運算需要的存算通道速率是1PB/s。SRAM的10-100TB/s、DRAM的40GB-1TB/s,都遠達不到要求。

而“功耗墻”則是指,在數(shù)據(jù)傳輸過程中,能耗巨大,導(dǎo)致整體系統(tǒng)的能效比不理想。這就像是為了快速配菜,不得不請很多幫手,結(jié)果人工成本大大增加。

例如,在7nm工藝下,數(shù)據(jù)搬運的功耗占比甚至達到了驚人的63.7%,遠遠大于數(shù)據(jù)計算的功耗。

大家應(yīng)該都聽說過HBM技術(shù)。

HBM(High Bandwidth Memory,高帶寬內(nèi)存),就是一種嘗試解決“存儲墻”和“功耗墻”問題的新型存儲技術(shù)。像英偉達這樣的芯片廠商,采用3D封裝等先進工藝,將存儲單元和計算單元封裝在一起,通過縮短兩者之間的距離,提高數(shù)據(jù)傳輸速度,同時降低能耗。


HBM在一定程度上緩解了問題,但并沒有從根本上改變存算分離的現(xiàn)狀。于是,業(yè)界提出了一個新的解決思路,那就是——存算一體。

既然存儲和計算分離會導(dǎo)致帶寬瓶頸,那么,把存儲和計算直接結(jié)合在一起,讓數(shù)據(jù)在存儲的過程中就能進行計算,或者在計算的過程中就能直接訪問存儲,從而減少數(shù)據(jù)的搬運次數(shù),不就行了嗎?

這樣一來,既可以提高整體計算效率,也可以降低功耗,徹底解決“兩堵墻”的問題。

實際上,我們的大腦,就是典型的存算一體結(jié)構(gòu)。神經(jīng)元既負責(zé)存儲信息(記憶),也負責(zé)處理信息(思考)。這種結(jié)構(gòu),使得大腦能夠以極高的效率處理復(fù)雜的任務(wù),而且能耗極低。

存算一體的發(fā)展歷程

存算一體的研究,其實很早就已經(jīng)開始了。

早在1969年,斯坦福研究所的Kautz等人,率先提出了存算一體計算機的概念。但是,受限于當(dāng)時的技術(shù)和工藝,概念僅僅停留在理論研究階段,并未得到實際應(yīng)用。

后來,為了實現(xiàn)存算一體,科學(xué)家們進行了大量的研究和嘗試,但仍然進展緩慢。

進入21世紀后,芯片與半導(dǎo)體技術(shù)日趨成熟,存算一體化實現(xiàn)的曙光亦逐漸顯現(xiàn)??茖W(xué)家們發(fā)現(xiàn),某些特殊的材料或器件,能夠在存儲數(shù)據(jù)的同時,在存儲單元內(nèi)部執(zhí)行簡單的邏輯運算。這將大大減少數(shù)據(jù)的搬運次數(shù)和功耗。

2010年,惠普實驗室的Williams教授團隊提出并驗證利用憶阻器實現(xiàn)簡單布爾邏輯功能(聯(lián)合、相交、相減等)。

2016年,美國加州大學(xué)圣塔芭芭拉分校(UCSB)的謝源教授團隊,提出使用阻變存儲器(RRAM)構(gòu)建存算一體架構(gòu)的深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)(PRIME)。相較于傳統(tǒng)馮·諾伊曼架構(gòu)方案,PRIME可以實現(xiàn)功耗降低約20倍、速度提升約50倍。

2017年,在微處理器頂級年會(Micro 2017)上,包括英偉達、英特爾、微軟、三星、蘇黎世聯(lián)邦理工學(xué)院與加州大學(xué)圣塔芭芭拉分校等都推出了他們的存算一體系統(tǒng)原型,掀起了學(xué)術(shù)界和產(chǎn)業(yè)界的一股“存算一體”熱潮。

最近這幾年,隨著AI浪潮的到來,海量的大模型訓(xùn)練和推理計算需求爆發(fā),引發(fā)了算力產(chǎn)業(yè)的新一輪增長。存算一體,更是進入了一個高速發(fā)展的快車道。

除了傳統(tǒng)芯片巨頭在加緊研究之外,也有很多創(chuàng)業(yè)企業(yè)“扎堆”入場。國內(nèi)有蘋芯科技、后摩智能、知存科技、億鑄科技、智芯科、千芯科技、九天睿芯等。國外有Mythic、Syntiant等公司。

2023年9月,清華大學(xué)團隊宣布研發(fā)出全球首顆全系統(tǒng)集成的、支持高效片上學(xué)習(xí)的憶阻器存算一體芯片,再次將“存算一體”推上熱搜。

如今,存算一體已經(jīng)成為業(yè)界最熱門的研究方向,正在加速從理論研究走向產(chǎn)業(yè)落地。

█ 存算一體的技術(shù)路線

接下來,我們看看存算一體的具體技術(shù)分類。

目前,業(yè)界根據(jù)存儲和計算的距離遠近,將存算一體分為三類,分別是近存計算、存內(nèi)處理和存內(nèi)計算。

近存計算(Processing Near Memory,PNM)

近存計算,通過芯片封裝和板卡組裝等方式,將存儲單元和計算單元集成,增加訪存帶寬、減少數(shù)據(jù)搬移,提升整體計算效率。

前面提到的HBM共封裝,就是近存計算。

近存計算又分為存儲上移和計算下移。HBM那個,屬于存儲上移。計算下移是采用板卡集成技術(shù),將數(shù)據(jù)處理能力卸載到存儲器,典型方案是CSD可計算存儲。

近存計算嚴格來說仍然是屬于存算分離架構(gòu)。這個路線比較容易實現(xiàn),現(xiàn)在已經(jīng)廣泛應(yīng)用于AI、大數(shù)據(jù)、邊緣計算、物聯(lián)網(wǎng)等場景。

存內(nèi)處理(Processing In Memory,PlM)

存內(nèi)處理,是在芯片制造的過程中,將“存”與“算”集成在同一個晶粒(Die)中,使存儲器本身具備了一定的算力。

存內(nèi)處理本質(zhì)上仍是存算分離。相比于近存計算,“存”與“算”距離更近。

目前,業(yè)內(nèi)的存內(nèi)處理方案大多在內(nèi)存(DRAM)芯片中加“算力”,比較典型的產(chǎn)品形態(tài)為HBM-PIM(三星)和PIM-DIMM。這類方案適合應(yīng)用于語音識別、數(shù)據(jù)庫索引搜索、基因匹配等場景。

存內(nèi)計算(Computing in Memory,ClM)

存內(nèi)計算,這是真正的存算一體了(也屬于業(yè)界所說的狹義的存算一體)。

在芯片設(shè)計的過程中,不再區(qū)分存儲單元和計算單元,直接消除“存”“算”界限,真正實現(xiàn)存算徹底融合。


這個方案的主要服務(wù)場景就是AI計算。

AI深度學(xué)習(xí)算法中包含了大量的矩陣乘法運算,其本質(zhì)是乘累加(Multiply Accumulate, MAC)運算。

存算一體技術(shù)可以將這些運算直接映射到存儲結(jié)構(gòu)中,在存儲單元的核心電路上做修改,從而在讀取的同時進行數(shù)據(jù)輸入和計算處理,在存儲陣列中完成卷積運算。這帶來了極高的能效比和極低的延遲。


存算一體芯片的大致架構(gòu)

存算一體的存儲介質(zhì)

以前小棗君給大家介紹半導(dǎo)體存儲的時候說過,存儲器分為易失性存儲器和非易失性存儲器。

存內(nèi)計算的電路,也可以基于這兩種存儲器。

易失性,就是內(nèi)存那種,掉電了數(shù)據(jù)就沒了,例如SRAM、DRAM。

非易失性,掉電時數(shù)據(jù)不會丟失,如傳統(tǒng)的閃存NOR Flash和NAND Flash,以及一些新型存儲器:阻變存儲器RRAM(ReRAM)、磁性存儲器MRAM、鐵變存儲器FRAM(FeRAM)、相變存儲器PCRAM(PCM)等。

SRAM、DRAM、Flash等都是成熟的技術(shù),基于電荷的移動完成數(shù)據(jù)存儲。

DRAM成本低,容量大,但是可用的eDRAM IP核工藝節(jié)點不先進,讀取延遲(Latency)也大,且需要定期刷新數(shù)據(jù)。Flash則屬于非易失性存儲器件,具有低成本優(yōu)勢,一般適合小算力場景。SRAM在速度方面具有極大優(yōu)勢,有幾乎最高的能效比,容量密度略小,在精度增強后可以保證較高精度,一般適用于云計算等大算力場景。

目前,針對新型存儲器的研究非常熱門。例如RRAM、MRAM等,基于電阻大小的變化完成數(shù)據(jù)存儲功能。


新型存儲器中,憶阻器(RRAM)的研究熱度最高。

RRAM使用電阻調(diào)制來實現(xiàn)數(shù)據(jù)存儲,讀出電流信號而非傳統(tǒng)的電荷信號,可以獲得較好的線性電阻特性。但目前RRAM工藝良率爬坡還在進行中,而且依然需要面對非易失存儲器固有的可靠性問題。


需要說明的是,存內(nèi)計算主要包含模擬和數(shù)字兩種實現(xiàn)方式。

模擬存內(nèi)計算能效高,但誤差較大,實現(xiàn)低功耗低位寬的整數(shù)乘加計算,適用于低精度、低功耗計算場景,例如端側(cè)可穿戴設(shè)備等。模擬存內(nèi)計算通常使用FLASH、RRAM、PRAM等非易失性介質(zhì)作為存儲器件,存儲密度大,并行度高,但是對環(huán)境噪聲和溫度非常敏感。

數(shù)字存內(nèi)計算誤差低,但單位面積功耗較大,適用于高精度、功耗不敏感的計算場景,例如云端AI場景。數(shù)字存算一體主要以SRAM和RRAM作為存儲器件,具有高性能、高精度的優(yōu)勢,且具備很好的抗噪聲能力和可靠性,

存算一體的應(yīng)用場景

前面已經(jīng)說過,存算一體天然適合AI相關(guān)的計算場景。

自然語言處理、信息檢索、圖神經(jīng)網(wǎng)絡(luò)、智能決策、具身智能等人工智能應(yīng)用,對算力效率以及系統(tǒng)能耗有極高的要求。傳統(tǒng)的“存算分離”難以應(yīng)對,存算一體則非常適合。

除了AI之外,就是AIoT智能物聯(lián)網(wǎng)產(chǎn)品。碎片化的AIoT市場對先進工藝芯片的需求并不強烈,反而更關(guān)注芯片的成本、功耗、開發(fā)難度。

存算一體芯片在這些方面都有優(yōu)勢,非常適合采用。

在一些大算力場景,例如云端AI計算,也是存算一體的用武之地。

目前的AI計算,基本上都是GPU為主。GPU在算力和能效上都無法同時與專用加速芯片(ASIC)競爭。在云計算算力市場,GPU的單一架構(gòu)也已經(jīng)不能適應(yīng)不同AI計算場景的算法離散化特點。例如在圖像、推薦、NLP領(lǐng)域,都有各自的主流算法架構(gòu)。

新型的存算一體芯片,具有能效優(yōu)勢,也適合固定場景的計算任務(wù),應(yīng)用潛力巨大。

此外,存算一體芯片還有一些其他延伸應(yīng)用,比如感存算一體、類腦計算等。這些也是非常具有潛力的市場領(lǐng)域。

存算一體面臨的挑戰(zhàn)

存算一體的技術(shù)前景非常廣闊,但是我們也必須認識到,這項技術(shù)的實現(xiàn)和普及還面臨著諸多挑戰(zhàn)。

首先,是來自技術(shù)上的挑戰(zhàn)。

存算一體采用新型存儲技術(shù),對半導(dǎo)體工藝有更高的要求。在芯片架構(gòu)、電路設(shè)計和材料選擇等方面,都仍有待進一步研究和創(chuàng)新。

其次,是來自生態(tài)上的挑戰(zhàn)。

存算一體技術(shù)作為一個新興領(lǐng)域,其生態(tài)系統(tǒng)尚未完全建立。

例如,在芯片設(shè)計階段,由于存算一體芯片區(qū)別于常規(guī)的芯片設(shè)計方案,所以目前市面上沒有成熟的專用EDA工具輔助設(shè)計和仿真驗證。芯片流片之后,也沒有成熟的工具協(xié)助測試。在芯片落地應(yīng)用階段,沒有專用的軟件與之匹配。

為此,需要產(chǎn)業(yè)界協(xié)作,進一步提高設(shè)計工具鏈的成熟度,實現(xiàn)自動化EDA工具與跨平臺編譯器的支持,加強代工廠標(biāo)準(zhǔn)IP庫的建設(shè)與優(yōu)化多場景下的制造成本,以便提高產(chǎn)業(yè)鏈的整體協(xié)同能力。

最后,是來自市場上的挑戰(zhàn)。

雖然存算一體技術(shù)具有廣闊的市場前景,但目前市場上仍存在諸多不確定因素。存算一體芯片的架構(gòu)場景通用性及規(guī)模擴展能力較差。傳統(tǒng)存算分離架構(gòu)仍占據(jù)主導(dǎo)地位,存算一體技術(shù)需要與傳統(tǒng)架構(gòu)進行競爭。

存內(nèi)計算僅適合原本就對存儲需求較大的場景,而對于本身存儲需求并不高的場景,為了引入內(nèi)存計算而加上一塊大內(nèi)存反倒會增加成本適得其反。

用戶對性價比非常關(guān)注,需要考慮用戶的需求和場景是否能夠接受存算一體。存算一體,也要在AI的發(fā)展過程中尋找自己的落地場景。

總之,挑戰(zhàn)還是很多的。但是,隨著技術(shù)的不斷進步以及業(yè)界的不懈努力,相信這些問題都會得到逐步解決。

來源:鮮棗課堂

編輯:涼漸

轉(zhuǎn)載內(nèi)容僅代表作者觀點

不代表中科院物理所立場

如需轉(zhuǎn)載請聯(lián)系原公眾號

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
伊朗被打醒了,哈梅內(nèi)伊連發(fā)三條中文:再不購買中國殲-10就晚了

伊朗被打醒了,哈梅內(nèi)伊連發(fā)三條中文:再不購買中國殲-10就晚了

墨羽怪談
2025-09-01 14:50:56
深圳某頂級建筑裝飾公司崩了,員工停薪,撤離工位!

深圳某頂級建筑裝飾公司崩了,員工停薪,撤離工位!

黯泉
2025-09-01 17:46:45
給退休金設(shè)立上下限,不止關(guān)乎公平問題,更關(guān)乎國家的未來

給退休金設(shè)立上下限,不止關(guān)乎公平問題,更關(guān)乎國家的未來

百味朱砂
2025-08-14 11:54:35
宋軼全臉詭異鼻子變形,遭疑整容本人發(fā)聲澄清

宋軼全臉詭異鼻子變形,遭疑整容本人發(fā)聲澄清

葫蘆哥愛吐槽
2025-09-01 16:38:58
“跳梁小丑”李玉剛跌下神壇,不再被大家寬容,梅葆玖:永不原諒

“跳梁小丑”李玉剛跌下神壇,不再被大家寬容,梅葆玖:永不原諒

詩意世界
2025-08-13 16:24:00
黃子韜:她不花我的錢,要給她買個東西,好像我犯了多大的錯一樣

黃子韜:她不花我的錢,要給她買個東西,好像我犯了多大的錯一樣

秀語千尋
2025-09-01 21:08:38
美女穿白牛仔褲搭黑運動短袖!簡約又吸睛,好看得讓人移不開眼

美女穿白牛仔褲搭黑運動短袖!簡約又吸睛,好看得讓人移不開眼

小喬古裝漢服
2025-09-01 19:30:03
她56歲仍是干凈之身,至今沒談過戀愛,除非是最愛不然不會獻身!

她56歲仍是干凈之身,至今沒談過戀愛,除非是最愛不然不會獻身!

科學(xué)發(fā)掘
2025-08-31 05:54:09
中方釋放重要信號!預(yù)示九三前有大事發(fā)生,臺?;蛱硪粏T“虎將”

中方釋放重要信號!預(yù)示九三前有大事發(fā)生,臺?;蛱硪粏T“虎將”

小lu侃侃而談
2025-09-01 20:04:11
震驚!一工廠干23年的員工官宣離職,稱賠償金到位,準(zhǔn)備回家養(yǎng)老

震驚!一工廠干23年的員工官宣離職,稱賠償金到位,準(zhǔn)備回家養(yǎng)老

火山詩話
2025-09-01 20:14:31
網(wǎng)盤中的加密文件,二十年后依然回味無窮

網(wǎng)盤中的加密文件,二十年后依然回味無窮

街機時代
2025-04-27 16:10:02
安徽夫婦自駕送兒子去新疆石河子上大學(xué):6天穿越3700公里,沿途打卡景點每天還直播7小時,剛到校就被粉絲認出

安徽夫婦自駕送兒子去新疆石河子上大學(xué):6天穿越3700公里,沿途打卡景點每天還直播7小時,剛到校就被粉絲認出

極目新聞
2025-08-30 18:45:57
為毛主席做飯11年的炊事員李開文,被安排到地方當(dāng)干部,是何職務(wù)

為毛主席做飯11年的炊事員李開文,被安排到地方當(dāng)干部,是何職務(wù)

談古論今歷史有道
2025-08-31 16:05:03
信用即財富,有債必償英格蘭!英國為何堅持償還所有歷史債務(wù)?

信用即財富,有債必償英格蘭!英國為何堅持償還所有歷史債務(wù)?

高博新視野
2025-08-31 16:03:32
新華社消息|上海合作組織成員國領(lǐng)導(dǎo)人發(fā)表關(guān)于第二次世界大戰(zhàn)勝利和聯(lián)合國成立80周年的聲明

新華社消息|上海合作組織成員國領(lǐng)導(dǎo)人發(fā)表關(guān)于第二次世界大戰(zhàn)勝利和聯(lián)合國成立80周年的聲明

新華社
2025-09-01 16:32:14
長沙李默庵故居將再次拍賣 上次618萬元起拍2913萬元成交,買家因故未能履行交易

長沙李默庵故居將再次拍賣 上次618萬元起拍2913萬元成交,買家因故未能履行交易

紅星新聞
2025-09-01 22:08:06
軍改前,武漢設(shè)有6所軍校,軍改后有4所是校本部、另2所降為校區(qū)

軍改前,武漢設(shè)有6所軍校,軍改后有4所是校本部、另2所降為校區(qū)

小圣雜談原創(chuàng)
2025-09-01 17:18:08
Here we go!羅馬諾:利物浦簽下水晶宮后衛(wèi)格伊,轉(zhuǎn)會費3500萬鎊

Here we go!羅馬諾:利物浦簽下水晶宮后衛(wèi)格伊,轉(zhuǎn)會費3500萬鎊

直播吧
2025-09-01 22:22:06
中國將迎來死亡高峰?22年去世1041萬人,23年1110萬,去年多少?

中國將迎來死亡高峰?22年去世1041萬人,23年1110萬,去年多少?

混沌錄
2025-08-30 22:47:24
51歲楊恭如罕見露面,真實狀態(tài)曝光,不婚不育四處旅游,瀟灑自在

51歲楊恭如罕見露面,真實狀態(tài)曝光,不婚不育四處旅游,瀟灑自在

壹點半娛樂
2025-09-01 15:55:55
2025-09-01 23:35:00
中科院物理所 incentive-icons
中科院物理所
愛上物理,改變世界。
9332文章數(shù) 136291關(guān)注度
往期回顧 全部

科技要聞

成都車展眾生相:20個主播圍著拍華為

頭條要聞

"甘蔗姐姐"籌錢救弟終成遺憾:弟弟移植后排異感染離世

頭條要聞

"甘蔗姐姐"籌錢救弟終成遺憾:弟弟移植后排異感染離世

體育要聞

一支穿云箭,紅軍雙喜臨門

娛樂要聞

蘇有朋,禍從口出?

財經(jīng)要聞

行情剛好點,創(chuàng)始人立馬漲估值

汽車要聞

激光雷達上車/配云輦-C 26款海豹07 DM-i全是硬貨

態(tài)度原創(chuàng)

時尚
旅游
健康
房產(chǎn)
教育

每年火一個“紅毯驚鴻一瞥”,今年輪到誰?

旅游要聞

熱聞|清明假期將至,熱門目的地有哪些?

精神科專家解答學(xué)習(xí)困難七大問題

房產(chǎn)要聞

海珠宅地上新!廣州大道南788號二期8.6億起拍!

教育要聞

青海玉樹:開學(xué)第一課點亮科技夢

無障礙瀏覽 進入關(guān)懷版