成人深夜视频网站|日韩高清无码久久|中文a√在线天堂|亚洲黄网站在线看|欧美视频 第二页|日本 久草 天堂|高潮无遮挡黄视频|久久一级内射精品|国产操逼一级视频|五月天婷婷色AV

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

谷歌技術報告披露大模型能耗:響應一次相當于微波爐叮一秒

0
分享至

時令 發(fā)自 凹非寺
量子位 | 公眾號 QbitAI

大模型耗電驚人,輿論一浪高過一浪。

現(xiàn)在,谷歌用硬核數(shù)據(jù)強勢還擊。

一次Gemini查詢僅能耗0.24wh,相當于微波爐運行1秒,排放0.03 g CO?e,甚至比人放一次屁還少,同時消耗約5滴水。

(文中數(shù)據(jù)均表示中位數(shù))



谷歌首席科學家Jeff Dean公開表示:

  • 這個數(shù)值明顯低于公眾普遍預期的水平。



并且像谷歌這樣的大模型廠商,一直專注研究如何降低AI消耗。

一年間,通過模型優(yōu)化和額外清潔能源的使用,Gemini的能耗降至原來的1/33,碳排放降至1/44,同時提供了更高質(zhì)量的響應。



下面讓我們一起看看谷歌是如何衡量和減少AI能源消耗的?

如何衡量AI消耗能源

谷歌首先指出,目前許多關于AI能源消耗的計算反映的都是理論效率,而非大規(guī)模運行下的實際效率。



若Gemini只考慮TPU和GPU的消耗,一次查詢只需消耗0.10wh,排放0.02 g CO?e,耗水量約0.12ml。

但這種計算方式僅考慮了機器在運行中的能耗,而忽略了一些關鍵因素。

與此同時,Jeff Dean也表示:

  • 人們都在思考AI是否會消耗大量能源?它是否會通過碳排放來傷害地球?



所以,谷歌針對AI服務時的實際情況,開發(fā)了一套更為全面的方法來計算能源消耗,包括以下幾個部分:

全系統(tǒng)動態(tài)功率

這不僅包括主AI模型在計算過程中使用的能源和水,還考慮了大規(guī)模運行下實際的芯片利用率,而該利用率往往遠低于理論最大值。

空閑計算機

為確保高可用性和可靠性,生產(chǎn)系統(tǒng)需要一定程度的預置容量,該容量處于空閑狀態(tài),但隨時可以處理流量高峰或故障轉(zhuǎn)移。這些閑置芯片消耗的能量必須計入總能源足跡。

CPU和內(nèi)存

AI模型的運行不僅依賴TPU和GPU等機器學習加速器,主機的CPU和內(nèi)存同樣在提供服務和消耗能源方面起著關鍵作用。

數(shù)據(jù)中心開銷

運行AI的信息技術設備所消耗的能源僅占整體能耗的一部分。支撐這些計算的基礎設施,如冷卻系統(tǒng)、配電系統(tǒng)以及其他數(shù)據(jù)中心開銷同樣會消耗能源。這部分開銷能源通常用電力使用效率(PUE)指標來衡量。

數(shù)據(jù)中心用水量

為了降低能耗及相關排放,數(shù)據(jù)中心通常會使用水進行冷卻。隨著優(yōu)化AI系統(tǒng)以提高能源效率,其整體用水量也會隨之自然減少。

通過上述更全面的指標,谷歌得出一次Gemini查詢的能耗為0.24wh,排放0.03 g CO?e,同時耗水量約5滴。



如此低的能耗,谷歌究竟是如何實現(xiàn)的?

為什么Gemini消耗這么低

谷歌表示,Gemin顯著的效率提升得益于其在AI開發(fā)中采取的全棧方法,從定制硬件、高效模型,到支撐這些模型運行的強大服務系統(tǒng),他們在每一層都融入了效率優(yōu)化。



首先是更高效的模型架構,Gemini是谷歌研究人員開發(fā)的Transformer模型框架,相比之前的語言建模架構,其效率可提升10倍到100倍。

此外,他們還在模型設計中融入了像MoE和混合推理等機制,從而進一步減少計算量和數(shù)據(jù)傳輸,提高整體運行效率。

與此同時,Gemini通過精準量化訓練(AQT)等方法不斷得到優(yōu)化,使模型在保證回答質(zhì)量的前提下進一步降低了能源消耗。

在優(yōu)化推理和服務上,谷歌不斷改進AI的交付方式,以提升響應速度和整體效率。

比如通過推測解碼技術,較小的模型可以先進行預測,再由較大的模型快速驗證,從而用更少的芯片提供更多響應。

蒸餾技術則可以利用大型模型作為教師,生成用于服務的小型高效模型(如Gemini Flash和Flash-Lite)。

不僅如此,為了減少能耗,谷歌在硬件上還采用定制化。

十多年來,他們一直從零開始設計TPU,以最大化每瓦的性能。同時,他們還協(xié)同設計AI模型與TPU,確保軟件充分利用硬件潛力,硬件也能高效運行未來的AI軟件。

值得一提的是,最新一代TPU Ironwood的能效比首款公開TPU高30倍,在推理任務中遠超通用CPU。



接下來,就是優(yōu)化空閑資源。谷歌的服務堆棧能夠高效利用CPU,并根據(jù)需求近乎實時地動態(tài)調(diào)度模型,從而最大化減少TPU的空閑時間,而不是采用“設置一次、永久運行”的方式。

同時,他們的XLA ML編譯器、Pallas內(nèi)核和Pathways系統(tǒng),使得在JAX等高級系統(tǒng)中表達的模型計算能夠在TPU服務硬件上高效運行。

再來看谷歌的超高效數(shù)據(jù)中心,其整體平均能源使用效率(PUE)可達1.09,為業(yè)界最高效的數(shù)據(jù)中心之一。

最后在數(shù)據(jù)中心運營方面,谷歌持續(xù)增加清潔能源的使用,以實現(xiàn)全天候無碳運行的目標,同時努力補充辦公室和數(shù)據(jù)中心平均消耗的120%淡水。

此外,他們還優(yōu)化冷卻系統(tǒng),通過科學的流域健康評估,平衡能源、水資源和排放之間的局部權衡,從而指導冷卻方式的選擇,并在水資源緊張地區(qū)限制用水量。

參考鏈接:
[1]https://x.com/JeffDean/status/1958525015722434945
[2]https://cloud.google.com/blog/products/infrastructure/measuring-the-environmental-impact-of-ai-inference/

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
日本干擾九三閱兵失??!30個歐洲國確定出席央媒四字回應大快人心

日本干擾九三閱兵失敗!30個歐洲國確定出席央媒四字回應大快人心

壹知眠羊
2025-08-29 11:29:56
高鐵光腳女子已“社會性死亡”:囂張嘴臉曝光被罵慘,名聲也沒了

高鐵光腳女子已“社會性死亡”:囂張嘴臉曝光被罵慘,名聲也沒了

胡鋇就愛無拘無束
2025-08-30 23:54:54
英超最新積分戰(zhàn)報 切爾西3輪不敗超阿森納登頂 曼聯(lián)首勝升至第9

英超最新積分戰(zhàn)報 切爾西3輪不敗超阿森納登頂 曼聯(lián)首勝升至第9

狂言體育
2025-08-31 10:49:40
周星馳《美人魚2》惹投資人吐槽,刪刪改改花了近6億,上映還沒準

周星馳《美人魚2》惹投資人吐槽,刪刪改改花了近6億,上映還沒準

最愛酷影視
2025-08-30 20:15:37
長春電影節(jié):劉昊然帥的扎眼,劉燁面相變了,劉浩存太驚艷

長春電影節(jié):劉昊然帥的扎眼,劉燁面相變了,劉浩存太驚艷

八卦南風
2025-08-29 14:04:04
缺兵少將仍取勝!廣廈無胡金秋朱俊龍,仍力克全主力浙江,展現(xiàn)冠軍底蘊

缺兵少將仍取勝!廣廈無胡金秋朱俊龍,仍力克全主力浙江,展現(xiàn)冠軍底蘊

晚霧空青
2025-08-31 10:23:13
建國后最大槍支失竊案,多年未破,后一退休干警查出真相,遭滅口

建國后最大槍支失竊案,多年未破,后一退休干警查出真相,遭滅口

阿胡
2024-03-22 13:32:34
只賣5000元,老外開始瘋搶中國手表

只賣5000元,老外開始瘋搶中國手表

源Sight
2025-08-28 20:07:46
張員瑛球場開拍,被要求穿那么短的裙子,讓一眾網(wǎng)友大呼心疼!

張員瑛球場開拍,被要求穿那么短的裙子,讓一眾網(wǎng)友大呼心疼!

鋒哥與八卦哥
2025-08-31 11:31:59
“中國護照接你回家”,觀眾被騙夠了,這回不買吳京的賬了

“中國護照接你回家”,觀眾被騙夠了,這回不買吳京的賬了

廖保平
2025-08-29 08:51:39
裁員7萬,月薪從兩萬降到五千,“斷崖式降薪”讓銀行人苦不堪言

裁員7萬,月薪從兩萬降到五千,“斷崖式降薪”讓銀行人苦不堪言

侃故事的阿慶
2025-08-30 12:54:04
梁朝偉新片打敗《哪吒2》,登頂熱度榜榜首

梁朝偉新片打敗《哪吒2》,登頂熱度榜榜首

影視高原說
2025-08-31 10:27:40
阿斯評價皇馬球員第3輪西甲表現(xiàn):馬斯坦托諾幾乎沒有存在感

阿斯評價皇馬球員第3輪西甲表現(xiàn):馬斯坦托諾幾乎沒有存在感

懂球帝
2025-08-31 07:03:47
全球四分之一胰腺癌在我國,提醒:不想胰腺受傷,4種零食要少吃

全球四分之一胰腺癌在我國,提醒:不想胰腺受傷,4種零食要少吃

泠泠說史
2025-08-29 16:17:06
俄軍剛炸基輔,法軍官通告4國,中國首當其沖,最難纏的對手出現(xiàn)

俄軍剛炸基輔,法軍官通告4國,中國首當其沖,最難纏的對手出現(xiàn)

吳欣純Deborah
2025-08-31 11:15:14
宗馥莉夠虎!向最高法最高檢舉報杭州法院

宗馥莉夠虎!向最高法最高檢舉報杭州法院

8哥話天下
2025-08-30 14:37:47
獨霸阿里AI電源訂單!華為+騰訊+字節(jié)比工業(yè)富聯(lián)更稀缺

獨霸阿里AI電源訂單!華為+騰訊+字節(jié)比工業(yè)富聯(lián)更稀缺

玉盤瀉月
2025-08-31 09:12:38
發(fā)現(xiàn)了沒有?為啥二手車市場幾乎都是九成新的車?價格卻很便宜?

發(fā)現(xiàn)了沒有?為啥二手車市場幾乎都是九成新的車?價格卻很便宜?

侃故事的阿慶
2025-08-30 21:48:42
黑龍江“70后”省教育廳副廳長擬任新職!

黑龍江“70后”省教育廳副廳長擬任新職!

喜哈生活
2025-08-31 08:02:09
NBA官方致敬林書豪!美媒曬瘋狂數(shù)據(jù):對轟科比砍生涯最高

NBA官方致敬林書豪!美媒曬瘋狂數(shù)據(jù):對轟科比砍生涯最高

雷速體育
2025-08-31 09:41:45
2025-08-31 12:27:00
量子位 incentive-icons
量子位
追蹤人工智能動態(tài)
11215文章數(shù) 176256關注度
往期回顧 全部

科技要聞

美團京東拼搶"線下折扣店",劉強東現(xiàn)身"助陣"

頭條要聞

情侶欠租失聯(lián)中介打開房門崩潰 對方還稱錢被偷要賠償

頭條要聞

情侶欠租失聯(lián)中介打開房門崩潰 對方還稱錢被偷要賠償

體育要聞

扛著別人的老婆,贏下那該死的冠軍

娛樂要聞

韓磊起訴后,女方公開道歉

財經(jīng)要聞

罕見熱鬧的8月之后,A股將迎怎樣的9月

汽車要聞

家庭泛越野 大狗PLUS預售煥新11.28萬起

態(tài)度原創(chuàng)

本地
時尚
親子
教育
公開課

本地新聞

換個城市過夏天 | 夏末狂歡,浪在阜新黃家溝!

我發(fā)現(xiàn)朋友圈吸引人的女生,都有這個特點!

親子要聞

寶媽必學,什么是誘騙+侵犯?

教育要聞

平四中的線段關系,一個視頻說明白!

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版