成人深夜视频网站|日韩高清无码久久|中文a√在线天堂|亚洲黄网站在线看|欧美视频 第二页|日本 久草 天堂|高潮无遮挡黄视频|久久一级内射精品|国产操逼一级视频|五月天婷婷色AV

網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

谷歌最新「0.27B」Gemma 3開(kāi)源!身板小卻猛如虎,開(kāi)發(fā)者直呼救命稻草

0
分享至


新智元報(bào)道

編輯:元宇

【新智元導(dǎo)讀】大模型越來(lái)越大,開(kāi)發(fā)者的「算力焦慮」也越來(lái)越嚴(yán)重。谷歌的Gemma卻另辟蹊徑:模型不求大,夠用才是王道。Gemma 3系列,尤其是新成員Gemma 3 270M正是這一理念的最佳詮釋者。它雖然「身板小」,卻能承擔(dān)各種AI實(shí)戰(zhàn)任務(wù),還能「組團(tuán)」一起干大事。

大塊頭不等于大智慧。

這在生成式AI領(lǐng)域,已逐漸成為共識(shí)。

Gemma 3系列的成功就是一個(gè)很好的例證。

在過(guò)去幾個(gè)月,是Gemma 3系列開(kāi)源模型的高光時(shí)刻。

先是Gemma 3和Gemma 3 QAT,在云端和本地桌面加速器上,均跑出了SOTA級(jí)別的表現(xiàn)。

緊接著,主打「移動(dòng)優(yōu)先」的Gemma 3n完整版,將強(qiáng)大、實(shí)時(shí)的多模態(tài)生成式AI直接帶入邊緣設(shè)備。

上周,Gemma系列模型的總下載量突破了2億大關(guān),Gemmaverse社區(qū)的熱度空前高漲。

Google又乘勢(shì)推出了Gemma 3 270M。

看名字中的「M」就知道,它的目標(biāo)不是「通吃一切」,而是要以更低成本、更高效率、更快速度地完成你交給它的活。

小身板,真能打

Gemma 3 270M是Gemma 3系列中參數(shù)規(guī)模最小的。

別看它個(gè)頭小,能量卻不可小覷。

在IFEval基準(zhǔn)測(cè)試上,Gemma 3 270M樹(shù)立了性能新標(biāo)桿。


它的IFEval分?jǐn)?shù)接近50%,顯著高于一些相同尺寸甚至更大尺寸的模型。

在小模型陣營(yíng)里,它是唯一接近50%水平的,意味著它在指令跟隨任務(wù)中表現(xiàn)非常突出。

再加上其出色的文本結(jié)構(gòu)化能力,讓它更適用于面向特定任務(wù)的微調(diào),從而在端側(cè)部署和科研應(yīng)用方面均展現(xiàn)出獨(dú)特優(yōu)勢(shì)。

在效率上,Gemma 3 270M在中小模型中表現(xiàn)最優(yōu),甚至超越了更大規(guī)模的Qwen 2.5 0.5B和SmolLM2-360M;但與1B級(jí)別的模型相比,仍有20~25個(gè)百分點(diǎn)的IFEval差距:這是極致壓縮帶來(lái)的不可避免損失。

綜合來(lái)看,Gemma 3 270M重要的性能亮點(diǎn)有:

小體積,強(qiáng)架構(gòu):模型中的1.7億參數(shù)用在詞嵌入層,支持256k超大詞表,能識(shí)別冷門(mén)Token,適合細(xì)分行業(yè)和語(yǔ)言環(huán)境下微調(diào)使用。剩下1億參數(shù),則用于Transformer塊;

省電狂魔:Google在Pixel 9 Pro上實(shí)測(cè),INT4量化版本進(jìn)行25輪對(duì)話(huà)只耗0.75%電量,是迄今最節(jié)能的Gemma模型;

跟指令超聽(tīng)話(huà):除了預(yù)訓(xùn)練版本外,Google還放出了指令微調(diào)模型,開(kāi)箱即用,能直接處理常規(guī)的指令類(lèi)任務(wù);

量產(chǎn)級(jí)QAT支持,部署無(wú)憂(yōu):模型提供了量化感知訓(xùn)練(QAT)版本,可在INT4精度下運(yùn)行,性能幾乎無(wú)損,特別適合資源受限設(shè)備的部署需求。

用對(duì)AI,才能事半功倍

「掛一幅畫(huà),你會(huì)用鐵錘嗎?」

這句話(huà)提醒我們:用對(duì)AI才能事半功倍。

不是每個(gè)AI項(xiàng)目,都需要?jiǎng)佑脦资畠|參數(shù)的大模型(大錘),更多情況下,像Gemma 3 270M這樣的小模型,反而是你需要的那把「AI扳手」。

Gemma 3 270M推出,正是延續(xù)了該系列模型「用對(duì)工具」的理念。

它是一款「開(kāi)箱即戰(zhàn)」的高性能基礎(chǔ)模型,正如上文在它的性能亮點(diǎn)中提到的,出色的指令跟隨能力,經(jīng)過(guò)簡(jiǎn)單微調(diào)后,便可以在文本分類(lèi)、數(shù)據(jù)抽取等任務(wù)中游刃有余。

此外,它還能直接部署在手機(jī),或者樹(shù)莓派這樣的單片機(jī)電腦上。

有了這樣一個(gè)小而強(qiáng)、易部署的模型作為起點(diǎn),開(kāi)發(fā)者可以打造輕量、快速且極具成本優(yōu)勢(shì)的生產(chǎn)系統(tǒng)。

Plaito AI的CTO Greg Mars對(duì)Gemma 3 270M頗為贊賞,認(rèn)為它可以在自己的M4 Pro上極其快速、高質(zhì)量的運(yùn)行。


LLM研究工程師Sebastian Raschka,還貼出了Gemma 3 270M和Qwen3 0.6B的并排比較。

他認(rèn)為最大的驚喜是Gemma 3 270M只有4個(gè)注意力頭。


和Qwen3 0.6B的16個(gè)注意力頭相比,Gemma 3 270M只有4個(gè)注意力頭,這意味著后者在推理時(shí)key/value復(fù)用率高,顯著降低顯存占用和延遲。

因此,Gemma 3 270M更適合部署在低配的本地環(huán)境。

雖然Gemma 3 270M剛剛發(fā)布,但Gemma 3系列在不同規(guī)模的任務(wù)中,早已展現(xiàn)出「小而專(zhuān)」的威力。

例如,Adaptive ML與SK Telecom合作解決復(fù)雜多語(yǔ)言?xún)?nèi)容審核的難題時(shí),并沒(méi)有依賴(lài)龐大的通用模型,而是選擇了微調(diào)一個(gè)Gemma 3 4B模型。結(jié)果不僅達(dá)標(biāo),甚至超越了更大體量的專(zhuān)有模型。

Gemma 3 270M延續(xù)了這一理念,將「小而專(zhuān)」進(jìn)一步壓縮到極致,把高效、精準(zhǔn)的特性下放到更多開(kāi)發(fā)者可直接使用的規(guī)模。

比如,你可以用它構(gòu)建一個(gè)「多模型小分隊(duì)」,每個(gè)模型專(zhuān)攻一類(lèi)任務(wù)。

但別以為這種小模型只能用在「單調(diào)的」企業(yè)系統(tǒng)里,它的專(zhuān)業(yè)化能力,同樣也能在創(chuàng)意領(lǐng)域干點(diǎn)有趣的事。

例如,Hugging Face的開(kāi)發(fā)者Joshua,就用Gemma 3 270M搞了個(gè)基于Transformers.js的網(wǎng)頁(yè)應(yīng)用,生成睡前故事,支持離線(xiàn)運(yùn)行,還能個(gè)性化生成角色和情節(jié)。

270M,是誰(shuí)的「理想型」

Gemma 3 270M承襲了Gemma系列的先進(jìn)架構(gòu)與強(qiáng)大預(yù)訓(xùn)練,具備打造定制應(yīng)用的理想基礎(chǔ)。

如果你的應(yīng)用場(chǎng)景與下列條件類(lèi)似,那它就是你的「理想型」:

任務(wù)明確、數(shù)據(jù)量大的場(chǎng)景:如情感分析、實(shí)體識(shí)別、查詢(xún)路由、結(jié)構(gòu)化轉(zhuǎn)換、創(chuàng)意寫(xiě)作和合規(guī)檢查類(lèi)任務(wù);

預(yù)算有限,對(duì)響應(yīng)速度有高要求:模型微調(diào)后,可運(yùn)行在輕量、低成本的本地或終端設(shè)備上,能幫你省下大模型的推理成本,速度更快;

希望快速迭代和上線(xiàn):它可以小時(shí)級(jí)別完成微調(diào)實(shí)驗(yàn),遠(yuǎn)快于大模型的開(kāi)發(fā)周期;

需要本地部署,保證隱私:Gemma 3 270M支持完全本地化運(yùn)行,用戶(hù)數(shù)據(jù)無(wú)需上傳云端;

構(gòu)建多個(gè)小模型一起跑:一臺(tái)設(shè)備上部署多個(gè)任務(wù)專(zhuān)家模型也不吃力,控制預(yù)算的同時(shí)實(shí)現(xiàn)模型能力最大化。

Gemma 3 270M采用與其他Gemma 3模型一致的架構(gòu),并配套提供微調(diào)方法與工具,幫助開(kāi)發(fā)者輕松將其打造成自己專(zhuān)屬的解決方案。

下載模型:Hugging Face、Ollama、Kaggle、LM Studio、Docker全平臺(tái)覆蓋,可以獲取預(yù)訓(xùn)練模型及指令微調(diào)版本;

試跑體驗(yàn):在Vertex AI或llama.cpp、Gemma.cpp、LiteRT、Keras、MLX等主流工具上都能玩;

開(kāi)始微調(diào):使用Hugging Face、UnSloth、JAX等你熟悉的工具開(kāi)展微調(diào);

部署上線(xiàn):微調(diào)完成后,可部署到本地環(huán)境、Google Cloud Run,或任意你選擇的平臺(tái)。

Gemmaverse的核心理念是:創(chuàng)新無(wú)關(guān)大小。

Gemma 3,尤其是Gemma 3 270M,是開(kāi)發(fā)者構(gòu)建「專(zhuān)精小模型艦隊(duì)」的理想起點(diǎn)。雖然它們身板小,卻能承擔(dān)起各種AI實(shí)戰(zhàn)任務(wù),組團(tuán)干大活一點(diǎn)也不含糊。

Gemma 3:開(kāi)發(fā)者手中的「瑞士軍刀」

2024年2月,Google推出了Gemma系列的首個(gè)版本。

作為Gemini的輕量級(jí)版本,Google推出它的初衷很簡(jiǎn)單,讓開(kāi)發(fā)者不再為「模型太大跑不動(dòng)、模型太小能力不夠」而糾結(jié)。

Gemma 3上線(xiàn)后,「開(kāi)源友好」「性?xún)r(jià)比高」「可塑性強(qiáng)」是眾多開(kāi)發(fā)者對(duì)它的一致評(píng)價(jià),儼然已成為開(kāi)發(fā)者AI工具箱里的「瑞士軍刀」。

大模型越來(lái)越大,隨之而來(lái)的是越來(lái)越嚴(yán)重的「算力焦慮」,市場(chǎng)對(duì)于低硬件需求且效能強(qiáng)勁的AI解決方案始終存在著巨大需求。

「模型不求大,夠用才是王道」。

Gemma系列的這一設(shè)計(jì)理念,正是對(duì)上述市場(chǎng)趨勢(shì)的積極回應(yīng),這次Gemma 3 270M的發(fā)布,更是將該理念推向一個(gè)新的階段。

參考資料:

https://developers.googleblog.com/en/introducing-gemma-3-270m/

https://huggingface.co/google/gemma-3-270m

https://www.youtube.com/watch?v=qcjrduz_YS8

https://ikala.ai/zh-tw/blog/ikala-ai-insight/gemma-3-intro/


特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
我在非洲當(dāng)保鏢:見(jiàn)證了海外華人的邪惡,非洲黑妹非要嫁給我

我在非洲當(dāng)保鏢:見(jiàn)證了海外華人的邪惡,非洲黑妹非要嫁給我

吳學(xué)華看天下
2023-12-20 12:32:08
79歲克林頓久違露面,帶除顫器引發(fā)健康擔(dān)憂(yōu),77歲希拉里卻很精神

79歲克林頓久違露面,帶除顫器引發(fā)健康擔(dān)憂(yōu),77歲希拉里卻很精神

譯言
2025-08-30 20:30:50
孟村女子葬禮后續(xù):弟弟曬照緬懷,曝姐姐隱忍原因,設(shè)計(jì)師發(fā)聲!

孟村女子葬禮后續(xù):弟弟曬照緬懷,曝姐姐隱忍原因,設(shè)計(jì)師發(fā)聲!

古希臘掌管松餅的神
2025-08-29 21:52:46
36歲楊穎上海商場(chǎng)現(xiàn)身,穿3年前高定禮服,失勢(shì)藝人辛酸盡顯?

36歲楊穎上海商場(chǎng)現(xiàn)身,穿3年前高定禮服,失勢(shì)藝人辛酸盡顯?

智凌縱橫
2025-08-30 10:36:55
楊蘭蘭保鏢身份疑曝光:姓胡、江西人,曾服役武警特勤,身手不凡

楊蘭蘭保鏢身份疑曝光:姓胡、江西人,曾服役武警特勤,身手不凡

公子麥少
2025-08-10 17:04:40
莫迪最新涉華表態(tài):印中保持緊密關(guān)系,對(duì)構(gòu)建多極化亞洲和世界至關(guān)重要

莫迪最新涉華表態(tài):印中保持緊密關(guān)系,對(duì)構(gòu)建多極化亞洲和世界至關(guān)重要

環(huán)球網(wǎng)資訊
2025-08-30 10:09:51
澳門(mén)賭場(chǎng)公關(guān)爆猛料:明星導(dǎo)演常來(lái),某天王玩半年,專(zhuān)走秘密通道

澳門(mén)賭場(chǎng)公關(guān)爆猛料:明星導(dǎo)演常來(lái),某天王玩半年,專(zhuān)走秘密通道

深析古今
2025-08-25 10:41:34
2進(jìn)武漢決賽,肖國(guó)棟秀恩愛(ài):感謝我老婆,這是送她的七夕禮物!

2進(jìn)武漢決賽,肖國(guó)棟秀恩愛(ài):感謝我老婆,這是送她的七夕禮物!

老媹古裝影視解說(shuō)
2025-08-29 21:07:49
iPhone17ProMax,突然提前上架

iPhone17ProMax,突然提前上架

搞機(jī)小帝
2025-08-30 13:57:02
董璇給張維伊家所有親屬買(mǎi)黃金,董璇媽媽感慨:他家親戚可多了!

董璇給張維伊家所有親屬買(mǎi)黃金,董璇媽媽感慨:他家親戚可多了!

陳意小可愛(ài)
2025-08-30 21:40:31
“我不想死!”長(zhǎng)沙女教師癌癥晚期,直言:全家必須為我犧牲!

“我不想死!”長(zhǎng)沙女教師癌癥晚期,直言:全家必須為我犧牲!

詩(shī)詞中國(guó)
2025-08-26 15:46:48
人民網(wǎng)發(fā)聲!兇手爸媽醫(yī)院工作,劉某父親哽咽發(fā)聲:一命抵一命

人民網(wǎng)發(fā)聲!兇手爸媽醫(yī)院工作,劉某父親哽咽發(fā)聲:一命抵一命

熱點(diǎn)菌本君
2025-08-27 15:45:34
【市長(zhǎng)】潮州市迎來(lái)新任副市長(zhǎng)鄧鋼:從紀(jì)委骨干到援藏先鋒,實(shí)干擔(dān)當(dāng)助力潮州騰飛

【市長(zhǎng)】潮州市迎來(lái)新任副市長(zhǎng)鄧鋼:從紀(jì)委骨干到援藏先鋒,實(shí)干擔(dān)當(dāng)助力潮州騰飛

潮州玩家
2025-08-30 22:26:13
韓國(guó)女運(yùn)動(dòng)員網(wǎng)上曬腹肌竟被舉報(bào)!稱(chēng)她是只穿內(nèi)衣太暴露?

韓國(guó)女運(yùn)動(dòng)員網(wǎng)上曬腹肌竟被舉報(bào)!稱(chēng)她是只穿內(nèi)衣太暴露?

奮斗在韓國(guó)
2025-08-30 14:06:44
打入一球,迪亞斯當(dāng)選奧格斯堡vs拜仁全場(chǎng)最佳球員

打入一球,迪亞斯當(dāng)選奧格斯堡vs拜仁全場(chǎng)最佳球員

懂球帝
2025-08-31 03:11:31
街頭捕獲高個(gè)長(zhǎng)發(fā)姐姐,她瑜伽褲勾勒的線(xiàn)條感絕了

街頭捕獲高個(gè)長(zhǎng)發(fā)姐姐,她瑜伽褲勾勒的線(xiàn)條感絕了

半生情感
2025-08-15 10:10:50
杭州男子暴打情夫后續(xù):扇臉猛踹,妻子跪地求饒,猛料被扒是慣犯

杭州男子暴打情夫后續(xù):扇臉猛踹,妻子跪地求饒,猛料被扒是慣犯

天天熱點(diǎn)見(jiàn)聞
2025-08-29 14:11:55
這是黃圣依?差點(diǎn)沒(méi)認(rèn)出來(lái),氣質(zhì)完全不一樣了呀,像是變了一個(gè)人

這是黃圣依?差點(diǎn)沒(méi)認(rèn)出來(lái),氣質(zhì)完全不一樣了呀,像是變了一個(gè)人

鄉(xiāng)野小珥
2025-08-24 13:16:57
貴州女老師趙慶梅執(zhí)行死刑,22名男生遭毒手,全班僅兩人幸免

貴州女老師趙慶梅執(zhí)行死刑,22名男生遭毒手,全班僅兩人幸免

第四思維
2025-08-26 09:14:41
重磅的房地產(chǎn)政策來(lái)了,國(guó)家要對(duì)老舊住房改造下重手。

重磅的房地產(chǎn)政策來(lái)了,國(guó)家要對(duì)老舊住房改造下重手。

流蘇晚晴
2025-08-30 18:06:15
2025-08-31 03:48:49
新智元 incentive-icons
新智元
AI產(chǎn)業(yè)主平臺(tái)領(lǐng)航智能+時(shí)代
13353文章數(shù) 66140關(guān)注度
往期回顧 全部

科技要聞

李斌內(nèi)部講話(huà):蔚來(lái)四季度必須盈利

頭條要聞

媒體:日本忍不了了 最后一刻取消訪(fǎng)美

頭條要聞

媒體:日本忍不了了 最后一刻取消訪(fǎng)美

體育要聞

扛著別人的老婆,贏下那該死的冠軍

娛樂(lè)要聞

吳京風(fēng)波拉出多位明星

財(cái)經(jīng)要聞

美上訴法院裁定特朗普關(guān)稅非法!

汽車(chē)要聞

全國(guó)靜態(tài)品鑒開(kāi)啟 方程豹鈦7成都車(chē)展首秀

態(tài)度原創(chuàng)

時(shí)尚
親子
藝術(shù)
游戲
軍事航空

伊姐周六熱推:電視劇《十二封信》;電影《死神來(lái)了:血脈詛咒》......

親子要聞

寶藍(lán)用平板一下子買(mǎi)了50盒玩具!!!

藝術(shù)要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫(xiě)法

UP主挑戰(zhàn)念“游戲科學(xué)”100萬(wàn)次:最后竟然成功了!

軍事要聞

美國(guó)務(wù)院批準(zhǔn)對(duì)烏新軍售

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版