成人深夜视频网站|日韩高清无码久久|中文a√在线天堂|亚洲黄网站在线看|欧美视频 第二页|日本 久草 天堂|高潮无遮挡黄视频|久久一级内射精品|国产操逼一级视频|五月天婷婷色AV

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

谷歌最新「0.27B」Gemma 3開源!身板小卻猛如虎,開發(fā)者直呼救命稻草

0
分享至


新智元報道

編輯:元宇

【新智元導(dǎo)讀】大模型越來越大,開發(fā)者的「算力焦慮」也越來越嚴(yán)重。谷歌的Gemma卻另辟蹊徑:模型不求大,夠用才是王道。Gemma 3系列,尤其是新成員Gemma 3 270M正是這一理念的最佳詮釋者。它雖然「身板小」,卻能承擔(dān)各種AI實戰(zhàn)任務(wù),還能「組團(tuán)」一起干大事。

大塊頭不等于大智慧。

這在生成式AI領(lǐng)域,已逐漸成為共識。

Gemma 3系列的成功就是一個很好的例證。

在過去幾個月,是Gemma 3系列開源模型的高光時刻。

先是Gemma 3和Gemma 3 QAT,在云端和本地桌面加速器上,均跑出了SOTA級別的表現(xiàn)。

緊接著,主打「移動優(yōu)先」的Gemma 3n完整版,將強(qiáng)大、實時的多模態(tài)生成式AI直接帶入邊緣設(shè)備。

上周,Gemma系列模型的總下載量突破了2億大關(guān),Gemmaverse社區(qū)的熱度空前高漲。

Google又乘勢推出了Gemma 3 270M。

看名字中的「M」就知道,它的目標(biāo)不是「通吃一切」,而是要以更低成本、更高效率、更快速度地完成你交給它的活。

小身板,真能打

Gemma 3 270M是Gemma 3系列中參數(shù)規(guī)模最小的。

別看它個頭小,能量卻不可小覷。

在IFEval基準(zhǔn)測試上,Gemma 3 270M樹立了性能新標(biāo)桿。


它的IFEval分?jǐn)?shù)接近50%,顯著高于一些相同尺寸甚至更大尺寸的模型。

在小模型陣營里,它是唯一接近50%水平的,意味著它在指令跟隨任務(wù)中表現(xiàn)非常突出。

再加上其出色的文本結(jié)構(gòu)化能力,讓它更適用于面向特定任務(wù)的微調(diào),從而在端側(cè)部署和科研應(yīng)用方面均展現(xiàn)出獨(dú)特優(yōu)勢。

在效率上,Gemma 3 270M在中小模型中表現(xiàn)最優(yōu),甚至超越了更大規(guī)模的Qwen 2.5 0.5B和SmolLM2-360M;但與1B級別的模型相比,仍有20~25個百分點(diǎn)的IFEval差距:這是極致壓縮帶來的不可避免損失。

綜合來看,Gemma 3 270M重要的性能亮點(diǎn)有:

小體積,強(qiáng)架構(gòu):模型中的1.7億參數(shù)用在詞嵌入層,支持256k超大詞表,能識別冷門Token,適合細(xì)分行業(yè)和語言環(huán)境下微調(diào)使用。剩下1億參數(shù),則用于Transformer塊;

省電狂魔:Google在Pixel 9 Pro上實測,INT4量化版本進(jìn)行25輪對話只耗0.75%電量,是迄今最節(jié)能的Gemma模型;

跟指令超聽話:除了預(yù)訓(xùn)練版本外,Google還放出了指令微調(diào)模型,開箱即用,能直接處理常規(guī)的指令類任務(wù);

量產(chǎn)級QAT支持,部署無憂:模型提供了量化感知訓(xùn)練(QAT)版本,可在INT4精度下運(yùn)行,性能幾乎無損,特別適合資源受限設(shè)備的部署需求。

用對AI,才能事半功倍

「掛一幅畫,你會用鐵錘嗎?」

這句話提醒我們:用對AI才能事半功倍。

不是每個AI項目,都需要動用幾十億參數(shù)的大模型(大錘),更多情況下,像Gemma 3 270M這樣的小模型,反而是你需要的那把「AI扳手」。

Gemma 3 270M推出,正是延續(xù)了該系列模型「用對工具」的理念。

它是一款「開箱即戰(zhàn)」的高性能基礎(chǔ)模型,正如上文在它的性能亮點(diǎn)中提到的,出色的指令跟隨能力,經(jīng)過簡單微調(diào)后,便可以在文本分類、數(shù)據(jù)抽取等任務(wù)中游刃有余。

此外,它還能直接部署在手機(jī),或者樹莓派這樣的單片機(jī)電腦上。

有了這樣一個小而強(qiáng)、易部署的模型作為起點(diǎn),開發(fā)者可以打造輕量、快速且極具成本優(yōu)勢的生產(chǎn)系統(tǒng)。

Plaito AI的CTO Greg Mars對Gemma 3 270M頗為贊賞,認(rèn)為它可以在自己的M4 Pro上極其快速、高質(zhì)量的運(yùn)行。


LLM研究工程師Sebastian Raschka,還貼出了Gemma 3 270M和Qwen3 0.6B的并排比較。

他認(rèn)為最大的驚喜是Gemma 3 270M只有4個注意力頭。


和Qwen3 0.6B的16個注意力頭相比,Gemma 3 270M只有4個注意力頭,這意味著后者在推理時key/value復(fù)用率高,顯著降低顯存占用和延遲。

因此,Gemma 3 270M更適合部署在低配的本地環(huán)境。

雖然Gemma 3 270M剛剛發(fā)布,但Gemma 3系列在不同規(guī)模的任務(wù)中,早已展現(xiàn)出「小而專」的威力。

例如,Adaptive ML與SK Telecom合作解決復(fù)雜多語言內(nèi)容審核的難題時,并沒有依賴龐大的通用模型,而是選擇了微調(diào)一個Gemma 3 4B模型。結(jié)果不僅達(dá)標(biāo),甚至超越了更大體量的專有模型。

Gemma 3 270M延續(xù)了這一理念,將「小而?!惯M(jìn)一步壓縮到極致,把高效、精準(zhǔn)的特性下放到更多開發(fā)者可直接使用的規(guī)模。

比如,你可以用它構(gòu)建一個「多模型小分隊」,每個模型專攻一類任務(wù)。

但別以為這種小模型只能用在「單調(diào)的」企業(yè)系統(tǒng)里,它的專業(yè)化能力,同樣也能在創(chuàng)意領(lǐng)域干點(diǎn)有趣的事。

例如,Hugging Face的開發(fā)者Joshua,就用Gemma 3 270M搞了個基于Transformers.js的網(wǎng)頁應(yīng)用,生成睡前故事,支持離線運(yùn)行,還能個性化生成角色和情節(jié)。

270M,是誰的「理想型」

Gemma 3 270M承襲了Gemma系列的先進(jìn)架構(gòu)與強(qiáng)大預(yù)訓(xùn)練,具備打造定制應(yīng)用的理想基礎(chǔ)。

如果你的應(yīng)用場景與下列條件類似,那它就是你的「理想型」:

任務(wù)明確、數(shù)據(jù)量大的場景:如情感分析、實體識別、查詢路由、結(jié)構(gòu)化轉(zhuǎn)換、創(chuàng)意寫作和合規(guī)檢查類任務(wù);

預(yù)算有限,對響應(yīng)速度有高要求:模型微調(diào)后,可運(yùn)行在輕量、低成本的本地或終端設(shè)備上,能幫你省下大模型的推理成本,速度更快;

希望快速迭代和上線:它可以小時級別完成微調(diào)實驗,遠(yuǎn)快于大模型的開發(fā)周期;

需要本地部署,保證隱私:Gemma 3 270M支持完全本地化運(yùn)行,用戶數(shù)據(jù)無需上傳云端;

構(gòu)建多個小模型一起跑:一臺設(shè)備上部署多個任務(wù)專家模型也不吃力,控制預(yù)算的同時實現(xiàn)模型能力最大化。

Gemma 3 270M采用與其他Gemma 3模型一致的架構(gòu),并配套提供微調(diào)方法與工具,幫助開發(fā)者輕松將其打造成自己專屬的解決方案。

下載模型:Hugging Face、Ollama、Kaggle、LM Studio、Docker全平臺覆蓋,可以獲取預(yù)訓(xùn)練模型及指令微調(diào)版本;

試跑體驗:在Vertex AI或llama.cpp、Gemma.cpp、LiteRT、Keras、MLX等主流工具上都能玩;

開始微調(diào):使用Hugging Face、UnSloth、JAX等你熟悉的工具開展微調(diào);

部署上線:微調(diào)完成后,可部署到本地環(huán)境、Google Cloud Run,或任意你選擇的平臺。

Gemmaverse的核心理念是:創(chuàng)新無關(guān)大小。

Gemma 3,尤其是Gemma 3 270M,是開發(fā)者構(gòu)建「專精小模型艦隊」的理想起點(diǎn)。雖然它們身板小,卻能承擔(dān)起各種AI實戰(zhàn)任務(wù),組團(tuán)干大活一點(diǎn)也不含糊。

Gemma 3:開發(fā)者手中的「瑞士軍刀」

2024年2月,Google推出了Gemma系列的首個版本。

作為Gemini的輕量級版本,Google推出它的初衷很簡單,讓開發(fā)者不再為「模型太大跑不動、模型太小能力不夠」而糾結(jié)。

Gemma 3上線后,「開源友好」「性價比高」「可塑性強(qiáng)」是眾多開發(fā)者對它的一致評價,儼然已成為開發(fā)者AI工具箱里的「瑞士軍刀」。

大模型越來越大,隨之而來的是越來越嚴(yán)重的「算力焦慮」,市場對于低硬件需求且效能強(qiáng)勁的AI解決方案始終存在著巨大需求。

「模型不求大,夠用才是王道」。

Gemma系列的這一設(shè)計理念,正是對上述市場趨勢的積極回應(yīng),這次Gemma 3 270M的發(fā)布,更是將該理念推向一個新的階段。

參考資料:

https://developers.googleblog.com/en/introducing-gemma-3-270m/

https://huggingface.co/google/gemma-3-270m

https://www.youtube.com/watch?v=qcjrduz_YS8

https://ikala.ai/zh-tw/blog/ikala-ai-insight/gemma-3-intro/


特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
拆彈失??!炸彈小隊:安東尼遭貝蒂斯放棄,桑喬+馬拉西亞無進(jìn)展

拆彈失敗!炸彈小隊:安東尼遭貝蒂斯放棄,桑喬+馬拉西亞無進(jìn)展

直播吧
2025-08-30 08:59:32
隆妮!狂飆(高啟蘭)驚艷照曝光,網(wǎng)友:太美了!

隆妮!狂飆(高啟蘭)驚艷照曝光,網(wǎng)友:太美了!

娛樂領(lǐng)航家
2025-08-28 23:00:03
23分鐘砍43分!他這樣打下去,東契奇的得分王懸了

23分鐘砍43分!他這樣打下去,東契奇的得分王懸了

籃球大視野
2025-08-30 12:19:08
中國腦梗發(fā)病率世界第一,醫(yī)生:主要原因已查出,4種蔬菜要少吃

中國腦梗發(fā)病率世界第一,醫(yī)生:主要原因已查出,4種蔬菜要少吃

詩意世界
2025-08-26 13:31:36
太強(qiáng)了!23分鐘砸出43分!勇士已經(jīng)要不起人家

太強(qiáng)了!23分鐘砸出43分!勇士已經(jīng)要不起人家

籃球?qū)崙?zhàn)寶典
2025-08-30 19:54:36
22歲女子酒后從副駕駛墜落,已在ICU昏迷一個月,警方排除刑事案件可能,家屬:開車的是女兒老板,醫(yī)藥費(fèi)沒著落了

22歲女子酒后從副駕駛墜落,已在ICU昏迷一個月,警方排除刑事案件可能,家屬:開車的是女兒老板,醫(yī)藥費(fèi)沒著落了

極目新聞
2025-08-30 11:37:11
iPhone17ProMax,突然提前上架

iPhone17ProMax,突然提前上架

搞機(jī)小帝
2025-08-30 13:57:02
我國的竹子在改變世界!多國排隊采購,“以竹代石”意味著什么?

我國的竹子在改變世界!多國排隊采購,“以竹代石”意味著什么?

不寫散文詩
2025-08-26 21:11:00
女孩身高2.26米,貌美如花,媽媽卻天天發(fā)愁:比門還高,沒人敢追

女孩身高2.26米,貌美如花,媽媽卻天天發(fā)愁:比門還高,沒人敢追

知鑒明史
2025-08-27 10:00:50
馬筱梅抱著玩偶擋住隆起的小腹,臉露憔悴

馬筱梅抱著玩偶擋住隆起的小腹,臉露憔悴

章眽八卦
2025-08-30 13:23:08
曝申花和海港都向足協(xié)要員行賄,聯(lián)賽冠軍懸念陡增,宋凱遇到難題

曝申花和海港都向足協(xié)要員行賄,聯(lián)賽冠軍懸念陡增,宋凱遇到難題

姜大叔侃球
2025-08-30 20:10:09
國民黨黨主席穩(wěn)了?鄭麗文怒批藍(lán)營:不敢認(rèn)中國人就去民進(jìn)黨!

國民黨黨主席穩(wěn)了?鄭麗文怒批藍(lán)營:不敢認(rèn)中國人就去民進(jìn)黨!

影史侃談
2025-08-30 07:21:01
比芯片還難攻克?美國尖端武器放在我國幾十年,至今未能仿制成功

比芯片還難攻克?美國尖端武器放在我國幾十年,至今未能仿制成功

滄海旅行家
2025-08-29 20:42:02
F1荷蘭站排位賽:皮亞斯特里奪桿!諾里斯第二,維斯塔潘第三

F1荷蘭站排位賽:皮亞斯特里奪桿!諾里斯第二,維斯塔潘第三

雷速體育
2025-08-30 22:16:19
太突然!柳州15年歷史老牌幼兒園倒閉了?引發(fā)網(wǎng)友們回憶殺……

太突然!柳州15年歷史老牌幼兒園倒閉了?引發(fā)網(wǎng)友們回憶殺……

柳州全攻略
2025-08-30 20:10:00
山東師生性丑聞?wù)掌鞒觯a臟聊天曝光:女生大膽主動、經(jīng)驗豐富

山東師生性丑聞?wù)掌鞒?,骯臟聊天曝光:女生大膽主動、經(jīng)驗豐富

博士觀察
2025-08-30 22:49:33
澤連斯基:俄軍已在波克羅夫斯克方向集結(jié)多達(dá)10萬人,正在準(zhǔn)備進(jìn)攻行動,目前前線局勢基本可控

澤連斯基:俄軍已在波克羅夫斯克方向集結(jié)多達(dá)10萬人,正在準(zhǔn)備進(jìn)攻行動,目前前線局勢基本可控

FM93浙江交通之聲
2025-08-29 23:21:02
裁員7萬,月薪從兩萬降到五千,“斷崖式降薪”讓銀行人苦不堪言

裁員7萬,月薪從兩萬降到五千,“斷崖式降薪”讓銀行人苦不堪言

侃故事的阿慶
2025-08-30 12:54:04
玩沙漠越野遇難網(wǎng)紅所乘車輛側(cè)翻前疑被碰撞,現(xiàn)場畫面曝光,家屬發(fā)聲:為何沒有同行人員站出來說出真相?

玩沙漠越野遇難網(wǎng)紅所乘車輛側(cè)翻前疑被碰撞,現(xiàn)場畫面曝光,家屬發(fā)聲:為何沒有同行人員站出來說出真相?

極目新聞
2025-08-29 22:37:18
徐敏的國民好男人形象毀了嗎?

徐敏的國民好男人形象毀了嗎?

阿廢冷眼觀察所
2025-08-30 16:05:48
2025-08-31 00:28:49
新智元 incentive-icons
新智元
AI產(chǎn)業(yè)主平臺領(lǐng)航智能+時代
13353文章數(shù) 66140關(guān)注度
往期回顧 全部

科技要聞

李斌內(nèi)部講話:蔚來四季度必須盈利

頭條要聞

媒體:日本忍不了了 最后一刻取消訪美

頭條要聞

媒體:日本忍不了了 最后一刻取消訪美

體育要聞

扛著別人的老婆,贏下那該死的冠軍

娛樂要聞

吳京風(fēng)波拉出多位明星

財經(jīng)要聞

美上訴法院裁定特朗普關(guān)稅非法!

汽車要聞

全國靜態(tài)品鑒開啟 方程豹鈦7成都車展首秀

態(tài)度原創(chuàng)

時尚
游戲
藝術(shù)
教育
軍事航空

伊姐周六熱推:電視劇《十二封信》;電影《死神來了:血脈詛咒》......

春城綻放玫瑰!英雄聯(lián)盟手游女子SOLO賽圓滿落幕

藝術(shù)要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

教育要聞

馬伯庸送娃上作文班被嘲:育兒焦慮真相,越優(yōu)秀越要接受孩子普通

軍事要聞

美國務(wù)院批準(zhǔn)對烏新軍售

無障礙瀏覽 進(jìn)入關(guān)懷版