成人深夜视频网站|日韩高清无码久久|中文a√在线天堂|亚洲黄网站在线看|欧美视频 第二页|日本 久草 天堂|高潮无遮挡黄视频|久久一级内射精品|国产操逼一级视频|五月天婷婷色AV

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

谷歌香蕉模型一夜登頂!干翻GPT-4o和FLUX,坐穩(wěn)AI圖像之王

0
分享至


智東西
編譯 陳駿達(dá)
編輯 李水青

智東西8月27日?qǐng)?bào)道,今天,谷歌推出了Gemini 2.5 Flash Image,這款模型是谷歌最先進(jìn)的圖像生成和編輯模型。

這一模型的核心亮點(diǎn)是其圖像編輯能力。谷歌稱,這一模型可將多個(gè)圖像混合到單個(gè)圖像中,保持高度角色一致性,還能使用自然語言進(jìn)行有針對(duì)性的修改,并充分利用Gemini的世界知識(shí)。

諾貝爾獎(jiǎng)得主、谷歌DeepMind CEO Demis Hassabis用自己的照片為新模型做宣傳,展示Gemini 2.5 Flash Image的角色一致性。他將自己的一張照片背景做了修改,切換為古典風(fēng)格,但是人物的容貌沒有出現(xiàn)改變。


上述能力也解鎖了不少有趣的用例,比如,按照特定視覺模板打造“球星卡”一般的設(shè)計(jì),讓普通人也能一鍵體驗(yàn)頂級(jí)運(yùn)動(dòng)員才有的待遇。


這一模型與谷歌Veo 3等視頻生成模型是絕配,結(jié)合使用后可以打造出豐富的視頻效果。海外AI創(chuàng)意平臺(tái)Kera AI已經(jīng)用類似的模式,打造了一部廣告大片。

這款模型在上周其實(shí)已經(jīng)以“nano-banana”的代號(hào)出現(xiàn)在大模型競技場中,并獲得了用戶200多萬票的認(rèn)可。如今正式揭曉后,Gemini 2.5 Flash Image在文生圖與圖像編輯兩個(gè)場景均拿下了全球第一,在圖像編輯榜單上更是獲得1362的高分,較第二名的領(lǐng)先幅度接近15%。


在谷歌公布的基準(zhǔn)測試中,Gemini 2.5 Flash Image在用戶綜合喜好度、人物、創(chuàng)造力、信息圖、物體和環(huán)境的生成上均領(lǐng)先GPT-4o圖像生成、Flux.1 Kontext(max)、Qwen Image Edit等模型,但在風(fēng)格化能力上與GPT-4o圖像生成仍有差距。


Gemini 2.5 Flash Image是一款主要面向開發(fā)者的模型,目前可在Gemini API、Google AI Studio、以及面向企業(yè)的Vertex AI中獲得。

這一模型的價(jià)格為30美元/100萬個(gè)輸出token,每張圖像為1290個(gè)輸出token,每張圖像價(jià)格約為0.039美元(折合人民幣0.28元)。所有其他輸入和輸出模態(tài)均遵循Gemini 2.5 Flash定價(jià)。

為了讓使用Gemini 2.5 Flash Image打造AI應(yīng)用更為容易,谷歌還對(duì)AI Studio的“構(gòu)建模式(Built Mode)”進(jìn)行了重大更新。開發(fā)者可以使用利用AI打造應(yīng)用程序,快速測試Gemini 2.5 Flash Image等新模型的功能。

當(dāng)準(zhǔn)備好發(fā)布應(yīng)用時(shí),開發(fā)者可以直接從谷歌AI Studio進(jìn)行部署,或?qū)⒋a保存到GitHub。谷歌也在博客中集中展示了幾個(gè)案例:

超強(qiáng)角色一致性,幫Altman一鍵穿越

在多輪對(duì)話和編輯中保持角色和對(duì)象外觀的一致,是圖像生成與編輯的重大挑戰(zhàn)。谷歌的Gemini 2.5 Flash Image允許用戶將同一個(gè)角色放置在不同的環(huán)境中,在新環(huán)境中從多個(gè)角度展示單個(gè)產(chǎn)品,或生成一致的品牌資產(chǎn),同時(shí)保留主題。

在下方的示例應(yīng)用中,用戶僅需上傳一張自己的自拍,就能生成從50年代到00年代的六張寫真,每張都有當(dāng)時(shí)的年代風(fēng)格,用戶的面貌并沒有出現(xiàn)明顯的偏離。


智東西也上傳了一張OpenAI聯(lián)合創(chuàng)始人兼首席執(zhí)行官Sam Altman的照片,谷歌的新模型直接讓Altman一鍵穿越回過去,畫面質(zhì)感超真實(shí),連每個(gè)年代的服飾都準(zhǔn)確還原了。


這種一致性還可用于專業(yè)設(shè)計(jì)場景。例如,用戶可以給模型提供一種特定的紋理,并要求其進(jìn)行替換。模型能在不改變形狀和細(xì)節(jié)的前提下,完成紋理的更換。


體驗(yàn)鏈接:

https://aistudio.google.com/apps/bundled/past_forward?showPreview=true&showAssistant=true

一句話精準(zhǔn)P圖,光線、色彩全可自定義

Gemini 2.5 Flash Image支持使用自然語言進(jìn)行有圖像轉(zhuǎn)換和編輯。例如,模型可以模糊圖像的背景、去除T恤上的污漬、從照片中刪除整個(gè)人物、改變拍攝對(duì)象的姿勢、為黑白照片添加顏色等。

為了展示這些功能的實(shí)際應(yīng)用,谷歌在AI Studio中構(gòu)建了一個(gè)照片編輯模板應(yīng)用。可以看到,這一照片編輯應(yīng)用支持對(duì)特定區(qū)域進(jìn)行選中和修改,或是進(jìn)行大范圍調(diào)整和濾鏡處理。

智東西上傳了一張?jiān)瞬竦恼掌⒁竽P瓦M(jìn)行微調(diào),讓牙齒看上去更白。


最終生成結(jié)果如下,可以看到修改后扎克伯格的其他外貌特征沒有出現(xiàn)明顯變化。


也可以通過預(yù)設(shè)的提示詞,對(duì)圖像的光線、背景等進(jìn)行自定義。下圖中,寫真的光線便被調(diào)整得更加溫暖。


體驗(yàn)鏈接:

https://aistudio.google.com/apps/bundled/pixshop

具備大量世界知識(shí),能看懂手繪插圖

過去,許多圖像生成模型雖然能打造出精美的畫面,但對(duì)現(xiàn)實(shí)世界缺乏深刻的語義理解。谷歌稱,Gemini 2.5 Flash Image擁有Gemini的世界知識(shí),為展示這點(diǎn),他們打造了一個(gè)模板應(yīng)用,將簡單的畫布變成了一個(gè)互動(dòng)式教育導(dǎo)師。

演示中,Gemini 2.5 Flash Image能夠理解手繪的各類畫面,并解答用戶提出的各類問題。


這種世界知識(shí)還讓模型能夠預(yù)測圖像未來的變化,具備一定圖像推理能力。比如,當(dāng)看到氣球飛翔仙人掌時(shí),模型能夠根據(jù)用戶“預(yù)測下一個(gè)可能場景”的指令,生成氣球破碎的畫面。


體驗(yàn)鏈接:

https://aistudio.google.com/apps/bundled/codrawing?showAssistant=true&showPreview=true

多圖融合能力出眾,可實(shí)現(xiàn)精準(zhǔn)商品展示

Gemini 2.5 Flash Image可以理解和合并多個(gè)輸入圖像,這在電子商務(wù)等場景中有很強(qiáng)的實(shí)用價(jià)值。例如,商家可以在同一場景中用AI生成不同產(chǎn)品的宣傳照,或是給客戶提供家具等產(chǎn)品擺放在真實(shí)場景中的樣子。

下方是谷歌提供的一個(gè)案例,只需將左側(cè)的臺(tái)燈拖拽到右側(cè)的場景中,稍等一段時(shí)間,就能看到擺放后的效果。可以看到模型不僅將臺(tái)燈元素加入畫面,還開啟了燈光。不過,生成過程明顯加速了。


多圖融合能力還可用于創(chuàng)意圖像的生成。例如,融合鯨魚與高山的兩張照片,打造出極具視覺沖擊力的視覺效果。


體驗(yàn)鏈接:

https://aistudio.google.com/apps/bundled/home_canvas?showPreview=true&showAssistant=true

Gemini 2.5 Flash Image發(fā)布后,海外網(wǎng)友已經(jīng)第一時(shí)間玩起來了。這位網(wǎng)友利用它客戶打造了月餅廣告宣傳照,他稱,同樣的提示詞,在Midjourney里要花上10倍的調(diào)整和微調(diào)才能產(chǎn)生類似的結(jié)果。


還有網(wǎng)友分享了自己利用Gemini 2.5 Flash Image結(jié)合Veo 3打造的視頻。在這一過程中,Gemini 2.5 Flash Image生成了許多不同角度的鏡頭畫面,而Veo 3負(fù)責(zé)將它們變?yōu)橐曨l。最終的效果十分驚艷。

不過,也有用戶吐槽這款模型的審查十分嚴(yán)格,例如,無法生成人們拿著刀和斧頭的畫面。


結(jié)語:圖像編輯再進(jìn)化,或成重要生產(chǎn)力工具

從某種意義上來說,準(zhǔn)確的圖像編輯能力是圖像生成走進(jìn)真實(shí)生產(chǎn)場景中最關(guān)鍵的能力之一。在電商等場景中,這一能力滿足了企業(yè)用戶對(duì)精確控制的需求;而在娛樂場景里,這一能力可以給用戶提供豐富的體驗(yàn)和玩法。

當(dāng)前,已有多家國內(nèi)外大模型廠商推出圖像編輯模型,這一領(lǐng)域的最新進(jìn)展值得持續(xù)關(guān)注。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
德云系自媒體爆料,郭德綱賬號(hào)取關(guān)六百多人,和前大徒弟有關(guān)

德云系自媒體爆料,郭德綱賬號(hào)取關(guān)六百多人,和前大徒弟有關(guān)

我就是個(gè)碼字的
2025-08-30 08:30:03
趙繼偉宴請(qǐng)全隊(duì)25人!送別3隊(duì)友!50道大菜擺滿,有烤全羊大龍蝦

趙繼偉宴請(qǐng)全隊(duì)25人!送別3隊(duì)友!50道大菜擺滿,有烤全羊大龍蝦

老吳說體育
2025-08-31 01:03:29
1973年,入獄7年,58歲的她無罪釋放,她卻拒絕出獄

1973年,入獄7年,58歲的她無罪釋放,她卻拒絕出獄

玥來玥好講故事
2025-08-29 20:36:14
“吃飯八分飽”錯(cuò)了?醫(yī)生建議:過了60歲,吃飯要盡量做到這7點(diǎn)

“吃飯八分飽”錯(cuò)了?醫(yī)生建議:過了60歲,吃飯要盡量做到這7點(diǎn)

說歷史的老牢
2025-08-30 11:17:31
神經(jīng)內(nèi)科醫(yī)生勸告:這5種不舒服其實(shí)是腦梗,千萬別大意,速看!

神經(jīng)內(nèi)科醫(yī)生勸告:這5種不舒服其實(shí)是腦梗,千萬別大意,速看!

華庭講美食
2025-08-27 16:23:47
上海夫妻冷戰(zhàn)十年分房睡,妻子突然病逝,丈夫整理房間發(fā)現(xiàn)這個(gè)

上海夫妻冷戰(zhàn)十年分房睡,妻子突然病逝,丈夫整理房間發(fā)現(xiàn)這個(gè)

飛云如水
2025-08-17 22:33:09
前所未有!俄軍空襲剛開始,烏軍就開始反擊,直接與俄羅斯對(duì)轟!

前所未有!俄軍空襲剛開始,烏軍就開始反擊,直接與俄羅斯對(duì)轟!

阿龍聊軍事
2025-06-07 20:04:46
男子花20萬買二手房,洗澡時(shí)卻流出紅色液體,物業(yè)上門檢查水箱傻眼

男子花20萬買二手房,洗澡時(shí)卻流出紅色液體,物業(yè)上門檢查水箱傻眼

罪案洞察者
2025-08-30 09:49:35
惡鄰占公共走廊放鞋柜,看網(wǎng)友“神”操作后,直呼 “干得漂亮”

惡鄰占公共走廊放鞋柜,看網(wǎng)友“神”操作后,直呼 “干得漂亮”

裝修秀
2025-08-30 10:50:03
當(dāng)年為什么查辦褚時(shí)健?

當(dāng)年為什么查辦褚時(shí)???

百曉生談歷史
2025-08-20 21:55:53
公安部發(fā)布!退休人員必看,事關(guān)錢袋子、養(yǎng)老金,不要掉以輕心

公安部發(fā)布!退休人員必看,事關(guān)錢袋子、養(yǎng)老金,不要掉以輕心

雙色球的方向舵
2025-08-29 15:41:13
已確認(rèn),即將抵達(dá)!暴雨+10級(jí)大風(fēng),再熬一天,浙江高溫退散!臺(tái)風(fēng)最新路徑公布

已確認(rèn),即將抵達(dá)!暴雨+10級(jí)大風(fēng),再熬一天,浙江高溫退散!臺(tái)風(fēng)最新路徑公布

浙江消防
2025-08-30 18:10:11
暴雨、大暴雨!臺(tái)風(fēng),又來了

暴雨、大暴雨!臺(tái)風(fēng),又來了

環(huán)球網(wǎng)資訊
2025-08-30 14:55:27
為什么社會(huì)上的單親媽媽,越來越多了?

為什么社會(huì)上的單親媽媽,越來越多了?

加油丁小文
2025-08-20 06:00:03
噩耗!藥企大佬尹正龍去世,僅60歲,當(dāng)天上午還在開會(huì),死因曝光

噩耗!藥企大佬尹正龍去世,僅60歲,當(dāng)天上午還在開會(huì),死因曝光

云景侃記
2025-08-28 14:16:26
記者:安東尼加盟貝蒂斯轉(zhuǎn)會(huì)費(fèi)2500萬鎊,曼聯(lián)有50%二轉(zhuǎn)分成

記者:安東尼加盟貝蒂斯轉(zhuǎn)會(huì)費(fèi)2500萬鎊,曼聯(lián)有50%二轉(zhuǎn)分成

懂球帝
2025-08-30 04:05:34
董璇給張維伊老家親戚買金子,男方瞬間變臉,雙方經(jīng)濟(jì)實(shí)力差太多

董璇給張維伊老家親戚買金子,男方瞬間變臉,雙方經(jīng)濟(jì)實(shí)力差太多

萌神木木
2025-08-30 14:00:10
圈內(nèi)大佬親述,陪睡陪玩只是冰山一角,岳云鵬、楊冪、許凱

圈內(nèi)大佬親述,陪睡陪玩只是冰山一角,岳云鵬、楊冪、許凱

農(nóng)村娛樂光哥
2025-08-29 11:15:35
叔叔宗繼昌律師發(fā)聲:宗慶后晚年承認(rèn)外有三孩子,說不會(huì)虧待他們

叔叔宗繼昌律師發(fā)聲:宗慶后晚年承認(rèn)外有三孩子,說不會(huì)虧待他們

興史興談
2025-07-14 15:41:56
提新車住豪宅,68歲“丁克”了一輩子的葛優(yōu),最終活成了人生贏家

提新車住豪宅,68歲“丁克”了一輩子的葛優(yōu),最終活成了人生贏家

瓜農(nóng)娟姐
2025-08-30 16:06:15
2025-08-31 03:47:00
智東西 incentive-icons
智東西
聚焦智能變革,服務(wù)產(chǎn)業(yè)升級(jí)。
10390文章數(shù) 116838關(guān)注度
往期回顧 全部

科技要聞

李斌內(nèi)部講話:蔚來四季度必須盈利

頭條要聞

媒體:日本忍不了了 最后一刻取消訪美

頭條要聞

媒體:日本忍不了了 最后一刻取消訪美

體育要聞

扛著別人的老婆,贏下那該死的冠軍

娛樂要聞

吳京風(fēng)波拉出多位明星

財(cái)經(jīng)要聞

美上訴法院裁定特朗普關(guān)稅非法!

汽車要聞

全國靜態(tài)品鑒開啟 方程豹鈦7成都車展首秀

態(tài)度原創(chuàng)

藝術(shù)
時(shí)尚
數(shù)碼
公開課
軍事航空

藝術(shù)要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

伊姐周六熱推:電視劇《十二封信》;電影《死神來了:血脈詛咒》......

數(shù)碼要聞

英特爾 Arc Pro B50 首個(gè) Geekbench 跑分出爐,低于銳炫 B570

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

美國務(wù)院批準(zhǔn)對(duì)烏新軍售

無障礙瀏覽 進(jìn)入關(guān)懷版