谷歌正式發(fā)布了Gemini 2.5 Flash Image新模型,該模型此前在測(cè)試階段被稱為"nanobanana",為企業(yè)創(chuàng)意項(xiàng)目提供了更多選擇。該模型能夠快速改變圖像外觀,相比以往版本提供更精準(zhǔn)的控制能力。
該模型將集成到Gemini應(yīng)用中。
基于Gemini 2.5 Flash構(gòu)建的這一新模型,為Gemini應(yīng)用的原生圖像編輯功能增加了更多能力。Gemini 2.5 Flash Image能夠在不同圖像間保持角色相似性,在編輯圖片時(shí)具有更好的一致性。例如,用戶上傳寵物照片后要求模型更換背景或?yàn)楣饭诽砑用弊訒r(shí),該模型可以完成這些操作而不會(huì)改變圖片主體。
谷歌在博客文章中表示:"我們深知,在編輯自己或熟悉的人的照片時(shí),細(xì)微的缺陷都很重要,'接近但不完全相同'的效果并不理想。因此我們的最新更新旨在讓朋友、家人甚至寵物的照片看起來(lái)始終保持他們本來(lái)的樣子。"
企業(yè)和個(gè)人用戶此前的一個(gè)主要抱怨是,在對(duì)AI生成圖像進(jìn)行編輯提示時(shí),輕微調(diào)整會(huì)過(guò)度改變照片。例如,有人指示模型移動(dòng)照片中人物的位置,雖然模型按指令執(zhí)行,但人物面部會(huì)被輕微改變。
在Gemini平臺(tái)生成的所有圖像都將包含谷歌的SynthID水印。該模型面向Gemini應(yīng)用的所有付費(fèi)和免費(fèi)用戶開(kāi)放。
社交媒體熱議
谷歌計(jì)劃發(fā)布新圖像模型的猜測(cè)在社交媒體平臺(tái)上廣泛傳播。LM Arena用戶發(fā)現(xiàn)了一個(gè)名為"nanobanana"的神秘新模型,正如Andressen Horowitz合伙人Justine Moore所說(shuō),該模型能夠"以令人印象深刻的準(zhǔn)確性執(zhí)行復(fù)雜的多步驟指令"。
人們很快注意到nanobanana模型似乎來(lái)自谷歌,隨后幾位早期測(cè)試者證實(shí)了這一點(diǎn)。不過(guò)當(dāng)時(shí)谷歌并未確認(rèn)在LM Arena上對(duì)該模型的計(jì)劃。
原生圖像編輯功能
Gemini在3月份為其平臺(tái)添加了原生AI圖像編輯功能,向聊天平臺(tái)的免費(fèi)用戶提供此服務(wù)。
將圖像編輯功能直接集成到聊天平臺(tái)中,使企業(yè)能夠在不切換窗口的情況下修復(fù)圖像或圖表。
用戶可以向Gemini上傳照片,然后告訴模型需要什么修改。滿意后,新圖片可以重新上傳到Gemini并制作成視頻。
除了添加服裝或改變位置外,Gemini 2.5 Flash Image還能混合不同照片,提供多輪編輯功能,并將一張圖片的風(fēng)格混合到另一張上。
谷歌仍需與Qwen及其最近發(fā)布的Qwen-Image Edit,以及為ChatGPT添加原生AI圖像編輯功能的OpenAI等競(jìng)爭(zhēng)對(duì)手抗衡。當(dāng)然,長(zhǎng)期被視為圖像編輯領(lǐng)域領(lǐng)導(dǎo)者的Adobe也將其旗艦?zāi)P虵irefly集成到Photoshop和其他照片編輯平臺(tái)中。
Q&A
Q1:Gemini 2.5 Flash Image與之前的圖像編輯模型相比有什么優(yōu)勢(shì)?
A:Gemini 2.5 Flash Image最大的優(yōu)勢(shì)是能夠保持角色相似性和編輯一致性。當(dāng)用戶編輯照片時(shí),比如給寵物換背景或添加配飾,模型不會(huì)改變圖片主體的特征,解決了之前輕微調(diào)整就會(huì)過(guò)度改變照片的問(wèn)題。
Q2:普通用戶可以使用Gemini 2.5 Flash Image嗎?
A:可以。該模型面向Gemini應(yīng)用的所有付費(fèi)和免費(fèi)用戶開(kāi)放,已集成到Gemini應(yīng)用中。用戶可以直接在聊天平臺(tái)中上傳照片并告訴模型需要什么修改,完成后還可以將新圖片制作成視頻。
Q3:Gemini 2.5 Flash Image都支持哪些圖像編輯功能?
A:該模型支持多種編輯功能,包括更換背景、添加服裝配飾、改變位置、混合不同照片、多輪編輯以及將一張圖片的風(fēng)格混合到另一張上。所有生成的圖像都會(huì)包含谷歌的SynthID水印。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.