最近兩周,“手辦化”突然就火了。
事情是這樣的,大約在兩周之前,大模型競(jìng)技場(chǎng)LMArena上架了一個(gè)只聞其名,不見(jiàn)其身的神秘模型——“nano banana”,按照官方說(shuō)法,這是一個(gè)頂尖的圖像生成與編輯模型,能實(shí)現(xiàn)前所未有的創(chuàng)作控制力。
結(jié)果呢?整個(gè)互聯(lián)網(wǎng)的AIGC玩家,都在用它變身“手辦大師”。
不開(kāi)玩笑,小雷是真被這玩意給刷屏了,這兩天一打開(kāi)群聊,就能看到無(wú)法無(wú)天的群友們?cè)谀眠@玩意瘋狂整活,有把自己頭像做成限量版GK模型的,有把自家貓狗“手辦化”的,甚至還有給剛發(fā)布的《黑神話:鐘馗》弄雕像和游戲盒的,推特上的國(guó)外網(wǎng)友玩得更是樂(lè)此不疲,看得我都有點(diǎn)心癢癢的。
幸好,這次我們不用眼巴巴地羨慕了。
(圖源:LMArena)
隨著Google的正式發(fā)布,如今Gemini 2.5 Flash Image已經(jīng)通過(guò)Gemini API和Google AI Studio向公眾開(kāi)放預(yù)覽,用戶只需訪問(wèn)官網(wǎng),就能直接體驗(yàn)到下一代圖像模型的威力。
最重要的是,這玩意在AI Studio里進(jìn)行測(cè)試是完全免費(fèi)的,對(duì)于我們這種熱愛(ài)嘗鮮的玩家來(lái)說(shuō),簡(jiǎn)直是把探索未來(lái)的門檻給直接鏟平了。
話不說(shuō)多,我們這邊直接開(kāi)整!
Gemini 2.5 Flash Image讓人人成手辦大師
想體驗(yàn)這個(gè)功能的話,其實(shí)還蠻簡(jiǎn)單的就是了。
打開(kāi)Google AI Studio網(wǎng)頁(yè)版,在Generate media選項(xiàng)卡下就能找到Gemini 2.5 Flash Image。界面非常直觀,一個(gè)提示詞輸入框,一個(gè)上傳圖片的區(qū)域,這就是通往新世界的大門。
要做的事情很簡(jiǎn)單,上傳一張圖片,然后用自然語(yǔ)言告訴它我們想要生成的內(nèi)容就像。
(圖源:Gemini)
話不多說(shuō),先來(lái)看圖。
首先,我們準(zhǔn)備一張自己想要進(jìn)行“手辦化”的圖片,可以是動(dòng)漫,也可以是真人,甚至不必是全身照,比如這張來(lái)自漫畫《捉摸不透的刑警織子?!防锏挠邪⒐瓤椬拥膯稳藞D就很不錯(cuò)。
接下來(lái),輸入提示詞:
Please turn this screenshot of the character into a kotobukiya figure. Behind it, place a toy box printed with the character's image. Next to it, add a computer with its screen displaying the design, complete with the the character. In front of the box, add a round plastic base for the figure and have it stand on it. The PVC material of the base should have a crystal-clear, translucent texture, and set the entire scene indoors.
最終成品如下:
(圖源:雷科技自制)
不得不說(shuō),Gemini對(duì)“手辦質(zhì)感”的理解已經(jīng)超出了我的預(yù)期。
這張圖的生成效果達(dá)到了以假亂真的水準(zhǔn),無(wú)論是手辦本身的材質(zhì)(蕾絲、皮革、肌膚)、包裝盒上的文字和品牌Logo,還是背景電腦屏幕上復(fù)雜的建模界面都很不錯(cuò),只有高度模糊的背景能看出些端倪。
再來(lái)些熱門的,比如說(shuō)《黑神話:鐘馗》:
(圖源:雷科技自制)
接著試一下大家都關(guān)心的名人,比如說(shuō)馬斯克:
(圖源:雷科技自制)
從結(jié)果來(lái)看,轉(zhuǎn)換效果可以說(shuō)是幾無(wú)失手,非常成熟。
如果你想玩點(diǎn)更高級(jí)的,我們把這張生成的圖片,扔進(jìn)同樣是豆包視頻生成中,用提示詞“畫面外的人從兩邊伸出亞洲人的雙手,拿起手辦把玩并展示桌上手辦的視頻”,生成一段把玩手辦的視頻。
(圖源:雷科技自制)
如果用提示詞“360度緩慢旋轉(zhuǎn)這個(gè)手辦,轉(zhuǎn)臺(tái)拍攝”,就能生成一段平滑的環(huán)繞展示視頻。
(圖源:雷科技自制)
最后還可以用Meshy或者騰訊混元3D,將手辦3D建?;?/strong>,我們就能得到一個(gè)可以自由旋轉(zhuǎn)、縮放的3D模型。
(圖源:雷科技自制)
雖說(shuō)后兩步借助了其他工具,但由Gemini 2.5 Flash Image產(chǎn)出的高質(zhì)量初始素材,是整個(gè)工作流成功的基石。這種打破次元壁的做法,讓每個(gè)人都能低成本地實(shí)現(xiàn)從一個(gè)想法到3D產(chǎn)品的完整流程,在過(guò)去是很難想象的。
修圖能力更強(qiáng)了,其實(shí)是終極版PS?
不過(guò),人人都在玩手辦化,是不是有點(diǎn)大材小用了?
我們不妨轉(zhuǎn)換一下思路,把它當(dāng)成終極版的PS來(lái)用?
舉個(gè)例子吧,比如說(shuō)那些珍貴的、但因年代久遠(yuǎn)而模糊破損的老照片,它能不能修復(fù)呢?
我上傳了一張黑白老照片,照片上有劃痕和噪點(diǎn),清晰度也很低。
(圖源:X)
接下來(lái),輸入提示詞:
Restore this old photo, remove scratches and noise, increase the resolution, and colorize it realistically.
(圖源:Gemini)
答案是,“完全可以,而且效果驚人”。
可以看到,Gemini 2.5 Flash Image不僅清除了物理?yè)p傷,還通過(guò)算法補(bǔ)全了缺失的細(xì)節(jié),面部的紋理和眼神光都得到了合乎邏輯的重現(xiàn)。上色的效果也偏近自然,沒(méi)有出現(xiàn)早期AI上色那種“塑料感”,充滿了溫暖的時(shí)代氣息。
再試試設(shè)計(jì)行業(yè)里源遠(yuǎn)流長(zhǎng)的梗,“把白天改成黑夜”這種要求,它能不能實(shí)現(xiàn)呢?
(圖源:雷科技)
提示詞:
Change the scene to night time, turn on the streetlights and the lights inside the buildings, make it look like it's raining slightly.
(圖源:Gemini)
只能說(shuō),Gemini 2.5 Flash Image在語(yǔ)義理解和光影重構(gòu)這塊,已經(jīng)達(dá)到了很出彩的水平。它不僅僅是簡(jiǎn)單地調(diào)暗畫面,而是真正理解了“夜晚”、“燈光”、“下雨”這些概念,并合乎物理邏輯地對(duì)整個(gè)畫面進(jìn)行了重新渲染。
最后,我也試了一下它的風(fēng)格切換能力。這次就拿《Panty&Stocking》里的畫面做例子:
(圖源:X)
提示詞:
Convert this scene into a photorealistic movie still from a 1990s live-action film, directed by Wong Kar-wai.
(圖源:Gemini)
很有意思,它不僅做到了“三次元化”,還微妙地捕捉到了王家衛(wèi)電影那種獨(dú)特的色彩、光影和氛圍感。
這種跨越媒介和導(dǎo)演風(fēng)格的無(wú)縫切換,為藝術(shù)創(chuàng)作提供了更多可能。
不算完美,卻堪稱圖片AIGC新標(biāo)桿
不可否認(rèn),Gemini 2.5 Flash Image的發(fā)布,標(biāo)志著AI在圖像生成領(lǐng)域?qū)崿F(xiàn)了重大突破。
就像我展示的那樣,曾經(jīng)需要專業(yè)人士花費(fèi)數(shù)小時(shí)在PS里用蒙版、圖層、筆刷精雕細(xì)琢的工作,如今只需一句自然語(yǔ)言就能瞬間完成,甚至修圖效果比我這種半吊子還要好上不少,屬實(shí)有點(diǎn)慚愧。
目前該模型在預(yù)覽階段,并非完美無(wú)瑕。
在處理極其復(fù)雜的、包含大量人物的場(chǎng)景時(shí),Gemini偶爾還是會(huì)出現(xiàn)輕微的邏輯錯(cuò)誤或細(xì)節(jié)失真。對(duì)于一些過(guò)于抽象或違反物理常識(shí)的指令,它的理解能力也還有提升空間。
不管怎么說(shuō),Gemini 2.5 Flash Image算是為AI圖片生成應(yīng)用樹立了一個(gè)新的標(biāo)桿。
可以預(yù)見(jiàn)的是,隨著技術(shù)的不斷成熟和成本的降低,未來(lái)手機(jī)、電腦的相冊(cè)和編輯器都可能會(huì)原生集成這項(xiàng)功能,就像AI消除、AI擴(kuò)圖那樣走進(jìn)尋常百姓家。無(wú)論是專業(yè)設(shè)計(jì)師還是普通用戶,每個(gè)人都有機(jī)會(huì)輕松上手,將自己腦海中的創(chuàng)意和對(duì)美的理解,更直觀、更高效地展現(xiàn)出來(lái)。
修圖有手就行?或許真的不是夢(mèng)。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.