成人深夜视频网站|日韩高清无码久久|中文a√在线天堂|亚洲黄网站在线看|欧美视频 第二页|日本 久草 天堂|高潮无遮挡黄视频|久久一级内射精品|国产操逼一级视频|五月天婷婷色AV

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

Nano banana手辦玩法火爆出圈!無需抽卡,效果驚了(°o°)

0
分享至

不圓 一水 發(fā)自 凹非寺
量子位 | 公眾號 QbitAI

小某書最新起號方式,還得看AI(doge)。

這兩天打開一看,幾乎全被各種精致逼真的手辦圖刷屏了:



而且仔細(xì)一扒,甭管是AI圈、二次元圈還是騎行圈等等,感覺大家一下子都在玩。

so,發(fā)生了啥?到底是什么引得大家如此動作一致?

時刻游走在吃瓜第一線的量子位趕緊去瞧了瞧,結(jié)果發(fā)現(xiàn),這不是最近爆火的圖像編輯模型nano-banana嘛。



這個模型起初在LMArena平臺匿名出現(xiàn),后來因生圖表現(xiàn)太好突然爆火,繼而引得無數(shù)網(wǎng)友猜測其歸屬。

直到兩天之前,谷歌才終于站出來認(rèn)領(lǐng)了該模型,并表示其真身為Gemini 2.5 Flash Image。

而隨著nano-banana揭開神秘面紗,國內(nèi)外網(wǎng)友更是掀起了一波瘋狂試玩的熱潮,其中手辦尤其受到大家的青睞。

所以,如何用nano-banana生成同款手辦?提示詞該怎么寫?

量子位手把手教程這就奉上——

實測爆火手辦玩法

不賣關(guān)子,先看看網(wǎng)上爆火的生成“真實手辦”的提示詞。

Use the nano-banana model to create a 1/7 scale model, in a realistic style and environment. Place the figure on a computer desk, using a circular transparent acrylic base without any text.On the computer screen, display the ZBrush modeling process of the figure.Next to the computer screen, place a TAMIYA-style toy packaging box printedwith the original artwork.

(中譯方便對照版:使用nano-banana模型制作一個1/7比例的實體模型,風(fēng)格和環(huán)境保持寫實。將模型擺放在電腦桌上,底座為圓形透明亞克力材質(zhì),且不帶任何文字。電腦屏幕上顯示的是該模型在ZBrush中的建模過程。在電腦屏幕旁邊,放置一個TAMIYA風(fēng)格的玩具包裝盒,包裝盒上印有原始插畫。)

就用這套提示詞和Gemini 2.5 Flash,讓我們試試水~



(PS:支持中文提示詞,但偶爾會出現(xiàn)錯誤,需要多試幾次,建議使用英文。)



動漫角色為參考圖,生成的“手辦”效果確實不錯。



出乎意料的是,只用了上面的提示詞,它居然可以識別出是艾倫耶格爾(盒子上有他的名字)。

而且即使不是全身像也可以生成,但參考圖以外的部位可能會有一些奇怪的地方。



可是一想到是銀魂就覺得很合理怎么回事。



用家里的毛孩子作為參考圖,簡直是讓人大呼“購買鏈接在哪里”的程度……



貓貓和狗狗都非??蓯邸?/p>

要是能結(jié)合3D打印做出來就更好了(真的可以)。



雖然網(wǎng)上的案例已經(jīng)很多了,但讓我們再試試真人效果呢。

親測,最好使用全身圖。



只要是全身圖就能成,包括這種搞怪動作亂飛的。



非常適合……你知道的,哪怕不是給自己,誰手里沒幾張好朋友的怪照片呢?

美中不足的是生成的“手辦”好像沒有支撐,但再補(bǔ)充一句就行。

  • 上面的模型飄起來了,給它加個支撐。



這些玩法也很火

除了手辦,nano-banana還有一些腦洞大開的玩法也很火。

它可以同時結(jié)合3張圖片進(jìn)行創(chuàng)作,既然如此,有網(wǎng)友意識到,為什么不試著控制角色的姿態(tài)呢。



還可以結(jié)合視頻生成模型創(chuàng)作連貫的動畫。

不需要太過完整的動作示例(雖然使用詳細(xì)示例可能會更精細(xì)),火柴人小草圖同樣可行。



也有網(wǎng)友選擇打破次元壁,讓二次元人物成為真人出現(xiàn)在漫展場地。

這和真實的cosplayer有什么差別?



上述玩法我們也“順帶”實測了一下,提示詞放在下面了,一起看看效果:

  • 讓圖一和圖二的角色擺出圖三的姿勢,一條手臂搭在對方的肩膀上,另一條手臂比心。



  • 讓圖一和圖二的角色以圖三的姿勢戰(zhàn)斗,一個人出拳,一個人用腿踢。



  • 生成一張真人扮演這張插畫的照片,背景設(shè)置為Comiket。



是生圖(指沒有修過的原圖)啊,完全是coser生圖??!

團(tuán)隊透露背后技術(shù)細(xì)節(jié)

通過以上實測不難發(fā)現(xiàn),nano-banana確實有點(diǎn)東西。

趁熱打鐵,谷歌AI Studio負(fù)責(zé)人Logan Kilpatrick(最右)最近還采訪了這個項目背后的團(tuán)隊。

從左到右分別是:研究工程師Kaushik Shivakumar、研究工程師Robert Riachi、小組產(chǎn)品經(jīng)理Nicole Brichtova、研究科學(xué)家Mostafa Dehghani。



略過開頭的產(chǎn)品功能介紹和演示環(huán)節(jié),咱們直接來看看背后的核心技術(shù)原理。

第一,以文本渲染作為核心指標(biāo)來快速衡量模型性能。

對圖像生成模型來說,一個無法回避的難題是如何進(jìn)行有效評估。傳統(tǒng)的評估方法嚴(yán)重依賴“人類偏好評估”,不僅非常主觀,而且需要耗費(fèi)大量昂貴人力。

為此團(tuán)隊提出了一個新的替代指標(biāo)——文本渲染。按照Robert Riachi的話來說:

  • 當(dāng)模型能處理好這種復(fù)雜的文字結(jié)構(gòu)時,它同樣也能學(xué)會圖像里的其他結(jié)構(gòu)。

Kaushik Shivakumar進(jìn)一步解釋,之所以使用這個指標(biāo),還是因為一直以來幾乎所有模型都無法很好解決文本渲染的問題。

  • 它為模型訓(xùn)練提供了一個客觀、可量化且不易飽和的衡量標(biāo)準(zhǔn)。相比于很快就會觸及瓶頸的其他自動化圖像質(zhì)量指標(biāo),文本渲染的難度足夠大,能夠持續(xù)為模型的改進(jìn)提供指引。

而且有趣的是,這一做法還帶來了意料之外的好處——一些原本并非針對文本渲染的改動,卻意外地提升了該指標(biāo)的表現(xiàn)。

不過需要提醒,這并非意味著完全放棄了人工評估,只是考慮到訓(xùn)練成本,文本渲染可以作為一種更高效、經(jīng)濟(jì)且可靠的替代方案。

第二,通過原生多模態(tài)與交錯式生成,實現(xiàn)復(fù)雜編輯與情境感知。

團(tuán)隊提到,該模型的核心優(yōu)勢在于原生多模態(tài)。原生多模態(tài)意味著圖像的理解和生成能力被深度整合進(jìn)了一個模型中,而非兩個系統(tǒng)的簡單拼接。

之所以要采用原生多模態(tài),主要目標(biāo)是在不同模態(tài)和能力之間實現(xiàn)“正向遷移”。

就拿之前經(jīng)常提到的數(shù)手指案例來說,明明圖片上是6只手指,但AI可能會基于文本知識硬說成5只,而視覺信號能夠為模型學(xué)習(xí)世界知識提供一條捷徑。



根據(jù)介紹,堪比“一對姐妹”的圖像理解與生成,其協(xié)同作用在“交錯式生成”中得到了最充分的體現(xiàn)。

“交錯式生成”被視為該模型實現(xiàn)復(fù)雜、多輪編輯的關(guān)鍵技術(shù),與傳統(tǒng)模型一次性生成一張圖片不同,交錯式生成是一個連續(xù)的過程——不僅能理解當(dāng)前的文本指令,還能看到并理解對話歷史中的所有圖片。

Mostafa Dehghani進(jìn)一步指出,它為解決極其復(fù)雜的圖像生成任務(wù)提供了一種全新范式:

  • 如果你的提示詞包含了6個甚至50個不同的編輯要求,傳統(tǒng)模型很可能在一次生成中無法滿足所有細(xì)節(jié)。但利用交錯式生成,模型可以將這個復(fù)雜任務(wù)分解為多個步驟,在不同的對話輪次中逐一完成編輯。

第三,該模型的進(jìn)步離不開對上一代模型的深入反思和對用戶反饋的積極響應(yīng)。

根據(jù)透露,團(tuán)隊會直接在等社交平臺上搜集用戶反饋,將用戶報告的失敗案例系統(tǒng)性整理起來,并將其構(gòu)建成內(nèi)部的評估基準(zhǔn)。

也就是說,每一個新版本的模型都必須在這些來自真實世界挑戰(zhàn)的測試集上證明自己。

具體而言,這些曾經(jīng)出現(xiàn)的bug包括:

1、像素級精確編輯:在Imagen 2.0中,用戶在嘗試對圖像進(jìn)行局部編輯時,模型可能會在添加新元素的同時不必要地改變圖像的其他部分。

2、角色一致性:Imagen 2.0已經(jīng)能夠在不改變角色位置的情況下為其添加帽子或改變表情。而新模型則實現(xiàn)了更高層次的一致性,能夠從不同角度渲染同一個角色,生成看起來完全是同一個人的側(cè)面或背面視圖。它還可以將一件家具從原始照片中取出,放置到一個全新的環(huán)境中。

3、更自然的圖像質(zhì)感:之前的編輯操作有時會產(chǎn)生不自然的PS感或疊加感。

Anyway,正是因為團(tuán)隊積極收集用戶反饋,彌補(bǔ)這些曾經(jīng)的短板,新模型這才有了如今的爆火。

未來,谷歌的目標(biāo)是將所有模態(tài)都整合到Gemini中,以實現(xiàn)AGI。

One More Thing

順帶一提,谷歌這次還計劃舉辦Nano Banana Hackathon(黑客馬拉松)活動。

持續(xù)時間為2天,屆時將提供免費(fèi)API使用額度。

獲獎?wù)哂袡C(jī)會贏得獎品和開發(fā)者積分,以及一些和Gemini有關(guān)的“酷炫玩意兒”。



最后,如果你現(xiàn)在想要試玩Nano Banana模型,可以通過AI Studio或Gemini API體驗。



也可以直接在Gemini內(nèi)使用。



AI Studio體驗地址:
https://aistudio.google.com/prompts/new_chat?model=gemini-2.5-flash-image-preview

參考鏈接:
[1]https://x.com/kei31/status/1961052667381203235
[2]https://x.com/yuhasbeentaken/status/1960778503366041769
[3]https://x.com/kiyoshi_shin/status/1960841949281443874
[4]https://x.com/lakeside529/status/1960875127123632297
[5]http://x.com/OfficialLoganK/status/1961127857192673540
[6]https://x.com/OfficialLoganK/status/1960725463694753930

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
3-2,62歲莫耶斯率隊3連勝,29歲曼城舊將格拉利什助攻梅開二度

3-2,62歲莫耶斯率隊3連勝,29歲曼城舊將格拉利什助攻梅開二度

側(cè)身凌空斬
2025-08-30 23:58:53
65歲大姐雇46歲男保姆,男保姆:雇主對我很好,每天都很開心

65歲大姐雇46歲男保姆,男保姆:雇主對我很好,每天都很開心

惟來
2025-08-29 07:31:06
小孩子的話一定要聽嗎?網(wǎng)友:我的天,我要看哭了嗚嗚嗚

小孩子的話一定要聽嗎?網(wǎng)友:我的天,我要看哭了嗚嗚嗚

解讀熱點(diǎn)事件
2025-08-13 00:10:08
真當(dāng)中方好惹的?趕在中國九三閱兵前,釣魚島一夜生變

真當(dāng)中方好惹的?趕在中國九三閱兵前,釣魚島一夜生變

史海無崖
2025-08-27 09:42:01
惡果和形式主義泛濫,央企暫停干部年輕化?

惡果和形式主義泛濫,央企暫停干部年輕化?

環(huán)球通信
2025-08-30 15:34:29
越南“胡志明大炮”首次亮相,號稱國產(chǎn)最強(qiáng),因造型蠢萌引發(fā)熱議

越南“胡志明大炮”首次亮相,號稱國產(chǎn)最強(qiáng),因造型蠢萌引發(fā)熱議

碳基生物關(guān)懷組織
2025-08-27 18:31:01
泰國內(nèi)閣任命普坦為代理總理

泰國內(nèi)閣任命普坦為代理總理

財聯(lián)社
2025-08-30 17:52:17
隨著上海海港客場1:4慘敗成都蓉城,3問主帥穆斯卡特?

隨著上海海港客場1:4慘敗成都蓉城,3問主帥穆斯卡特?

田先生籃球
2025-08-30 21:54:02
中國腦梗發(fā)病率世界第一,醫(yī)生:主要原因已查出,4種蔬菜要少吃

中國腦梗發(fā)病率世界第一,醫(yī)生:主要原因已查出,4種蔬菜要少吃

詩意世界
2025-08-26 13:31:36
00后女孩紋身畫面曝出:女孩全程微笑,沒有痛苦表情,紋身師驚訝

00后女孩紋身畫面曝出:女孩全程微笑,沒有痛苦表情,紋身師驚訝

胡侃社會百態(tài)
2025-08-30 16:50:53
林心如馬爾代夫度假照曝光!網(wǎng)友驚嘆:這身材太驚艷?

林心如馬爾代夫度假照曝光!網(wǎng)友驚嘆:這身材太驚艷?

娛樂領(lǐng)航家
2025-08-29 21:00:03
薩姆納自宣加盟廣東男籃隨后刪除動態(tài),上賽季場均可得36分

薩姆納自宣加盟廣東男籃隨后刪除動態(tài),上賽季場均可得36分

雷速體育
2025-08-31 07:14:18
岡薩雷斯家中出軌女友:用攝像頭看到露骨畫面 還好沒拍臥室

岡薩雷斯家中出軌女友:用攝像頭看到露骨畫面 還好沒拍臥室

直播吧
2025-08-30 12:00:22
年輕時是大帥哥但沒紅,老了靠丑化自己成為一線男星!

年輕時是大帥哥但沒紅,老了靠丑化自己成為一線男星!

下水道男孩
2025-08-30 23:51:00
金正恩赴華方式引熱議:“蒼鷹一號”太舊,韓媒稱可能乘火車出行

金正恩赴華方式引熱議:“蒼鷹一號”太舊,韓媒稱可能乘火車出行

起喜電影
2025-08-31 02:56:03
一個很玄學(xué)的現(xiàn)象:心善能通神,德高可鎮(zhèn)鬼

一個很玄學(xué)的現(xiàn)象:心善能通神,德高可鎮(zhèn)鬼

金沛的國學(xué)筆記
2025-08-29 15:10:50
姆巴佩另類雙響,熊皇一條龍救主!0-1到2-1,皇馬逆轉(zhuǎn)登頂

姆巴佩另類雙響,熊皇一條龍救主!0-1到2-1,皇馬逆轉(zhuǎn)登頂

我的護(hù)球最獨(dú)特
2025-08-31 05:36:04
看到大家分房睡都沒成功。我就放心了

看到大家分房睡都沒成功。我就放心了

特約前排觀眾
2025-08-31 00:05:08
刺激夜:皇馬2-1,巴黎6-3,羅馬1-0,拜仁3-2,曼聯(lián)3-2,馬競1-1

刺激夜:皇馬2-1,巴黎6-3,羅馬1-0,拜仁3-2,曼聯(lián)3-2,馬競1-1

側(cè)身凌空斬
2025-08-31 05:32:03
蘇有朋道歉

蘇有朋道歉

中國日報
2025-08-30 16:04:59
2025-08-31 08:07:00
量子位 incentive-icons
量子位
追蹤人工智能動態(tài)
11215文章數(shù) 176256關(guān)注度
往期回顧 全部

頭條要聞

高校被指強(qiáng)制學(xué)生辦校園電話卡:不辦卡無法開宿舍門

頭條要聞

高校被指強(qiáng)制學(xué)生辦校園電話卡:不辦卡無法開宿舍門

體育要聞

扛著別人的老婆,贏下那該死的冠軍

娛樂要聞

吳京風(fēng)波拉出多位明星

財經(jīng)要聞

美上訴法院裁定特朗普關(guān)稅非法!

科技要聞

李斌內(nèi)部講話:蔚來四季度必須盈利

汽車要聞

全國靜態(tài)品鑒開啟 方程豹鈦7成都車展首秀

態(tài)度原創(chuàng)

家居
游戲
本地
公開課
軍事航空

家居要聞

提升功能 靈活居住環(huán)境

魔獸懷舊服:HICC活躍角色下降,AFK潮出現(xiàn),隱藏內(nèi)容會開放嗎

本地新聞

換個城市過夏天 | 夏末狂歡,浪在阜新黃家溝!

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

以軍繼續(xù)襲擊加沙城

無障礙瀏覽 進(jìn)入關(guān)懷版