成人深夜视频网站|日韩高清无码久久|中文a√在线天堂|亚洲黄网站在线看|欧美视频 第二页|日本 久草 天堂|高潮无遮挡黄视频|久久一级内射精品|国产操逼一级视频|五月天婷婷色AV

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

AI生成圖片,哪家強?

0
分享至

文 | 硅基星芒

AI的滲透正無遠弗屆。正如很多插畫網(wǎng)站,添加“AI生成”標簽已是標配。

從藝術(shù)角度看,AI生成的圖片,似乎爭議依然巨大。但不得不承認的是,在工作和學習中,AI圖片生成卻是一個提高效率的好辦法。

目前,多模態(tài)大模型領(lǐng)域中,支持文生圖的模型數(shù)量正在指數(shù)級增長。

為了解決大家的“選擇困難癥”,這次我們選擇了6個模型進行測評。

參賽選手如下:

騰訊混元、智譜CogView-4、通義千問、即夢、可靈和Gemini 2.5 Flash Image。

其中,前段時間在LMarena上爆火的模型nano-Banana,據(jù)說吊打一切文生圖模型。

現(xiàn)在也已經(jīng)“驗明正身”,正是8月27日Google發(fā)布的Gemini 2.5 Flash Image。

在測評前,先疊個甲:

對美術(shù)方面,實在是一竅不通。

因此,我們不談復雜的理論,也不聊晦澀的美術(shù)史。

只是以一個普通人的視角,借助AI給出的評分標準,來評價一下到底“好不好看”。一家之言,僅供參考。

01 第一維度:基礎(chǔ)美學與真實感

考驗目標:AI的基本畫功,好不好看、真不真實。

題目:傍晚陽光下的少女

Prompt: 超寫實照片,一個有雀斑的年輕女子,面帶微笑,在黃金時刻坐在窗邊,溫暖的陽光穿過她的頭發(fā),電影感光線,8K,高細節(jié)。

評分標準:


測評結(jié)果:


騰訊:人物的皮膚質(zhì)感過于光滑,僅有微小瑕疵。

智譜:皮膚過于光滑,雀斑形狀和分布過于均勻和刻意,屬于明顯瑕疵。

千問:雙手比例和形態(tài)非常不自然,完全沒有寫實感,“一眼AI”,屬于明顯瑕疵。

即夢和可靈:非常出色,接近完美,不愧是“專業(yè)畫手”。

Gemini:皮膚質(zhì)感過于光滑細膩,寫實感還是差了一些。

總體來說,對于人物的塑造,各個AI還是比較拿手的。

雖然有些模型生成的圖片略有瑕疵,但整體觀感不錯。

02 第二維度:想象力與創(chuàng)意

考驗目標:AI的腦洞有多大,對于現(xiàn)實中不存在的事物的創(chuàng)造能力。

題目:星云構(gòu)成的雄獅

Prompt: 一頭雄偉的獅子,由旋轉(zhuǎn)的星系和星云雕刻而成,宇宙塵埃構(gòu)成了它的鬃毛,眼睛是閃爍的恒星,背景是深邃的宇宙。

評分標準:


測評結(jié)果:


這一輪的題目看來對AI難度有點高了。

騰訊:第一眼看上去很華麗,很有氣勢,但似乎理解出現(xiàn)了一些偏差。這并非一個由星云構(gòu)成的生命體,而是一尊宇宙材質(zhì)的宏偉雕像。

智譜:生成了一個宇宙背景下的實體獅子,完全徹底的概念性跑偏。

千問:“半神半獸”的感覺,實體獅子與星云的混合,離要求還是有一定差距。

即夢:科幻感十足,但獅子身體仍然是實體而不是星云構(gòu)成的,觀感有一定新意。

可靈:本輪的最佳選手,視覺效果很好,實現(xiàn)了與星云的融合。

Gemini:獅子的實體也是不透明的,不過神韻、氣質(zhì)和細節(jié)都還不錯。

看來,對于現(xiàn)實中不存在的事物,AI出現(xiàn)概念理解錯誤的幾率會大大增加,而想象能力也是目前模型有所欠缺的地方。

可能的原因也比較多,例如訓練數(shù)據(jù)存在一定的局限性、對物理世界存在路徑依賴或是概念融合能力的欠缺。

03 第三維度:指令理解與執(zhí)行力

考研目標:AI聽不聽話,能不能正確遵從指令。

題目:水果籃里的數(shù)學題

Prompt: 一個木碗里裝著三個紅蘋果和兩個黃香蕉,放在一張白色的桌子上。

評分標準:


測評結(jié)果:


這肯定是人類眼中最簡單的一道題,但對AI來說難度可不低。

六個模型中,只有智譜、千問和Gemini正確完成了如此“簡單”的指令。

即夢和可靈都搞錯了蘋果的數(shù)量,而混元更是漏洞百出。

根據(jù)這一輪的結(jié)果,我們也可以得到一個推斷:

AI生圖模型并非按照我們的數(shù)學概念和美術(shù)流程來工作。

或者說,它并不是按照我們最直接的思路,畫一個蘋果,再畫一個香蕉,直到數(shù)目符合要求。

指令中的3這個數(shù)字,對AI來說,并不代表一個精確的數(shù)量,而是一個需要渲染的“構(gòu)圖特征”。

而在向量空間中,“三個蘋果”和“四個蘋果”可能是非常接近的。

同時,我們也無法得知提供給上述AI的訓練集到底是什么樣的。

但是,標簽肯定是做不到完全精準的,AI只能長時間在海量但又不完全精確的數(shù)據(jù)中學習。

AI的最終目標,是讓生成的圖片最接近于它見過的“三個蘋果”,而不是“讓生成的蘋果數(shù)量等于3”。

04 第四維度:風格模仿與駕馭力

考驗目標:AI模仿特定的藝術(shù)家或藝術(shù)流派的能力。

題目:水墨風的機甲

Prompt:一個巨大的中國古代機甲戰(zhàn)士,站立在云霧繚繞的山谷中,中國傳統(tǒng)水墨山水畫風格。

評分標準:


測評結(jié)果:


又是一道有點抽象的題目。

表現(xiàn)最好的是Gemini,實打?qū)嵗L制出了山水畫風格,大體符合要求。

千問生成的機甲看起來確實氣勢磅礴,細節(jié)處理也很到位,但很明顯,這是素描而不是水墨風格,只能說是“有形無神”。

即夢生成的圖片也并非水墨畫,而是帶有寫實感的數(shù)字繪畫,更像是個游戲的概念設計圖。

可靈則發(fā)揮了優(yōu)秀的拼接能力,在水墨風格的背景中插入了日式機甲,風格完全割裂。

混元和智譜生成的圖片則有些奇怪,水墨畫風格沒實現(xiàn)的同時,也沒理解“機甲戰(zhàn)士”這個主體,畫中人更像是個古代武士,完全偏離了題目要求。

如此看來,AI尚且不具備完全模仿某個藝術(shù)家或藝術(shù)流派的能力,能夠做到“形似神不似”就實屬不易。

05 第五維度:文化理解與概念表達

考驗目標:AI能否理解特定的文化以及是否能夠表達抽象的概念。

題目:中秋佳節(jié)的漢服少女

Prompt:一位美麗的年輕女孩,身穿中國傳統(tǒng)漢服,慶祝中秋節(jié),她手持一個精致的兔子燈籠,身后是明亮的滿月。

評分標準:


測評結(jié)果:


Gemini和可靈都拿下了相當高的分數(shù),展現(xiàn)出了較高的文化素養(yǎng)。

對于漢服的概念理解比較深刻,而月亮、燈籠、園林等文化元素也都齊全。

推測其訓練數(shù)據(jù)中,中國傳統(tǒng)文化的相關(guān)素材標注是比較準確的。

兩家模型的算法能夠把“漢服”等關(guān)鍵詞正確關(guān)聯(lián)到視覺特征上。

即夢和千問在美觀度和氛圍塑造上也很成功,不過漢服的結(jié)構(gòu)有些模糊。

盡管這種古風畫作可能意味著AI對于服飾歷史知識的了解程度不夠深刻,但滿足“好看”這一要求仍然不在話下。

智譜生成的則是唯一采用了動漫風格的圖片,對歷史文化的復現(xiàn)程度顯然是太淺了。

混元生圖看似美觀,但在服飾結(jié)構(gòu)上有比較明顯的錯誤,即一定程度上的文化混淆。

因此,AI在文化表現(xiàn)上也是存在“雙刃劍”效應的。

頂級AI具備相當可觀的文化知識,對于傳播、創(chuàng)作優(yōu)秀傳統(tǒng)文化會有很大的幫助。

而部分AI還存在“刻板印象”,受到低質(zhì)量數(shù)據(jù)的影響,反而會加劇大眾的文化誤解。

06 總評

本次測評的總分如下:

Gemini:44分

可靈:40分

即夢:39分

千問:38.5分

智譜:33.5分

騰訊:28.5分

從效果上來看,千問、即夢、可靈和Gemini的文生圖效果都是很不錯的。

尤其是前身為nano-Banana的Gemini 2.5 Flash Image,拿到了最高的分數(shù),證明了它并非浪得虛名。

不過,我們的核心目標還是要透過現(xiàn)象看本質(zhì)。

人們總是驚嘆于AI的“創(chuàng)造力”,它足夠以假亂真,繪畫水平也超越了大部分人。

但事實上,AI輸出的圖片,并非源于類似人類的靈感或意圖。

AI作畫,并非像一個畫手一樣,從一張白紙開始一筆一筆畫出事物。

而是從一張充滿隨機噪聲點的“混沌畫布”開始,根據(jù)提示詞進行降噪。

也就是說,AI作圖并非基于邏輯推理,而是基于概率。

對于蘋果生成數(shù)量的錯誤,可能就是因為“構(gòu)成一幅和諧的水果靜物圖”這個在訓練數(shù)據(jù)中頻繁出現(xiàn)的指令,其概率權(quán)重超過了“3”這個脆弱的數(shù)字符號。

對于星云和獅子之間的掙扎,與“獅子”相關(guān)的像素模式可能是“實體”和“毛發(fā)”,而與“星云”相關(guān)的則是“氣體”和“半透明”。AI無法同時滿足兩個相互矛盾的概率分布,因此降噪過程就無法成功。

對于水墨風的機甲,則可能是AI背后的數(shù)據(jù)庫在發(fā)揮作用。如果數(shù)據(jù)庫中有大量“水墨”、“機甲”等高質(zhì)量的標簽,降噪過程也會被順利引導至一個高質(zhì)量的概率空間。

簡單的來說,AI不是在根據(jù)指令繪畫,而是根據(jù)知識儲備,試圖通過降噪給出最可能符合指令的圖像。

至于錯誤,文生圖是一個很復雜的過程,很遺憾,我們無法確切得知問題出在哪一環(huán)節(jié)。

也因此,至少目前為止,我們并不是“創(chuàng)作者”,而是“概率的引導者”。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
為了錢,中國足協(xié)連臉都不要了?

為了錢,中國足協(xié)連臉都不要了?

筆桿論道
2025-09-01 09:50:49
成都成華區(qū):中鐵二十二局一在建工地塔吊坍塌致5人遇難,涉事工地已封停

成都成華區(qū):中鐵二十二局一在建工地塔吊坍塌致5人遇難,涉事工地已封停

界面新聞
2025-09-01 21:22:14
宋軼回應整容:沒有整容,只是換了新的化妝老師

宋軼回應整容:沒有整容,只是換了新的化妝老師

韓小娛
2025-08-31 17:40:46
洪秀柱組團參加九三閱兵,民進黨破防大罵,國民黨訪陸規(guī)格再升級

洪秀柱組團參加九三閱兵,民進黨破防大罵,國民黨訪陸規(guī)格再升級

頭條爆料007
2025-09-01 20:37:18
中國最后一位太監(jiān)孫耀庭自述:晚上伺候娘娘時,鞋底必須藏蒼耳

中國最后一位太監(jiān)孫耀庭自述:晚上伺候娘娘時,鞋底必須藏蒼耳

妙知
2025-08-28 10:19:43
重磅!利物浦3500萬鎊簽下水晶宮隊長,夏窗砸5.3億+夢幻首發(fā)出爐

重磅!利物浦3500萬鎊簽下水晶宮隊長,夏窗砸5.3億+夢幻首發(fā)出爐

我愛英超
2025-09-01 22:40:34
高盛預言:2027年房價再跌10%,2027年谷底將至,現(xiàn)在買房等于首付打水漂!

高盛預言:2027年房價再跌10%,2027年谷底將至,現(xiàn)在買房等于首付打水漂!

新浪財經(jīng)
2025-09-01 09:05:49
德國外長不明白,德日兩大強國要攜手抗中,中國人怎么就不怕呢?

德國外長不明白,德日兩大強國要攜手抗中,中國人怎么就不怕呢?

歷史求知所
2025-09-01 00:00:03
在美網(wǎng)搶走小孩簽名帽被罵,波蘭百萬富豪為自己辯護:是我拿的,人生就是先到先得

在美網(wǎng)搶走小孩簽名帽被罵,波蘭百萬富豪為自己辯護:是我拿的,人生就是先到先得

臺州交通廣播
2025-09-01 20:03:39
烏克蘭遠超導彈量產(chǎn),匈牙利即將變天

烏克蘭遠超導彈量產(chǎn),匈牙利即將變天

難得君
2025-09-01 16:23:14
島內(nèi)出席九三閱兵人員名單出爐,綠營氣急敗壞,川普對臺態(tài)度或變

島內(nèi)出席九三閱兵人員名單出爐,綠營氣急敗壞,川普對臺態(tài)度或變

DS北風
2025-09-01 17:27:07
風向變了,民眾突然都醒了

風向變了,民眾突然都醒了

深度報
2025-08-31 22:48:44
七夕舔狗經(jīng)濟崩盤了,商家宣傳黯然退場,男性群體徹底沒錢了!

七夕舔狗經(jīng)濟崩盤了,商家宣傳黯然退場,男性群體徹底沒錢了!

眼光很亮
2025-09-01 02:44:22
買下維多利亞老宅,卻養(yǎng)不起賣1鎊都沒人要?!她變身Airbnb老板,把危機變財富

買下維多利亞老宅,卻養(yǎng)不起賣1鎊都沒人要?!她變身Airbnb老板,把危機變財富

英國那些事兒
2025-08-31 23:18:23
自己管不住孩子,讓全深圳陪綁?深圳家長投訴電話手表遭“打臉”

自己管不住孩子,讓全深圳陪綁?深圳家長投訴電話手表遭“打臉”

柚媽充電屋
2025-08-31 18:20:03
宋軼整容失敗認不出?臉變寬嘴變大顴骨變高,乍一看還以為是易夢玲

宋軼整容失敗認不出?臉變寬嘴變大顴骨變高,乍一看還以為是易夢玲

八卦王者
2025-09-01 15:15:08
重磅:烏克蘭火烈鳥導彈攻擊克里米亞!擊毀俄安全局大樓

重磅:烏克蘭火烈鳥導彈攻擊克里米亞!擊毀俄安全局大樓

項鵬飛
2025-09-01 18:07:01
光速下課!官方:滕哈赫不再擔任勒沃庫森主帥,上任僅62天

光速下課!官方:滕哈赫不再擔任勒沃庫森主帥,上任僅62天

直播吧
2025-09-01 18:09:19
小仙女隧道龜速騎電車后續(xù):真容曝光,社會性死亡,步行推車前行

小仙女隧道龜速騎電車后續(xù):真容曝光,社會性死亡,步行推車前行

花心電影
2025-09-01 20:16:15
澤連斯基吹響沖鋒號:對俄展開縱深打擊,火烈鳥首戰(zhàn)告捷

澤連斯基吹響沖鋒號:對俄展開縱深打擊,火烈鳥首戰(zhàn)告捷

史政先鋒
2025-09-01 12:57:50
2025-09-02 02:15:00
鈦媒體APP incentive-icons
鈦媒體APP
獨立財經(jīng)科技媒體
123168文章數(shù) 861007關(guān)注度
往期回顧 全部

科技要聞

8月造車新勢力:零跑小鵬再創(chuàng)單月銷量新高

頭條要聞

媒體:莫迪到天津參加一場國際峰會 結(jié)果惹得有人吃醋

頭條要聞

媒體:莫迪到天津參加一場國際峰會 結(jié)果惹得有人吃醋

體育要聞

一支穿云箭,紅軍雙喜臨門

娛樂要聞

蘇有朋,禍從口出?

財經(jīng)要聞

行情剛好點,創(chuàng)始人立馬漲估值

汽車要聞

激光雷達上車/配云輦-C 26款海豹07 DM-i全是硬貨

態(tài)度原創(chuàng)

親子
教育
游戲
家居
時尚

親子要聞

開學了,躺平孩子的復學難題,1招就解決!

教育要聞

當學習變成樂趣,孩子自然會發(fā)光

《007:曙光》SOP專場直播公布 將有超長實機

家居要聞

意式極簡 盡顯時尚小眾

為什么“屁股大”的女生,更受直男歡迎?

無障礙瀏覽 進入關(guān)懷版