西風(fēng) 發(fā)自 凹非寺
量子位 | 公眾號(hào) QbitAI
在最近與科隆國(guó)際游戲展同期舉辦的Devcom開發(fā)者大會(huì)上,AI再次賺足了臉面。
微軟、騰訊、谷歌、Meta等國(guó)際巨頭帶來(lái)超過(guò)20場(chǎng)AI相關(guān)議題AI如何提升游戲美術(shù)生產(chǎn)效率AI工具如何與傳統(tǒng)工作流無(wú)縫集成AI在動(dòng)畫生成、場(chǎng)景構(gòu)建等具體環(huán)節(jié)的應(yīng)用案例”成為開發(fā)者們探討的重點(diǎn)內(nèi)容。
近年來(lái),游戲美術(shù)對(duì)精細(xì)度的要求呈現(xiàn)指數(shù)級(jí)增長(zhǎng)。隨之而來(lái)的是幾何級(jí)增長(zhǎng)的工作量。
而在科隆游戲展期間,騰訊游戲首次面向全球發(fā)布游戲創(chuàng)作AI全鏈路解決方案VISVISE
簡(jiǎn)單來(lái)說(shuō),VISVISE包含一整套AI工具,分為動(dòng)畫制作、模型制作、數(shù)字資產(chǎn)管理、智能NPC四大管線,覆蓋游戲美術(shù)開發(fā)全流程,重點(diǎn)在于輔助游戲美術(shù)完成那些重復(fù)、機(jī)械且工作量巨大的“體力活”
比如在3D動(dòng)畫制作方面,VISVISE的MotionBlink可根據(jù)用戶輸入的少量關(guān)鍵幀,自動(dòng)補(bǔ)全中間幀,生成完整序列動(dòng)畫
在過(guò)去,動(dòng)畫師手動(dòng)補(bǔ)幀甚至要占角色動(dòng)畫制作總工時(shí)的60%-70%,短短10秒的動(dòng)畫制作,手K精修可能要3-7人天才能完成。
而現(xiàn)在,AI自動(dòng)補(bǔ)全生成200幀動(dòng)畫僅需4秒
并且還做到了1.5秒間隔極限優(yōu)化,部分效果能達(dá)到光學(xué)動(dòng)捕的水準(zhǔn):
在現(xiàn)場(chǎng)體驗(yàn)了MotionBlink的功能后,一名來(lái)自德國(guó)的游戲開發(fā)專業(yè)學(xué)生表示,他目前正在自主開發(fā)獨(dú)立游戲并籌備創(chuàng)業(yè),其中最大的瓶頸正是動(dòng)捕技術(shù)。在他看來(lái),MotionBlink能夠顯著降低角色動(dòng)畫的制作門檻,為小型團(tuán)隊(duì)和創(chuàng)業(yè)者提供支持。
而這只是VISVISE的一個(gè)AI工具,其余像Superman角色動(dòng)畫方案GoSkinning自動(dòng)蒙皮等工具都已在眾多游戲中落地,例如GoSkinning就在《和平精英》《PUBG Mobile》等知名產(chǎn)品中應(yīng)用
VISVISE究竟是如何打造而成的?騰訊打造它的核心出發(fā)點(diǎn)又是什么?我們接著往下看。
游戲AI大模型解決的是什么問(wèn)題?
傳統(tǒng)游戲美術(shù)生產(chǎn)制作中,50%-60%的工作都耗費(fèi)在美術(shù)資產(chǎn)的制作上,其中最繁瑣的環(huán)節(jié)要數(shù)3D建模以及動(dòng)畫制作
3D建模是把概念設(shè)計(jì)稿變成“立體數(shù)字模型”的過(guò)程,產(chǎn)出的是“靜態(tài)數(shù)字模型”,要讓角色能動(dòng)起來(lái),就得經(jīng)過(guò)“骨骼綁定→蒙皮→動(dòng)畫制作”流程。
想象一下,你正在給一個(gè)3D角色“穿衣服”——不是真的縫制布料,而是用數(shù)字化的方式,讓它的皮膚和骨骼完美聯(lián)動(dòng)。這就是游戲開發(fā)中枯燥卻又關(guān)鍵的工作之一:蒙皮
騰訊游戲效能產(chǎn)品部負(fù)責(zé)人陳冬解釋道,當(dāng)骨骼運(yùn)動(dòng)時(shí),需要計(jì)算3D模型的每個(gè)面片(Mesh)隨骨骼移動(dòng)的程度,也就是確定每個(gè)面片關(guān)聯(lián)的關(guān)節(jié)及其權(quán)重。權(quán)重決定了面片受哪根關(guān)節(jié)影響以及影響的程度,“如果某塊面片只關(guān)聯(lián)單一關(guān)節(jié),那它就只會(huì)受這根關(guān)節(jié)的運(yùn)動(dòng)影響”。
在傳統(tǒng)流程中,美術(shù)師需要手動(dòng)調(diào)整成千上萬(wàn)個(gè)“權(quán)重點(diǎn)”,就像用隱形的線把皮膚通過(guò)不同權(quán)重?cái)?shù)據(jù)縫到骨頭上??拷P(guān)節(jié)的皮膚要分散綁定(權(quán)重分配),這樣角色抬手時(shí),手肘的褶皺才會(huì)自然。
但問(wèn)題來(lái)了:
- 一個(gè)角色可能有上百根骨頭,每根骨頭都要精準(zhǔn)控制皮膚變形;
- 稍有不慎,衣服就會(huì)“穿?!薄热鐑?nèi)層衣物運(yùn)動(dòng)幅度太大,直接戳破外層。
即便資深綁定師,也要花60%的時(shí)間解決這些問(wèn)題。
而到了動(dòng)畫環(huán)節(jié),挑戰(zhàn)更復(fù)雜:
傳統(tǒng)方式有兩種:“手K”和“動(dòng)捕”。徒手逐幀調(diào)整動(dòng)畫(手K)效率極低,一個(gè)十秒的動(dòng)畫可能就要調(diào)一周。動(dòng)作捕捉(動(dòng)捕)速度雖快,但數(shù)據(jù)質(zhì)量不穩(wěn)定,仍需大量修正。而風(fēng)格化、非通用類型的動(dòng)作——比如武術(shù)動(dòng)作或夸張表情,常因缺乏數(shù)據(jù)儲(chǔ)備需額外組織動(dòng)捕實(shí)驗(yàn)。
AI想解決這些問(wèn)題,但游戲數(shù)據(jù)的復(fù)雜性讓它舉步維艱:
- 蒙皮需要建模頂點(diǎn)和骨骼的復(fù)雜關(guān)系,而3D數(shù)據(jù)異構(gòu)性強(qiáng),AI表征是難題;
- 動(dòng)畫細(xì)節(jié)極為豐富,缺乏統(tǒng)一有效表征(如大語(yǔ)言離散化表達(dá)),其空間、時(shí)序多維建模是難題。
更關(guān)鍵的是,游戲行業(yè)的標(biāo)準(zhǔn)極高——AI生成的內(nèi)容必須能無(wú)縫融入管線,還得方便美術(shù)師隨時(shí)調(diào)整。如果一家公司不懂游戲研發(fā)流程,或者沒有足夠數(shù)據(jù),它的AI很可能連“及格線”都摸不到。
所以,真正的挑戰(zhàn)或許是:如何讓AI既懂技術(shù),又懂游戲?
騰訊游戲有何解法?
在蒙皮方面,騰訊游戲VISVISE推出GoSkinning蒙皮工具,通過(guò)兩階段AI解決蒙皮難題:先由通用蒙皮AI大模型(基于GCN和Transformer架構(gòu))預(yù)測(cè)骨鏈、骨骼的權(quán)重,再通過(guò)局部AI對(duì)效果不佳區(qū)域(如裙擺、翅膀等復(fù)雜部件)進(jìn)行二次優(yōu)化
操作起來(lái)十分簡(jiǎn)單,在場(chǎng)景中選擇模型和關(guān)節(jié)后,即可點(diǎn)擊自動(dòng)整體蒙皮。
局部蒙皮方面,在場(chǎng)景中只需選出錯(cuò)誤的關(guān)節(jié)和頂點(diǎn),然后再用GoSkinning局部蒙皮AI進(jìn)行修復(fù)便可完成。
這套系統(tǒng)訓(xùn)練時(shí)“喂了”騰訊游戲研發(fā)過(guò)程中積累的高質(zhì)量數(shù)據(jù),最終實(shí)現(xiàn)2萬(wàn)頂點(diǎn)模型30秒處理完成,效率提升8倍。
動(dòng)畫制作方面同樣被AI革新,騰訊游戲VISVISE的MotionBlink工具只需開發(fā)者設(shè)定起跳、落地等關(guān)鍵姿勢(shì),AI便能通過(guò)自回歸Diffusion模型自動(dòng)補(bǔ)全中間幀。其底層MotionGen大模型,基于大規(guī)模高精動(dòng)捕數(shù)據(jù),支持攀爬、舞蹈等動(dòng)作風(fēng)格,部分移動(dòng)類動(dòng)作生成質(zhì)量接近專業(yè)動(dòng)捕。
來(lái)看一個(gè)實(shí)操案例,首先設(shè)置角色運(yùn)動(dòng)軌跡:
然后添加幾個(gè)關(guān)鍵幀,調(diào)整角色的動(dòng)作姿勢(shì):
接著使用MIB智能補(bǔ)全中間幀:
幾秒鐘,一段完整動(dòng)畫就生成了:
目前,團(tuán)隊(duì)智能關(guān)鍵幀生成相關(guān)研究已被ACM SIGGRAPH 2025接收
更關(guān)鍵的是,這些工具能以插件形式嵌入Maya等現(xiàn)有開發(fā)軟件,開發(fā)者無(wú)需重構(gòu)管線即可調(diào)用
騰訊游戲這種將技術(shù)研發(fā)與生產(chǎn)實(shí)踐緊密結(jié)合的能力,源自其長(zhǎng)期積累的一線開發(fā)經(jīng)驗(yàn)。AI技術(shù)團(tuán)隊(duì)清楚地知道:游戲角色揮劍時(shí),手腕該旋轉(zhuǎn)多少度;角色模型需要綁定多少個(gè)權(quán)重點(diǎn),裙擺才會(huì)呈現(xiàn)最自然的狀態(tài)。
VISVISE何時(shí)造的?如何誕生的?
與其他“先有技術(shù)再找應(yīng)用”的AI路線不同,VISVISE是騰訊游戲基于實(shí)際開發(fā)需求而誕生的
2016年,騰訊游戲就開始探索AI在游戲中的應(yīng)用,最初將深度學(xué)習(xí)技術(shù)用于運(yùn)營(yíng)提效和流程優(yōu)化;2017年,團(tuán)隊(duì)開始嘗試用強(qiáng)化學(xué)習(xí)進(jìn)行游戲?qū)南嚓P(guān)研究;到2018年,技術(shù)研發(fā)重點(diǎn)擴(kuò)展到了美術(shù)生產(chǎn)管線(DCC)領(lǐng)域。
2022年,騰訊游戲推出了AI自動(dòng)蒙皮工具GoSkinning1.0版本。這項(xiàng)技術(shù)采用數(shù)據(jù)驅(qū)動(dòng)的方式,通過(guò)機(jī)器學(xué)習(xí)方法對(duì)已有蒙皮數(shù)據(jù)的特征進(jìn)行學(xué)習(xí),能夠在相似的衣物數(shù)據(jù)集上進(jìn)行預(yù)測(cè),實(shí)現(xiàn)包含骨骼與面片的網(wǎng)格智能蒙皮,并在《和平精英》《QQ炫舞》等游戲中投入使用。
實(shí)際應(yīng)用數(shù)據(jù)顯示,僅GoSkinning 1.0版本就讓《和平精英》動(dòng)畫蒙皮制作環(huán)節(jié)的效率提升了約40%
此后,VISVISE團(tuán)隊(duì)與《和平精英》項(xiàng)目組保持長(zhǎng)期合作,持續(xù)根據(jù)具體開發(fā)需求輸出定制化技術(shù)功能。目前GoSkinning已迭代至4.2版本,新增了裙擺蒙皮、四足蒙皮、面部綁定等功能,動(dòng)畫蒙皮制作效率提升達(dá)到60%以上。
據(jù)陳冬透露,隨著2023年生成式AI的快速發(fā)展,他們意識(shí)到大規(guī)模的數(shù)據(jù)通過(guò)神經(jīng)網(wǎng)絡(luò)進(jìn)行預(yù)訓(xùn)練后能帶來(lái)強(qiáng)大的生成式能力,于是團(tuán)隊(duì)加大了對(duì)游戲開發(fā)中成本最高的3D模型與動(dòng)畫生成領(lǐng)域的投入。
到2024年,騰訊游戲決定將分散的AI探索整合為系統(tǒng)化的產(chǎn)品矩陣,VISVISE由此正式誕生
該系統(tǒng)圍繞游戲創(chuàng)作的六大核心環(huán)節(jié)——模型生成、貼圖制作、骨骼綁定、動(dòng)畫制作、場(chǎng)景構(gòu)建及渲染,構(gòu)建了動(dòng)畫制作、模型制作、數(shù)字資產(chǎn)管理和智能NPC四大AI生產(chǎn)管線,每個(gè)管線都配備了針對(duì)性的AI工具。這些AI模型均基于游戲行業(yè)實(shí)際需求開發(fā),并針對(duì)不同類型游戲進(jìn)行了差異化訓(xùn)練。
2025年Q1、Q2,騰訊財(cái)報(bào)連續(xù)強(qiáng)調(diào)了AI對(duì)研發(fā)效率的提升作用,其中Q1提到AI已對(duì)長(zhǎng)青游戲產(chǎn)生實(shí)質(zhì)性貢獻(xiàn),Q2則指出《王者榮耀》《和平精英》等頭部產(chǎn)品在向平臺(tái)化演進(jìn)過(guò)程中加大了AI應(yīng)用力度。
目前,VISVISE不僅服務(wù)于騰訊內(nèi)部游戲項(xiàng)目,還包括眾多行業(yè)合作伙伴,僅GoSkinning就已應(yīng)用于近百款游戲
游戲AI的未來(lái)?
隨著ChatGPT5以及Google Genie3的發(fā)布,逐漸出現(xiàn)這樣一種論斷:多模態(tài)將會(huì)成為AI技術(shù)發(fā)展的關(guān)鍵能力。而存在豐富2D、3D交互場(chǎng)景的游戲,也是AIGC的最佳應(yīng)用場(chǎng)景之一。在這樣的趨勢(shì)下,我們應(yīng)該如何看待游戲和游戲AI的能力與價(jià)值?
其實(shí)回看AI發(fā)展史,游戲一直是AI技術(shù)的“試驗(yàn)田”和“加速器”——就像騰訊游戲效能產(chǎn)品部負(fù)責(zé)人陳冬說(shuō)的:“游戲和AI,天生就是一對(duì)”。
比如,英偉達(dá)的顯卡最初是為了渲染游戲畫面,如今卻成了訓(xùn)練大模型的算力基石;DeepMind當(dāng)年訓(xùn)練強(qiáng)化學(xué)習(xí)AI,第一個(gè)“陪練”就是《星際爭(zhēng)霸》和《DOTA2》;甚至硬件層面,GPU里負(fù)責(zé)游戲的CUDA核心和AI運(yùn)算的Tensor核心,物理距離近得像是刻意安排的“鄰居”。
這種關(guān)系不是巧合,而是技術(shù)演進(jìn)的必然。
游戲“感知環(huán)境→決策→反饋→迭代”的邏輯,本質(zhì)上就是AI的訓(xùn)練場(chǎng)。比如,一個(gè)AI在《王者榮耀》里學(xué)會(huì)“蹲草埋伏”,和它在現(xiàn)實(shí)世界學(xué)會(huì)“預(yù)判交通”的底層邏輯,可能沒什么不同。
同時(shí),游戲也是對(duì)3D資產(chǎn)有著最大需求的重要場(chǎng)景之一。但更關(guān)鍵的是,游戲?qū)Α皹O致體驗(yàn)”的追求,一直在逼著AI突破極限。早些年,開發(fā)者就想做“會(huì)哭會(huì)笑的NPC”,但技術(shù)不夠,只能做“木頭人”;現(xiàn)在,AI能讓NPC記住你的名字、吐槽你的操作,甚至假裝生氣——但這還不夠。
陳冬告訴我們,最想突破的是智能NPC
現(xiàn)在的NPC像是“打補(bǔ)丁”的機(jī)器人:加個(gè)記憶模塊、塞個(gè)情感計(jì)算,但本質(zhì)上還是“按劇本演戲”。
真正的突破,是讓NPC像人一樣“理解”虛擬世界——比如,它該知道“玩家剛才那句話是在開玩笑”,而不是機(jī)械地回答“指令無(wú)效”。
這很難,但游戲的魅力就在于此:它既是AI的“考場(chǎng)”,也是“靈感來(lái)源”。或許某天,游戲里的NPC會(huì)先一步達(dá)到AGI——畢竟,它們已經(jīng)在虛擬世界里,演了太久的人類。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.