成人深夜视频网站|日韩高清无码久久|中文a√在线天堂|亚洲黄网站在线看|欧美视频 第二页|日本 久草 天堂|高潮无遮挡黄视频|久久一级内射精品|国产操逼一级视频|五月天婷婷色AV

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

小紅書AIGC團隊提出圖像和視頻換臉新算法DynamicFace

0
分享至



本論文主要作者來自小紅書 AIGC 團隊(Dynamic-X-Lab),Dynamic?X?LAB 是一個專注于 AIGC 領(lǐng)域的研究團隊,致力于推動姿態(tài)驅(qū)動的人像生成與視頻動畫技術(shù)。他們以高質(zhì)量、高可控性的生成模型為核心,圍繞文生圖(t2i)、圖像生成(i2i)、圖像轉(zhuǎn)視頻(i2v)和風(fēng)格遷移加速等方向展開研究,并通過完整的開源方案分享給開發(fā)者與研究者社區(qū)。



  • 論文標題:DynamicFace: High-Quality and Consistent Face Swapping for Image and Video using Composable 3D Facial Priors
  • 論文鏈接:
  • https://arxiv.org/abs/2501.08553
  • 項目主頁:
  • https://dynamic-face.github.io/

近年來,擴散模型在圖像與視頻合成領(lǐng)域展現(xiàn)出前所未有的生成能力,為人臉生成與編輯技術(shù)按下了加速鍵。特別是一張靜態(tài)人臉驅(qū)動任意表情、姿態(tài)乃至光照的夢想,正在走向大眾工具箱,并在三大場景展現(xiàn)巨大潛力:

  • 影視行業(yè):導(dǎo)演只需一張定妝照,即可讓演員「數(shù)字替身」在綠幕里實時完成高難度的表情捕捉與重打光,后期不再為補拍鏡頭而燒預(yù)算,真正進入「先拍臉、后拍景」的降本增效時代。

  • 游戲行業(yè):捏臉系統(tǒng)將不再局限于預(yù)設(shè)模板。玩家上傳一張自拍,即刻生成 360° 可旋轉(zhuǎn)、可眨眼、可微表情的個性化角色;配合實時語音驅(qū)動,NPC 的口型與情緒可隨劇情即時變化,沉浸式體驗再升一級。

  • 自媒體與電商:短視頻創(chuàng)作者無需真人出鏡,一張品牌代言照即可批量產(chǎn)出不同光線、不同角度的口播視頻;虛擬主播更可 7x24 小時直播帶貨,表情自然、光影一致,告別「恐怖谷」效應(yīng)。

人臉視頻生成的核心難題在于,如何在根據(jù)參考圖像和外部動作序列,嚴謹?shù)乇3衷磪⒖既四樕矸萏卣鞑槐粨p傷的同時,還要維持目標人臉動作的一致性?,F(xiàn)有方法在追求真實動態(tài)表現(xiàn)時,通常會遭遇以下三大挑戰(zhàn):

  • 空間與時間建模的內(nèi)在矛盾:許多聚焦于身份一致性的圖像生成模型在空間特征提取方面已足夠優(yōu)秀,然而由于在注入運動信息時耦合了目標身份特征,進而導(dǎo)致運動信息不準確,一旦需要建模時間變化的視頻擴散模型時,不準確的運動建模會被逐幀放大,最終陷入身份還原能力和運動一致難以兩全的問題。

  • 身份一致性降低:在復(fù)雜或大幅度動作變化情況下,面部區(qū)域極易出現(xiàn)形變、失真,難以保證人物獨特的面貌特征能隨時保留。這種問題直接影響動畫人物的個體識別度和可信度,也是用戶接受數(shù)字人像動畫的首要阻礙。

  • 整體視頻質(zhì)量受損:當前最優(yōu)秀的人像動畫生成模型雖然在動畫效果層面取得進展,但往往還需借助外部換臉后處理工具以改善關(guān)鍵幀細節(jié)??上?,這類后處理雖能暫時修復(fù)細節(jié),卻往往損傷了整段視頻在視覺上的統(tǒng)一性和自然度,導(dǎo)致畫面出現(xiàn)割裂感和不連貫的現(xiàn)象。

小紅書提出 DynamicFace,讓視頻人臉交換邁入「電影級」工業(yè)流水線!

方法介紹

本研究提出了一種創(chuàng)新性的人臉置換方法DynamicFace,針對圖像及視頻領(lǐng)域的人臉融合任務(wù)實現(xiàn)了高質(zhì)量與高度一致性的置換效果。

與傳統(tǒng)人臉置換方法相比,DynamicFace 獨創(chuàng)性地將擴散模型(Diffusion Model)與可組合的 3D 人臉先驗進行深度融合,針對人臉運動與身份信息進行了精細化解耦,以生成更一致的人臉圖像和視頻。



可組合三維面部先驗的顯式條件解耦

針對現(xiàn)有方法在身份與運動表征中普遍存在的耦合冗余問題,DynamicFace 提出將人臉條件顯式分解為身份、姿態(tài)、表情、光照及背景五個獨立的表征,并基于 3DMM 重建模型獲取對應(yīng)參數(shù)。

具體而言,利用源圖像提取身份形狀參數(shù) α,目標視頻逐幀提取姿態(tài) β 與表情 θ,隨后渲染生成形狀–姿態(tài)法線圖,減少目標人臉身份泄露,最大程度保留源身份;表情信息從二維關(guān)鍵點中提取,建模更精準的表情信息,僅保留眉毛、眼球及口唇區(qū)域的運動先驗,避免引入目標身份特征;光照條件由 UV 紋理圖經(jīng)模糊處理得到,僅保留低頻光照分量;背景條件采用遮擋感知掩碼與隨機位移策略,實現(xiàn)訓(xùn)練–推理階段的目標臉型對齊。

四條條件并行輸入 Mixture-of-Guiders,每組由 3×3 卷積與零初始化卷積末端構(gòu)成輕量級條件注入模塊,在注入網(wǎng)絡(luò)前經(jīng)過 FusionNet 融合四個條件特征后注入到擴散模型中,可在保持 Stable Diffusion 預(yù)訓(xùn)練先驗的同時實現(xiàn)精準控制。


身份–細節(jié)雙流注入機制

為實現(xiàn)高保真身份保持,DynamicFace 設(shè)計了雙流并行注入架構(gòu)。高層身份流由 Face Former 完成:首先利用 ArcFace 提取 ID Embedding,再通過可學(xué)習(xí) Query Token 與 U-Net 各層 Cross-Attention 交互,確保全局身份一致性;細節(jié)紋理流由 ReferenceNet 實現(xiàn),該網(wǎng)絡(luò)為 U-Net 的可訓(xùn)練副本,將 512×512 源圖潛變量經(jīng) Spatial-Attention 注入主網(wǎng)絡(luò),實現(xiàn)細粒度的紋理遷移。


即插即用時序一致性模塊

針對時序一致性問題,DynamicFace 會在訓(xùn)練中插入時序注意力層來優(yōu)化幀間穩(wěn)定性,但時序?qū)釉谔幚黹L視頻生成時會出現(xiàn)幀間跳動的現(xiàn)象。為此,我們提出了 FusionTVO,將視頻序列劃分為若干段,并為每段設(shè)置融合權(quán)重,在相鄰段的重疊區(qū)域?qū)嵭屑訖?quán)融合;并在潛變量空間引入總變差(Total Variation)約束,抑制幀與幀之間的不必要波動;對于人臉之外的背景區(qū)域,在每一步去噪迭代過程中采用目標圖像中的背景潛變量空間進行替換,維持了場景的高保真度。

生成結(jié)果展示








https://mp.weixin.qq.com/s/gt94VPIuKvN_ZU2KyT0UqA?click_id=1


https://mp.weixin.qq.com/s/gt94VPIuKvN_ZU2KyT0UqA?click_id=1

與 SOTA 方法的定性對比實驗









DynamicFace 可以很好地保持身份(例如,形狀和面部紋理信息)和動作(包括表情和姿勢等),并且生成結(jié)果維持了更好的背景一致性。

具體來說,基于 GAN 的方法往往會生成較為模糊、視覺上并不真實且身份一致性較差的結(jié)果,但可以維持不錯的運動一致性;其他基于擴散模型的方法能生成分辨率更高且更真實的結(jié)果,但運動一致性保持較差(如表情不一致,眼神朝向不同等)。

DynamicFace 通過精細化解耦的條件注入可以保證更優(yōu)的表情一致、眼神一致和姿勢一致性。

與 SOTA 方法的定量對比實驗



為全面評估 DynamicFace 的性能,研究團隊在 FaceForensics++(FF++)和 FFHQ 數(shù)據(jù)集上進行系統(tǒng)性的定量實驗,并與當前最具代表性的 6 種換臉方法進行對比,包括 Deepfakes、FaceShifter、MegaFS、SimSwap、DiffSwap 以及 Face Adapter。

實驗遵循先前論文的參數(shù)設(shè)置:從每個測試視頻中隨機抽取 10 幀作為評估樣本,并另取連續(xù) 60 幀用于視頻級指標計算。所有方法均使用官方開源權(quán)重或公開推理腳本,在輸入分辨率(512×512)下復(fù)現(xiàn)結(jié)果。定量結(jié)果如表中所示:DynamicFace 同時在身份一致性(ID Retrieval)和運動一致性(Mouth&Eye Consistency)達到了最優(yōu)的結(jié)果。

整體而言,實驗結(jié)果充分證明了 DynamicFace 在身份保真與運動還原方面的綜合優(yōu)勢,驗證了其在高質(zhì)量人臉可控生成中的卓越性能。

更多應(yīng)用樣例





我們也展示了一些其他的應(yīng)用示例,DynamicFace 可以對身份保持和人體驅(qū)動等生成結(jié)果進行后處理,顯著提升生成結(jié)果的人臉 ID 一致性和表情控制,更多效果展示可以在項目主頁中進行查看。期望這種精細化解耦條件注入的方法能為可控生成的后續(xù)工作提供新思路。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
小米給車評人800塊車馬費?陳震甩截圖炸鍋,網(wǎng)友:高端夢碎了!

小米給車評人800塊車馬費?陳震甩截圖炸鍋,網(wǎng)友:高端夢碎了!

倪衛(wèi)濤頻道
2025-08-28 22:33:05
震驚!柯建銘的反擊!??!

震驚!柯建銘的反擊?。。?/a>

放開他讓wo來
2025-08-31 05:10:03
備受期待的9.3閱兵,九國元首集體缺席,降低對華規(guī)格,信息量大

備受期待的9.3閱兵,九國元首集體缺席,降低對華規(guī)格,信息量大

天行艦
2025-08-29 00:00:04
臺灣92歲老兵回重慶祭祖,下飛機后卻怒道:這不還是臺北嗎?

臺灣92歲老兵回重慶祭祖,下飛機后卻怒道:這不還是臺北嗎?

涼羽亭
2025-08-27 20:11:31
釋永信讓女大學(xué)生抓娃娃兩次!

釋永信讓女大學(xué)生抓娃娃兩次!

八卦瘋叔
2025-08-01 11:01:45
80后同學(xué)群竟成了訃告群!班里60個同學(xué),已走了5人,全是心梗…

火山詩話
2025-08-28 10:12:59

9月3日大閱兵唯一“遺憾”,國人這次真的不能忍了!

9月3日大閱兵唯一“遺憾”,國人這次真的不能忍了!

策略述
2025-08-29 19:42:06
《鏢人》正式補拍,陳麗君已到新疆,吳京騎虎難下

《鏢人》正式補拍,陳麗君已到新疆,吳京騎虎難下

光影新天地
2025-08-30 14:14:01
長得帥就是好!男子進廠打工,被5個女生堵宿舍里,深夜才離開

長得帥就是好!男子進廠打工,被5個女生堵宿舍里,深夜才離開

唐小糖說情感
2025-08-28 10:52:28
輪到理想打逆風(fēng)局了

輪到理想打逆風(fēng)局了

虎嗅APP
2025-08-30 07:35:04
我爸是市委書記,我對女友說我爸是工人,結(jié)果她和副鎮(zhèn)長好上了

我爸是市委書記,我對女友說我爸是工人,結(jié)果她和副鎮(zhèn)長好上了

喬生桂
2025-08-17 08:15:03
沙漠大媽向游客索要過路費,被拒后開摩托車撞人,報警后續(xù)來了!

沙漠大媽向游客索要過路費,被拒后開摩托車撞人,報警后續(xù)來了!

鋭娛之樂
2025-08-31 01:25:39
活了這么多年,頭一次見激光雷達在車里的。。。

活了這么多年,頭一次見激光雷達在車里的。。。

差評XPIN
2025-08-31 00:13:06
為什么都在勸不要當高薪海員?網(wǎng)友:船員之間會相互解決嗎

為什么都在勸不要當高薪海員?網(wǎng)友:船員之間會相互解決嗎

帶你感受人間冷暖
2025-08-30 00:15:05
價格“大跳水”!暴跌70%!東莞這波虧大了!

價格“大跳水”!暴跌70%!東莞這波虧大了!

東莞好生活
2025-08-30 10:13:59
硬地大滿貫24連勝!辛納逆轉(zhuǎn)晉級美網(wǎng)16強,一數(shù)據(jù)比肩納達爾德約

硬地大滿貫24連勝!辛納逆轉(zhuǎn)晉級美網(wǎng)16強,一數(shù)據(jù)比肩納達爾德約

全景體育V
2025-08-31 06:01:33
提新車住豪宅,68歲“丁克”了一輩子的葛優(yōu),最終活成了人生贏家

提新車住豪宅,68歲“丁克”了一輩子的葛優(yōu),最終活成了人生贏家

瓜農(nóng)娟姐
2025-08-30 16:06:15
又一船東宣布:暫停運輸電動汽車

又一船東宣布:暫停運輸電動汽車

龍de船人
2025-08-30 09:05:28
發(fā)動機被斷供后,梟龍生產(chǎn)線一夜搬空,千億訂單蒸發(fā),途毀于一旦

發(fā)動機被斷供后,梟龍生產(chǎn)線一夜搬空,千億訂單蒸發(fā),途毀于一旦

8哥話天下
2025-08-29 09:36:41
再添一員虎將,上賽季的超級得分王,朱芳雨徹底殺瘋,杜鋒樂壞了

再添一員虎將,上賽季的超級得分王,朱芳雨徹底殺瘋,杜鋒樂壞了

宏遠小師哥
2025-08-31 06:41:01
2025-08-31 08:24:49
機器之心Pro incentive-icons
機器之心Pro
專業(yè)的人工智能媒體
11187文章數(shù) 142429關(guān)注度
往期回顧 全部

科技要聞

李斌內(nèi)部講話:蔚來四季度必須盈利

頭條要聞

高校被指強制學(xué)生辦校園電話卡:不辦卡無法開宿舍門

頭條要聞

高校被指強制學(xué)生辦校園電話卡:不辦卡無法開宿舍門

體育要聞

扛著別人的老婆,贏下那該死的冠軍

娛樂要聞

吳京風(fēng)波拉出多位明星

財經(jīng)要聞

美上訴法院裁定特朗普關(guān)稅非法!

汽車要聞

全國靜態(tài)品鑒開啟 方程豹鈦7成都車展首秀

態(tài)度原創(chuàng)

家居
本地
手機
公開課
軍事航空

家居要聞

提升功能 靈活居住環(huán)境

本地新聞

換個城市過夏天 | 夏末狂歡,浪在阜新黃家溝!

手機要聞

蘋果iPhone 17系列爆水管 Pro版大漲價8499起

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

以軍繼續(xù)襲擊加沙城

無障礙瀏覽 進入關(guān)懷版