成人深夜视频网站|日韩高清无码久久|中文a√在线天堂|亚洲黄网站在线看|欧美视频 第二页|日本 久草 天堂|高潮无遮挡黄视频|久久一级内射精品|国产操逼一级视频|五月天婷婷色AV

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請入駐

一張照片+一段音頻生成“電影大片”視頻!通義萬相又一重磅開源

0
分享至


智東西
作者 王涵
編輯 漠影

智東西8月27日消息,昨夜,阿里通義萬相正式開源全新多模態(tài)視頻生成模型通義萬相Wan2.2-S2V,用戶僅需一張靜態(tài)圖片和一段音頻,即可通過該模型生成面部表情自然、口型一致、肢體動(dòng)作絲滑的電影級(jí)數(shù)字人視頻。

Wan2.2-S2V單次生成的視頻時(shí)長可達(dá)分鐘級(jí),有望大幅提升數(shù)字人直播、影視制作、AI教育等行業(yè)的視頻創(chuàng)作效率。目前,模型已在通義萬相官網(wǎng)、Hugging Face和魔搭社區(qū)上線。


7月28日,阿里開源視頻生成模型通義萬相Wan2.2,包括文生視頻Wan2.2-T2V-A14B、圖生視頻Wan2.2-I2V-A14B和統(tǒng)一視頻生成Wan2.2-IT2V-5B三款模型。其中,文生視頻模型和圖生視頻模型為業(yè)界首個(gè)使用MoE架構(gòu)的視頻生成模型。

8月11日,Wan2.2-I2V-Flash上線, 相比Wan2.1推理速度提升12倍,0.1元/秒,抽卡成功率提升123%。

本次發(fā)布并開源的Wan2.2-S2V則更加偏向音頻驅(qū)動(dòng),專攻圖像+音頻,讓畫面和音頻更加契合。


體驗(yàn)鏈接:

通義萬相官網(wǎng):https://tongyi.aliyun.com/wanxiang/generate

阿里云百煉API:https://bailian.console.aliyun.com/?tab=api#/api/?type=model&url=2978215

開源地址:

Github:https://github.com/Wan-Video/Wan2.2

魔搭社區(qū):https://www.modelscope.cn/models/Wan-AI/Wan2.2-S2V-14B

Hugging Face:https://huggingface.co/Wan-AI/Wan2.2-S2V-14B

智東西第一時(shí)間對Wan2.2-S2V進(jìn)行了體驗(yàn),發(fā)現(xiàn)其針對真人角色的視頻生成,口型對的很精準(zhǔn),手部或身體其他部分的晃動(dòng)也十分自然,但在動(dòng)畫角色的五官識(shí)別還不太精準(zhǔn),并且該模型免費(fèi)版本排隊(duì)時(shí)間較長且只有一個(gè)排隊(duì)名額。

一、一張照片+一段音頻,就能讓圖片中的人物開口說話

Wan2.2-S2V可驅(qū)動(dòng)真人、卡通、動(dòng)物、數(shù)字人等類型圖片,并支持肖像、半身以及全身等任意畫幅,用戶上傳一段音頻后,模型就能讓圖片中的主體形象完成說話、唱歌和表演等動(dòng)作。

點(diǎn)開Wan2.2-S2V主頁,可以看到在聊天框下方有兩個(gè)方框可以選擇模式,視頻類可以選擇“圖生視頻”“文生視頻”“視頻特效”等7個(gè)功能。


我上傳了一張動(dòng)畫人物“吉伊”的圖片,并輸入文字“讓畫面中的角色唱歌”:

“吉伊”不僅動(dòng)了起來,連身邊的星星都跟著旋轉(zhuǎn),還自己配上了bgm,就是嘴巴的線條沒有識(shí)別準(zhǔn)確:

用戶如想要生成人物對嘴型的視頻,則需選擇數(shù)字人選項(xiàng),上傳角色圖像。音頻可以選擇自己上傳,也可以用AI生成,AI生成的音頻需要用戶輸入想要的臺(tái)詞并選擇喜歡的聲線,目前還僅支持中文和英文。


比如,讓小狗張嘴唱歌:

讓愛因斯坦張口說話:

我還上傳了一張歐美男生的人物照片和一段中文音頻:

Wan2.2-S2V生成的視頻不僅能保證人物形象和原圖一致,其面部表情和嘴部動(dòng)作都能與音頻基本對齊,視頻人物臉上的光線甚至還可以隨著嘴形的變化而變化。

此外,該模型還支持文本控制,用戶輸入Prompt后可對視頻畫面進(jìn)行控制,讓視頻主體的運(yùn)動(dòng)和背景的變化更豐富。

再比如,生成一段音樂MV:

畫面中的人物不僅可以對上口型,連手部動(dòng)作和身體搖晃都在音樂的節(jié)拍上,車窗外的畫面也可以移動(dòng),模擬火車行進(jìn)的真實(shí)場景。

二、歷史參考幀擴(kuò)展至73幀,還支持不同分辨率

基于通義萬相視頻生成基礎(chǔ)模型能力,Wan2.2-S2V融合了文本引導(dǎo)的全局運(yùn)動(dòng)控制和音頻驅(qū)動(dòng)的細(xì)粒度局部運(yùn)動(dòng),實(shí)現(xiàn)了復(fù)雜場景的音頻驅(qū)動(dòng)視頻生成。

同時(shí)該模型還引入AdaIN和CrossAttention兩種控制機(jī)制,實(shí)現(xiàn)了更準(zhǔn)確更動(dòng)態(tài)的音頻控制效果。

為保障長視頻生成效果,Wan2.2-S2V通過層次化幀壓縮技術(shù),將motion frames(歷史參考幀)的長度從數(shù)幀拓展到73幀,從而實(shí)現(xiàn)了穩(wěn)定的長視頻生成效果。

Wan2.2-S2V還可支持不同分辨率場景的視頻生成需求, 如豎屏短視頻、橫屏影視劇。

結(jié)語:產(chǎn)業(yè)需求推動(dòng)AI生成視頻的技術(shù)迭代

文生視頻、圖生視頻賽道真是太卷了。

無論是國內(nèi)的即夢AI、MiniMax、昆侖萬維等,還是國外的Runway、Midjouney等,都在視頻生成類大模型上猛下功夫。

就拿通義萬相來說,自今年2月以來,通義萬相已連續(xù)開源文生視頻、圖生視頻、首尾幀生視頻、全能編輯、音頻驅(qū)動(dòng)生視頻等多款模型。

當(dāng)前,數(shù)字人直播、影視制作、AI教育等行業(yè)對高效視頻創(chuàng)作工具的需求日益廣泛。

這種旺盛的產(chǎn)業(yè)需求,正成為推動(dòng)視頻生成類大模型技術(shù)快速迭代的核心動(dòng)力,也為賽道未來的發(fā)展提供了廣闊空間。


特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
3年仗不能白打,普京請中國出山,中國的回應(yīng),算是很給他面子了

3年仗不能白打,普京請中國出山,中國的回應(yīng),算是很給他面子了

boss外傳
2025-08-31 13:05:03
泰倫·盧:聯(lián)盟停擺時(shí)奧尼爾白送我一萬美元,幫我度過了難關(guān)

泰倫·盧:聯(lián)盟停擺時(shí)奧尼爾白送我一萬美元,幫我度過了難關(guān)

雷速體育
2025-08-30 12:22:47
夫妻性生活“前戲”黃金15分鐘:這樣做,感情升溫不止一點(diǎn)點(diǎn)

夫妻性生活“前戲”黃金15分鐘:這樣做,感情升溫不止一點(diǎn)點(diǎn)

精彩分享快樂
2025-08-31 09:31:21
日本干擾九三閱兵失??!30個(gè)歐洲國確定出席央媒四字回應(yīng)大快人心

日本干擾九三閱兵失??!30個(gè)歐洲國確定出席央媒四字回應(yīng)大快人心

壹知眠羊
2025-08-29 11:29:56
《兵臨城下》沒拍透的斯大林格勒,真實(shí)比電影狠 10 倍

《兵臨城下》沒拍透的斯大林格勒,真實(shí)比電影狠 10 倍

陳天宇
2025-08-29 11:20:18
美國報(bào)道的南海撞機(jī)事件,迫降后全國專家會(huì)診,美方說萬幸沒升級(jí)

美國報(bào)道的南海撞機(jī)事件,迫降后全國專家會(huì)診,美方說萬幸沒升級(jí)

干史人
2025-08-30 07:00:02
肖國棟攜妻子領(lǐng)獎(jiǎng)!2項(xiàng)排名飆升鎖定大師賽資格,中國斯諾克首人

肖國棟攜妻子領(lǐng)獎(jiǎng)!2項(xiàng)排名飆升鎖定大師賽資格,中國斯諾克首人

排球黃金眼
2025-08-31 00:51:37
8000萬新援官宣在即!紐卡社媒發(fā)布球員頭像剪影:?

8000萬新援官宣在即!紐卡社媒發(fā)布球員頭像剪影:?

直播吧
2025-08-30 18:00:15
兩名大學(xué)生全勤打完64天暑期工,老板當(dāng)場發(fā)工資,每人15000元!

兩名大學(xué)生全勤打完64天暑期工,老板當(dāng)場發(fā)工資,每人15000元!

魯中晨報(bào)
2025-08-31 09:35:02
我被“氛圍編程”騙了,吳恩達(dá)一句話點(diǎn)醒我:AI寫碼累死人!

我被“氛圍編程”騙了,吳恩達(dá)一句話點(diǎn)醒我:AI寫碼累死人!

AI變革
2025-08-30 19:14:17
安徽19歲小伙認(rèn)42歲上司為干媽,去其家中蹭飯借宿引發(fā)悲劇

安徽19歲小伙認(rèn)42歲上司為干媽,去其家中蹭飯借宿引發(fā)悲劇

蘇大強(qiáng)專欄
2024-07-20 23:05:00
投訴魯迅夾煙女子硬扛到底,收回道歉,要求恢復(fù)名譽(yù),官媒發(fā)聲

投訴魯迅夾煙女子硬扛到底,收回道歉,要求恢復(fù)名譽(yù),官媒發(fā)聲

千言娛樂記
2025-08-30 22:00:53
馬杜羅想逃,沒門!

馬杜羅想逃,沒門!

九思堂開峻
2025-08-31 07:34:53
退休前攢夠這10趟旅行,去過4個(gè)就賺了,全走遍這輩子真值!

退休前攢夠這10趟旅行,去過4個(gè)就賺了,全走遍這輩子真值!

i書與房
2025-08-28 13:27:09
如果在機(jī)場上有人將毒品塞進(jìn)我包里,過安檢被查出如何自證清白?

如果在機(jī)場上有人將毒品塞進(jìn)我包里,過安檢被查出如何自證清白?

帶你感受人間冷暖
2025-08-24 21:12:22
“從女副教授淪為保安”,一名高校教工的血淚教訓(xùn),收入令人心酸

“從女副教授淪為保安”,一名高校教工的血淚教訓(xùn),收入令人心酸

妍妍教育日記
2025-08-28 15:58:28
人民日報(bào)點(diǎn)名批評!全紅嬋賽前突傳噩耗,親哥破防:告都告不贏

人民日報(bào)點(diǎn)名批評!全紅嬋賽前突傳噩耗,親哥破防:告都告不贏

動(dòng)物奇奇怪怪
2025-08-30 16:26:40
湖南最傳奇地主:兒子女婿都是開國大將,國民黨中將當(dāng)過他的長工

湖南最傳奇地主:兒子女婿都是開國大將,國民黨中將當(dāng)過他的長工

咸説歷史
2025-08-30 12:55:06
特朗普向普京發(fā)停戰(zhàn)通牒:美國準(zhǔn)備強(qiáng)力介入,不停火就面對后果吧

老高風(fēng)云
2025-08-30 13:35:35

即將消失的蒙古國:全國只有一條高速公路,76%的國土正在成沙漠

即將消失的蒙古國:全國只有一條高速公路,76%的國土正在成沙漠

芳芳?xì)v史燴
2025-08-08 19:02:24
2025-08-31 14:24:49
智東西 incentive-icons
智東西
聚焦智能變革,服務(wù)產(chǎn)業(yè)升級(jí)。
10390文章數(shù) 116838關(guān)注度
往期回顧 全部

科技要聞

入手iPhone 16還是等17?兩款手機(jī)全面對比

頭條要聞

牛彈琴:有意思 美國總統(tǒng)跟一塊石頭干上了

頭條要聞

牛彈琴:有意思 美國總統(tǒng)跟一塊石頭干上了

體育要聞

遼籃官宣:4冠功勛李曉旭續(xù)約迎第21季 新賽季變球員兼教練

娛樂要聞

韓磊起訴后,女方公開道歉

財(cái)經(jīng)要聞

罕見熱鬧的8月之后,A股將迎怎樣的9月

汽車要聞

家庭泛越野 大狗PLUS預(yù)售煥新11.28萬起

態(tài)度原創(chuàng)

家居
游戲
本地
公開課
軍事航空

家居要聞

提升功能 靈活居住環(huán)境

韓網(wǎng)LPL第三賽段最佳陣容投票結(jié)果出爐:JKL當(dāng)選MVP

本地新聞

換個(gè)城市過夏天 | 夏末狂歡,浪在阜新黃家溝!

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

哈馬斯證實(shí)其軍事領(lǐng)導(dǎo)人辛瓦爾已死亡

無障礙瀏覽 進(jìn)入關(guān)懷版