成人深夜视频网站|日韩高清无码久久|中文a√在线天堂|亚洲黄网站在线看|欧美视频 第二页|日本 久草 天堂|高潮无遮挡黄视频|久久一级内射精品|国产操逼一级视频|五月天婷婷色AV

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

視頻產(chǎn)業(yè)的創(chuàng)意活力,被百度蒸汽機(jī)這顆“動(dòng)力心臟”激活了

0
分享至



1776 年,瓦特改良蒸汽機(jī),將傳統(tǒng)手工作坊轉(zhuǎn)化為規(guī)模化生產(chǎn)的工廠,蒸汽機(jī)由此成為工業(yè)革命的動(dòng)力心臟。今天,AIGC技術(shù)在視頻內(nèi)容產(chǎn)業(yè)引發(fā)深刻變革,行業(yè)都在尋找那一部讓視頻制作從手工作坊到工業(yè)化生產(chǎn)的“蒸汽機(jī)”。

從機(jī)器原型到產(chǎn)業(yè)動(dòng)力心臟,瓦特蒸汽機(jī)完成了兩大轉(zhuǎn)變:一是工業(yè)化,通過氣缸恒溫技術(shù),顯著提升了蒸汽機(jī)運(yùn)行效率,能支持規(guī)?;墓I(yè)生產(chǎn);二是商業(yè)化,與大量工廠主建立合作,推動(dòng)蒸汽機(jī)深度融入經(jīng)濟(jì)生產(chǎn)活動(dòng)。

這正是百度商業(yè)體系在做的,視頻生成模型的產(chǎn)業(yè)級探索。8月21日,百度蒸汽機(jī)(MuseSteamer)迎來重要產(chǎn)品迭代,突破性實(shí)現(xiàn)多人有聲視頻的一體化生成功能。



在工業(yè)化維度,該模型實(shí)現(xiàn)了環(huán)境音效與人物自然語音的同步生成技術(shù)落地,有望大幅提升視頻制作效率;商業(yè)化進(jìn)程中,百度蒸汽機(jī)實(shí)施價(jià)格優(yōu)化策略,通過 Turbo版、Lite版、Pro版及有聲版的梯度化產(chǎn)品矩陣,全系列服務(wù)定價(jià)降至行業(yè)平均水平的70%,并完成與千帆大模型平臺的深度集成。企業(yè)用戶可通過千帆平臺獲取高性能視頻生成服務(wù),C端用戶則可通過百度搜索入口或“繪想”平臺體驗(yàn)產(chǎn)品功能。

這一系列舉措背后,標(biāo)志著AI模型作為視頻內(nèi)容產(chǎn)業(yè)的動(dòng)力心臟,正牽引整個(gè)行業(yè)踏入規(guī)?;a(chǎn)的全新階段。而支撐這場視頻內(nèi)容產(chǎn)業(yè)智能化的核心——百度蒸汽機(jī),我們有必要對其抽絲剝繭,一探究竟。



自O(shè)penAI于2024年推出Sora后,市場涌現(xiàn)的眾多視頻生成模型,但深入行業(yè)實(shí)踐不難發(fā)現(xiàn),AIGC技術(shù)革新的表象之下,視頻內(nèi)容產(chǎn)業(yè)的核心痛點(diǎn)依然存在。

首先,通用視頻生成模型在設(shè)計(jì)理念上追求大而全,與具體生產(chǎn)需求難以適配。以AI短劇為例,觀眾更喜歡看多人角色互動(dòng),但現(xiàn)有通用視頻生成模型在多個(gè)角色對話場景時(shí),普遍存在眼神交互失準(zhǔn)、肢體動(dòng)作協(xié)調(diào)性不足等缺陷。同時(shí),音視頻同步生成技術(shù)尚未完全成熟,創(chuàng)作者仍需在圖像生成、音頻制作、口型匹配等多個(gè)環(huán)節(jié)進(jìn)行跨平臺協(xié)同作業(yè)。谷歌Veo3升級后雖實(shí)現(xiàn)了音畫同步輸出功能,但因缺乏中文支持,無法有效進(jìn)入華語市場。

不僅模型與場景的矛盾現(xiàn)實(shí)存在,成本與效率的矛盾也尤為突出。Sora演示的20秒視頻片段雖然技術(shù)表現(xiàn)驚艷,但背后巨大的算力消耗使得中小規(guī)模制作機(jī)構(gòu)難以承受,加之單次生成的成功率有限,反復(fù)操作的結(jié)果,就是進(jìn)一步推高了生產(chǎn)成本。



此外,制作與分發(fā)之間也存在脫節(jié)。當(dāng)前多數(shù)視頻生成模型仍局限于內(nèi)容生產(chǎn)環(huán)節(jié),與平臺分發(fā)系統(tǒng)之間缺乏有效的銜接,難以實(shí)現(xiàn)與廣告投放系統(tǒng)的協(xié)同優(yōu)化,導(dǎo)致創(chuàng)意內(nèi)容在商業(yè)轉(zhuǎn)化過程中,價(jià)值大打折扣。

回溯歷代工業(yè)革命會發(fā)現(xiàn),從蒸汽動(dòng)力到電能、互聯(lián)網(wǎng),那些真正具備影響力的技術(shù),是能夠滿足業(yè)務(wù)場景實(shí)際需求、完成產(chǎn)業(yè)化落地的完整技術(shù)體系。

以產(chǎn)業(yè)需求為標(biāo)尺,是百度蒸汽機(jī)誕生的原點(diǎn),也指引著模型的進(jìn)化方向。

此前,百度商業(yè)團(tuán)隊(duì)在攻克短劇投放的難題時(shí),敏銳洞察到傳統(tǒng)廣告素材制作存在策劃、拍攝、剪輯等冗長環(huán)節(jié),啟動(dòng)專項(xiàng)研發(fā),歷經(jīng)多輪迭代將模型打磨成一站式智能創(chuàng)作平臺。今年7月,百度蒸汽機(jī)(MuseSteamer)發(fā)布,用戶僅需上傳一張參考圖片與一句創(chuàng)作提示詞,系統(tǒng)便能輸出高清視頻,實(shí)現(xiàn)從創(chuàng)意構(gòu)思到成片產(chǎn)出的全流程一體化生成。

百度蒸汽機(jī)(MuseSteamer)發(fā)布之后,迅速獲得百度內(nèi)部業(yè)務(wù)線及影視創(chuàng)作者、廣告主群體的廣泛關(guān)注與試用。據(jù)百度副總裁、移動(dòng)生態(tài)商業(yè)體系負(fù)責(zé)人陳一凡透露,上線50天以來,百度也收到了用戶的諸多訴求,比如:

運(yùn)鏡能不能不再是簡單的推拉,也能提供環(huán)繞、搖鏡等復(fù)雜鏡頭?

畫質(zhì)能否進(jìn)一步提升,從720P畫質(zhì)升級到1080P?

人物口型與臺詞的吻合,能否進(jìn)一步對齊,讓視頻更有感染力?

畫面和音頻能否一次生成,減少后期配音、生成音頻的繁瑣操作?

雖然邀測期間免費(fèi),但后續(xù)還想接著用,成本還能不能再降一降?



用戶有需求,百度就有回應(yīng)。最新升級的蒸汽機(jī)2.0 版本,就一口氣解決了上述痛點(diǎn)。具體是怎么改變的呢?



升級后的百度蒸汽機(jī)2.0,創(chuàng)作者只需提供一張概念圖與自然語言指令,即可輸出包含多角色對話、環(huán)境音效與高清畫面的完整視頻,而且支持中文。

可以說,借助百度蒸汽機(jī)2.0有聲版模型,AIGC視頻創(chuàng)作真正迎來無配音時(shí)代。AI視頻制作也從跨平臺的手工作坊階段,進(jìn)入可一站式規(guī)?;慨a(chǎn)的工業(yè)時(shí)代。具體來說,要解決幾大難題:



一是多模態(tài)同步生成的精度難題。傳統(tǒng)分步式生成方案,口型和聲音容易錯(cuò)位,而多人有聲音視頻一體化生成,不僅要一次搞定多模態(tài),還要保持語音與唇形、表情、動(dòng)作的毫秒級精準(zhǔn)對齊,復(fù)雜場景下依然穩(wěn)定,技術(shù)挑戰(zhàn)更高。

據(jù)百度商業(yè)研發(fā)首席架構(gòu)師李雙龍介紹,百度蒸汽機(jī)采用端到端訓(xùn)練模式,摒棄傳統(tǒng)模塊化訓(xùn)練思路,采用統(tǒng)一神經(jīng)網(wǎng)絡(luò)架構(gòu)同步學(xué)習(xí)畫面渲染、語音合成、音效匹配等核心技術(shù)的內(nèi)在規(guī)律,極大提升了訓(xùn)練效率與生成質(zhì)量。

比如這個(gè)長達(dá)一分多鐘的AI視頻,涉及多個(gè)場景的切換,以及復(fù)雜的多人對話,百度蒸汽機(jī)2.0可以實(shí)現(xiàn)語音信號與唇形動(dòng)畫的毫秒級時(shí)序?qū)R、語調(diào)情感與面部表情的一致性映射、人物肢體動(dòng)作與場景設(shè)定的邏輯自洽。

高精度的多模態(tài)同步生成,可以直接減少后期剪輯的復(fù)雜度與工作量。以伊利倍暢宣傳片制作項(xiàng)目為例,應(yīng)用該技術(shù)后,項(xiàng)目周期從原先的4周縮短至3天,展現(xiàn)出強(qiáng)大的應(yīng)用價(jià)值與技術(shù)優(yōu)勢。

二是電影級敘事所要求的連貫性和感染力。傳統(tǒng)視頻生成過程中,畫面渲染、語音合成、音效處理等獨(dú)立模塊進(jìn)行訓(xùn)練,不可避免地產(chǎn)生信息丟失,比如畫面生成模型難以捕捉語音中的情感強(qiáng)度變化,音效處理算法無法準(zhǔn)確模擬場景的空間聲學(xué)特性,導(dǎo)致視頻創(chuàng)作流程需頻繁切換多個(gè)平臺。

百度蒸汽機(jī)采用首創(chuàng)的多模態(tài)潛在空間規(guī)劃技術(shù)(Latent Multi-Modal Planner),具備強(qiáng)大的多角色交互自主規(guī)劃能力,能夠自主協(xié)調(diào)構(gòu)建角色身份、情感表達(dá)及互動(dòng)關(guān)系,打造真實(shí)細(xì)膩的人物表現(xiàn)力。

比如,我們上傳了一張網(wǎng)圖,兩位身穿古代盔甲的武士打麻將,讓兩個(gè)角色展開交互,并且文生音頻與表情的一致性很高,人物表現(xiàn)也跟圖片背景比較匹配。“一張圖講故事”,就是點(diǎn)一下鼠標(biāo)的事兒。

大家應(yīng)該發(fā)現(xiàn)了,一體化生成與中文場景深度適配的本土化視頻,百度蒸汽機(jī)的中文能力,成了華語創(chuàng)作者的福音。為啥之前沒有這類中文音視頻同步生成的工具呢?

挑戰(zhàn)在于,中文語音存在四種聲調(diào),聲調(diào)系統(tǒng)更為復(fù)雜,而且高度依賴語境的語義表達(dá),同一個(gè)詞在不同語境下的解釋不同,所需要搭配的表情、音色、聲調(diào)自然也不一樣。這要求AI視頻模型不僅具備文本識別能力,更需構(gòu)建深層次的文化語義理解體系。

百度蒸汽機(jī)2.0展現(xiàn)出的中文場景適配性,來自數(shù)據(jù)與算法的雙重創(chuàng)新。數(shù)據(jù)層面,系統(tǒng)采集并標(biāo)注了覆蓋七大漢語方言區(qū)、總時(shí)長達(dá)10萬小時(shí)的語音語料庫,并構(gòu)建了包含語境信息與情感維度的標(biāo)注體系,解決了歧義句的語義解析難題;算法層面,超98%的還原度精準(zhǔn),能夠細(xì)膩地展現(xiàn)中文語音細(xì)節(jié)與情感表達(dá)。

此外,在畫質(zhì)與運(yùn)鏡方面,此次百度蒸汽機(jī)2.0支持1080P高清分辨率,配合環(huán)繞、搖鏡、推軌等數(shù)十種專業(yè)鏡頭語言,實(shí)現(xiàn)了超越行業(yè)標(biāo)準(zhǔn)的專業(yè)級影像表達(dá),為創(chuàng)作者提供更多的創(chuàng)作可能性。

百度蒸汽機(jī)2.0,就像給視頻內(nèi)容產(chǎn)業(yè)裝上了一臺超給力的發(fā)動(dòng)機(jī)。不管是專業(yè)的影視工作室,還是剛?cè)腴T的內(nèi)容小白,只要有想法,都能把創(chuàng)意變成一個(gè)個(gè)爆款視頻,輕松打造屬于自己的內(nèi)容工廠。

但僅僅是生產(chǎn)制作,不足以撼動(dòng)內(nèi)容產(chǎn)業(yè)。百度蒸汽機(jī)的另一重隱藏價(jià)值,在于制作與分發(fā)體系的全面打通,這是視頻生成模型領(lǐng)域所少有的。



AI視頻模型如果沒有商業(yè)體系的支撐,技術(shù)突破的價(jià)值終將消散在成本黑洞與分發(fā)壁壘中。構(gòu)建一套讓創(chuàng)意轉(zhuǎn)化為收益的商業(yè)體系,是產(chǎn)業(yè)所需要的,也是百度所擅長的。

通過促增長、降成本的雙重賦能,百度商業(yè)體系正在讓AI視頻生成技術(shù)被高效傳導(dǎo)至產(chǎn)業(yè)末梢。

具體來說,百度商業(yè)體系為企業(yè)構(gòu)建了以視頻為核心的增長引擎,打通生產(chǎn)-分發(fā)-變現(xiàn)的全鏈路。

企業(yè)生成的視頻可直接接入百度搜索廣告系統(tǒng),根據(jù)用戶畫像動(dòng)態(tài)調(diào)整畫面節(jié)奏與話術(shù)。對于C端創(chuàng)作者,百度也構(gòu)建了多元的收益通道,百家號對蒸汽機(jī)生成的優(yōu)質(zhì)內(nèi)容給予流量加權(quán),創(chuàng)作者可以獲得廣告分成收益。

視頻內(nèi)容想要規(guī)模化量產(chǎn),另一個(gè)條件是成本足夠低。百度蒸汽機(jī)的工程化能力,進(jìn)一步降低了AI視頻制作的成本。

好萊塢視效指導(dǎo)姚騏用百度蒸汽機(jī)生成的科幻短片《歸途》,共有40多個(gè)鏡頭,傳統(tǒng)制作方式需要百萬美元的預(yù)算,如今成本僅需百元。C端用戶也可以通過繪想平臺每月贈送15個(gè)5秒視頻的“想象力值”,免費(fèi)體驗(yàn)全流程AI視頻創(chuàng)作。

百度商業(yè)體系商業(yè)研發(fā)總經(jīng)理劉林介紹道,依托多年積累的GPU架構(gòu)和工程化實(shí)踐,通過算子優(yōu)化、訓(xùn)練集調(diào)整等技術(shù)手段,百度蒸汽機(jī)將視頻生成推理成本降至行業(yè)均價(jià)的70%,未來還有望進(jìn)一步降低。



總結(jié)一下,百度蒸汽機(jī)是通過技術(shù)創(chuàng)新+商業(yè)體系的雙重賦能,讓每個(gè)參與者分享AI紅利。對企業(yè)而言,意味著從購買工具轉(zhuǎn)向接入生態(tài),以更低成本獲得更高商業(yè)回報(bào);對創(chuàng)作者來說,是從技術(shù)追隨者變?yōu)閯?chuàng)意主導(dǎo)者,釋放個(gè)體內(nèi)容生產(chǎn)力。

這顆由百度技術(shù)與商業(yè)體系共同鍛造的動(dòng)力心臟,正驅(qū)動(dòng)視頻內(nèi)容產(chǎn)業(yè)的創(chuàng)新齒輪加速轉(zhuǎn)動(dòng)。



聲明:個(gè)人原創(chuàng),僅供參考

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
他們出賣楊靖宇,有的解放后竟混成高官,有的活到80年代安度晚年

他們出賣楊靖宇,有的解放后竟混成高官,有的活到80年代安度晚年

阿胡
2024-12-28 12:15:05
外交部回應(yīng)特朗普涉華指責(zé)

外交部回應(yīng)特朗普涉華指責(zé)

新京報(bào)
2025-09-04 16:49:37
衛(wèi)青去世后,衛(wèi)氏家族被誅殺,劉徹:他幫我平匈奴,我卻殺他全家

衛(wèi)青去世后,衛(wèi)氏家族被誅殺,劉徹:他幫我平匈奴,我卻殺他全家

蜉蝣說
2025-09-03 11:59:50
4換1,朱俊龍或交易,威少或簽CBA豪門,張鎮(zhèn)麟比趙睿貴一半

4換1,朱俊龍或交易,威少或簽CBA豪門,張鎮(zhèn)麟比趙睿貴一半

東球弟
2025-09-04 08:43:30
銷量驟降11%,車企集體踩坑增程?

銷量驟降11%,車企集體踩坑增程?

Tech星球
2025-09-03 11:01:16
難以置信!長沙一美女老師獲全國一等獎(jiǎng),因濃妝艷抹和穿著遭質(zhì)疑

難以置信!長沙一美女老師獲全國一等獎(jiǎng),因濃妝艷抹和穿著遭質(zhì)疑

火山詩話
2025-09-02 06:20:47
不僅華為要謝,中國更要感謝梁孟松!為中國芯片竟放棄上億年薪!

不僅華為要謝,中國更要感謝梁孟松!為中國芯片竟放棄上億年薪!

青青子衿
2025-09-02 04:12:58
上海中考同分不同命,不同區(qū)的中考差距有多大?

上海中考同分不同命,不同區(qū)的中考差距有多大?

愛下廚的阿椅
2025-09-04 11:01:43
女優(yōu)小那海綾引退不干了!每日被罵整形女丑八怪

女優(yōu)小那海綾引退不干了!每日被罵整形女丑八怪

葫蘆哥愛吐槽
2025-09-04 13:38:25
東營市委書記楊國強(qiáng)南下,履新海南省領(lǐng)導(dǎo)

東營市委書記楊國強(qiáng)南下,履新海南省領(lǐng)導(dǎo)

澎湃新聞
2025-09-04 08:29:03
小米徠卡深化合作 小米16 Ultra直接上可樂標(biāo)

小米徠卡深化合作 小米16 Ultra直接上可樂標(biāo)

PChome電腦之家
2025-09-04 10:39:31
夜店摸黑親一口,竟讓我“喜提”性病?

醫(yī)路向前巍子
2025-08-21 12:30:00

香港僅此一家!三代人都受邀登樓觀禮,爺爺還參加過3次

香港僅此一家!三代人都受邀登樓觀禮,爺爺還參加過3次

白面書誏
2025-09-03 15:03:08
不是迷信!中元節(jié)當(dāng)天,“最不能”做的四件事,告訴家人要知道

不是迷信!中元節(jié)當(dāng)天,“最不能”做的四件事,告訴家人要知道

智慧生活筆記
2025-09-01 09:08:13
100式“雙離譜”坦克解讀

100式“雙離譜”坦克解讀

南海的波濤
2025-09-04 12:08:32
事實(shí)證明,47歲全程解說大閱兵的寶曉峰,已經(jīng)走上了另一條大道!

事實(shí)證明,47歲全程解說大閱兵的寶曉峰,已經(jīng)走上了另一條大道!

歸史
2025-09-04 10:59:34
絕不向中國低頭?寧愿開除9000人賣公司,也不會給中國轉(zhuǎn)讓技術(shù)

絕不向中國低頭?寧愿開除9000人賣公司,也不會給中國轉(zhuǎn)讓技術(shù)

阿傖說事
2025-07-27 09:00:12
別再可憐蘇軾,我們都被騙了!身為北宋頂流,他才是史上最幸運(yùn)人

別再可憐蘇軾,我們都被騙了!身為北宋頂流,他才是史上最幸運(yùn)人

玥來玥好講故事
2025-08-19 20:30:22
宋慶齡拒絕與孫中山合葬,坦言:她陪我53年,我答應(yīng)要和她葬一起

宋慶齡拒絕與孫中山合葬,坦言:她陪我53年,我答應(yīng)要和她葬一起

云霄紀(jì)史觀
2025-09-01 10:44:25
美媒發(fā)問:哈登和霍里,你更希望擁有誰的生涯?其中哈登被熱議

美媒發(fā)問:哈登和霍里,你更希望擁有誰的生涯?其中哈登被熱議

魚崖大話籃球
2025-09-04 17:35:55
2025-09-04 18:28:49
腦極體 incentive-icons
腦極體
從智能密鑰到已知盡頭
3425文章數(shù) 167032關(guān)注度
往期回顧 全部

科技要聞

17999元起!華為發(fā)布三折疊屏手機(jī)新品

頭條要聞

閱兵式上一戰(zhàn)旗被指有"錯(cuò)字" 真相來了

頭條要聞

閱兵式上一戰(zhàn)旗被指有"錯(cuò)字" 真相來了

體育要聞

“他就像是身高2米的梅西”

娛樂要聞

墻倒眾人推!胡歌張譯的仇終于有人報(bào)

財(cái)經(jīng)要聞

A股久違的深跌出現(xiàn)了 下一步思路是什么

汽車要聞

對話仇雨菁:七年磨一劍,芯馳科技的破局之路

態(tài)度原創(chuàng)

本地
親子
旅游
公開課
軍事航空

本地新聞

食味印象 | 夜未央 在自由時(shí)光邂逅煙火氣

親子要聞

小孩別養(yǎng)太胖!長大后減肥難上加難,還會影響身高?。ㄡt(yī)藥衛(wèi)生報(bào))

旅游要聞

熱聞|清明假期將至,熱門目的地有哪些?

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

全網(wǎng)獨(dú)家!九三閱兵全圖鑒

無障礙瀏覽 進(jìn)入關(guān)懷版