成人深夜视频网站|日韩高清无码久久|中文a√在线天堂|亚洲黄网站在线看|欧美视频 第二页|日本 久草 天堂|高潮无遮挡黄视频|久久一级内射精品|国产操逼一级视频|五月天婷婷色AV

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

剛剛!谷歌內(nèi)部揭秘Genie 3:Sora后最強(qiáng)AI爆款,開啟世界模型新時代

0
分享至


新智元報道

編輯:KingHZ

【新智元導(dǎo)讀】Genie 3來了!這或許是最接近「模擬世界」的AI魔法。只需一句話,它就能生成一個動態(tài)、可互動的世界——角色能互動、下水會濺起水花,甚至還能記住一分鐘前的細(xì)節(jié)。DeepMind研究者直言:Genie 3是通向AGI的關(guān)鍵一步。

Genie 3是有史以來最先進(jìn)的世界模型之一。

僅通過文本,它能夠?qū)崟r生成完全互動、高度一致的世界。

它不僅是DeepMind積累的結(jié)晶,還是通向AGI和具身智能體的關(guān)鍵一步。

但Genie 3是如何構(gòu)建的?未來的世界模型又是什么樣?

剛剛,谷歌DeepMind的研究科學(xué)家Jack Parker-Holder和研究總監(jiān)Shlomi Fruchter,在a16z的訪談中,分享了他們的觀點(diǎn)。


這次對話提供了對Genie 3的第一手洞察。

主持人Justine Moore發(fā)推表示:「Genie 3在網(wǎng)絡(luò)上引發(fā)熱潮」。


他總結(jié)了深入探討的要點(diǎn):

  • Genie3是由兩個DeepMind項(xiàng)目(Veo 2和Genie 2)合作完成的成果。

  • 實(shí)時、互動的世界模型有很多潛在應(yīng)用

  • 但應(yīng)用并不是推動研究的主要動力——它們是從用戶使用模型的過程中自然涌現(xiàn)出來的。

  • Genie 3可以保留最長達(dá)一分鐘的空間記憶。

  • 物理規(guī)律是模型的「自然產(chǎn)物」,并會隨著訓(xùn)練數(shù)據(jù)的規(guī)模和深度而不斷提升。

  • 目前還沒有一個「終極模型」能夠同時具備Veo 3和Genie 3的所有能力。


Genie 3:AI新魔法

如果說LLM的原生圖像編輯功能,「動動嘴PS」是「言出法隨」,那Genie 3這次的新特性叫什么?

只需輸入文本提示,Genie 3即可生成動態(tài)世界。用戶可以實(shí)時進(jìn)行探索,每秒高達(dá)24幀,分辨率為720p。

十多年來,谷歌DeepMind一直致力于模擬環(huán)境的研究。

Genie 3是他們最新最強(qiáng)的「世界模型」,是通向通用人工智能(AGI)的關(guān)鍵一步,因?yàn)樗茏孉I智能體在無限豐富的模擬環(huán)境中進(jìn)行訓(xùn)練。

去年,他們推出了首批基礎(chǔ)世界模型Genie 1和Genie 2,它們能為智能體生成全新的環(huán)境。此外,他們還通過Veo 2和Veo 3等視頻生成模型,不斷提升對直觀物理的理解能力。

這些模型在世界模擬的不同能力上都取得了進(jìn)展。Genie 3是谷歌首個支持實(shí)時交互的世界模型,同時提升了一致性和真實(shí)感。


在生成視頻時長、世界一致性、內(nèi)容的多樣性、特殊記憶等多個方面,Genie 3都實(shí)現(xiàn)了突破。


它甚至可以讓個人創(chuàng)造自己的游戲世界、訓(xùn)練強(qiáng)化學(xué)習(xí)的智能體、機(jī)器人研究等。

所有這些應(yīng)用基本上都源于一個核心能力:只用幾句話就能生成一個完整的世界。

最關(guān)鍵的新特性是:特殊記憶。

比如:一個角色拿著刷子在墻上刷漆,然后他移動到墻的另一邊去刷,接著又回到原來的位置,結(jié)果之前刷的痕跡還在。

特殊記憶(special memory)是DeepMind團(tuán)隊有意設(shè)計的目標(biāo),但最終的效果好得出乎意料。

即便是參與Genie 3的內(nèi)部成員,第一次看到上面刷墻的示例時也不敢相信,需要再三觀看、逐幀檢查,才確定這真的是模型生成的。


Genie 3的一致性非常高:建筑物左側(cè)的樹木在整個交互過程中始終保持一致,即使它們時而進(jìn)入視野時而消失

其實(shí),Genie 2就已經(jīng)具備了一些「記憶能力」。但當(dāng)時,整個AI界太多令人激動的模型發(fā)布,比如Veo 2模型幾天后也發(fā)布了。而且,當(dāng)時谷歌主打的賣點(diǎn)是「可以生成新的世界」,所以記憶能力就沒被強(qiáng)調(diào)出來。

到了Genie 3,在「記憶」上,谷歌DeepMind下了更大的決心,明確地把「增強(qiáng)記憶能力」作為核心目標(biāo)之一。

當(dāng)時設(shè)定的目標(biāo)是:

超過一分鐘的記憶、

支持「實(shí)時生成」、

還能提升「分辨率」。

其實(shí),這幾個目標(biāo)本身是互相矛盾的,但谷歌無所畏懼。

說實(shí)話,直到項(xiàng)目快結(jié)束時,在看到最終樣本的那一刻,他們依然感到震撼。這種成果即使是預(yù)期中的,真的實(shí)現(xiàn)的時候還是非常令人興奮。畢竟,研究項(xiàng)目永遠(yuǎn)不會有百分百的確定性。

在設(shè)計上,他們還有一個明確的方向,就是不采用「顯式表示法」。市面上已有一些方法,比如用NeRF或Gaussian Splatting等技術(shù),通過構(gòu)建明確的3D世界結(jié)構(gòu),來達(dá)到一致性。這些方法很好,在某些應(yīng)用上效果不錯。

但他們堅持讓模型「逐幀生成」,這種方式對模型的泛化能力、適應(yīng)多樣世界的能力更有幫助。

智能涌現(xiàn),驚喜不斷

就像其他生成式模型一樣,隨著Scaling,效果確實(shí)會提升,這已經(jīng)不是什么秘密了。

盡管不如語言模型在推理能力上的涌現(xiàn)表現(xiàn),Genie 3依然涌現(xiàn)出一些令人驚訝的行為。比如說,如果一個角色靠近一扇門,模型可能就會「推測」角色應(yīng)該打開門;這類符合人類直覺的行為,模型現(xiàn)在能在一定程度上表現(xiàn)出來了。

還有就是對語言的理解在不斷變好,生成的內(nèi)容也越來越真實(shí),視覺效果更自然。

從Genie 2到Genie 3的提升非常明顯,特別是在「模擬現(xiàn)實(shí)世界能力」上有巨大飛躍。

比如物理效果的表現(xiàn)——像水的模擬、光照的變化,都非常驚艷。

現(xiàn)在已經(jīng)到了一個地步,哪怕是非專業(yè)人士,看了之后也會覺得是真實(shí)拍攝的視頻。

這太驚人了。而在Genie 2時代,模型雖然大致能表現(xiàn)出物體該有的行為,但你還是一眼能看出「這是AI生成的,不是真的」。

現(xiàn)在的視頻真假難辨,進(jìn)步真的很大了。

在「地形多樣性」問題:比如模型需要理解在沙地上行走、在下坡滑雪、在水中游泳,這些動作和物理反饋應(yīng)該是不一樣的。

谷歌團(tuán)隊發(fā)現(xiàn)這些行為很多都是規(guī)模和數(shù)據(jù)廣度所帶來的「涌現(xiàn)能力」。

換句話說,他們并沒有為這些行為做專門的訓(xùn)練或設(shè)計,而是模型自己「學(xué)」出來的。它通過足夠豐富的訓(xùn)練數(shù)據(jù),掌握了這個「世界」的通用常識。大多數(shù)時候,它表現(xiàn)非常不錯。

比如下面的例子:

在滑雪時,角色在下坡時速度會變快,而試圖上坡時就會變慢,甚至爬不上去;

下水后,角色一般會開始游泳或?yàn)R起水花;

靠近水坑時,模型通常也會讓角色穿上雨靴。

這些行為都非常自然,和人類對真實(shí)世界的理解非常一致,而這些都是模型自己學(xué)會的,真的讓人覺得像魔法一樣。

這里還有一個有趣的權(quán)衡:既能保持世界的「物理一致性」,同時也能忠實(shí)地執(zhí)行用戶的提示詞。

對視頻模型來說,「低概率事件」本來很難,但Genie 3依然能有不錯的表現(xiàn)。

這正是它的魅力所在:

即便是一些現(xiàn)實(shí)中不太可能發(fā)生的場景,Genie 3也能讓你如臨其境,而不是僅僅生成一個和你身邊環(huán)境一樣的無聊視頻。

在「指令跟隨/文本對齊」,Genie 3也得到了提升,這主要得益于DeepMind內(nèi)部不同項(xiàng)目(特別是Veo項(xiàng)目)的經(jīng)驗(yàn)遷移和知識共享。這種跨團(tuán)隊協(xié)作是DeepMind的優(yōu)勢。

世界模型是讓智能體走向現(xiàn)實(shí)世界最快的路徑。Genie 3朝著這個目標(biāo)邁出了一大步。

那Genie 4、Genie 5的新特性有哪些設(shè)想?

未來的關(guān)鍵

真實(shí)感和交互性

但總的來說,Genie 3團(tuán)隊最關(guān)注的始終是一件事:讓模型本身變得盡可能強(qiáng)大,讓它能產(chǎn)生更廣泛的影響,然后把創(chuàng)造應(yīng)用的機(jī)會交給其他團(tuán)隊。

他們表示最終會開放Genie 3模型。

未來確實(shí)讓人特別興奮,但也必須承認(rèn),世界模型距離真正「準(zhǔn)確模擬現(xiàn)實(shí)世界」還有很大差距。

比如,把一個人放進(jìn)生成的世界里,讓他隨心所欲地做任何事情,我們還遠(yuǎn)遠(yuǎn)做不到。

還有很多工作要做,才能讓虛擬世界的真實(shí)感和自由度接近現(xiàn)實(shí)。

應(yīng)用還有很多,關(guān)鍵在于能否準(zhǔn)確模擬世界,并把人放進(jìn)其中。也許還能從「第三視角」觀察自己,或者與虛擬智能體互動。

他們還透露真實(shí)感交互性是未來的關(guān)鍵。

現(xiàn)在機(jī)器人領(lǐng)域最大的瓶頸之一就是數(shù)據(jù):能收集到的數(shù)據(jù)非常有限。

而Genie 3能生成幾乎無限的場景,這樣一來機(jī)器人就能在虛擬世界里學(xué)習(xí),而不再局限于現(xiàn)實(shí)中能采集到的視頻。這個想法真的很令人興奮。

最后一個問題:人類是不是生活在某種模擬中?

這個問題被問過很多次,得到了「哲學(xué)化」的回答:如果真是模擬,那它運(yùn)行在完全不同的硬件之上

如果人類真的生活在一個模擬世界里,那它絕對不是運(yùn)行在現(xiàn)在的硬件上的。因?yàn)槲覀兊氖澜缡?strong>連續(xù)的,而不是數(shù)字化的。

所有的感知都是連續(xù)的信號。


也許,在量子層面會有一些「硬件限制」,但至少和我們現(xiàn)在的計算機(jī)完全不同。

或許未來量子計算機(jī),才是運(yùn)行我們這個模擬世界的真正平臺。

參考資料:

https://www.youtube.com/watch?v=tWgjhC7dJRo

https://x.com/Mascobot/status/1956769541759094859

https://supersonic.video/tWgjhC7dJRo

https://x.com/venturetwins/status/1956769043668725919


特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
8月30日俄烏:俄烏的瘋狂對攻

8月30日俄烏:俄烏的瘋狂對攻

山河路口
2025-08-30 18:22:38
安徽夫婦自駕送兒子去新疆石河子上大學(xué):6天穿越3700公里,沿途打卡景點(diǎn)每天還直播7小時,剛到校就被粉絲認(rèn)出

安徽夫婦自駕送兒子去新疆石河子上大學(xué):6天穿越3700公里,沿途打卡景點(diǎn)每天還直播7小時,剛到校就被粉絲認(rèn)出

極目新聞
2025-08-30 18:45:57
劉銘瑤七夕下葬:白色棺木3歲兒子送行,不入婆家墳,弟弟再發(fā)聲

劉銘瑤七夕下葬:白色棺木3歲兒子送行,不入婆家墳,弟弟再發(fā)聲

公子麥少
2025-08-29 20:02:36
“把東西還回去!”無人超市遭4男子蒙面偷盜,店員通過監(jiān)控勸阻,遼寧營口警方介入

“把東西還回去!”無人超市遭4男子蒙面偷盜,店員通過監(jiān)控勸阻,遼寧營口警方介入

瀟湘晨報
2025-08-30 12:32:10
朝鮮44年慣例被打破,金正恩北京行創(chuàng)下多個首次,或乘專列抵京?

朝鮮44年慣例被打破,金正恩北京行創(chuàng)下多個首次,或乘專列抵京?

傲傲講歷史
2025-08-30 15:18:57
北信源突然宣布:7月工資推遲至9月底

北信源突然宣布:7月工資推遲至9月底

每日經(jīng)濟(jì)新聞
2025-08-29 22:40:52
認(rèn)慫了!投訴魯迅抽煙壁畫女子鞠躬道歉,原因曝光,網(wǎng)友卻不買賬

認(rèn)慫了!投訴魯迅抽煙壁畫女子鞠躬道歉,原因曝光,網(wǎng)友卻不買賬

鋭娛之樂
2025-08-30 14:11:17
74歲王石樂開花!萬科上半年營收1053億,宣布境外債務(wù)全清零

74歲王石樂開花!萬科上半年營收1053億,宣布境外債務(wù)全清零

胖福的小木屋
2025-08-30 18:25:30
52歲阿姨堅持每月3次性生活,年底體檢,檢查結(jié)果讓醫(yī)生意外

52歲阿姨堅持每月3次性生活,年底體檢,檢查結(jié)果讓醫(yī)生意外

青青會講故事
2025-08-29 11:58:23
官方批復(fù)!四川將添新機(jī)場

官方批復(fù)!四川將添新機(jī)場

魯中晨報
2025-08-30 18:20:57
突發(fā)!山東發(fā)生事件:40歲男老師與女學(xué)生不雅聊天記錄,被曝光!

突發(fā)!山東發(fā)生事件:40歲男老師與女學(xué)生不雅聊天記錄,被曝光!

花心電影
2025-08-30 12:27:56
剛剛,證監(jiān)會緊急召開座談會:發(fā)布四大利好!對下周A股有何影響

剛剛,證監(jiān)會緊急召開座談會:發(fā)布四大利好!對下周A股有何影響

虎哥閑聊
2025-08-30 08:22:24
中方通告全球!停止向巴基斯坦供應(yīng)梟龍發(fā)動機(jī),引發(fā)多方關(guān)注

中方通告全球!停止向巴基斯坦供應(yīng)梟龍發(fā)動機(jī),引發(fā)多方關(guān)注

健身狂人
2025-08-28 15:13:50
54歲男子每周進(jìn)行14次性生活,堅持3年后,體檢結(jié)果讓醫(yī)生很意外

54歲男子每周進(jìn)行14次性生活,堅持3年后,體檢結(jié)果讓醫(yī)生很意外

如煙若夢
2025-08-29 17:11:26
監(jiān)控恢復(fù)!父親扛尸體母親擦血跡,出殯當(dāng)天群眾自發(fā)相送,太淚目

監(jiān)控恢復(fù)!父親扛尸體母親擦血跡,出殯當(dāng)天群眾自發(fā)相送,太淚目

眼光很亮
2025-08-30 00:18:27
中消協(xié)提醒:謹(jǐn)慎通過朋友圈、微信群、直播間等渠道購買保健食品

中消協(xié)提醒:謹(jǐn)慎通過朋友圈、微信群、直播間等渠道購買保健食品

紅星新聞
2025-08-29 20:44:57
血淚澆灌的烏克蘭陣亡將士紀(jì)念日;普通人為何必須關(guān)注世界大事?

血淚澆灌的烏克蘭陣亡將士紀(jì)念日;普通人為何必須關(guān)注世界大事?

近距離
2025-08-30 10:09:49
這五個人中,誰將成為泰國新總理,關(guān)鍵仍在他信?

這五個人中,誰將成為泰國新總理,關(guān)鍵仍在他信?

上觀新聞
2025-08-30 19:40:06
重慶官宣:區(qū)長左軍,任上落馬

重慶官宣:區(qū)長左軍,任上落馬

新京報政事兒
2025-08-30 19:43:33
俄烏在頓涅茨克重鎮(zhèn)激烈交戰(zhàn)

俄烏在頓涅茨克重鎮(zhèn)激烈交戰(zhàn)

環(huán)球網(wǎng)資訊
2025-08-30 18:55:43
2025-08-30 22:11:00
新智元 incentive-icons
新智元
AI產(chǎn)業(yè)主平臺領(lǐng)航智能+時代
13353文章數(shù) 66140關(guān)注度
往期回顧 全部

科技要聞

李斌內(nèi)部講話:蔚來四季度必須盈利

頭條要聞

以色列資深外交官:馬克龍早就決定承認(rèn)巴勒斯坦國了

頭條要聞

以色列資深外交官:馬克龍早就決定承認(rèn)巴勒斯坦國了

體育要聞

淘汰曼聯(lián)的英乙隊,仍然沒有忘記張恩華

娛樂要聞

吳京風(fēng)波拉出多位明星

財經(jīng)要聞

美上訴法院裁定特朗普關(guān)稅非法!

汽車要聞

輔助駕駛新賽道 理想VLA司機(jī)大模型即將全量推送

態(tài)度原創(chuàng)

家居
時尚
親子
數(shù)碼
房產(chǎn)

家居要聞

提升功能 靈活居住環(huán)境

伊姐周六熱推:電視劇《十二封信》;電影《死神來了:血脈詛咒》......

親子要聞

爸爸的食堂營業(yè)了,看看都給孩子們做了什么好吃的

數(shù)碼要聞

蘋果官方配件斜挎帶曝光:專為iPhone 17系列打造

房產(chǎn)要聞

顛覆認(rèn)知!??谡嬲暮勒髌?,終于出現(xiàn)了!

無障礙瀏覽 進(jìn)入關(guān)懷版