2016-2022 All Rights Reserved.平安財(cái)經(jīng)網(wǎng).復(fù)制必究 聯(lián)系QQ 備案號(hào):
本站除標(biāo)明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。
郵箱:toplearningteam#gmail.com (請(qǐng)將#換成@)
OpenAI最近公布了Sora文生視頻模型,這是研發(fā)團(tuán)隊(duì)使用超大規(guī)模視頻數(shù)據(jù)訓(xùn)練出的一個(gè)通用視覺(jué)模型,目前生成的視頻時(shí)長(zhǎng)最高可以達(dá)到60秒,視頻還具備鏡頭設(shè)計(jì),支持一鏡到底。
1.Sora實(shí)現(xiàn)了多項(xiàng)技術(shù)突破,僅通過(guò)關(guān)鍵詞就可以生成相應(yīng)的文字,還能理解文字中的元素在現(xiàn)實(shí)世界中的表現(xiàn)形式,甚至具備真實(shí)的物理引擎。官方演示的視頻中還有一些小瑕疵,但整體上已經(jīng)具備令人震驚的視覺(jué)效果。
2.Sora制作的復(fù)雜場(chǎng)景可以包含多個(gè)角色,還能設(shè)計(jì)出特定的動(dòng)作類型,對(duì)描述的對(duì)象和背景做出精準(zhǔn)的細(xì)節(jié)描繪。在渲染干凈的街道、巨型全息投影、巡邏的機(jī)器人等未來(lái)場(chǎng)景方面也能呈現(xiàn)出讓人信服的畫面。
3.Sora關(guān)于3D幾何形狀和一致性的知識(shí)是通過(guò)觀察大量數(shù)據(jù)自然學(xué)會(huì)的,這就是生成式模型的優(yōu)勢(shì),它不是基于海量數(shù)據(jù)的單純模仿,而是具備學(xué)習(xí)能力。
4.這一模型將會(huì)給國(guó)產(chǎn)大模型格局帶來(lái)優(yōu)化。在ChatGPT發(fā)布之后,國(guó)內(nèi)有不少AI公司如雨后春筍一般噴涌而出,但缺乏突破性的研究成果,Sora的問(wèn)世將會(huì)倒逼國(guó)內(nèi)AI公司加大研發(fā)成本和投入,以早日跟上世界領(lǐng)先水平的步伐。
5.經(jīng)過(guò)一段時(shí)間,中國(guó)一定會(huì)做出類似Sora的模型,但是這個(gè)時(shí)間還有很多的不確定性。中國(guó)AI必須要努力追趕,但是也不必妄自菲薄,沿著正確的道路前進(jìn),總有一天會(huì)縮短中美之間的AI差距。
6.國(guó)產(chǎn)大模型現(xiàn)在還有很多瓶頸亟待突破,Sora對(duì)物理世界的模擬能力一枝獨(dú)秀,這也是其他視頻生成模型需要追趕的地方,未來(lái)Sora在更多的領(lǐng)域應(yīng)用,可以為國(guó)產(chǎn)模型提供成熟的借鑒經(jīng)驗(yàn)。
2016-2022 All Rights Reserved.平安財(cái)經(jīng)網(wǎng).復(fù)制必究 聯(lián)系QQ 備案號(hào):
本站除標(biāo)明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。
郵箱:toplearningteam#gmail.com (請(qǐng)將#換成@)