圖片來源:視覺中國
科技日報(bào)記者?張佳欣
上個(gè)月,OpenAI公司推出了文生視頻人工智能(AI)模型Sora。OpenAI展示了Sora利用少量簡短文字提示即可創(chuàng)建逼真視頻的能力,并提供了包括一位女士在閃爍著霓虹燈的東京街道漫步,以及一只狗在兩個(gè)窗臺(tái)之間跳躍的視頻片段。
Sora所展現(xiàn)的能力和潛力很快引起了科技界、商界和投資界的高度關(guān)注。OpenAI表示,根據(jù)文字提示生成視頻只是其整體計(jì)劃中的一步。ChatGPT在AI準(zhǔn)確理解和生成自然語言表達(dá)方面取得了突破,而Sora則更進(jìn)一步,在理解自然語言的基礎(chǔ)上創(chuàng)建了更復(fù)雜的視頻內(nèi)容。
OpenAI相信,順應(yīng)AI發(fā)展的邏輯和技術(shù)進(jìn)步的趨勢,Sora未來會(huì)創(chuàng)作出更加精致、更加真實(shí)的作品,在各個(gè)領(lǐng)域的應(yīng)用也更加多樣化。如果這些應(yīng)用與其他技術(shù)相結(jié)合,將對世界產(chǎn)生重大影響。
AI原生產(chǎn)品潛在應(yīng)用多
Sora并不是文生視頻技術(shù)的第一個(gè)例子。去年6月,谷歌支持的人工智能初創(chuàng)公司Runway發(fā)布了Gen-2,這是一款根據(jù)文本提示或現(xiàn)有圖像生成視頻的模型。今年1月,谷歌研究院推出了一款名為Lumiere的文生視頻擴(kuò)散模型,號(hào)稱能夠一次生成“完整、真實(shí)、動(dòng)作連貫”的視頻。
英國《自然》雜志報(bào)道稱,Sora等AI原生產(chǎn)品有不少潛在的好處。英國德蒙福特大學(xué)數(shù)字文化專家特蕾西·哈伍德指出,該技術(shù)可以一種更便于理解的方式來呈現(xiàn)晦澀難懂的文本,比如學(xué)術(shù)論文。其最重要的用途之一,就是形象化地表達(dá)復(fù)雜概念,并將研究結(jié)果傳達(dá)給外行人。
該技術(shù)另一個(gè)潛在用途可能是醫(yī)療保健,文生視頻AI能夠代替人類醫(yī)生與患者交談。英國科普咨詢師克萊爾·馬隆表示,有些人可能會(huì)覺得這令人不安。但人們也可能會(huì)發(fā)現(xiàn),如果他們想要在一天內(nèi)多次詢問醫(yī)療人員專業(yè)問題,這會(huì)非常方便。
馬隆說,像Sora這樣的文生視頻AI工具可幫助研究人員深入研究龐大的數(shù)據(jù)集。生成式AI可篩選出代碼并完成一般研究任務(wù),但也可“做更復(fù)雜的工作,比如向它提供數(shù)據(jù),并要求它作出預(yù)測”。
將AI戰(zhàn)場引向影視創(chuàng)作
美國“歐亞評論”網(wǎng)站稱,Sora將對一些行業(yè)發(fā)展和相關(guān)就業(yè)產(chǎn)生影響。ChatGPT上線后,很多行業(yè)開始改變運(yùn)營方式,有些職業(yè)受到?jīng)_擊,工作崗位開始被AI取代。引入Sora之后,類似的事情也會(huì)發(fā)生。從網(wǎng)上的反映來看,影視行業(yè)專業(yè)人士的擔(dān)憂最為嚴(yán)重。
美國演員湯姆·漢克斯表示,他正在使用AI技術(shù)拓展他去世后繼續(xù)職業(yè)生涯的前景。對此,英國雷丁大學(xué)研究創(chuàng)造性AI和電影制作的多米尼克·利斯稱:“如果你是一名雄心勃勃的年輕演員,正在規(guī)劃自己的未來,而你被告知‘對不起,湯姆·漢克斯將永遠(yuǎn)扮演主角’,你還會(huì)打算未來投身表演業(yè)嗎?”
就在去年,好萊塢編劇發(fā)起了全行業(yè)罷工,抗議制作公司廣泛使用AI進(jìn)行劇本創(chuàng)作。Sora的出現(xiàn),完全可將AI戰(zhàn)場引向好萊塢,甚至對全球影視行業(yè)產(chǎn)生重大影響。
當(dāng)然,AI應(yīng)用的進(jìn)步也會(huì)催生大量新職業(yè)。但如果人類的學(xué)習(xí)和知識(shí)技能的積累被AI所取代,世界將會(huì)發(fā)生重大變化。ChatGPT無需上法學(xué)院即可通過律師資格考試,而Sora則無需上電影學(xué)院也能拍電影。
倫理、法律和社會(huì)影響不容忽視
哈伍德表示,虛假信息是文生視頻技術(shù)的主要挑戰(zhàn)。她說:“我們很快就會(huì)被大量引人注目的信息淹沒,這真的很令人擔(dān)憂。”
《科學(xué)美國人》雜志報(bào)道稱,AI有可能復(fù)制或高度模仿受版權(quán)保護(hù)的作品,并將其作為原創(chuàng)生成內(nèi)容呈現(xiàn)。
“歐亞評論”網(wǎng)站稱,數(shù)字時(shí)代的各種問題將因AI技術(shù)的進(jìn)步而加劇。想象一下,在未來社會(huì),如果數(shù)十億網(wǎng)民可使用類似Sora的工具輕松制作和發(fā)布視頻或電影,世界將會(huì)變成什么樣?
盡管互聯(lián)網(wǎng)的出現(xiàn)使得信息的獲取、創(chuàng)造和傳播成為民眾的“普遍權(quán)力”,但其并沒有帶來真正的信息多樣性。海量信息時(shí)代仍然存在信息壟斷和“有效信息沙漠”?;ヂ?lián)網(wǎng)底層核心技術(shù)和規(guī)則的掌控者仍然可以控制信息受眾。例如,高層次的AI大模型技術(shù)和應(yīng)用可能會(huì)被極少數(shù)公司所控制,這些AI巨頭擁有難以被法律約束的另一種權(quán)力。如果按這樣的軌跡發(fā)展下去,AI巨頭很可能成為無所不能的“怪物”。
《自然》雜志表示,文生視頻AI工具讓每個(gè)人都有機(jī)會(huì)成為媒體內(nèi)容創(chuàng)作者,但它同時(shí)將給社會(huì)帶來廣泛的問題。人們必須換一種思路來評估所看到的內(nèi)容,以應(yīng)對這種消費(fèi)方式的根本性轉(zhuǎn)變。