Sora問世，一石驚起千層浪_文化_中國西藏網(wǎng)

中國西藏網(wǎng) > 即時新聞 > 文化

Sora問世，一石驚起千層浪

發(fā)布時間：2024-03-12 15:36:00來源：光明網(wǎng)

　　作者：楊易臻張宣蔡姝雯

　　“穿著時尚的女性漫步在霓虹燈閃爍的東京街頭”“兩艘海盜船在一杯咖啡內(nèi)作戰(zhàn)”……春節(jié)假期，這幾段畫面精美的視頻在朋友圈“霸屏”，這些視頻是美國人工智能團隊OpenAI新發(fā)布的視頻大模型Sora創(chuàng)作的。

　　Sora，這個詞來源于日語中的“天空”，意指無限的創(chuàng)造潛力。2022年底因發(fā)布ChatGPT一炮走紅的OpenAI，又因Sora在全球內(nèi)容創(chuàng)作領(lǐng)域掀起新的風(fēng)暴。

　　博采眾長，Sora“一騎絕塵”

　　只需要一段20至30個詞匯的文本指令或一張靜態(tài)圖像，就可以生成一段視頻，不論是寫實還是動畫風(fēng)格、寬屏還是豎屏，皆可任意選擇。雖然Sora并非首個可以通過文本生成視頻的大模型，但在時長、分辨率等視頻生成模型的關(guān)鍵指標(biāo)上，相比先前的Runway、Pika等文生視頻產(chǎn)品，Sora可謂“一騎絕塵”。“Sora的誕生，意味著AGI（人工通用智能）的實現(xiàn)可能從10年縮短至一兩年。”360創(chuàng)始人周鴻祎在微博上宣布。

　　記者親身體驗了此前某款視頻大模型的生成產(chǎn)品，在生成的10秒視頻中，人物表情僵硬、動作不協(xié)調(diào)，視頻也無法準確呈現(xiàn)文字描述，與Sora的演示視頻相比，確實差距巨大。

　　“Sora的技術(shù)亮點是，讓AI內(nèi)容編輯和生成實現(xiàn)了從文本、圖像到視頻的本質(zhì)跨越?！敝袊嬎銠C學(xué)會理事、南京理工大學(xué)計算機科學(xué)與工程學(xué)院副院長肖亮認為，Sora的底層技術(shù)并不算新，但優(yōu)勢在于“博采眾長”，是多項技術(shù)積累、共同作用的結(jié)果。Sora在技術(shù)上的“顛覆性”主要體現(xiàn)在三方面：一是突破當(dāng)前視覺大模型“60s超長視頻”生成瓶頸，以往的視頻模型大多只能生成時長不超過10秒的視頻，而Sora在保證視頻時長的同時，還能保持人物和場景的連貫；二是呈現(xiàn)多角度一鏡到底，逼真表現(xiàn)光影幾何、物理關(guān)系；三是較為真實地遵循物理世界規(guī)律，比如畫筆會在畫布上留下水墨、人吃漢堡會留下咬痕等。

　　OpenAI對Sora的定位頗具野心，號稱其并非僅僅是“文生視頻”的工具，而是一個通用的“物理世界模擬器”——復(fù)現(xiàn)真實世界的重力、摩擦力等物理現(xiàn)象。這一定位使得Sora未來有望成為跨越各行各業(yè)的“超級工具”，可用于模擬天氣變化、自動駕駛、生物行為甚至軍事場景等。

　　對此，南京大學(xué)計算機科學(xué)與技術(shù)系長聘副教授過潔表示，實際上，早有多條技術(shù)路徑瞄準“模擬物理世界”這一目標(biāo)，只不過實現(xiàn)方式不同。Sora的技術(shù)路徑可以理解為“數(shù)據(jù)驅(qū)動”——通過學(xué)習(xí)視頻來理解現(xiàn)實世界的動態(tài)變化，并用計算機視覺技術(shù)模擬這些變化?！暗珡腟ora的一些‘翻車’視頻可以看出，它在理解物理世界時會遇到困難?！边^潔以游戲舉例，在一款射擊游戲中，玩家想要走出屋子射擊“敵人”，Sora很可能會讓玩家“穿墻而去”。“Sora是否知道墻是一道物理障礙？在它塑造的世界規(guī)則中，是否有這么一條規(guī)矩，規(guī)定墻是不能穿過的？這些都是未知?！?/p>

　　“目前Sora接受的所有訓(xùn)練都是人類‘喂’給它的，其實還是沒有跳脫現(xiàn)階段人類的認知范圍。目前還有許多物理規(guī)律連人類都還沒有掌握，人類尚未踏足的知識領(lǐng)域，Sora也無法理解。”過潔說。

　　創(chuàng)意工作，AI仍難以替代人類

　　“過往的人工智能產(chǎn)品，多半可以分為‘以文生文’‘以文生圖’等類型。它們大多是根據(jù)網(wǎng)上已有的語料來進行內(nèi)容產(chǎn)出，對于我們的工作生活并沒有帶來特別大的改變?！蹦暇┐髮W(xué)人工智能學(xué)院院長周志華分析，大家之所以對“文生視頻”的反應(yīng)“有點大”，是因為通過文字輸入來生成視頻這種方式，更容易讓大家感同身受。

　　影視娛樂行業(yè)的內(nèi)容創(chuàng)作者，成為最早擁抱AI創(chuàng)作工具的探路人之一。國內(nèi)一家頭部影視公司的AI項目負責(zé)人王鈺媛告訴記者，自2022年5月“文生圖”工具Midjourney推出測試版本，她便開始探索AI為內(nèi)容創(chuàng)作帶來的可能性?！癆I目前在影視全流程都有所應(yīng)用，涵蓋前期開發(fā)、中期制作、后期宣發(fā)整個鏈條。在影視項目的前期開發(fā)中，AI可以協(xié)助頭腦風(fēng)暴，激發(fā)‘腦洞’，還可以輔助背景調(diào)研、制作策劃書、潤色大綱、評估IP等。比如，在動畫電影的角色設(shè)計過程中，需要完成角色的配色、服裝、整體的線稿等，傳統(tǒng)情況下，美術(shù)設(shè)計師要用三四天時間才能完成，如果導(dǎo)演不滿意，還需要好幾輪溝通和修改，而利用AI，能迅速生成很多案例給導(dǎo)演和制片方選擇，減少了大量溝通成本?！?/p>

　　3月6日，一部自稱“完全由AI制作的開創(chuàng)性長篇電影”在洛杉磯首映。這部《終結(jié)者2》的翻拍作品，由50位藝術(shù)家組成的團隊完成。該團隊使用Midjourney、Runway、Pika等多個AI工具進行創(chuàng)作。結(jié)合過往的使用經(jīng)驗，王鈺媛認為，就整體質(zhì)量而言，目前AI生成的內(nèi)容離商業(yè)質(zhì)量要求還很遠。比如，控制影片特定畫面的風(fēng)格、色調(diào)，保持角色的一致性，制作連貫的長鏡頭，都是AI目前難以完成的。AI工具更偏向于輔助、提供靈感和參考，沒有辦法完全取代某一個環(huán)節(jié)。

　　“不過，大模型確實有可能顛覆傳統(tǒng)電影的商業(yè)模式。傳統(tǒng)的影視制作，需要編劇、導(dǎo)演、制作團隊、演員等共同協(xié)作，工種細分程度很高?！蓖踱曟抡f，近幾年興起的短視頻中，遵循“黃金三秒定律”的短視頻，無需在制作上多么精良，但對視頻創(chuàng)意的要求很高，需要立刻抓住觀眾眼球。對于這些短視頻創(chuàng)作者，AI就可以成為很好的輔助。

　　在未來的“眼球爭奪戰(zhàn)”中，拼創(chuàng)意將成為趨勢?！霸?jīng)一個專業(yè)團隊才能制作出的影片，現(xiàn)在有可能一個人就能完成。不需要商業(yè)融資、不需要花大價錢請演員、攝影師，人人都可以成為創(chuàng)作者。”王鈺媛推測，AI將給觀眾帶來更多可選擇的娛樂產(chǎn)品，除了電影、電視劇，短視頻、游戲等更多節(jié)奏緊湊、領(lǐng)域細分的內(nèi)容和產(chǎn)品將呈現(xiàn)爆發(fā)式增長。“我認為AI工具沖擊的不是某個具體的工種，而是傳統(tǒng)行業(yè)或者帶有固定思維的人群?！?/p>

　　新浪潮來襲，教育何為？

　　“盡管國內(nèi)大模型產(chǎn)品如雨后春筍大量涌現(xiàn)，但實際發(fā)展還是與美國存在差距。”業(yè)內(nèi)人士表示，究其原因，在于算力、數(shù)據(jù)和人才三個方面。

　　當(dāng)下，人工智能已成為產(chǎn)業(yè)創(chuàng)新的關(guān)鍵抓手之一。省政府工作報告也指出，要更大力度發(fā)展數(shù)字經(jīng)濟，以人工智能全方位賦能新型工業(yè)化，積極構(gòu)建特色化行業(yè)大模型，打造人工智能創(chuàng)新應(yīng)用先導(dǎo)區(qū)。

　　“江蘇發(fā)展人工智能大模型的一大優(yōu)勢是高校資源非常充分，但江蘇各個高校培養(yǎng)的頂尖人才外溢現(xiàn)象比較明顯?！边^潔說。

　　2月27日，南京大學(xué)宣布，將于今年9月面向全體本科新生開設(shè)“人工智能通識核心課程體系”。課程體系將涵蓋1門必修的人工智能通識核心課，搭配人工智能素養(yǎng)課，以及各學(xué)科與人工智能深度融合的前沿拓展課，從知識、能力、價值觀與倫理三個維度開展教育教學(xué)。

　　“近幾年國內(nèi)許多高校都建立了人工智能學(xué)院，從本科開始專門培養(yǎng)人工智能專業(yè)人才，這是一個好開端?！敝苤救A表示。南京大學(xué)2018年成立我國C9高校中第一個人工智能學(xué)院培養(yǎng)本科生，并率先發(fā)布我國第一個人工智能本科專業(yè)教育培養(yǎng)體系。

　　“從人工智能領(lǐng)域的發(fā)展來看，重要的是打通‘基礎(chǔ)研究—人才培養(yǎng)—創(chuàng)新技術(shù)—產(chǎn)業(yè)發(fā)展’的通道?！敝苤救A說，“基礎(chǔ)研究水平提高了，國內(nèi)大批研究生能夠接觸和從事與國際接軌的研究課題。其中一些學(xué)生自然會走到前沿促進基礎(chǔ)研究和技術(shù)創(chuàng)新，他們將成為我國人工智能產(chǎn)業(yè)蓬勃發(fā)展的生力軍。”（楊易臻張宣蔡姝雯）

（責(zé)編：常邦麗）

版權(quán)聲明：凡注明“來源：中國西藏網(wǎng)”或“中國西藏網(wǎng)文”的所有作品，版權(quán)歸高原（北京）文化傳播有限公司。任何媒體轉(zhuǎn)載、摘編、引用，須注明來源中國西藏網(wǎng)和署著作者名，否則將追究相關(guān)法律責(zé)任。

相關(guān)閱讀

專題推薦

傲游截圖20180202095714.jpg

微觀

觀當(dāng)下

西藏貢嘎：絕美冰洞景觀最長高海拔公路隧道在西藏貫通為藏文古籍文獻的數(shù)字化做貢獻世界最長超高海拔公路隧道全線貫通

賞閱

西藏冬日壯美札達土林

西藏羊卓雍錯風(fēng)光壯麗航拍西藏林芝壯美雪景航拍西藏芒康千年古鹽田西藏拉薩：雪后布達拉宮美如畫

資料云

QQ截圖20200831163244.jpg

中央第七次西藏工作座談會

流淌的吉曲河——學(xué)歷史講拉薩雪域長歌新時代?邊疆行——西藏篇一江清水向東流

即時新聞

關(guān)于我們|信息聲明|糾錯熱線|中國西藏網(wǎng)舉報受理和處置管理辦法

中國西藏網(wǎng)版權(quán)所有，未經(jīng)書面授權(quán)禁止使用

中國西藏信息中心主辦版權(quán)所有：高原(北京)文化傳播有限公司 Copyright ? 2000-2017 by hamasdt.com All Rights Reserved E-mail: xizangzongbianshi@163.com

互聯(lián)網(wǎng)新聞信息服務(wù)許可證：10120170010 違法和不良信息舉報電話：010-58336000 互聯(lián)網(wǎng)宗教信息服務(wù)許可證：京（2022）0000001

廣播電視節(jié)目制作經(jīng)營許可證（京）字第04446號京ICP備 17049894號-2 京公網(wǎng)安備110102001709-1

焦作市| 浮山县| 江口县| 中山市| 日土县| 大埔区| 三明市| 磐安县| 峡江县| 榆中县| 福清市| 万全县| 大城县| 和林格尔县| 修文县| 高陵县| 公主岭市| 仁寿县| 天祝| 买车| 广饶县| 扎赉特旗| 灵石县| 大庆市| 策勒县| 乌拉特前旗| 丰原市| 柳州市| 保靖县| 新泰市| 鄢陵县| 虞城县| 吉隆县| 内乡县| 宁明县| 萨嘎县| 安阳市| 昌乐县| 牙克石市| 嫩江县|