元宇宙,重構(gòu)人機關(guān)系新場景
作者:邊凱歸(北京大學(xué)網(wǎng)絡(luò)信息系統(tǒng)研究所副所長)
互聯(lián)網(wǎng)的演進歷程是從中心化、開放的網(wǎng)絡(luò)空間,逐步變成去中心化、碎片化的虛擬世界。其中交互技術(shù)的不斷發(fā)展,讓傳統(tǒng)用戶輸入和機器輸出,升級成結(jié)合視頻和人工智能(AI)的多元化人機交互,將人與人之間的連接重構(gòu)成為元宇宙分布式社區(qū)中的虛擬關(guān)系。雖然面臨著諸多挑戰(zhàn),但這一技術(shù)趨勢無疑將引發(fā)網(wǎng)絡(luò)空間中資源與利益的重新分配。
交互改變 AI與視頻完成交互
人與人之間的交互是通過捕捉聲音、動作、文字等信號完成信息傳輸?shù)摹W匀祟惏l(fā)明計算機起,人人交互很大一部分被人機交互所代替。而主流人機交互方式的發(fā)展,可大致劃分為三個階段。
第一個階段是互聯(lián)網(wǎng)時代。在互聯(lián)網(wǎng)時代,人機交互主要是通過手指操作鼠標、鍵盤,眼睛查看顯示屏內(nèi)容完成。為何如此?因為手指是人類完成精細動作最直接的器官,眼睛是能夠最大化、直接接收外界信息的五官之一。自然地,人類會選擇手指操控鼠標鍵盤完成人類對機器的輸入,眼睛查看顯示器內(nèi)容完成機器對人類的輸出。
第二個時代是移動互聯(lián)網(wǎng)時代。在移動互聯(lián)網(wǎng)時代,人機交互主要是通過手指操控觸摸屏完成。這種交互技術(shù)在全球范圍內(nèi)的第一次大規(guī)模商用,始于2007年的蘋果手機,至今仍然是所有移動設(shè)備的主要交互方式。與第一代交互方式不同,這樣的方式回歸了人類嬰幼兒時期的最基本動作,即用手指在屏幕上指向、點擊、滑動,交互設(shè)備由觸摸屏替代了鼠標、鍵盤。
在第三代交互方式出現(xiàn)之前,我們需要審視這樣一個現(xiàn)象。第一代、第二代交互方式普及時,其他的交互方式(肢體動作、語音、肌電、腦電等),和交互設(shè)備(體感攝像頭、慣性傳感器、智能眼鏡、智能手環(huán)、智能頭盔)也在不斷涌現(xiàn)。但這些交互方式往往都因為表達能力受限、準確度不高等問題,始終無法取代手指和眼睛在交互方式中的主導(dǎo)地位。
第三個時代是2021年開始構(gòu)建的元宇宙時代。在元宇宙時代,現(xiàn)實世界中的人類可以和虛擬世界中的智能體(虛擬人、數(shù)字財產(chǎn)、數(shù)字物品等)進行交互。在元宇宙構(gòu)建初期,人類仍然通過手指和眼睛與虛擬世界進行交互,就像在玩一場“身臨其境的沉浸式視頻游戲”。與第二代交互方式的區(qū)別在于,其交互設(shè)備的多樣性將得到極大擴展。例如,攝像頭、慣性傳感器將捕捉到的人類身體動作、語音等指令展示在視頻游戲中,游戲劇情反饋也會通過智能眼鏡、智能頭盔展示給人類。在不遠的未來,當(dāng)AI技術(shù)不斷發(fā)展,特別是腦機交互技術(shù)可以準確讀取人腦信息時,人們就可以不通過動作、語音、打字等其他信號發(fā)送指令,而可以直接將意念所想傳達給設(shè)備,解鎖AI技術(shù)中這一最神秘的難關(guān)。因此,交互的終極方式是視頻和AI——人類通過AI將指令輸入到虛擬世界,同時又通過沉浸式視頻展示將交互結(jié)果輸出給人類。
連接改變 去中心化、碎片化的連接
人機交互的方式,不僅關(guān)系到人類獲取信息的渠道,同樣也決定了人與人之間在網(wǎng)絡(luò)空間中的連接形式。伴隨著人機交互方式的改變,人與人之間的連接形式也將被重新定義和構(gòu)建。
起初,互聯(lián)網(wǎng)Web1.0時代是一個中心化、開放連接的時代,其主要目標是連接所有的互聯(lián)網(wǎng)公開信息,方便人們檢索和查找信息。用戶通過鼠標、鍵盤,與網(wǎng)站內(nèi)容進行交互,網(wǎng)頁之間通過超鏈接相連,形成了一張巨大的網(wǎng)。這張網(wǎng)中的節(jié)點是網(wǎng)頁,這些網(wǎng)頁連接著數(shù)以億計的訪問者設(shè)備,每個網(wǎng)頁都部署在中心化的服務(wù)器上。在這個時代,人們的主要需求是檢索和查找網(wǎng)頁信息,而社交、娛樂等需求并不旺盛,人與人之間的關(guān)系通過訪問共同網(wǎng)頁而產(chǎn)生,沒有任何人或機構(gòu)試圖阻礙這種關(guān)系的產(chǎn)生。
新華社發(fā)
互聯(lián)網(wǎng)Web2.0時代則變成了一個中心化、割裂連接的時代,其主要目標是連接所有的人,并且最大化地激活人們的社交、游戲、購物、視聽、交易等個性化需求。在這個階段,用戶在不同時空環(huán)境下,通過點擊、觸控等操作表達需求,被網(wǎng)站、app捕捉,并通過推薦系統(tǒng)反饋給用戶個性化內(nèi)容。因此,此時的互聯(lián)網(wǎng)仍然是中心化的,只是用戶之間的連接已經(jīng)被逐步割裂。例如,流量較大的網(wǎng)站為了更好吸引用戶,開始經(jīng)營自己的用戶群體,通過讓用戶注冊,形成了該網(wǎng)站系統(tǒng)下的獨立用戶群體。目前,移動智能手機幾乎所有app都要求用戶進行注冊,每個app的系統(tǒng)內(nèi)部,用戶之間可以進行連接。但不同網(wǎng)站、app系統(tǒng)的用戶,無法進行互聯(lián)互通。可以說,整個互聯(lián)網(wǎng)像是被割裂成了無數(shù)個子網(wǎng),較大的子網(wǎng)代表了用戶數(shù)較多的頭部網(wǎng)站或app。每個子網(wǎng)內(nèi)部都是中心化的,所有數(shù)據(jù)都存儲在該網(wǎng)站或app的數(shù)據(jù)庫中,承載著該網(wǎng)站或app提供的特定業(yè)務(wù)(如社交、游戲、視聽等)。用戶在每個子網(wǎng)中都有一個注冊ID,享受著該子網(wǎng)提供的業(yè)務(wù)。
而目前,我們正在探索的互聯(lián)網(wǎng)Web3.0時代,則是一個去中心化、碎片化連接的時代,其主要目的是支持人與人通過虛擬世界智能體之間的交互,產(chǎn)生某種虛擬關(guān)系。這樣一種新型虛擬關(guān)系,將再一次重構(gòu)元宇宙框架下人與人間的連接形式。用戶在元宇宙中可以創(chuàng)建屬于自己的唯一虛擬身份以及若干虛擬資產(chǎn)和虛擬物品,用戶只需通過虛擬身份在某虛擬社區(qū)進行授權(quán)操作,就可以與該社區(qū)中的其他用戶產(chǎn)生虛擬關(guān)系。這些虛擬世界的操作,可以通過傳統(tǒng)的點擊、觸控等交互動作完成,也可以通過虛擬現(xiàn)實智能眼鏡、沉浸式AI視頻中的交互動作(眼神、肢體動作)完成,虛擬社區(qū)捕捉到這些交互動作之后,所產(chǎn)生的結(jié)果也會通過交互設(shè)備(智能眼鏡、智能頭盔)以虛擬視頻方式展示給用戶。同時,這一系列的動作和結(jié)果也將會記錄在區(qū)塊鏈上,從而保證數(shù)據(jù)安全。
顯然,這樣一系列的虛擬操作是以用戶為中心,且完全的分布式和不可預(yù)測,不存在任何一個網(wǎng)站或app可以要求用戶必須重新注冊一個ID,也不存在一個超級網(wǎng)站或app可以收集絕大多數(shù)用戶的個人數(shù)據(jù)。人與人之間的連接與否,取決于雙方是否存在虛擬關(guān)系,是否授權(quán)虛擬身份在虛擬社區(qū)中進行了某個操作。
面向未來 充滿機遇與挑戰(zhàn)
元宇宙時代,在去中心化、碎片化的虛擬世界,以往互聯(lián)網(wǎng)中的資源和利益都會重新分配,產(chǎn)生了很多新的機遇。當(dāng)然,實現(xiàn)這樣的愿景也存在諸多挑戰(zhàn)。
在構(gòu)建元宇宙的初級階段,交互方式仍然不可避免地依賴于手和眼睛。沉浸式的交互設(shè)備,使得輸入、輸出可以更加逼真,除了視覺、聽覺,還可以包括觸覺、嗅覺等其他多個維度的感官體驗。而當(dāng)AI交互技術(shù)進階到高級階段時,我們就可以脫離手、眼等器官,AI可以讀取人的意念,通過腦機接口,完成人類與虛擬世界的交互,即人們將自己的指令通過腦電波直接輸入給虛擬世界,同時虛擬世界也將反饋結(jié)果直接發(fā)送給人腦。這樣一種超級智能的交互過程甚至省去了人的動作發(fā)號施令、用眼睛查看結(jié)果等傳統(tǒng)操作,可以直接將交互結(jié)果呈現(xiàn)在人腦中。這種方式省去了所有中間環(huán)節(jié),其他第三方更是無法知曉人與人之間在交流什么,從而做到了徹徹底底的去中心化,以及保護了人腦所想的數(shù)據(jù)安全。
對元宇宙連接的碎片化重構(gòu),打破了傳統(tǒng)網(wǎng)絡(luò)空間中的業(yè)務(wù)壟斷,也將重構(gòu)傳統(tǒng)的資源和利益分配方式,從而產(chǎn)生了流量與盈利兩方面機遇。首先,由于用戶在元宇宙中的交互關(guān)系都只存在于社區(qū)中,而傳統(tǒng)互聯(lián)網(wǎng)巨頭也只會變成一個較大的社區(qū),這會導(dǎo)致用戶更多地將時間分配給具有獨特屬性的中小型社區(qū),他們或?qū)⒂瓉砀嗔髁繖C遇,而不像現(xiàn)在用戶時間都被頭部網(wǎng)站、app所瓜分。其次,鑒于交互方式多元化,第三方無法輕易捕捉到用戶的所有動作、眼神、意念等數(shù)據(jù),無法收集到足夠多的個性化偏好數(shù)據(jù),傳統(tǒng)的推薦系統(tǒng)就無法正常運行,也就無法復(fù)制互聯(lián)網(wǎng)巨頭所賴以生存的廣告營銷推廣等營利模式,而流量所帶來的利潤將更加平均地分配給不同社區(qū)。
同時,我們需要清醒地認識到,無論從用戶還是社區(qū)著眼,即使實現(xiàn)視頻交互技術(shù)下的初級元宇宙,也存在很多困難和挑戰(zhàn)。首先,從實踐來看,多數(shù)用戶寧可用一個囊括所有生活服務(wù)的超級app,也不愿在不同虛擬社區(qū)之間來回切換。即使用戶發(fā)現(xiàn)很多數(shù)據(jù)被數(shù)據(jù)中心所掌握,也會習(xí)慣性繼續(xù)使用傳統(tǒng)的互聯(lián)網(wǎng)服務(wù)??梢哉f,大部分用戶并沒有意識到中心化的互聯(lián)網(wǎng)對自身數(shù)據(jù)隱私安全的侵害。其次,流量意味著商業(yè)價值。作為服務(wù)提供商的頭部網(wǎng)站、app都不愿意看到人們將時間花在中小型虛擬社區(qū)中,他們?nèi)匀幌M谔摂M世界構(gòu)建最大的社區(qū),并吸引足夠多的用戶和使用時間。最后,虛擬社區(qū)是碎片化的,用戶所發(fā)表的文字、圖片、甚至更難捕捉到的信息,分散在更多社區(qū)中,從分散度以及信息監(jiān)測維度上,都無疑大大提高了監(jiān)管的難度。
版權(quán)聲明:凡注明“來源:中國西藏網(wǎng)”或“中國西藏網(wǎng)文”的所有作品,版權(quán)歸高原(北京)文化傳播有限公司。任何媒體轉(zhuǎn)載、摘編、引用,須注明來源中國西藏網(wǎng)和署著作者名,否則將追究相關(guān)法律責(zé)任。