聽說過洛天依和《甩蔥舞》嗎?伴隨虛擬偶像的出圈,虛擬人產(chǎn)業(yè)已經(jīng)成為資本下注的新目標(biāo)。
公開數(shù)據(jù)顯示,截至今年9月,國內(nèi)虛擬數(shù)字人賽道投融資金額已超過去年,達到24.9億元。2021年虛擬數(shù)字人相關(guān)企業(yè)投融資金額約為19.71億元,而在2015年這一統(tǒng)計數(shù)字僅為0.33億元,6年間復(fù)合增長率達到97.71%。
各大科技巨頭也不約而同選擇在虛擬人領(lǐng)域“秀肌肉”:國外的Meta、微軟,國內(nèi)的騰訊、阿里、百度、快手、網(wǎng)易,均投入重金布局。
(資料圖片僅供參考)
除了虛擬偶像之外,虛擬人目前已在多個場景有落地應(yīng)用?!疤摂M人的價值不僅僅是‘不塌房’的虛擬偶像?!表槥橘Y本副總裁馮錚告訴澎湃新聞記者?!疤摂M人最大的應(yīng)用場景是虛擬身份和交互界面:前者是虛擬世界中的個人形象;后者相當(dāng)于虛擬世界中的機器人,由AI驅(qū)動,和人類交互?!?
元宇宙市場像初創(chuàng)期的門戶網(wǎng)站
用學(xué)術(shù)的解釋來看虛擬人,指的是通過CG、動作捕捉、VR等技術(shù),以圖片、視頻、直播等形式存在于非物理世界,具有擬人化特征的虛擬形象,也可稱為數(shù)字人。
Unity中國平臺技術(shù)總監(jiān)楊棟告訴澎湃新聞記者,虛擬人技術(shù)發(fā)展已有較長時間。之所以在今年備受關(guān)注,一是由于柳夜熙、洛天依等娛樂化虛擬人形象的出圈,二是“元宇宙”概念的興起。定制個人虛擬形象需求的不斷擴大,讓虛擬人產(chǎn)業(yè)逐漸走入大眾視野。
“虛擬人最初走紅是在2017年,隨后經(jīng)歷了一段時間的摸索期,在這兩年逐漸走向商業(yè)化?!瘪T錚告訴澎湃新聞記者?!霸钪娓拍钫w虛無飄渺,其中大家接觸最多和最了解的就是虛擬數(shù)字人,無論是虛擬偶像還是虛擬主播,相對更形象和具體一些,因此受到資本的廣泛關(guān)注?!?
根據(jù)艾媒咨詢預(yù)測,虛擬人帶動的國內(nèi)產(chǎn)業(yè)市場規(guī)模將在2025年達到6402.7億元。
虛擬人究竟是怎么造出來的?網(wǎng)易伏羲虛擬交互技術(shù)負責(zé)人齋藤飛向記者透露,制作一個虛擬人,需要考慮場景、受眾、承載虛擬人的硬件平臺以及成本投入的上下限,這些限制條件綜合決定虛擬人的畫風(fēng)、美術(shù)品質(zhì)標(biāo)準(zhǔn),并且圈定人設(shè)的基本范圍,在此基礎(chǔ)上再進一步確定角色名字、基本設(shè)定、主視覺的設(shè)計。
齋藤飛提到,虛擬人制造目前仍是一個復(fù)雜的技術(shù)體系,需要包括美術(shù)(建模師、綁定師、動畫師)、開發(fā)(客戶端開發(fā)、技術(shù)美術(shù)、視效開發(fā))、算法(語音生成、動畫驅(qū)動)等跨學(xué)科、跨領(lǐng)域、跨職能協(xié)同。當(dāng)不同領(lǐng)域圍繞同一目標(biāo)共同前進時,如何高效統(tǒng)籌管理也是一項巨大挑戰(zhàn)。
目前,虛擬人分為多個種類,最為大眾熟知的是娛樂型虛擬人,其中包括柳夜熙、AYAYI、洛天依等虛擬偶像,她們活躍在社交媒體平臺,偶爾會帶帶貨。 第二類是服務(wù)型數(shù)字人虛擬員工,此外還有一些虛擬數(shù)字人作為客服存在。 第三類則是ID型數(shù)字人,代表虛擬世界中的某個特定化身,例如虛擬新聞主播等。
“預(yù)計虛擬人的商業(yè)價值最大化要等5至10年?!瘪T錚表示,需要人人都有下一代硬件設(shè)備,才能像移動互聯(lián)網(wǎng)那樣大規(guī)模地影響和改變世界,爆發(fā)出產(chǎn)業(yè)的最大價值。
在他看來,其實目前虛擬人賽道的企業(yè)競爭并不激烈?!翱赡芷髽I(yè)普遍對于短期內(nèi)掙錢的領(lǐng)域更感興趣,而虛擬人目前的商業(yè)回報不明顯,更多是長線布局?!?
作為投資方,馮錚坦言,自己對初創(chuàng)企業(yè)的技術(shù)能力和短期內(nèi)切入口最為關(guān)注。“現(xiàn)在的元宇宙很像1998、1999年時,當(dāng)時四大門戶(網(wǎng)站)、阿里巴巴剛剛創(chuàng)立。今天虛擬世界也有一批有愿景的創(chuàng)業(yè)者開始去嘗試,而且也吸引到了一批早期用戶。在業(yè)態(tài)迭代的過程中,產(chǎn)品會隨著認知、技術(shù)、用戶甚至硬件的變化不斷進化,這些都考驗企業(yè)的核心技術(shù)能力?!?
大廠“跑馬圈地”,誰能脫穎而出
值得注意的是,虛擬人已成為各大科技巨頭共同押注的賽道。
文娛產(chǎn)業(yè)分析師張書樂認為,虛擬人某種意義上是互聯(lián)網(wǎng)大廠展示肌肉的集中呈現(xiàn)物,即內(nèi)容創(chuàng)造、人工智能、動作捕捉和各種與之相關(guān)的技術(shù)的融匯。
在騰訊智能產(chǎn)品副總裁李學(xué)朝看來,騰訊通過整合ASR(語音識別技術(shù))、NLP(自然語言處理)、語音交互、自然語言理解、圖像識別、TTS(語音自動合成)、知識圖譜等AI能力,連接騰訊內(nèi)容和服務(wù)生態(tài),面向使用場景打磨平臺能力,助力客戶打造出有智能、有形象、可交互的數(shù)字分身。
“數(shù)字人是互聯(lián)網(wǎng)3.0的重要入口,既是技術(shù)對效率的解放,也將推動線上和線下更全面地一體化,進入全真互聯(lián)?!崩顚W(xué)朝認為。
“網(wǎng)易伏羲事業(yè)部在2018年就成立虛擬人團隊,當(dāng)時的團隊成員是國內(nèi)最早的虛擬人制造師之一?!本W(wǎng)易伏羲AI虛擬人首席專家大丁向記者透露。
如今,虛擬人制造師已經(jīng)成為炙手可熱的工作,不僅涉及AI從業(yè)者,也包括工程平臺、技術(shù)美術(shù),產(chǎn)品經(jīng)理,項目管理、商務(wù)等崗位。
百度自2019年正式進軍數(shù)字人領(lǐng)域,并主打高度定制化的超寫實機器人。百度數(shù)字人與機器人業(yè)務(wù)負責(zé)人李士巖告訴記者,虛擬人是技術(shù)驅(qū)動型的市場,一旦某個技術(shù)突破,市場就會迅速展開?!皬氖袌鲆?guī)模來看,預(yù)計2030年達到2700億,在整個產(chǎn)值來看,2022年發(fā)生在市場上的產(chǎn)值是大幾十億左右,且預(yù)計每年會有超過50%的速度遞增?!?
在他看來,虛擬人是web3.0以及元宇宙時代的主要內(nèi)容,也是主要的交互載體。“我們非??粗靥摂M人未來應(yīng)用場景,以及為企業(yè)在營銷和生產(chǎn)上帶來的價值,將來虛擬人會是每個人在元宇宙中的載體和分身,百度會堅定投入,無論是人力上或者資金的投入方面,每年都是百分之幾十的速度增長?!?/p>
快手也宣布了自己在虛擬人方面的進展。快手Y-tech AI技術(shù)中心負責(zé)人萬鵬飛告訴澎湃新聞記者,“目前快手已經(jīng)能夠提供從建模到最終的內(nèi)容制作的一站式服務(wù),在全鏈路上都有深厚的積累。”他透露,數(shù)字人和XR是快手發(fā)展路徑上的重要方向。
10月12日,Meta發(fā)布最新數(shù)字人成果:用手機掃描即可生成超寫實數(shù)字化身,根據(jù)扎克伯格在發(fā)布會視頻中的介紹,Meta的最新掃描技術(shù)允許在任何正常光源下進行自主掃描,這是突破數(shù)字人掃描中空間局限的一次大膽嘗試。此外,Meta的科研人員透露,他們?nèi)詫⒅铝τ诳s短處理時間,以進一步提升掃描效率。
制作成本高昂,實時交互是難題
楊棟透露,虛擬人的制作成本非常高,從前期的動作、表情捕捉,到后面的數(shù)據(jù)處理、渲染,時間成本、人力成本都非常高昂。
“要想降低成本,首先要摸索出一條標(biāo)準(zhǔn)化的制作流程,并且在每一步流程里,提供相應(yīng)地專業(yè)化、標(biāo)準(zhǔn)化工具或解決方案,從而帶動整個行業(yè)加速發(fā)展?!?
在他看來,虛擬人真正的難點應(yīng)該是在實時交互上,現(xiàn)在偏寫實或者3D的虛擬人的展現(xiàn)方式其實更多的是視頻類型,如果需要做到實時交互,則不僅要依靠畫面,還需要語音、智能系統(tǒng)、硬件設(shè)備、網(wǎng)絡(luò)甚至算力的系統(tǒng)配合。產(chǎn)業(yè)的發(fā)展還需要時間,但是需求和市場都已經(jīng)存在。
萬鵬飛同樣提到了實時交互的重要性和難點?!坝脩粜枰铜h(huán)境交互的能力,以及和其他人交互的能力?!彼J為,虛擬世界構(gòu)建的核心仍然是社交關(guān)系,而這種關(guān)系需要身份系統(tǒng)、環(huán)境系統(tǒng)、經(jīng)濟系統(tǒng)等共同構(gòu)建。這在技術(shù)上仍然是一個不小的挑戰(zhàn)。
不過,雖然得到業(yè)界和資本圈的普遍看好,虛擬人目前的發(fā)展仍在早期階段。張書樂向記者分析,目前虛擬人內(nèi)容輸出依然需要人工完成,即依靠聲音庫生成而非人工智能角度的虛擬數(shù)字人(如洛天依)演繹的大量內(nèi)容創(chuàng)作者來進行歌曲創(chuàng)作、動作捕捉,而這并不比配合現(xiàn)實藝人的演藝簡單。
另外,人工智能向的虛擬數(shù)字人,盡管可以進行有效問答,亦可針對特定內(nèi)容(如高考作文)進行創(chuàng)作,但涉及到認知盲點就不再有效。例如在駕駛過程中,成為車載導(dǎo)航的虛擬數(shù)字人進行人機交互的展示意義和智能音箱并無二致,形象呈現(xiàn)也無實際意義。
“僅僅看到營銷成本降低,卻無視虛擬數(shù)字人的研發(fā)、維護和升級成本,都是將虛擬人看作是一種低成本營銷和蹭熱點手段的偏見?!睆垥鴺繁硎尽?
網(wǎng)易伏羲產(chǎn)品經(jīng)理閣語透露,未來技術(shù)團隊的發(fā)展方向主要分為兩類:一是致力于打造更生動自然的虛擬人,讓其表現(xiàn)趨近于真人;二是如何去實現(xiàn)虛擬人生產(chǎn)和AI能力應(yīng)用的一個規(guī)?;?,實現(xiàn)將虛擬人技術(shù)高效的應(yīng)用在各個場景中。
關(guān)鍵詞:
責(zé)任編輯:Rex_01