隨著人工智能、虛擬現(xiàn)實等技術的發(fā)展,數(shù)字虛擬人頻頻出現(xiàn)在公眾的視野。作為以數(shù)字形式存在于數(shù)字空間中并具有擬人或真人外貌、行為和特點的虛擬人物,數(shù)字人是如何研發(fā)的?有哪些應用?
(資料圖)
走進人們?nèi)粘I?/strong>
“大家好,谷小雨有禮了!”近日,在南宋德壽宮遺址博物館開館儀式上,一位身著古裝的虛擬數(shù)字人擔任主持人,吸引了觀眾的注意。仔細瞧,這位數(shù)字人柳葉細眉、衣袂飄飄、氣質(zhì)素雅、靈動可愛。它便是浙江廣電集團旗下浙江衛(wèi)視推出的宋韻文化推廣人。
“我們推出谷小雨,既是向傳統(tǒng)文化靠近,也是向年輕群體靠攏?!闭憬l(wèi)視谷小雨工作室負責人接受本報采訪時表示,谷小雨是由浙江衛(wèi)視研發(fā)的首個數(shù)字國潮產(chǎn)品。這個產(chǎn)品把宋韻元素與新媒介、新技術、新應用融合,創(chuàng)新性地打造出谷小雨這個形象。“我們希望用可親可愛的人物形象、可感可觸的數(shù)字手段,讓廣大受眾尤其是年輕人喜歡上宋韻文化。”
谷小雨已在多種場合亮相——電視節(jié)目中,它吟唱宋詞、介紹宋代蹴鞠文化;世界互聯(lián)網(wǎng)大會烏鎮(zhèn)峰會期間,它與嘉賓通過H5在線合拍;在南宋德壽宮遺址博物館,它成為導覽員,對答游客提問應答如流……最近,谷小雨參與的“南宋人的一天” 對外文化交流云展覽,還陸續(xù)在新西蘭、德國、荷蘭、巴基斯坦等國的中國文化中心上線。
與谷小雨類似,越來越多的數(shù)字人在文旅、金融、政務等服務領域“上崗”,走進人們?nèi)粘I睢@?,以敦煌飛天為藍本打造的國風虛擬數(shù)字人天妤,在全網(wǎng)已擁有500余萬粉絲;在2022世界人工智能大會上亮相的中信金控新員工——數(shù)字人小信,可以擔任客戶的專屬財富規(guī)劃師;打開湖北省仙桃市人民政府門戶網(wǎng)站,紅衣白裙的數(shù)字人“桃桃”笑盈盈地對視頻新聞、政策解讀進行播報……《數(shù)字人產(chǎn)業(yè)發(fā)展趨勢報告(2023)》指出,隨著交互智能技術的加速發(fā)展,數(shù)字人正在從技術創(chuàng)新走向產(chǎn)業(yè)應用。
有趣的內(nèi)涵不能少
如此逼真的數(shù)字人是如何打造出來的呢?以谷小雨為例,數(shù)字人首先要做到“形似人”。按照人物概念設計,谷小雨來自南宋臨安,生于谷雨時節(jié),有“雨生百谷,欣欣向榮”的美好寓意。浙江衛(wèi)視特地與宋韻文化研究傳承中心合作,邀請相關宋韻專家組成顧問團,為谷小雨的人物造型、形象設計、內(nèi)容呈現(xiàn)等提供全程專業(yè)級指導把關。亮相一檔歌唱節(jié)目時,谷小雨的舞臺造型是一套現(xiàn)代改良的宋制漢服,上身是改良褙子、宋抹疊穿,袖口造型以西湖荷葉為靈感,下身是水墨印花長裙,妝容參考的是南宋仕女珍珠妝。
作為技術支持方,騰訊團隊打造出一個超200萬面數(shù)的高精度寫實虛擬人,滿足大型舞臺節(jié)目錄制以及智能多模態(tài)交互的多樣化需求。騰訊相關負責人劉明亮告訴記者,谷小雨的麻花辮由30萬根發(fā)絲組成,不同材質(zhì)的衣物有5層,為了達到形神兼?zhèn)涞男Ч?,團隊基于游戲引擎進行實時交互模擬,使得人物在不同燈光、不同動作下的表現(xiàn)都非常真實。
除了“好看的皮囊”,數(shù)字人還要具備“有趣的內(nèi)涵”。例如,在出任導覽員之前,谷小雨進行了400G開放數(shù)據(jù)和30億參數(shù)量的超大規(guī)模語言模型訓練,再加上海量宋韻文獻和百科搜索引擎的助力,谷小雨成功掌握了宋韻百科知識。為了使谷小雨能夠與游客實時語音對話,技術團隊運用語音識別、自然語言理解、語音合成等技術,讓這位數(shù)字導覽員聽得懂、答得出、懂得多。
谷小雨還采用了語音驅(qū)動口型技術,通過適配各種音色、歌唱、語氣詞等不同類型的音頻輸入,學習種類繁多的情感語音數(shù)據(jù),生成韻律自然、情感風格豐富和個性化的高表現(xiàn)力語音,再配合靈動準確的面部表情和口型,讓數(shù)字人的語音達到可媲美真人的效果。
產(chǎn)業(yè)增長勢頭強勁
目前,數(shù)字人已在企業(yè)服務、影視動畫、文化傳媒等領域得到廣泛應用。艾媒咨詢《2022-2023年中國虛擬人行業(yè)深度研究及投資價值分析報告》稱,在娛樂需求增加、人工智能等技術不斷迭代的背景下,中國虛擬人產(chǎn)業(yè)高速發(fā)展,元宇宙的熱潮加速推動虛擬數(shù)字人產(chǎn)業(yè)升級。數(shù)據(jù)顯示,2021年中國虛擬人帶動產(chǎn)業(yè)市場規(guī)模和核心市場規(guī)模分別為1074.9億元和62.2億元,預計2025年分別達到6402.7億元和480.6億元,呈現(xiàn)強勁的增長勢頭。
記者了解到,虛擬數(shù)字人的制作流程一般包括模型綁定、動作捕捉、動畫解算、實時渲染等步驟,其中要運用到大量的現(xiàn)實增強、深度學習、虛擬制片等高科技前沿技術。比較簡單的動漫形象數(shù)字人,一般1個月就能完成;而制作一個更寫實的3D數(shù)字人,從角色設計到完成渲染需要3至6個月甚至更久。數(shù)字人越是“精致”“逼真”,越花費時間、人力成本。
劉明亮表示,算力提升、引擎升級等技術迭代,正推動數(shù)字人制作效能和智能水平持續(xù)提升。一方面,制作數(shù)字人的成本更低、效率更高;另一方面,數(shù)字人的交互性越來越強,提供的服務和陪伴等“人”的屬性更強。
業(yè)內(nèi)人士認為,從關注動畫、渲染的身份型數(shù)字人到融合語言理解能力、表達能力、學習能力、交互能力的服務型數(shù)智人,從在線服務到在場體驗,隨著元宇宙相關技術的進一步發(fā)展,數(shù)字人將進入大規(guī)模應用期,加速轉(zhuǎn)化為現(xiàn)實生產(chǎn)力。
關鍵詞: 浙江衛(wèi)視
責任編輯:Rex_30