題:“真人復(fù)刻數(shù)字人”搶市場,中小企業(yè)如何突圍?
作者 賈迎亞 上海大學(xué)管理學(xué)院副教授
(資料圖片僅供參考)
李博倫 上海大學(xué)管理學(xué)院碩士生
邱肅川 復(fù)旦大學(xué)智慧城市研究中心高級研究員
年中將至,各大電商平臺紛紛進(jìn)入618倒計(jì)時(shí),精打細(xì)算的消費(fèi)者,也開始在各大平臺互相交流自己的“作業(yè)”。數(shù)字人也在成為MCN機(jī)構(gòu)直播布局的重點(diǎn)。在競爭激烈的市場環(huán)境中,億萬分身不眠不休,億萬產(chǎn)業(yè)無窮無盡,越來越多的數(shù)字人類被開發(fā)、應(yīng)用于互聯(lián)網(wǎng)中。技術(shù)使機(jī)器充分具備了人的特點(diǎn),人類也在追求智能化的道路上越走越遠(yuǎn)?!罢嫒藦?fù)刻數(shù)字人”真能實(shí)現(xiàn)彎道超車嗎?中小企業(yè)如何突圍?
真人復(fù)刻數(shù)字人服務(wù)面臨兩大需求
真人復(fù)刻數(shù)字人(2D或3D形象),是一種利用計(jì)算機(jī)視覺、圖形渲染、動(dòng)作捕捉、深度學(xué)習(xí)、語音合成等多項(xiàng)先進(jìn)技術(shù),在外觀形象、行為表達(dá)、思想交互三個(gè)方面完美復(fù)制實(shí)體人的數(shù)字化存在。艾瑞咨詢預(yù)測,真人復(fù)刻數(shù)字人將會(huì)經(jīng)歷三個(gè)階段,第一階段,以CG技術(shù)(Computer Graphics)還原真人表情、動(dòng)作的階段。第二階段,以腦機(jī)接口植入意識、記憶到數(shù)字備份中,并通過電腦還原。第三階段,通過量子計(jì)算機(jī)進(jìn)行深度神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí),對思維和意識進(jìn)行全部還原。
當(dāng)前,想要提供真人復(fù)刻數(shù)字人服務(wù)或利用數(shù)字人特性進(jìn)行業(yè)務(wù)驅(qū)動(dòng)、場景升級的中小企業(yè)面臨兩大需求:一是進(jìn)入元宇宙虛擬空間的數(shù)字形象需求,二是用戶對數(shù)字分身進(jìn)行內(nèi)容創(chuàng)作的需求。
據(jù)IDC預(yù)測,中國數(shù)字人市場規(guī)模預(yù)計(jì)到2026年達(dá)102.4億元人民幣。清華大學(xué)發(fā)布的《虛擬數(shù)字人研究報(bào)告2.0版》顯示,數(shù)字人已經(jīng)滲透到各行各業(yè),成為新一代的生產(chǎn)力和創(chuàng)造力。從頭部企業(yè)的布局來看,數(shù)字人產(chǎn)品服務(wù)在B端占有79%的市場,而在C端的占比僅有36%,顯然,B端是當(dāng)前頭部企業(yè)數(shù)字人布局的重點(diǎn)領(lǐng)域。
頭部企業(yè)切入B端賽道,主要圍繞“人-貨-場”的發(fā)展路徑,并建立了完整的數(shù)字人產(chǎn)業(yè)鏈。不管是數(shù)字人IP、功能型數(shù)字人還是AI員工的市場,頭部企業(yè)在基礎(chǔ)層和平臺層已建立較高的行業(yè)壁壘,例如,占據(jù)基礎(chǔ)層的微軟、Unity、英特爾等,占據(jù)平臺層的網(wǎng)易、科大訊飛、騰訊等。
中小企業(yè)搶灘數(shù)字人賽道選擇哪種發(fā)展模式?
目前最可行、便捷與最易變現(xiàn)的渠道是從事真人復(fù)刻數(shù)字人的AIGC內(nèi)容創(chuàng)作,最關(guān)鍵的是落實(shí)到具體的垂直場景,根據(jù)客戶需要進(jìn)行相應(yīng)設(shè)計(jì),這才是入局的“初心”所在。
在Chat GPT掀起了人工智能創(chuàng)作的浪潮之后,各大科技巨頭紛紛加入競爭,AIGC迎來了前所未有的機(jī)遇和挑戰(zhàn)。AIGC即AI Generated Content,是一種利用人工智能技術(shù)來生成內(nèi)容的應(yīng)用。在Web3.0時(shí)代,內(nèi)容生產(chǎn)方式由PGC(專業(yè)制作)和UGC(用戶制作)逐步過渡到AIUGC(AI輔助用戶創(chuàng)作)和AIGC時(shí)代。AIGC利用生成式算法、自然語言處理(NLP)以及人工智能學(xué)習(xí)知識圖譜,打破了內(nèi)容創(chuàng)作者的創(chuàng)作限制,創(chuàng)作者可以更自由地實(shí)現(xiàn)二次精加工。從長期來看,隨著數(shù)據(jù)、算法、算力等要素的不斷提升,創(chuàng)作者甚至可以利用AI技術(shù)創(chuàng)造出超越現(xiàn)實(shí)的奇幻世界。
最令人驚嘆的是,AIGC能夠?qū)崿F(xiàn)真人復(fù)刻數(shù)字人的多模態(tài)化,即外觀、聲音和動(dòng)作三者完美融合。AIGC在生成方面包含著基于線索的部分生成、完全自主生成和基于底稿的優(yōu)化生成。內(nèi)容方面,不僅包含圖像、文本、音頻等外顯內(nèi)容,同樣也包括策略、劇情、訓(xùn)練數(shù)據(jù)等內(nèi)在邏輯內(nèi)容。當(dāng)垂直場景直接導(dǎo)入或模型生成(如NeRF模型),只需利用大廠提供的AI工具(Bing、Midjourney、Runway、Soundraw等),一款多模態(tài)化的真人復(fù)刻數(shù)字人就可以出現(xiàn)在你的眼前。
對中小企業(yè)而言,實(shí)現(xiàn)真人復(fù)刻數(shù)字人在細(xì)分場景下變現(xiàn),需注意以下三點(diǎn):
第一,規(guī)避大廠深耕多年的數(shù)字人場景,尋找有特色和需求的場景。例如,利用數(shù)字人打造具有當(dāng)?shù)匚幕厣穆糜尉包c(diǎn)、鄉(xiāng)村振興項(xiàng)目、遠(yuǎn)程醫(yī)療服務(wù)、老年人生活輔助、智慧城市管理等,讓用戶感受到數(shù)字人與真實(shí)世界的互動(dòng)和融合,提高用戶的沉浸感、真實(shí)感和參與感,解決現(xiàn)實(shí)世界中存在的問題。
第二,不斷創(chuàng)新,快速迭代,打造高品質(zhì)的數(shù)字人產(chǎn)品。要想讓數(shù)字人從平面圖像變成立體模型,從單一表達(dá)變成多樣化交流,需要不斷地優(yōu)化技術(shù)和算法。如專注于開發(fā)能夠模擬真人感官體驗(yàn)的2D數(shù)字人賽道,從醫(yī)療、法律、直播帶貨三個(gè)場景出發(fā),構(gòu)建數(shù)字人應(yīng)用平臺,提升數(shù)字人的服務(wù)水平。目前,許多數(shù)字人中小企業(yè)都選擇了類似的策略,即在基礎(chǔ)技術(shù)階段“做深、做細(xì)、做實(shí)”,然后向著渲染、動(dòng)捕和唇形等技術(shù)難度較大的3D數(shù)字人領(lǐng)域進(jìn)軍,并不斷豐富場景化應(yīng)用。
第三,打造數(shù)字人業(yè)務(wù)閉環(huán)。需要考慮的是如何從人工標(biāo)注、模型訓(xùn)練,到深度學(xué)習(xí)、自我迭代,并建立穩(wěn)固的用戶反饋。短期來看,視頻生成技術(shù)還原了真人的唇形和語音、語速、語調(diào),應(yīng)是發(fā)展的重心。長期來看,實(shí)時(shí)互動(dòng)技術(shù)才能滿足元宇宙中的社交需求,為用戶帶來真實(shí)體驗(yàn)。在這個(gè)過程中,中小企業(yè)應(yīng)圍繞用戶的實(shí)時(shí)反饋來優(yōu)化數(shù)字人產(chǎn)品與服務(wù)。
真人復(fù)刻數(shù)字人是一條全新的進(jìn)化路線。當(dāng)虛擬偶像市場已被頭部企業(yè)所壟斷,中小企業(yè)無法與之抗衡時(shí),要利用自身的技術(shù)和創(chuàng)新能力,專注于C端市場,打造最適合用戶需求的真人復(fù)刻數(shù)字人。(中新經(jīng)緯APP)
本文由中新經(jīng)緯研究院選編,因選編產(chǎn)生的作品中新經(jīng)緯版權(quán)所有,未經(jīng)書面授權(quán),任何單位及個(gè)人不得轉(zhuǎn)載、摘編或以其它方式使用。選編內(nèi)容涉及的觀點(diǎn)僅代表原作者,不代表中新經(jīng)緯觀點(diǎn)。
責(zé)任編輯:孫慶陽
關(guān)鍵詞: