Email:[email protected]
預(yù)期目標(biāo):到2025年,數(shù)字人4D面部動(dòng)態(tài)重建幀率≥30fps,綁定后生成表情誤差小于5mm,數(shù)字人的自然度、真實(shí)度等主觀體驗(yàn)評(píng)分達(dá)到行業(yè)領(lǐng)先水平。基于多模態(tài)交互輸入結(jié)合大模型實(shí)現(xiàn)高準(zhǔn)確度、低延遲的動(dòng)作、表情、行為推理。
(七)虛擬空間創(chuàng)作平臺(tái)
揭榜任務(wù):研究基于元宇宙虛擬空間的構(gòu)建系統(tǒng),實(shí)現(xiàn)低代碼快速構(gòu)建虛擬空間。研究音視頻互動(dòng)平臺(tái),實(shí)現(xiàn)在元宇宙中進(jìn)行語(yǔ)音、視頻交流。研究多人協(xié)作系統(tǒng),實(shí)現(xiàn)數(shù)字孿生模型的多人交互協(xié)作。研究共享桌面技術(shù),實(shí)現(xiàn)多人共享演示內(nèi)容。研究元宇宙空間與云渲染方式的融合,實(shí)現(xiàn)手機(jī)或PC訪問元宇宙空間。研究人物換裝、捏臉功能,實(shí)現(xiàn)在虛擬空間中打造個(gè)性化的數(shù)字人。集成智能助手,提供專屬場(chǎng)景的業(yè)務(wù)問答與指令。
預(yù)期目標(biāo):到2025年,實(shí)現(xiàn)不少于5類場(chǎng)景的低代碼快速構(gòu)建,支持會(huì)議元宇宙、展覽元宇宙、教育元宇宙、辦公元宇宙、園區(qū)元宇宙等場(chǎng)景,場(chǎng)景運(yùn)行流暢不卡頓。支持在線人數(shù)、模型加載效率、延遲時(shí)間等核心指標(biāo)達(dá)到國(guó)際先進(jìn)水平。
(八)3D沉浸式實(shí)時(shí)通信系統(tǒng)
揭榜任務(wù):研究基于多模態(tài)、多視角的三維視覺技術(shù),實(shí)現(xiàn)對(duì)人、物、場(chǎng)的動(dòng)態(tài)三維數(shù)據(jù)采集、建模和顯示。研制基于多傳感器的三維數(shù)據(jù)捕捉設(shè)備和基于裸眼3D顯示器的沉浸式實(shí)時(shí)通信系統(tǒng),旨在提供身臨其境的沉浸感體驗(yàn),可應(yīng)用于視頻會(huì)議和遠(yuǎn)程協(xié)作,為遠(yuǎn)程教育和培訓(xùn)、遠(yuǎn)程手術(shù)和醫(yī)學(xué)會(huì)診、游戲和文旅等領(lǐng)域提供新的技術(shù)手段。
預(yù)期目標(biāo):到2025年,3D沉浸式實(shí)時(shí)通信系統(tǒng)從采集到呈現(xiàn)端到端時(shí)延小于400ms,幀率大于25,三維重建平均誤差、結(jié)構(gòu)相似性、感知損失指標(biāo)達(dá)到行業(yè)領(lǐng)先水平。
(九)3D實(shí)景地圖平臺(tái)
揭榜任務(wù):研究3D實(shí)景地圖平臺(tái),突破3D實(shí)景地理實(shí)體在語(yǔ)義化、結(jié)構(gòu)化等維度上的技術(shù)瓶頸。研究用時(shí)空數(shù)據(jù)編織與時(shí)空知識(shí)圖譜技術(shù)實(shí)現(xiàn)對(duì)地理實(shí)體自身屬性及實(shí)體間關(guān)系進(jìn)行一致性描述,以實(shí)現(xiàn)地理實(shí)體的語(yǔ)義化,達(dá)到計(jì)算機(jī)可理解、可分析。研究用GeoAI方法識(shí)別分類技術(shù),實(shí)現(xiàn)地理實(shí)體單體分割并獲取其幾何輪廓及組成結(jié)構(gòu)。在城市規(guī)劃、應(yīng)急防災(zāi)、交通治理等場(chǎng)景下實(shí)現(xiàn)快速批量應(yīng)用。
預(yù)期目標(biāo):到2025年,地理實(shí)體語(yǔ)義化覆蓋率、結(jié)構(gòu)化準(zhǔn)確率等核心指標(biāo)達(dá)到行業(yè)領(lǐng)先。
(十)基于文本描述的3D場(chǎng)景生成系統(tǒng)
揭榜任務(wù):研究基于文本描述的3D場(chǎng)景生成系統(tǒng),突破傳統(tǒng)方法需要大量標(biāo)記3D模型數(shù)據(jù)集的限制,解決當(dāng)前基于文本描述的3D場(chǎng)景生成算法結(jié)果過飽和、過平滑、缺少細(xì)節(jié)等問題。研究多模態(tài)室內(nèi)3D場(chǎng)景生成,實(shí)現(xiàn)高質(zhì)量3D內(nèi)容生成,包括復(fù)雜效果,基于文本生成多樣性3D內(nèi)容和360°場(chǎng)景等。研究基于分布式云渲染實(shí)現(xiàn)多模態(tài)實(shí)時(shí)3D場(chǎng)景生成系統(tǒng),實(shí)現(xiàn)高帶寬高質(zhì)量?jī)?nèi)容實(shí)時(shí)傳輸,海量高質(zhì)量3D內(nèi)容實(shí)時(shí)云端生產(chǎn)、渲染、交互。