Email:[email protected]
二、重點(diǎn)產(chǎn)品
(五)語言大模型產(chǎn)品
揭榜任務(wù):探索以知識為中心的大模型范式,通過上下文編碼、動態(tài)記憶機(jī)制等核心技術(shù),提升語言認(rèn)知大模型的智慧涌現(xiàn)水平。對標(biāo)國際先進(jìn)產(chǎn)品,提升中英雙語的語義理解、邏輯推理、代碼編程等能力,實現(xiàn)在線知識咨詢功能,能夠?qū)崟r融合基于互聯(lián)網(wǎng)的海量信息。開展大模型推理加速算法研究,提升語言大模型賦能智能產(chǎn)品的部署效率。
預(yù)期目標(biāo):到2025年,語言大模型在中英文均達(dá)到世界先進(jìn)水平,提升大模型泛化能力,零樣本或少樣本學(xué)習(xí)在超過30個基準(zhǔn)中達(dá)到優(yōu)異性能。中英雙語認(rèn)知能力全面提升,在模型常識性、專業(yè)性、邏輯性、推理能力方面取得重大突破。語言大模型在數(shù)字座艙、機(jī)器人或語音助手等領(lǐng)域?qū)崿F(xiàn)應(yīng)用。
(六)語音大模型產(chǎn)品
揭榜任務(wù):研究具有高通用性和高解釋性的通用語音表征理論和方法,突破語音數(shù)據(jù)依賴性強(qiáng)、領(lǐng)域適應(yīng)性弱等難題,實現(xiàn)超大規(guī)模語音表征訓(xùn)練、語音表征信息解耦合建模等關(guān)鍵技術(shù),支撐語音大模型的泛化性。構(gòu)建面向多個語種、多個語音任務(wù)共享的語音大模型,賦能語音助手、虛擬客服、數(shù)字人等智能產(chǎn)品的智能化升級。
預(yù)期目標(biāo):到2025年,語音大模型達(dá)到世界先進(jìn)水平,覆蓋語種超20個,其中漢語、英語、法語等5個以上重點(diǎn)語種的處理效果業(yè)界領(lǐng)先,可支撐語音識別、語音合成、聲紋識別、情感識別等10個以上語音任務(wù),性能較傳統(tǒng)模型實現(xiàn)顯著提升。
(七)視覺大模型產(chǎn)品
揭榜任務(wù):研究視覺大模型統(tǒng)一算法底層架構(gòu),創(chuàng)新視覺大模型訓(xùn)練路徑,構(gòu)建支持動態(tài)視覺理解和生成統(tǒng)一的底層基礎(chǔ)模型架構(gòu),突破靜態(tài)向動態(tài)視覺大模型的范式升級。視覺大模型能夠通過少樣本微調(diào)解決圖像、視頻等視覺任務(wù),生成式任務(wù)指標(biāo)達(dá)到國際先進(jìn)水平,解決視覺大模型的高效設(shè)計、有效訓(xùn)練、快速推理等關(guān)鍵技術(shù)問題。
預(yù)期目標(biāo):到2025年,訓(xùn)練超過千億級參數(shù)規(guī)模的通用視覺大模型,能夠通過少樣本微調(diào)方式解決超過30個視覺基礎(chǔ)任務(wù)(包括10個以上動態(tài)視覺或三維視覺任務(wù))并且表現(xiàn)出色,推理速度達(dá)到全球領(lǐng)先,具備在智能終端產(chǎn)品的部署能力。
(八)多模態(tài)大模型產(chǎn)品
揭榜任務(wù):研究多源多模態(tài)異構(gòu)數(shù)據(jù)的表示和對齊方法,實現(xiàn)文本、圖像、視頻、語音等模態(tài)數(shù)據(jù)間的語義對齊,全面提升多模態(tài)大模型性能。研究多模態(tài)大模型訓(xùn)練和推理加速方法,構(gòu)建算法、框架、硬件和并行策略等協(xié)同考慮的優(yōu)化和計算架構(gòu),提升萬億級參數(shù)多模態(tài)模型的工程效率。
預(yù)期目標(biāo):到2025年,全面提升多模態(tài)大模型性能,多模態(tài)大模型達(dá)到萬億參數(shù),零樣本學(xué)習(xí)下解決15個以上多模態(tài)任務(wù),基于主觀評價的最終效果和推理速度達(dá)到國際先進(jìn)水平。