5月19日上午,以“元啟無(wú)限,AI創(chuàng )未來(lái)”為主題的第四屆“天馬杯”全國高??萍紕?chuàng )新大賽(簡(jiǎn)稱(chēng)“天馬杯”大賽)決賽在重慶舉行。28支隊伍同臺展示在虛擬數字人領(lǐng)域的創(chuàng )新成果,為人們揭秘虛擬數字人是如何打造出來(lái)的,并決出了各個(gè)獎項。b703團隊、E305團隊、卷不過(guò)就開(kāi)擺團隊分獲2D數字人驅動(dòng)、3D數字人驅動(dòng)、NLP賽道一等獎,并分別獲得現金獎勵5萬(wàn)元,以及馬上消費定制offer。
本屆“天馬杯”大賽于2022年10月啟動(dòng)。在前期的初賽中,共有來(lái)自清華大學(xué)、中國科學(xué)技術(shù)大學(xué)、香港科技大學(xué)等眾多國內外知名高校875名學(xué)子報名參賽,并組成了253支參賽隊伍。經(jīng)過(guò)初賽的激烈角逐,清華大學(xué)等25所知名大學(xué)的28支隊伍、80人脫穎而出,進(jìn)入當天的決賽。
據悉,本次大賽聚焦前沿科技領(lǐng)域,基于大模型,設置了2D數字人驅動(dòng)、3D數字人驅動(dòng)、NLP(自然語(yǔ)言處理,屬于人工智能的一個(gè)子領(lǐng)域)三個(gè)賽道。其中,2D數字人驅動(dòng)賽道的賽題為“語(yǔ)音驅動(dòng)數字人口型生成”,3D數字人驅動(dòng)賽題為“視頻驅動(dòng)人臉生成”,NLP賽道賽題為“數字人播報資訊內容生成”。
在前期的預賽中,參賽團隊圍繞這三大賽題進(jìn)行開(kāi)發(fā),取得了讓數字人具備“人的行為模式”的創(chuàng )新成果——它們的語(yǔ)言、動(dòng)作、表情等都十分接近真人。決賽中,28支隊伍圍繞3個(gè)賽道和相應的賽題,通過(guò)現場(chǎng)演示、答辯等方式展示自己在數字人領(lǐng)域的創(chuàng )新成果,讓人大開(kāi)眼界。
針對參賽團隊的創(chuàng )新成果,大賽評委逐一進(jìn)行點(diǎn)評和評分,最終,決出了三個(gè)賽題的一二三等獎和優(yōu)秀獎。其中,b703團隊、E305團隊、卷不過(guò)就開(kāi)擺團隊分獲2D數字人驅動(dòng)、3D數字人驅動(dòng)、NLP賽道一等獎;賞金獵人、我們可行了兩個(gè)團隊獲得2D數字人驅動(dòng)賽道二等獎,NKUAI、USTC-QingBo兩個(gè)團隊獲得3D數字人驅動(dòng)賽道二等獎,Kcolc、沒(méi)立功的汪汪隊兩個(gè)團隊獲得NLP賽道二等獎;SOTA、零零捌兩個(gè)團隊獲得2D數字人驅動(dòng)賽道三等獎,只因你太美、3D測試獲得3D數字人驅動(dòng)賽道三等獎,久仰九陽(yáng)、愛(ài)擺爛的歪歪豬兩個(gè)團隊獲得NLP賽道三等獎;aaaaa、unjuanable兩個(gè)團隊獲得2D數字人驅動(dòng)賽道優(yōu)秀獎,馬上開(kāi)卷、卷心菜兩個(gè)團隊獲得3D數字人驅動(dòng)賽道優(yōu)秀獎,beenjoy、你不對我隊兩個(gè)團隊獲得NLP賽道優(yōu)秀獎。奪得一二三等獎及優(yōu)秀獎的團隊,分別獲得獎金5萬(wàn)元、2萬(wàn)元、1萬(wàn)元、5000元。
此外,進(jìn)入當天決賽的參賽學(xué)生,還可獲得市人社局主辦的數字技術(shù)工程師培育項目培訓資格和全國卓越工程師大賽優(yōu)先推薦參賽資格,以及馬上消費定制offer、知名企業(yè)實(shí)踐參觀(guān)等獎勵。
對于參加本次比賽,參賽團隊成員紛紛感嘆非常值得。來(lái)自華中科技大學(xué)的E305團隊,在決賽中一舉奪得3D賽道冠軍。她透露,參加這次比賽之前,團隊已開(kāi)發(fā)出一套快速高精度3D驅動(dòng)數字人方案——通過(guò)視頻來(lái)進(jìn)行數字人的BlendShape的參數估計,實(shí)現了基于視頻的數字人驅動(dòng),且已應用于醫美領(lǐng)域人臉模具的制造。
而在這次比賽中,基于馬上消費提供的訓練模型和數據,團隊對原有項目的技術(shù)開(kāi)發(fā)有了新的啟發(fā),并據此在比賽過(guò)程中研究了一些新的網(wǎng)絡(luò )和數據預處理改進(jìn)方法,實(shí)現了項目更優(yōu)的效果。預計未來(lái),項目成果會(huì )在更多領(lǐng)域得到應用。
來(lái)自重慶大學(xué)的SOTA戰隊,在比賽中獲得了2D數字人驅動(dòng)賽道三等獎。比賽中,該團隊基于馬上消費提供的訓練模型和訓練數據,開(kāi)發(fā)了“語(yǔ)音驅動(dòng)的數字人嘴型生成”項目,實(shí)現了輸入一段音頻后,通過(guò)AI模型就可預測這段音頻對應的嘴型。這項技術(shù)可以幫助模擬更準確的虛擬人物的嘴型,增加虛擬人物的真實(shí)性。同樣,也可以應用于平面虛擬人物的嘴型模擬,生成更加逼真的人物。
據悉,作為持有消費金融牌照的科技驅動(dòng)型金融機構,馬上消費組建了近2000人的科研團隊,在大數據、人工智能等新一代信息技術(shù)領(lǐng)域取得累累創(chuàng )新碩果,累計申請發(fā)明專(zhuān)利突破1000件。這使得其在人工智能、數字人等技術(shù)方面已有了深厚沉淀,形成了核心競爭力。(圖為馬上消費授權中國網(wǎng)財經(jīng)使用)
相關(guān)稿件