近日,由國際頂級語(yǔ)音會(huì )議ASRU(IEEE Automatic Speech Recognition and Understanding,自動(dòng)語(yǔ)音識別與理解)舉辦的ASRU 2023多通道多方會(huì )議轉錄挑戰賽(M2MeT2.0)發(fā)布了最終排名結果。馬上消費人工智能研究院智能語(yǔ)音團隊憑借扎實(shí)的語(yǔ)音技術(shù)和創(chuàng )新實(shí)力,在本次挑戰賽的限定數據集和不限定數據集兩個(gè)賽道中均斬獲亞軍。
語(yǔ)音識別(Automatic Speech Recognition)、說(shuō)話(huà)人日志(Speaker Diarization)等語(yǔ)音處理技術(shù)的最新發(fā)展激發(fā)了眾多智能語(yǔ)音的廣泛應用。本次M2MeT2.0挑戰賽對說(shuō)話(huà)人相關(guān)的人物上評估提出了更高要求,并且同時(shí)設立限定數據與不限定數據兩個(gè)子賽道。通過(guò)將語(yǔ)音歸屬于特定的說(shuō)話(huà)人,旨在提高多說(shuō)話(huà)人ASR系統在真實(shí)世界環(huán)境中的準確性和適用性,以進(jìn)一步促進(jìn)多說(shuō)話(huà)人語(yǔ)音識別領(lǐng)域研究的發(fā)展。
ASRU是國際上最大的非營(yíng)利性專(zhuān)業(yè)技術(shù)學(xué)會(huì )IEEE旗下語(yǔ)音和語(yǔ)言處理技術(shù)委員會(huì )的旗艦技術(shù)活動(dòng),來(lái)自全球學(xué)術(shù)界和工業(yè)界的頂級專(zhuān)家和研究人員將圍繞當下語(yǔ)音領(lǐng)域的研究熱點(diǎn)進(jìn)行深入探討。馬上消費人工智能研究院智能語(yǔ)音團隊相關(guān)負責人表示,公司在智能語(yǔ)音領(lǐng)域深耕多年,已自研上線(xiàn)了語(yǔ)音合成、語(yǔ)音識別、聲紋識別和語(yǔ)義理解等全流程對話(huà)機器人技術(shù),此役得到ASRU2023認可也是對公司智能語(yǔ)音技術(shù)的重要檢驗。
據悉,馬上消費于2017年成立人工智能研究院,在人工智能應用創(chuàng )新領(lǐng)域持續輸出,系統或產(chǎn)品包括AI金融大腦、虛擬數字人、多模態(tài)生物核驗與防偽等,致力于打造全場(chǎng)景的AI解決方案,全面推動(dòng)AI應用生態(tài)的快速發(fā)展和全面賦能。
此外,馬上消費還聯(lián)合中國科學(xué)院、中國信通院、南開(kāi)大學(xué)等全國著(zhù)名科研機構及高校建立了16個(gè)創(chuàng )新實(shí)驗室,先后有15篇論文被AI頂會(huì )收錄;先后參與國家及行業(yè)標準制定55項,參與34項權威成果,獲中國人工智能產(chǎn)業(yè)發(fā)展聯(lián)盟權威認證,榮獲“2022年度吳文俊人工智能科學(xué)技術(shù)獎”,并與騰訊、百度、華為等多家企業(yè)積極參行業(yè)內的標準制定和技術(shù)研討。