“克曰穆朕文且師華父悤譲氒心寧靜于猷淑哲氒”要怎么斷句?世界人工智能大會(huì )期間,一篇鐫刻在西周青銅鼎面的鐘鼎文難倒了不少參觀(guān)者,最先“解題”成功的是合合信息推出的智能文字識別AI(人工智能)系統。在無(wú)人工干預的狀態(tài)下,鐘鼎文從內凹狀態(tài)被拉平,并被轉譯成簡(jiǎn)體字,原本連在一起的文字經(jīng)過(guò)“AI斷句”功能自動(dòng)處理后被正確區分開(kāi)來(lái)?,F場(chǎng)觀(guān)眾紛紛評價(jià):這屆AI實(shí)在太“卷”,竟然能讀懂古文。
今年是世界人工智能大會(huì )舉辦的第五年,“科技風(fēng)向標、產(chǎn)業(yè)加速器”是這場(chǎng)全球AI領(lǐng)域的行業(yè)盛會(huì )對參展技術(shù)與產(chǎn)品的期許。針對圖像處理及內容識別中,文檔圖像質(zhì)量退化嚴重、文字檢測及版面分析困難、非限定條件文字識別率低、結構化智能理解能力差等全球性難題,合合信息重點(diǎn)展示了智能文字識別技術(shù)的創(chuàng )新成果及產(chǎn)業(yè)應用示范,用科技探索產(chǎn)研融合新方向。
AI“讀懂”鐘鼎文:向智能文字識別應用的山頂“沖鋒” 合合信息智能文字識別技術(shù)主要由以“彎曲矯正”為代表的智能圖像處理,基于深度學(xué)習的復雜場(chǎng)景文字識別,自然語(yǔ)言處理(NLP)三大核心模塊組成。智能圖像處理技術(shù)可對曲面、陰影、摩爾紋等復雜場(chǎng)景下的文檔圖像進(jìn)行精準的矯正處理,為接下來(lái)的文字信息提取、識別創(chuàng )造了良好的條件;復雜場(chǎng)景文字識別技術(shù)主要利用手寫(xiě)印刷混排識別,抗強干擾識別,扭曲文字識別等一系列深度學(xué)習技術(shù)進(jìn)行文字提取及識別,并結合領(lǐng)先的NLP技術(shù),對識別出的結果進(jìn)行語(yǔ)義理解。
本次展示的鐘鼎文識別項目,是繼去年的甲骨文識別之后,合合信息向古文字識別發(fā)起的又一次沖鋒。大會(huì )現場(chǎng)還可使用公司旗下產(chǎn)品“掃描全能王APP”,用“拍圖識字”功能一鍵識別豎排的繁體古籍《桃花源記》,將其轉化為易于閱讀的橫排、簡(jiǎn)體版本。
合合信息技術(shù)人員介紹:“選擇鐘鼎文、古籍等素材來(lái)識別,是因為與常規文本相比,鼎面的文字形小細密,豎排的格式也與正常的文本不同。從載體上看,青銅鼎面存在彎曲、反光、凹凸不平的狀況,古籍表面也可能有模糊、框線(xiàn)等因素的干擾,整體識別難度極大。這些問(wèn)題的解決不僅對文物保護和文化傳承意義重大,也有助于技術(shù)在各行業(yè)的應用向縱深拓展?!?/p>
PS篡改檢測:“像素級”起底修改痕跡 合合信息“PS篡改檢測”功能是智能文字識別技術(shù)的另一大亮點(diǎn)。從個(gè)人證件、票據到各類(lèi)商業(yè)材料,詐騙團伙經(jīng)常會(huì )使用PS過(guò)的材料來(lái)進(jìn)行偽裝行騙,受害者不計其數。該技術(shù)主要采用神經(jīng)網(wǎng)絡(luò )捕捉圖像在篡改過(guò)程中留下的細微痕跡,基于百萬(wàn)級的數據學(xué)習圖像被篡改后統計特征的變化,不僅可以判斷圖片是否被篡改,還能定位修改區域,以熱力圖形式展示圖片的PS區域篡改置信度,檢測準確率遠超傳統技術(shù)方法和人眼判斷。
“PS篡改檢測”是合合信息智能圖像處理技術(shù)優(yōu)勢的集中體現,這種直接針對圖像特征信息的篡改檢測方法在行業(yè)中屬于創(chuàng )新應用,覆蓋身份證、護照等多種證照識別,適用于保險、銀行、證券、政務(wù)等多種場(chǎng)景。
創(chuàng )立于2006年的合合信息在智能文字識別領(lǐng)域中已有十多年深耕經(jīng)驗,相關(guān)技術(shù)已廣泛落地各行業(yè),為全球百余個(gè)國家和地區的億級用戶(hù)提供數字化服務(wù)。據權威機構認定,掃描全能王APP針對常規的印刷體文檔字符平均識別率達到99.77%,手寫(xiě)體文檔字符平均識別率為97.00%;“AI+OCR”行業(yè)解決方案可識別上百種卡證、票據、行業(yè)單據內容,支持五十多種主流語(yǔ)言的信息提取。
據悉,近三年來(lái),合合信息先后在ICDAR、ICPR等人工智能?chē)H競賽中斬獲15項冠軍,學(xué)術(shù)成果在CVPR、AAAI、ACL、ACM MM等頂會(huì )上發(fā)表,相關(guān)項目獲中國圖象圖形學(xué)學(xué)會(huì )(CSIG)科技進(jìn)步獎二等獎。在今年8月的CSIG圖像圖形技術(shù)挑戰賽中,合合信息參與的賽隊奪得總冠軍。