近期,中國信息通信研究院(以下簡稱“中國信通院”)開展“可信AI—OCR智能化服務”評估工作,合合信息獲得了“增強級”評級。
作為將圖像信息轉(zhuǎn)換為文字信息的關(guān)鍵技術(shù),OCR(光學字符識別)技術(shù)能夠在多場景下,實現(xiàn)數(shù)據(jù)信息提取,有效提高業(yè)務效率,被廣泛應用于金融、交通、醫(yī)療等多個領(lǐng)域。
中國信通院持續(xù)關(guān)注OCR技術(shù)及應用的發(fā)展情況,聯(lián)合多家企業(yè)共同制定《OCR服務智能化分級技術(shù)要求和評估方法》,制定了OCR服務在功能、性能、安全等方面的技術(shù)要求以及評估方法,為OCR、智能文檔處理技術(shù)的研發(fā)和產(chǎn)業(yè)應用提供參考。
OCR智能化服務評估,依據(jù)《OCR服務智能化分級技術(shù)要求和評估方法》開展,其中的功能維度,涵蓋基礎(chǔ)類功能測試和增強類功能測試兩個方面,從卡證類、票據(jù)類、通用表格、通用圖片等文字識別服務層面,綜合評估OCR智能化產(chǎn)品的功能;性能維度,涵蓋多種常見業(yè)務場景的文字識別性能測試。
據(jù)介紹,合合信息的智能文字識別產(chǎn)品,通過全部7項基礎(chǔ)類功能指標測試以及9項增強類功能指標測試,獲得“增強級”評級。以具有較大難度的證件類和票據(jù)類性能測試為例,面對旋轉(zhuǎn)、陰影、反光、褶皺、形變、模糊、多語言、低像素、光照不均等復雜場景,合合信息的智能文字識別產(chǎn)品,均有較高的識別準確率。合合信息的智能文字識別產(chǎn)品,支持超過50種復雜語言的識別,為全球化、多語言背景下的信息智能識別,提供了技術(shù)支撐。