合合信息智能文檔處理系統(tǒng)獲權威評測認可-天天要聞
時間:2023-06-24 02:03:18
數(shù)字經(jīng)濟快速發(fā)展的背后,全球數(shù)據(jù)總量呈現(xiàn)出爆發(fā)式增長趨勢。智能文檔處理(IDP)技術能夠高效地從多格式文檔中捕捉、提取和處理數(shù)據(jù),幫助機構和企業(yè)大幅提升文檔處理效率,節(jié)約時間和人力成本。近期,合合信息智能文字識別產(chǎn)品通過中國信息通信研究院(以下簡稱“中國信通院”)“可信AI—智能文檔處理系統(tǒng)”評估工作,并獲得“5級”評定。據(jù)悉,“5級”為該模塊最高評定等級。
人工智能技術的應用場景正在不斷拓展,其發(fā)展也面臨著產(chǎn)品能力參差不齊、缺乏行業(yè)基準和標桿、安全可信要求落實不明確等問題。中國信通院于2018年起逐步構建和完善“可信AI”評測體系,助力人工智能技術的發(fā)展和產(chǎn)業(yè)的健康成長,“智能文檔處理”是近兩年來新增的評測項目之一。
中國信通院智能文檔處理系統(tǒng)評測體系介紹(圖源:中國信通院)
(資料圖片僅供參考)
國際數(shù)據(jù)公司(IDC)最新發(fā)布的預測數(shù)據(jù)顯示,中國數(shù)據(jù)量規(guī)模將從2022年的23.88ZB增長至2027年的76.6ZB,年均增長速度(CAGR)達到26.3%。其中,企業(yè)數(shù)據(jù)量占據(jù)70%,目前僅有24%的數(shù)據(jù)被用于分析或AI決策。由此可見,企業(yè)在經(jīng)營中沉淀下來的數(shù)據(jù),有大部分價值尚待釋放。
計算機信息化系統(tǒng)中的數(shù)據(jù)分為結構化數(shù)據(jù)和非結構化數(shù)據(jù),人們?nèi)粘I?、工作中所接觸到的各類辦公文檔、文本、圖片、報表都屬于非結構化數(shù)據(jù)。由于格式復雜、標準多樣,非結構化數(shù)據(jù)處理起來既困難又耗時,智能文檔處理技術可以把關鍵信息從半結構化/非結構化數(shù)據(jù)中提取出來,進一步實現(xiàn)業(yè)務流程的端到端自動化。IDC認為,智能文檔處理技術是提升部分行業(yè)、業(yè)務、流程的核心生產(chǎn)要素,隨著與應用和流程自動化的深度整合,潛在的應用場景廣泛,普及空間較大。
目前,智能文檔處理技術已被廣泛應用于文檔數(shù)字化管理、自動化流程、圖文提取等業(yè)務場景,并加速滲透金融、政務、醫(yī)療、海關等垂直領域。中國信通院持續(xù)關注智能文檔處理技術及應用的發(fā)展情況,依據(jù)《自然語言處理技術和產(chǎn)品評估方法 第8部分:智能文檔處理系統(tǒng)》,全方位評估企業(yè)智能文檔處理的技術先進度。
評估結果顯示,合合信息智能文檔處理產(chǎn)品在通用能力及AI核心能力方面均表現(xiàn)優(yōu)異:
通用能力方面,合合信息產(chǎn)品在信息抽取、表格文字識別、版面分析等方面均獲得5分評分。表格文字識別、版面分析是文檔處理的難點,合合信息表格文字識別技術支持識別圖片/PDF格式文檔中的多類型表格內(nèi)容。在財報相關表格識別測試中,合合信息有線表識別單元格結構準確率高于98%;無線表識別在保證表格區(qū)域內(nèi)容的完整性的同時,檢測準確率較傳統(tǒng)方法顯著提升。
合合信息“表格文字識別”處理效果展示
合合信息版面分析技術通過解決版面分割、區(qū)域間的邏輯關系處理等方面的難題,可將文檔圖像切分成不同類型內(nèi)容(文本、圖形、公式、表格等)的區(qū)域,并分析區(qū)域之間的關系,讓機器更精準地確定文檔中的文字位置、字體、大小和排版方式,從各類版式復雜的圖片文檔中精準獲取信息。
AI核心能力方面,合合信息產(chǎn)品在NLP領域的文本分類、知識圖譜領域的實體識別、關系抽取及OCR領域的字符識別、文本行識別均獲得5分評分,并支持文本生成、事件抽取等高階處理能力,其中準確率、召回率、F1值等指標評分總體較高。
資料顯示,合合信息創(chuàng)立于2006年,是一家人工智能及大數(shù)據(jù)科技企業(yè)。合合信息智能文檔處理產(chǎn)品是一款集圖像處理、文檔質(zhì)量判斷、文檔識別、版面分析、文檔結構化信息抽取、存儲、檢索、管理等技術于一體的智能文檔解決方案產(chǎn)品,旨在幫助個人和企業(yè)實現(xiàn)文檔信息化管理。
此外,本月,中國信通院攜手合合信息啟動了《文檔圖像篡改檢測標準》制定工作,中國圖象圖形學學會、中國科學技術大學等知名學術機構參與聯(lián)合編制。該檢測標準將基于產(chǎn)業(yè)現(xiàn)狀,圍繞“細粒度”視覺差異偽造圖像鑒別、生成式圖像判別等行業(yè)焦點議題,凝聚行業(yè)共識,為中國“可信AI”在機器視覺、圖像處理領域的體系建設提供有力支持。(柯巖)
相關稿件
合合信息智能文檔處理系統(tǒng)獲權威評測認可-天天要聞
中國充電聯(lián)盟聲明:沒有協(xié)調(diào)解決政府專項資金的職能 世界熱消息
邱悅與謝園結婚22年無子無女,他離世后,她如何獨自面對人生?
廣東143個鎮(zhèn)街遭遇暴雨 一小時最大降雨超百毫米|環(huán)球看熱訊
我市各部門區(qū)縣立下“軍令狀”吹響“集結號” 優(yōu)化營商環(huán)境 強化政策落實 持續(xù)做好服務
宋 PLUS DM-i漲價還減配?還是哈弗梟龍MAX超高性價比香 全球熱門
日本少子化問題或致200多所大學因缺生源倒閉-環(huán)球熱消息
全球微動態(tài)丨iOS 17.0 beta 2 即將上線,準備好了嗎?
“愛回家”助力72名學生家長返繁就業(yè)創(chuàng)業(yè)
通訊!全省“一泓清水入黃河”專題推進會議暨第一次專班視頻調(diào)度會議召開
驪住集團總裁瀨戶欣哉:不斷為中國市場引入資源以抓住廣袤機遇與增長空間
那英當了5年好聲音導師,只捧紅了她,她卻不承認那英是自己導師
淮濱:法治校長進校園 情暖端午“警”相隨 環(huán)球熱資訊
緊急提醒!昆明一家10人食用,9人中毒!這些山上自采食材千萬別吃
波神入綠凱登全美第1熱搜!美記曬數(shù)據(jù)贊史總妙手:布朗坐等2.95億
外媒:土耳其將最低工資再提高34%應對高通脹 去年已提高1倍


