本軟件主要功能是版面對象(文字、表格、公式、圖形等)的自動識別,包括版面分割、樣式識別、表格識別、公式識別、圖形解析、文字識別與元數據抽取等。可用于數字內容制作(如點讀書熱區檢測)、文件格式轉換(如PDF到EPub)、表單識別與金融文檔處理、數學公式識別與結構化拷貝、題庫構建與試題檢索、漫畫制作與檢索等。目前支持圖像、PS、PDF、Word、EPub、網頁等文件格式,支持圖書、論文、證券研究報告、試題、表單類數據等。
本產品可應用于數字出版、金融科技、電子書、題庫、在線教育、咨詢、動漫等領域的內容加工與信息挖掘。
有關方法和軟件已經開發近15年,不斷進行更新,并已在多個行業與公司實際應用。
掃碼關注,查看更多科技成果