一種基于圖注意力網絡的表格指標信息抽取方法
本發明屬于行業標準信息數字化技術領域,具體為一種基于圖注意力網絡的表格指標信息抽取方法。本發明包括:表格預處理;單元格信息編碼;鄰接列表分析;表格信息關聯分析;分類和指標信息計算;表格預處理是對表格進行圖網絡結構化處理,得到表格信息的圖網絡結構;然后分別對表格中單元格進行詞向量編碼和鄰接列表分析;鄰接列表分析包括在取得單元格的行鄰接列表和列鄰接列表后,結合詞向量編碼,得到同行或同列表單元格語義信息;表格信息關聯度分析包括表格信息關聯度分析和行列信息傳遞關系分析;分類和指標信息計算,使用線性分類器進行分類得到當前單元格的指標歸類結果。本發明效率更高,得到的表格指標信息更正確、更完整。
復旦大學
2021-01-12