本發(fā)明公開了一種基于空間變換的自然場(chǎng)景下文本識(shí)別方法,首先對(duì)訓(xùn)練圖像集中的文本圖像,獲取圖像的文本內(nèi)容,并訓(xùn)練基準(zhǔn)點(diǎn)定位網(wǎng)絡(luò)、圖像預(yù)處理網(wǎng)絡(luò)、圖像編碼器網(wǎng)絡(luò)以及特征解碼器網(wǎng)絡(luò)等網(wǎng)絡(luò)模型;然后利用訓(xùn)練得到的網(wǎng)絡(luò)模型對(duì)待識(shí)別圖像集中圖像進(jìn)行空間變換,得到變換后的待識(shí)別圖像;然后計(jì)算變換后的待識(shí)別圖像的特征向量以及預(yù)測(cè)概率序列,最終獲取圖像識(shí)別的結(jié)果。本發(fā)明方法文本識(shí)別準(zhǔn)確率高,且能夠克服文本排列不規(guī)則等不利因素的影響。
試用
掃碼關(guān)注,查看更多科技成果