基于 HMM 和決策樹的阿拉伯語光學字母識別方法
本發明公開了一種阿拉伯語光學字母識別方法,包括以下步驟: 接收包含阿拉伯語文本的輸入圖像,通過檢測所述輸入圖像中每個讀 音符號的邊界框、并將其坐標與文本主體的邊界框坐標比較去除所有 讀音符號,將每個輸入圖像劃分為四層,并對所述四層執行特征提取, 將特征提取的結果輸入隱馬爾可夫模型,以生成表示每個阿拉伯語字 母的隱馬爾可夫模型,對生成的表示每個阿拉伯語字母的隱馬爾可夫 模型進行迭代訓練,直至滿足似然比準則為止,將迭代訓練后的隱馬 爾可夫模型輸入決策樹,以預測讀音符號的位置和類別,并生成最終 識別結果。本發明能夠利用阿拉伯語的書寫特性使識別任務更簡單, 并具有較高的識別精度。
華中科技大學
2021-04-11