本發明公開了一種阿拉伯語光學字母識別方法,包括以下步驟:接收包含阿拉伯語文本的輸入圖像,通過檢測所述輸入圖像中每個讀音符號的邊界框、并將其坐標與文本主體的邊界框坐標比較去除所有讀音符號,將每個輸入圖像劃分為四層,并對所述四層執行特征提取,將特征提取的結果輸入隱馬爾可夫模型,以生成表示每個阿拉伯語字母的隱馬爾可夫模型,對生成的表示每個阿拉伯語字母的隱馬爾可夫模型進行迭代訓練,直至滿足似然比準則為止,將迭代訓練后的隱馬爾可夫模型輸入決策樹,以預測讀音符號的位置和類別,并生成最終識別結果。本發明能夠利用阿拉伯語的書寫特性使識別任務更簡單,并具有較高的識別精度。
未應用
掃碼關注,查看更多科技成果