結合模式識別及語音情感感知算法,開發了應用于移動平臺的語音情感識別系統,該技術具有自主知識產權。該系統能夠通過移動終端采集用戶的語音信號,經情感建模和識別算法處理后,實時感知用戶語音中包含的六種基本情感信息(高興、悲傷、驚訝、害怕、生氣、嫌惡)。系統特點:1、融合說話人無關和說話人相關兩種語音情感模型,用以彌補單一模型無法兼顧算法普適性和準確性的不足;2、具備在線及離線兩種工作模式,在線模式下,移動設備可以借助服務器獲得更為準確的識別結果,并且節省運算資源;3、對移動設備使用環境中的低采樣率與低信噪比環境作了針對性優化,保障了識別算法在一般環境下的魯棒性。
本系統基于北京航空航天大學模式識別與人工智能實驗室的多模型融合語音情感識別技術,在移動平臺上實現了對說話人情感表達的識別。其能夠對說話人相關和說話人無關情形進行相應優化,對于未在系統注冊的一般用戶,識別準確率為76%;對于已在系統注冊的用戶,識別準確率可達83%,屬于國內外領先水平。對于長度為2s的語音,本系統離線模式下識別時間小于0.5s,在線模式下識別時間小于0.2s。
掃碼關注,查看更多科技成果