本研究成果是基于 AI 的語音質量自動評估技術,通過引入檢索增強、質量對比學習、不確定性等方面的創新方法,顯著提升語音質量評測的可解釋性、準確性和實用性。在評測準確性方面,通過實驗驗證,基于檢索增強和質量對比學習的評測方法在多種語音數據集上的評測準確性均顯著高于傳統方法。在計算效率方面,優化算法以確保評測過程的高效性和實時性,保障了在保證高準確性的同時,實現高效的評測。在魯棒性方面,評估方法在不同類型和質量的語音數據上均表現出良好的魯棒性,適用于多種實際應用場景。兩項相關核心技術已申請專利并進入實審階段,確保了技術的原創性和獨特性。最近,在由 SLT 2024(IEEE Spoken Language TechnologyWorkshop 2024)主辦的 VoiceMOS2024 挑戰賽的多個賽道的比賽中取得了第一名。
該技術在語音助手、智能客服、等領域具有廣泛前景。有望為相關企業帶來顯著的經濟效益和市場競爭力。重點應用領域包括,1.在線教育系統:可以用于自動評估語音發音質量,提升學生的學習體驗和效果;2. 電信和呼叫中心客服系統:可以用于通話質量的自動監測,確保服務的QoS,增強企業的品牌形象和客戶忠誠度。3.與發音質量自動評估相關的其他領域。
非侵入式語音質量自動評估系統在技術進步和產業結構調整、優化、升級方面具有重要影響。該系統不僅可以推動語音技術的整體進步,還將通過提升用戶體驗、降低運營成本、支持新興產業發展等多方面的作用,促進相 關 產 業 的 升 級 和 優 化 。商業化前景廣闊,ROI高。
掃碼關注,查看更多科技成果