1. 痛點問題
本成果解決了多網多域數據整合中的信息抽取、數據格式不一致、數據冗余和信息密度低等問題。在互聯網數據、群智采集數據和結構化數據的匯聚過程中,存在數據來源多樣、格式復雜、信息抽取困難等問題,本系統通過高效的數據匯聚技術,將這些繁雜的數據轉化為結構化、高信息密度的數據,為基于圖譜的數據分析提供支撐。
2. 解決方案
技術核心包括命名實體識別、實體屬性抽取、實體對齊消歧、圖像識別、視頻處理等關鍵技術。預期產品/服務是一個面向多網多域的數據高效匯聚系統(MMODIS),它能夠將不同來源、不同格式的數據進行信息抽取和合理組織,并通過數據集成的思路進行去重和糾錯,最終形成知識圖譜雛形,為數據分析提供支持。
MMODIS系統體系結構圖
市場規模方面,隨著大數據和人工智能技術的發展,對于高效數據匯聚系統的需求日益增長。競爭情況方面,目前暫無成熟的一站式多網多域數據匯聚產品,本成果具有先發優勢。行業成熟度方面,數據匯聚和知識圖譜構建是當前信息技術領域的熱點,行業正處于快速發展階段。
發展現狀方面,MMODIS系統由清華大學軟件學院設計和開發,已具備一定的技術基礎和應用前景。未來規劃方面,系統將進一步優化算法,提升數據處理能力,并拓展應用場景。預期經濟效益方面,隨著系統應用的推廣,預計將帶來顯著的經濟效益,包括數據服務、分析咨詢等。
MMODIS系統在多網多域數據匯聚、信息抽取和知識圖譜構建方面具有深厚的技術積累和技術優勢,且具備良好的數據處理效率、準確性和用戶操作體驗。
掃碼關注,查看更多科技成果