目前基于AI的圖像分析技術已經日趨完善,在人臉識別、車牌識別等場景的應用越來越廣泛,市場競爭也愈發激烈。本成果面向更復雜的場景:視頻分析。通過深度網絡學習視頻數據的時空特性,能夠捕捉視頻的動態信息并進行自動分析,達到不同應用的目標。目前在較難的視頻分析任務—手語翻譯上達到較為先進的水平。
通過該研究對基于AI的視頻時空特征有了較為深入的了解。可以應用在視頻監控中的行為識別(比如監控老人是否跌倒、部分場所可疑行為等)、動作識別(比如體育項目動作分析、體育運動自動教學等),醫學視頻數據分析(比如基于視頻的疾病預測)、動物行為分析(比如基于視頻的動物行為自動監測和分析)等任何需要借助視頻來分析目標動態特性的場景。該技術需要針對不同的應用場景進行深入定制優化,甚至需要重新設計算法。
小試
掃碼關注,查看更多科技成果