多人姿態(tài)估計(jì)系統(tǒng)AlphaPose
由上海交通大學(xué)盧策吾團(tuán)隊(duì)開發(fā)的開源項(xiàng)目-AlphaPose,是一個(gè)多人姿態(tài)估計(jì)系統(tǒng),具有極高的精準(zhǔn)度。AlphaPose 是基于騰訊優(yōu)圖和盧策吾團(tuán)隊(duì)在 ICCV 2017 上的分區(qū)域多人姿態(tài)識(shí)別算法(RMPE),該算法主要為了解決在人物檢測(cè)結(jié)果不準(zhǔn)的情況下進(jìn)行穩(wěn)定的多人姿態(tài)識(shí)別問題。AlphaPose 在姿態(tài)估計(jì)標(biāo)準(zhǔn)測(cè)試集 MSCOCO 上達(dá)到 72.3 mAP,是首個(gè)超過 70 mAP 的開源系統(tǒng), 比 Mask-RCNN 相對(duì)提高 8.2%,比 OpenPose(CMU)相對(duì)提高 17%。設(shè)計(jì)思路:綜合利用了對(duì)稱性空間遷移網(wǎng)絡(luò)(Symmetric Spatial Transformer Network)和單人姿態(tài)估計(jì)算法,從而擺脫了多人姿態(tài)識(shí)別任務(wù)對(duì)人物檢測(cè)準(zhǔn)確性的依賴,并且進(jìn)一步通過參數(shù)化的人物姿態(tài)表達(dá)對(duì)識(shí)別結(jié)果進(jìn)行了優(yōu)化。根據(jù)在公開數(shù)據(jù)集MPII上的測(cè)試結(jié)果,該算法相較CMU提出的OpenPose算法提升了1個(gè)百分點(diǎn),尤其是對(duì)手肘、手腕、膝蓋、腳踝等細(xì)小關(guān)鍵點(diǎn)的改善尤為明顯。應(yīng)用案例:視頻姿態(tài)跟蹤(Pose Tracking):為了匹配同一個(gè)人在不同幀中的姿態(tài),團(tuán)隊(duì)開源了一個(gè)高效的線上姿態(tài)跟蹤器(Pose Tracker)——Pose Flow。Pose Flow 是第一個(gè)在 PoseTrack Challenge 數(shù)據(jù)集上的 mAP 超過 60 (66.5 mAP) 、MOTA 超過50 (58.3 MOTA) 的線上開源姿態(tài)跟蹤器(Pose Tracker)。視覺副詞識(shí)別(Visual Adverb Recognition):團(tuán)隊(duì)提出對(duì)視覺副詞進(jìn)行研究,提供了新的 ADHA 數(shù)據(jù)集,以及一個(gè)基于該姿態(tài)估計(jì)系統(tǒng)的算法。
上海交通大學(xué)
2021-04-10