提出了無線緩存網絡中的一種新穎的資源調度方法。無線緩存是當前無線通信領域的一個研究熱點,使用無線緩存技術可以節約基站的資源消耗,從而有望提升系統整體吞吐量并降低移動通信的資費。資源調度是發掘無線緩存網絡性能的關鍵,同時也是設計的難點。 在研究過程中,他們發現在有限的文件生命周期內,無線緩存網絡中的資源調度是一個復雜的動態規劃問題,很難直接求解。在王銳老師的幫助下,兩位同學把復雜的動態規劃問題與馬爾科夫決策過程問題相類比,并利用強化學習方法解決了這一問題。