已发表成果:
WOK 论文 30 篇;中文核心 6 篇;
Deep Q-Network with Predictive State Models in Partially Observable Domains
基于循环卷积神经网络的POMDP值迭代算法
计算机工程,1000-3428,2020-02-13.