搜索结果 - 《计算机应用研究》编辑部官方网站

根据国家网信办相关规定和要求，《计算机应用研究》编辑部网站域名更换为arocmag.cn，原域名 arocmag.com 自2025年1月1日起自动跳转到新域名。

了解更多

搜索结果

搜索刘健共有 1 个结果

1

DPC-DQRL:动态行为克隆约束的离线-在线双Q值强化学习

DPC-DQRL: offline to online double Q value reinforcement learning with dynamic behavior cloning constraints

闫雷鸣

刘健

朱永昕

深度强化学习

离线-在线强化学习

动态策略约束

Q值估计

2025年第4期 : 1003-1010 doi:10.19734/j.issn.1001-3695.2024.09.0338