Q-learning算法中,Q函数是
A: 奖励函数
B: 状态-动作值函数
C: 估值函数
D: 状态函数
发布时间:2024-06-30 17:13:15
以下文字与答案无关
提示:有些试题内容 显示不完整,文字错误 或者 答案显示错误等问题,这是由于我们在扫描录入过程中 机器识别错误导致,人工逐条矫正总有遗漏,所以恳请 广大网友理解。