对于有模型强化学习,下列说法正确的是? ( )
选项:
A:有模型强化学习是一类依赖于环境模型(状态转移概率和奖励函数)的强化学习算法
B:模型算法通过学习环境的模型来进行规划和决策。
C:常见的有模型学习算法包括动态规划、蒙特卡洛树搜索等。
D:常见的有模型强化学习算法包括Q-learning、SARSA等。
发布时间:2024-06-11 01:47:45