对于有模型强化学习,下列说法正确的是? ( ) 选项: A:有模型强化学习是一类依赖于环境模型(状态转移概率和奖励函数)的强化学习算法 B:模型算法通过学习环境的模型来进行规划和决策。 C:常见的有模型学习算法包括动态规划、蒙特卡洛树搜索等。 D:常见的有模型强化学习算法包括Q-learning、SARSA等。 动态规划 通过学习 蒙特卡洛 发布时间:2024-04-01 10:13:54