在强化学习中,什么是探索-利用权衡? 选项: A: 平衡模型训练的复杂度和速度 B: 平衡模型对新动作的探索和已知动作的利用 C: 平衡模型对数据集的拟合程度和泛化能力 D: 平衡模型对输入特征的依赖程度 模型 数据集 复杂度 发布时间:2024-06-09 18:55:57