7.3.2 Q学习算法

2025年08月08日
Q学习是一种无模型的强化学习算法,通过学习状态-动作值函数来找到最优策略。它在游戏AI、机器人控制等领域有广泛应用。