7.3.1 强化学习的基本概念

2025年08月08日
强化学习包含智能体、环境、状态、动作、奖励等基本概念。智能体在环境中采取动作,根据获得的奖励来调整策略。