Reinforcement_Learning1 [1] 기본 용어 정리 [강화학습] 수업 요약created: 2026-03-12last modified: 2026-03-12(앞으로 배울 것..)MDP > Planning > RL(value function) > RL(Policy) > RL(model) ? Reinforcement Learning의 용어들은, 일반적으로 쓰는 단어의 뜻과 다른 부분이 있다.따라서 해당 용어들을 아래에서 엄밀하게 정의한다.AgentEnvironmentActionStateRewardReturnHistoryStateObservationPolicyValueModel 1. Reinforcement Learning (강화학습) 강화학습의 기본 개념은 Agent와 Environment의 상호작용에서 시작한다. Agent가 Environment 속에서 Ac.. 2026. 3. 12. 이전 1 다음