강화학습이란 무엇인가?환경과의 상호작용을 통해 보상을 최대화하도록 학습하는 머신러닝 방법 더 쉽게 정리하자면, 스스로 실수를 통해 학습하며 점점 더 똑똑해지는 학습 방식 지도학습과 어떤 차이가 있는가?지도학습 : 정답이 주어져 있고 그 정답을 맞히는 방향으로 학습강화학습 : 정답 없이 시행착오를 거치며 보상을 최대화하는 방향으로 스스로 학습 가장 큰 차이점 : 정답의 유무 강화학습의 주요 키워드환경 : 에이전트가 상호작용하는 세계에이전트 : 행동을 결정하는 주체상태 : 현재 환경의 정보행동 : 에이전트가 취하는 행위보상 : 행동의 결과로 주어지는 점수나 신호정책 : 어떤 상태에서 어떤 행동을 할지 결정하는 전략 강화학습의 예시알파고자율주행차게임 AI등등 https://www.youtube.com/wa..