Study.log/AI 2

강화학습 기초 개념 총정리

강화학습이란 무엇인가?환경과의 상호작용을 통해 보상을 최대화하도록 학습하는 머신러닝 방법 더 쉽게 정리하자면, 스스로 실수를 통해 학습하며 점점 더 똑똑해지는 학습 방식 지도학습과 어떤 차이가 있는가?지도학습 : 정답이 주어져 있고 그 정답을 맞히는 방향으로 학습강화학습 : 정답 없이 시행착오를 거치며 보상을 최대화하는 방향으로 스스로 학습 가장 큰 차이점 : 정답의 유무 강화학습의 주요 키워드환경 : 에이전트가 상호작용하는 세계에이전트 : 행동을 결정하는 주체상태 : 현재 환경의 정보행동 : 에이전트가 취하는 행위보상 : 행동의 결과로 주어지는 점수나 신호정책 : 어떤 상태에서 어떤 행동을 할지 결정하는 전략 강화학습의 예시알파고자율주행차게임 AI등등 https://www.youtube.com/wa..

Study.log/AI 2025.08.01

머신러닝 기초 개념 총정리: 데이터, 변수, 지도·비지도학습

표와 행 / 열표는 데이터 세트이다.행과 열은 표를 구성하는 기본적인 구조이며행은 개체 instance, 관측치 observed value, 기록 record, 사례 example, 경우 case열은 특성 feature, 속성 attribute, 변수 variable=field라고도 한다. 독립변수와 종속변수독립변수 : 원인이 되는 것종속변수 : 원인으로 인해 결과가 되는 것 각 열이 원인과 결과의 관계에 있을 때 그 둘을 인과관계에 있다고 한다.또한 상관관계 안에 인과관계가 존재한다. 지도학습과 비지도학습지도학습 정의 : 정답이 없는 데이터를 사용해서 입력과 출력 간의 관계를 학습하는 머신러닝 방법목적 : 과거 데이터를 학습해서, 새로운 입력값에 대한 출력(결과)를 예측하기 위해 사용 하위 개념회귀 :..

Study.log/AI 2025.07.31