강화학습1 [머신 러닝 교과서] 머신 러닝의 학습 방법 1. 머신 러닝 : 대량의 데이터 분석 및 규칙 유도하여 모델 생성 2. 머신 러닝의 종류 1) 지도 학습 : 레이블된 훈련 데이터 → 미래의 데이터 예측 분류 : 범주형 클래스 레이블 예측 - 이진 분류일 때, 음성/양성 클래스로 분류 - 결정 경계(decision boundary, 두 클래스를 구분할 수 있는 규칙) 학습 회귀 : 연속적인 출력 값 예측 - 예측 변수(특성)와 반응 변수(타깃)와의 관계 학습 - 데이터 포인트와 직선 사이의 거리가 최소 되는 직선 2) 강화 학습 : 환경과 상호작용 → 에이전트(시스템) 성능 향상 - 보상 함수를 이용한 피드백 (얼마나 행동이 좋은지 측정한 값) - 행동 수행 > 피드백 > 보상 최대화하여 행동 학습 3) 비지도 학습 : 레이블되지 않거나 구조를 알 수.. 2024. 3. 12. 이전 1 다음