지도학습(Supervised Learning)이란 말그대로 컴퓨터를 학습 시키는것이다.
즉, 특정 intput(x)값이랑 outpit(y)값이 있는 실제 데이터 를 가지고 컴퓨터에게 학습 시키는 방법이다
지도학습(Supervised Learning)에 세부 분류로는 Regression과 Classification이 있다
1. Regression
regression은 결과값(output=y)을 연속적인값(continuous)을가진다
즉, 주어진 input변수를 output변수에 대응시키는 어떤 연속함수를 찾는 과정이 바로 Regression이다
간단한 예를들자면 몇시간을 일하면 얼마의 돈을받는 추정하는 문제가 있다
INPUT(X) | OUTPUT(Y) |
1 | 10000 |
2 | 20000 |
3 | 30000 |
1시간에 1만원, 2시간에 2만원, 3시간에 3만원 을 받는 데이터 셋이 있다
여기서 시간은 input(x)값이고 시간당받는돈은 output(y)값이다 여기서 돈은 연속된 값을 가지고 있어서 Regression문제이다.
예를들어 4시간을 일하면 얼마받을수있어? 위에있는 데이터 셋으로 학습한 컴퓨터에게 물어보면 컴퓨터가 돈(예측값) 예측을 할 수 있다
2.Classification
classification은 주어진 input변수가 어느 discrete category에 속하는지 찾아내는 것이다
예를들면 종양이 양성인지 악성인지 진단하는 문제가 있다. 0 이면 양성 1 이면 악성
이번에도 위에 regression문제처럼 사전에 조사한 종양의 크기 그 종양의 진단 결과 악성/양성 정보를 이용하므로
악성/양성으로 input(x)가 악성/양성 어디에 속해야하는지 알아야 하므로 classification(분류)문제이다
다른 예를들자면 이 내용이 스팸이아니야(정답 label input data)주고 이글은 스팸이야 (정답 label) 하고 다음 에 예측할때 이글은 스팸이야? 라고하면 예(1) 아니면 아니요(0) 만 정답이 있는것이다.
요약
지도학습(Supervised Learning)은 정답이 주어진 상태(데이터 셋)에서 컴퓨터를 학습시키는 방법이다
Regression문제 결과 output은 연속적인값을 가지고 Classification(분류)는 이산값을 가진다.
머신러닝 공부를 시작하고 복습하려고 작성했어요 틀린게 있다면 말해주시면 감사합니다!!!
# 머신러닝 # 지도학습
'Machine Learning' 카테고리의 다른 글
Linear Regression (0) | 2019.08.02 |
---|
댓글