본문 바로가기
Machine Learning

지도학습(Supervised Learning)

by 앵남(Andy) 2019. 8. 1.

지도학습(Supervised Learning)이란 말그대로 컴퓨터를 학습 시키는것이다. 

즉, 특정 intput(x)값이랑 outpit(y)값이 있는 실제 데이터 를 가지고 컴퓨터에게 학습 시키는 방법이다

지도학습(Supervised Learning)에 세부 분류로는 Regression과 Classification이 있다

 

1. Regression 

regression은 결과값(output=y)을 연속적인값(continuous)을가진다

즉, 주어진 input변수를 output변수에 대응시키는 어떤 연속함수를 찾는 과정이 바로 Regression이다

간단한 예를들자면 몇시간을 일하면 얼마의 돈을받는 추정하는 문제가 있다

INPUT(X) OUTPUT(Y)
1 10000
2 20000
3 30000

 1시간에 1만원, 2시간에 2만원, 3시간에 3만원 을 받는 데이터 셋이 있다 

여기서 시간은 input(x)값이고 시간당받는돈은 output(y)값이다  여기서 돈은 연속된 값을 가지고 있어서 Regression문제이다.

예를들어 4시간을 일하면 얼마받을수있어? 위에있는 데이터 셋으로 학습한 컴퓨터에게 물어보면 컴퓨터가 돈(예측값) 예측을 할 수 있다

 

2.Classification

classification은 주어진 input변수가 어느 discrete category에 속하는지 찾아내는 것이다

 

예를들면 종양이 양성인지 악성인지 진단하는 문제가 있다. 0 이면 양성 1 이면 악성 

이번에도 위에 regression문제처럼 사전에 조사한 종양의 크기 그 종양의 진단 결과 악성/양성 정보를 이용하므로

악성/양성으로 input(x)가 악성/양성 어디에 속해야하는지 알아야 하므로  classification(분류)문제이다

 

다른 예를들자면 이 내용이  스팸이아니야(정답 label input data)주고 이글은 스팸이야 (정답 label) 하고 다음 에 예측할때 이글은 스팸이야? 라고하면 예(1) 아니면 아니요(0) 만 정답이 있는것이다.

 

요약

지도학습(Supervised Learning)은 정답이 주어진 상태(데이터 셋)에서 컴퓨터를 학습시키는 방법이다

Regression문제 결과 output은 연속적인값을 가지고 Classification(분류)는 이산값을 가진다.

 

 

 

 

 

 

 

 

머신러닝 공부를 시작하고  복습하려고 작성했어요 틀린게 있다면 말해주시면 감사합니다!!!

# 머신러닝 # 지도학습

 

 

 

'Machine Learning' 카테고리의 다른 글

Linear Regression  (0) 2019.08.02

댓글