Machine learning/Algorithms

Supervised learning(지도 학습) VS Unsupervised learning(비지도 학습)

Hannah_ko 2019. 6. 17. 16:41
SMALL

2019/06/17 - [Machine learning/Algorithms] - What is machine learning?

 

 

저번 포스팅에 이어 이번 포스팅에는 머신러닝의 두 가지 종류인

Supervised learning과 Unsupervised learning에 대해 작성해보려 한다.

 

 

 

지도학습이란,

머신러닝을 학습시킬 때 사용하는 데이터 셋의 각 데이터마다

정답이 표시되어 있는 학습방법을 말한다.

 

예를 들어, 사과 사진을 보여주고 "사과"라고 말해주는 것이다.

 

 

이 지도학습은 또 다시 두 가지로 나눌 수 있다.

분류(Classification)와 회귀(Regression) 이다.

 

 

 

분류(Classification)는 0 또는 1, 악성 또는 양성 등과 같이

불연속적인 값들을 예측하는 것이다.

 

강의에서 나온 예를 들어보도록 하겠다.

 

환자 나이와 종양 크기를 가지고 양성, 음성을 판별하는 간단한 머신러닝 예제이다.

위의 그래프에서는 양성과 음성을 나눌 수 있는 예측선을 그어 경계를 나눈다.

학습 데이터 이외의 특정 나이와 종양의 크기(보라색 점선)를 가지고

그 종양이 양성인지 음성인지를 경계면에 따라 구분하는 것이다.

 

이와 같이 분류는 여러 카테고리 중 어떤 카테고리에 속하는지를

확률로 예측하는 것이다.

 

 

 

분류와 다르게 회귀(Regression)

연속된 값을 가진 결과를 예측하는 것이다.

 

 

대표적인 예로는 주택 가격 예측이 있다.

위 그래프와 같이,

어떤 가격이나 크기 등 연속적인 값들을 그 확률을 예측하는 방법이 회귀이다.

회귀를 예측할 때는 직선으로 예측선을 그어도 되고 곡선으로 그어도 된다.

 

 

분류도 마찬가지이다.

예측선을 직선으로 할지, 곡선으로 할지는 알고리즘을 짤 때 고려해야하는 부분이다.

 

 

 

 


 

 

 

 

비지도학습이란,

지도학습과는 다르게 머신러닝을 학습시키는 데이터의

각각의 정답이 표시되어있지 않은 것이다.

이는 머신러닝이 직접 데이터들의 공통점이나 특징을 찾아 학습한다.

 

 

 

 

위 그래프와 같이,

데이터들 사이의 관계들을 기반으로 Clustering(군집)으로 나누는 것이다.

 

 

지도학습에 비해 비지도학습이 자주 사용되진 않지만,

고객 데이터 분석, 우주의 구성 분석, 유전자 분석 등 각 변수들 간 특성을 알지 못하는 경우

사용할 수 있다.

 

 

이는 다시 말해, Cluster algorigthm이라고도 한다.

 

 

 

 


Coursera, "Machine Learningby Stanford University", Andrew Ng

LIST