-
Supervised learning(지도 학습) VS Unsupervised learning(비지도 학습)Machine learning/Algorithms 2019. 6. 17. 16:41SMALL
2019/06/17 - [Machine learning/Algorithms] - What is machine learning?
저번 포스팅에 이어 이번 포스팅에는 머신러닝의 두 가지 종류인
Supervised learning과 Unsupervised learning에 대해 작성해보려 한다.
지도학습이란,
머신러닝을 학습시킬 때 사용하는 데이터 셋의 각 데이터마다
정답이 표시되어 있는 학습방법을 말한다.
예를 들어, 사과 사진을 보여주고 "사과"라고 말해주는 것이다.
이 지도학습은 또 다시 두 가지로 나눌 수 있다.
분류(Classification)와 회귀(Regression) 이다.
분류(Classification)는 0 또는 1, 악성 또는 양성 등과 같이
불연속적인 값들을 예측하는 것이다.
강의에서 나온 예를 들어보도록 하겠다.
환자 나이와 종양 크기를 가지고 양성, 음성을 판별하는 간단한 머신러닝 예제이다.
위의 그래프에서는 양성과 음성을 나눌 수 있는 예측선을 그어 경계를 나눈다.
학습 데이터 이외의 특정 나이와 종양의 크기(보라색 점선)를 가지고
그 종양이 양성인지 음성인지를 경계면에 따라 구분하는 것이다.
이와 같이 분류는 여러 카테고리 중 어떤 카테고리에 속하는지를
확률로 예측하는 것이다.
분류와 다르게 회귀(Regression)는
연속된 값을 가진 결과를 예측하는 것이다.
대표적인 예로는 주택 가격 예측이 있다.
위 그래프와 같이,
어떤 가격이나 크기 등 연속적인 값들을 그 확률을 예측하는 방법이 회귀이다.
회귀를 예측할 때는 직선으로 예측선을 그어도 되고 곡선으로 그어도 된다.
분류도 마찬가지이다.
예측선을 직선으로 할지, 곡선으로 할지는 알고리즘을 짤 때 고려해야하는 부분이다.
비지도학습이란,
지도학습과는 다르게 머신러닝을 학습시키는 데이터의
각각의 정답이 표시되어있지 않은 것이다.
이는 머신러닝이 직접 데이터들의 공통점이나 특징을 찾아 학습한다.
위 그래프와 같이,
데이터들 사이의 관계들을 기반으로 Clustering(군집)으로 나누는 것이다.
지도학습에 비해 비지도학습이 자주 사용되진 않지만,
고객 데이터 분석, 우주의 구성 분석, 유전자 분석 등 각 변수들 간 특성을 알지 못하는 경우
사용할 수 있다.
이는 다시 말해, Cluster algorigthm이라고도 한다.
Coursera, "Machine Learningby Stanford University", Andrew Ng
LIST'Machine learning > Algorithms' 카테고리의 다른 글
SVM(Support Vector Machine) 서포트 벡터 머신 (0) 2020.11.28 Tree-based Machine Learning Models 트리 기반 모델 2 (0) 2020.11.12 Tree-based Machine Learning Models 트리 기반 모델 1 (0) 2020.11.11 통계학의 선형회귀분석과 머신러닝의 Ridge, Lasso 회귀 모델 비교 (0) 2020.11.10 What is machine learning? (0) 2019.06.17 댓글