IT/AI-ML

[AI-ML] 지도학습 vs 비지도학습

Millennials 2021. 8. 13. 17:52

머신러닝(Machine Learning)은 특정 데이터(훈련 데이터Training Data)로부터 어떠한 규칙을 발견해내는 것이며,

그 규칙을 훈련데이터에 적용시켜 얻은 결과물과 다른 새로운 데이터(테스트 데이터Test Data)에 적용시켜 비슷한 결과물을 얻어내는 과정을 말한다. 

1. 지도학습


지도 학습(Supervised Learning)은 훈련 데이터(Training Data)로부터 하나의 함수를 유추해내기 위한 
기계 학습(Machine Learning)의 한 방법이다. - 위키백과

지도 학습 알고리즘

  • 선형 회귀(Linear Regression)
  • 로지스틱 회귀(Logistic Regression)
  • 서포트 벡터 머신(Support Vector Machine)
  • k-최근접 이웃(k-Nearest Neighbors)
  • 결정 트리(Decision Tree)
  • 앙상블(Ensemble)
  • 신경망(Neural Networks)

지도학습은 크게 분류(Classification)과 회귀(Regression)으로 나뉘어진다.

 

1-1) 분류(Classification)

훈련 데이터로부터 특정한 라벨들을 구별해내는 규칙을 배우는 것아 분류이다.

예) 사람의 키와 몸무게 등의 신체정보(X)와 비만여부(y)가 들어있는 훈련데이터를 통해 비만여부를 분류해내는 규칙(함수)를 발견해내는 것이다. 이를 통해 새로운 신체정보(x)가 들어왔을때 비만인지, 정상체중인지 등을 판단해내도록 하는 것이다.

 

1-2) 회귀(Regression)

훈련 데이터로부터 독립변수들(X)과 종속변수(y)를 설정하여 독립변수의 변화에 따른 종속변수의 변화식 즉 회귀식을 이끌어내는 것이다.

예) 서울부동산 정보가 들어있는 훈련 데이터셋에서 '집의 평수'와 '지하철역과의 거리'를 독립변수(X)로 '집의 가격'을 종속변수(y)로 설정하여, 독립변수의 변화에 따른 종속변수의 변화를 가장 잘 설명하는 회귀식을 만들어낸다. 그리고 이를 통해 새로운 집의 '집의 평수'와 '지하철역과의 거리' 독립변수 값을 알았을때, '집의 가격' 종속변수를 예측할 수 있게된다.

출처 : https://multicore-it.com/109

 


2. 비지도학습


비 지도 학습(Unsupervised Learning)은 기계 학습의 일종으로, 데이터가 어떻게 구성되었는지를 알아내는 문제의 범주에 속한다. 이 방법은 지도 학습(Supervised Learning) 혹은 강화 학습(Reinforcement Learning)과는 달리 입력값에 대한 목표치가 주어지지 않는다. - 위키백과

비지도 학습 알고리즘

 

클러스터링  

  • k-Means
  • DBSCAN
  • 계층 군집 분석
  • 이상치 탐지, 특이값 탐지

차원축소

  • 주성분 분석(PCA)
  • 커널 PCA
  • t-SNE

연관 규칙

  • Apriori
  • Eclat

비지도학습은 지도학습과 달리 학습데이터 셋 내에 라벨이 존재하지 않는다. 데이터 셋 내에 비슷한 값을 가지는 자료들을 군집화하는 규칙을 만들어낸다.

 

출처 : 제이앤테크 블로그 https://m.blog.naver.com/PostView.naver?isHttpsRedirect=true&blogId=jn-solution&logNo=221286682151

 

출처 : 코드스테이츠

 


 

반응형