Codeit Sprint/Weekly_Paper

위클리 페이퍼 #11 - 지도학습과 비지도 학습

ko_sick 2024. 10. 18. 21:15

위클리 페이퍼 #12의 주제중 하나인 지도학습과 비지도 학습에 관한이야기 입니다. 

 

우선 머신러닝에 대해서 알고 있어야하는데, Machine Learning "데이터를 이용해 컴퓨터를 학습시키는 방법론"으로써 크게 알고리즘은 3가지로 나눌수 있습니다. 지도 학습(Supervised Learning), 비지도 학습(Unsupervised Learning), 강화 학습(Reinforcement Learning)으로 지도 학습과 비지도 학습에 대한 이야기를 다루도록 하겠습니다.

 

지도 학습(Supervised Learning)

- 데이터에 레이블(Label)이 주어진 상태에서 컴퓨터를 학습 시키는 방법으로, 쉽게 표현하자면 문제와 답이 주어진 상황이라고 이해를 하면 쉽겠습니다. 데이터셋이 주어지고, 그 해당 데이터셋에 맞는 정답이 존재하는 형태 입니다. 결과값의 형태에 따라서 사용하게 되는 모델링이 달라지게 됩니다.

 

- 연속성을 띄는 결과값인 경우 Regression(회귀)와 관련된 모델을 이용해야 합니다. 예를 들어. 다음달의 시험에서 맞을 점수는? 아파트의 가격이 2억인데 다음달에는 2억 일것인가? 2억 1천만원 일것인가?와 같이 범주형의 예측이 아닌, 연속값인 경우에 회귀 모델을 이용해서 예측해야 합니다.

 

- 이산값을 띄는 결과값인 경우에 Classifcation(분류)와 관련된 모델을 이용해서 예측해야 합니다. 아래 이미지 분류와 같이 CNN(Convolution Neural Network)를 이용해서 분류문제를 해결하는 방법을 이용해야 합니다.

분류 문제 예시

 

비지도 학습(Unsupervised Learning)

데이터에 대한 레이블이 정답이 주어지지않은 상태에서 컴퓨터를 학습시키는 방법론으로, 데이터에 대한 명시적인 정답이 없이 데이터만 이용하여 학습을 진행하는 방법으로, 데이터의 무작위로 분포되어있을때, 특정한 특성을 지닌 부류로 묶는 비지도 학습의 일종인 클러스터링 알고리즘이 대표적으로 있습니다. 

 

 

클러스터링 알고리즘 예시

 

비지도 학습을 통해서 데이터의 숨겨진 특징(Feature)혹은 구조를 발견할때 사용되고, 그외에도 뉴스기사 데이터를 통해서 카테고리 파악등의 레이블이 주어지지않은 데이터를 학습 할 때 사용되는 방법입니다.

 

 

 

 

자료 출처 : https://brunch.co.kr/@aischool/2

자료 출처 : https://hunkim.github.io/ml/