스프린터 2

위클리페이퍼 #12 - 모델학습에서의 편향과 분산

모델 학습(ML) 시 편향(bias)와 분산(Variance)은 중요한 오류 요소이다. 편향(Bias)이란?모델이 학습데이터를 단순화 하여 학습하는 정도를 의미한다. 편향이 높은 경우에 모델이 데이터를 충분히 설명하지 못하여, 일반화 성능이 떨어지는 '과소적합(underfitting)'상태가 될 수 있다. 추정 결과가 한 쪽으로 치우치는 경향을 보임에 따라서 발생하는 오차이다. 예를 들어, 선형 모델을 아주 복잡한 데이터에 적용한다면 데이터의 복잡성을 충분히 방영하지 못해 높은 편향을 나타낼수 있다.  분산(Variance)이란?분산은 모델이 학습 데이터의 노이즈에 민감하게 반응하여 학습된 정도를 나타내고 분산이 높은 경우에 모델이 학습 데이터에 과하게 맞춰져, 다른 유형의 데이터에 대해서 예측 정확도가..

위클리 페이퍼 #11 - 지도학습과 비지도 학습

위클리 페이퍼 #12의 주제중 하나인 지도학습과 비지도 학습에 관한이야기 입니다.  우선 머신러닝에 대해서 알고 있어야하는데, Machine Learning "데이터를 이용해 컴퓨터를 학습시키는 방법론"으로써 크게 알고리즘은 3가지로 나눌수 있습니다. 지도 학습(Supervised Learning), 비지도 학습(Unsupervised Learning), 강화 학습(Reinforcement Learning)으로 지도 학습과 비지도 학습에 대한 이야기를 다루도록 하겠습니다. 지도 학습(Supervised Learning)- 데이터에 레이블(Label)이 주어진 상태에서 컴퓨터를 학습 시키는 방법으로, 쉽게 표현하자면 문제와 답이 주어진 상황이라고 이해를 하면 쉽겠습니다. 데이터셋이 주어지고, 그 해당 데이..