위클리페이퍼 4

위클리페이퍼 #12 - 모델학습에서의 편향과 분산

모델 학습(ML) 시 편향(bias)와 분산(Variance)은 중요한 오류 요소이다. 편향(Bias)이란?모델이 학습데이터를 단순화 하여 학습하는 정도를 의미한다. 편향이 높은 경우에 모델이 데이터를 충분히 설명하지 못하여, 일반화 성능이 떨어지는 '과소적합(underfitting)'상태가 될 수 있다. 추정 결과가 한 쪽으로 치우치는 경향을 보임에 따라서 발생하는 오차이다. 예를 들어, 선형 모델을 아주 복잡한 데이터에 적용한다면 데이터의 복잡성을 충분히 방영하지 못해 높은 편향을 나타낼수 있다.  분산(Variance)이란?분산은 모델이 학습 데이터의 노이즈에 민감하게 반응하여 학습된 정도를 나타내고 분산이 높은 경우에 모델이 학습 데이터에 과하게 맞춰져, 다른 유형의 데이터에 대해서 예측 정확도가..

위클리페이퍼 #9 - 상품/서비스에서 중요한 획득지표, 고객 생애 가치(LTV, LifeTime Value)

금주의 위클리페이퍼는 2가지의 주제이다.1. 원하는 제품/서비스를 하나 선택하여 해당 상품/서비스에서 가장 중요한 획득 지표는 무엇인지 설명해 주세요. 그 이유를 구체적으로 설명해 주세요. 2. 고객 생애 가치(LTV)를 계산하는 방법과 이 지표가 중요한 이유를 설명해 주세요. 예시를 포함해 주세요. 1. 특정 상품/서비스에서 가장 중요한 획득 지표는 무엇인가?스트리밍 서비스(넷플릭스, Spotify, YouTube Premium)를 기준으로 가장 중요한 획득 지표로는 가입자 수(Number of Subscribers)일 것입니다. 그에 해당하는 이유수익 창출 : 스트리밍 서비스의 주요 수익원은 구독료이기 때문에 가입자 수가 많을수록 수익이 증가하게 됩니다.시장 점유율 : 많은 가입자를 보유한다면, 동일..

위클리페이퍼 #7 - 장바구니분석, 지지도(Support), 신뢰도(Confidence), 향상도(Lift)

금주의 위클리 페이퍼의 주제는 2가지 이다. 1) 장바구니 분석의 다양한 활용 사례를 설명해 주세요. 각 사례에서 얻을 수 있는 비즈니스 인사이트는 무엇인지 구체적으로 설명해 주세요. 2) Support, Confidence, Lift 지표의 정의와 각 지표의 중요성을 설명해 주세요. 이 지표들을 해석하는 방법을 구체적인 예와 함께 설명해 주세요.  장바구니 분석장바구니 분석은 연관규칙분석과 동일한 의미로 비지도학습법중의 일정으로 항목들간의 연관규칙을 찾는데 이에 대한 항목은 상품 및 서비스 등이 해당된다. 활용 사례에 대해서 설명하고 각 사례에서 얻을수 있는 비즈니스 인사이트에 대해서 설명하겠습니다. 1. 제품 배치 최적화사례 : 슈퍼마켓에서 장바구니 분석을 통해 자주 함께 구매되는 제품을 파악한다.비..

위클리페이퍼 #5 - 절대 경로, 상대 경로, Git-branch

금주의 위클리 페이퍼의 주제는 2가지이다. 1) 절대 경로와 상대 경로는 무엇인가요?2) Git에서 branch는 무엇인가요? 절대 경로와 상대 경로파일 경로란 컴퓨터 시스템에서 파일의 위치를 나타내는 주소로, 앱, 시스템, 운영 체제가 필요한 파일을 찾을수 있도록 도와주는 것이다. 절대 경로란?파일의 root directory에서 부터 해당 파일까지의 전체 경로를 의미한다. 어디에서 출발하든 절대적으로 변하지 않는 경로를 뜻한다. 예를 들어서 Window OS의 기준으로 내문서에 위치한 hello.txt를 찾는다고 예시를 들어 보면 아래와 같은 주소를 사용 할 수 있다.C:\Users\Username\Documents\hello.txt 이와같이 hello.txt를 만나기전 경유한 directory를 모..