공부/파이썬을 통한 기초통계학

Binomial distribution, 이항 분포

ko_sick 2025. 2. 19. 14:26

🤗 Binomial Distributuion
이항 분포에 대해서 알아보고, 파이썬을 통해서 간단한 예제 문제를 풀도록 하겠습니다.
파이썬 문제는 https://wikidocs.net/165587를 참고했습니다.

우선 먼저 문제를 보여드리도록 하겠습니다.

 

문제

파이썬으로 이항 분포Binomial distribution를 구현해보세요.

베이스라인의 code here 을 채우세요.

베이스라인

from scipy.stats import binom # scipy 패키지를 사용합니다. 
def pdf_binom(x, n, p):
    '''
    주어진 x, n, p 관한 이항 분포의 확률 값을 출력한다.
    '''
    prob = # code here
    print(f"P(X={x}; n={n}, p={p}) = {prob:.2f}")

Input

pdf_binom(x=3, n=10, p=0.3)

pdf_binom(x=7, n=10, p=0.7)

pdf_binom(x=50, n=100, p=0.1)

Output

CopyP(X=3; n=10, p=0.3) = 0.27

P(X=7; n=10, p=0.7) = 0.27

P(X=50; n=100, p=0.1) = 0.00

 

베이스라인(정답 - 더보기 클릭)

더보기
from scipy.stats import binom # scipy 패키지를 사용합니다.
def pdf_binom(x, n, p):
    '''
    주어진 x, n, p 관한 이항 분포의 확률 값을 출력한다.
    '''
    prob = binom.pmf(x, n, p)
    print(f"P(X={x}; n={n}, p={p}) = {prob:.2f}")

scipy.stats의 binom에 대한 설명은 https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.binom.html에 상세하게 설명되어져 있습니다.

 

이항 분포 완벽 분석: 평균, 분산, 그리고 모수 공간까지!

이전에서 다뤘던 내용중에 베르누이 분포가 (p가 성공일때, 실패는 1-p, 이때 확률은 고정된 상태) 1회 성공에 대한 성공/실패를 다루는 분포라면, 이항 분포(Binomial Distribution)은 베르누이를 n번의 시도로 확장해서 시행한것으로 볼 수 있다. 그에 대한 probability mass function의 형태는 다음과 같다.

 

$$f(x) = \binom{n}{k}p^{k}(1-p)^{n-k} \qquad \text{for} k \in \{0,1,\ldots,n\}, 0 \le p \le 1 $$

 

예를 들어서 50명에게 설문조사를 했을때, 대답을 몇명이 했는지에 대해서도 이항분포로 다뤄질수 있습니다.

핵심 요약

  1. 이항 분포의 이해: 이항 분포는 주어진 횟수(n)의 독립적인 시행에서 각각의 시행이 성공할 확률(p)을 가질 때, 특정 횟수(x)만큼 성공할 확률을 나타내는 분포입니다.
  2. 평균과 분산: 이항 분포의 평균은 np로, 분산은 np(1-p)로 계산됩니다.
  3. 모수 공간: 모수 공간은 모수가 의미 있는 값을 가질 수 있는 영역을 의미하며, 이항 분포에서는 n은 1보다 크거나 같은 정수, p는 0과 1 사이의 실수로 정의됩니다.

이항 분포 파헤치기

이항 분포는 우리 주변에서 흔히 찾아볼 수 있는 확률 분포 중 하나입니다. 예를 들어, 동전 던지기, 주사위 굴리기, 제품 검사 등 다양한 상황에서 이항 분포를 활용하여 확률을 계산할 수 있습니다.

이항 분포의 특징

  • 고정된 시행 횟수 (n): 이항 분포는 정해진 횟수의 독립적인 시행을 전제로 합니다.
  • 성공 확률 (p): 각 시행에서 성공할 확률은 동일하게 p로 주어집니다.
  • 이산 확률 분포: 이항 분포는 성공 횟수와 같은 이산적인 값을 가집니다.

이항 분포의 활용

이항 분포는 다음과 같은 분야에서 널리 활용됩니다.

  • 통계학: 가설 검정, 신뢰 구간 추정 등
  • 확률 모델링: 특정 사건 발생 확률 예측
  • 금융: 투자 수익률 분석, 위험 관리
  • 공학: 시스템 신뢰도 평가, 품질 관리

이항 분포 관련 추가 정보

  • 이항 분포의 확률 질량 함수: 이항 분포의 확률 질량 함수는 다음과 같이 정의됩니다.
  • 이항 분포의 누적 분포 함수: 이항 분포의 누적 분포 함수는 다음과 같이 정의됩니다.