CS/AI

[AI] 모비율

뱅타 2023. 6. 12. 09:25

모비율의 추정

모비율: 모집단에서 어떤 특성을 갖는 집단의 비율

종류

1. 점추정

  • 확률변수 X:

    n개의 표본에서 특정 속성을 갖는 표본의 개수

  • 모비율 𝑝의 점추정량

    $\hat𝑝 = \frac{X}{n}$

예제

대학교 1 학년생의 흡연율을 조사하기 위해 150 명을 랜덤하게 선택하여 흡연여부를 조사하였다 . 이 중 48 명이 흡연을 하고 있었다 . 이 대학교 1 학년생의 흡연율의 평균을 점추정하시오 .

𝑛 = 150 , 𝑋 = 48

$\hat𝑝 = \frac{𝑋}{𝑛} = \frac{48}{150} = 0.32$

평균흡연율을 32% 로 추정됨

2. 구간추정

  • 𝑛이 충분히 클 때,

    $n \hat p > 5, n(1 - \hat p) > 5$ 일 때를 의미

    X~N(np, np(1 - p))

  • 확률변수 X의 표준화

    $Z = \frac{X - np}{\sqrt{n\hat p(1-\hat p)}}=\frac{\hat p - p}{\sqrt{\frac{\hat p(1-\hat p)}{n}}}$

    근사적으로 표준정규분포 N(0, 1)을 따른다.

  • $P(|Z| <= Z_{a/2}) = 1 - a$

    $P(-Z_{a/2} <= Z <= Z_{a/2}) = P(-Z_{a/2} <= \frac{\hat p - p}{\sqrt{\frac{\hat p(1-\hat p)}{n}}} <= Z_{a/2})$

    $= P(\hat p - Z_{a/2}\sqrt{\frac{\hat p(1-\hat p)}{n}}<= p <= \hat p + Z_{a/2}\sqrt{\frac{\hat p(1-\hat p)}{n}}) = 1 - a$

  • 모비율 p의 100(1-a)% 신뢰구간(confidence interval)

    $(\hat p - Z_{a/2}\sqrt{\frac{\hat p(1-\hat p)}{n}}, \hat p + Z_{a/2}\sqrt{\frac{\hat p(1-\hat p)}{n}})$

예제

대학교 1 학년생의 흡연율을 조사하기 위해 150 명을 랜덤하게 선택하여 흡연여부를 조사하였다. 이 중 48 명이 흡연을 하고 있었다.

흡연율 𝑝 의 95 % 신뢰구간 (confidence interval) 을 구하시오

$a = 0.05, z_{a/2}=z_{0.025}=1.96, \hat p = \frac{48}{150} = 0.32$

  • $\hat p - Z_{a/2}\sqrt{\frac{\hat p(1-\hat p)}{n}}<= p <= \hat p + Z_{a/2}\sqrt{\frac{\hat p(1-\hat p)}{n}}$

$\sqrt{\frac{\hat p(1 - \hat p)}{n}} = \sqrt{\frac{(0.32)(0.68)}{150}}=0.038$

$\hat p - Z_{a/2}\sqrt{\frac{\hat p(1-\hat p)}{n}} = 0.32 - (1.96)(0.038) = 0.245$

$\hat p + Z_{a/2}\sqrt{\frac{\hat p(1-\hat p)}{n}} = 0.32 + (1.96)(0.038) = 0.395$

95% 신뢰구간:

$(0.245, 0.395)$

import numpy as np 
x=48 
n=150 

phat = x / n 
alpha=0.05 

zalpha = scipy.stats.norm.ppf (1 - alpha/2) 
sd = np.sqrt (phat*(1 - phat)/n) 
print("phat %.3f, zalpha : %.3f, sd : %.3f"%(phat, zalpha , sd )) 
ci = [phat - zalpha * sd , phat + zalpha * sd ] 
print(ci)

// phat 0.320, zalpha : 1.960, sd : 0.038
// [0.24534963990338954, 0.3946503600966105]

Notice

코드에 대해 좀 더 궁금하신 분들은 아래 링크를 참고해 주세요.

https://gist.github.com/KrGil/39eae24c21aa5cffc4ecaf915c3a9e80

728x90
반응형

'CS > AI' 카테고리의 다른 글

[AI] 석사 1학기 수강 후기  (0) 2023.06.16
[AI] 모평균  (0) 2023.06.07
[AI] 확률  (0) 2023.05.08
[AI]선형변환(linear_transformation)  (0) 2023.04.11
[AI] LU 분해(scipy.linalg.lu())  (0) 2023.03.30