모비율의 추정
모비율: 모집단에서 어떤 특성을 갖는 집단의 비율
종류
1. 점추정
확률변수 X:
n개의 표본에서 특정 속성을 갖는 표본의 개수
모비율 𝑝의 점추정량
$\hat𝑝 = \frac{X}{n}$
예제
대학교 1 학년생의 흡연율을 조사하기 위해 150 명을 랜덤하게 선택하여 흡연여부를 조사하였다 . 이 중 48 명이 흡연을 하고 있었다 . 이 대학교 1 학년생의 흡연율의 평균을 점추정하시오 .
𝑛 = 150 , 𝑋 = 48
$\hat𝑝 = \frac{𝑋}{𝑛} = \frac{48}{150} = 0.32$
평균흡연율을 32% 로 추정됨
2. 구간추정
𝑛이 충분히 클 때,
$n \hat p > 5, n(1 - \hat p) > 5$ 일 때를 의미
X~N(np, np(1 - p))
확률변수 X의 표준화
$Z = \frac{X - np}{\sqrt{n\hat p(1-\hat p)}}=\frac{\hat p - p}{\sqrt{\frac{\hat p(1-\hat p)}{n}}}$
근사적으로 표준정규분포 N(0, 1)을 따른다.
$P(|Z| <= Z_{a/2}) = 1 - a$
$P(-Z_{a/2} <= Z <= Z_{a/2}) = P(-Z_{a/2} <= \frac{\hat p - p}{\sqrt{\frac{\hat p(1-\hat p)}{n}}} <= Z_{a/2})$
$= P(\hat p - Z_{a/2}\sqrt{\frac{\hat p(1-\hat p)}{n}}<= p <= \hat p + Z_{a/2}\sqrt{\frac{\hat p(1-\hat p)}{n}}) = 1 - a$
모비율 p의 100(1-a)% 신뢰구간(confidence interval)
$(\hat p - Z_{a/2}\sqrt{\frac{\hat p(1-\hat p)}{n}}, \hat p + Z_{a/2}\sqrt{\frac{\hat p(1-\hat p)}{n}})$
예제
대학교 1 학년생의 흡연율을 조사하기 위해 150 명을 랜덤하게 선택하여 흡연여부를 조사하였다. 이 중 48 명이 흡연을 하고 있었다.
흡연율 𝑝 의 95 % 신뢰구간 (confidence interval) 을 구하시오
$a = 0.05, z_{a/2}=z_{0.025}=1.96, \hat p = \frac{48}{150} = 0.32$
- $\hat p - Z_{a/2}\sqrt{\frac{\hat p(1-\hat p)}{n}}<= p <= \hat p + Z_{a/2}\sqrt{\frac{\hat p(1-\hat p)}{n}}$
$\sqrt{\frac{\hat p(1 - \hat p)}{n}} = \sqrt{\frac{(0.32)(0.68)}{150}}=0.038$
$\hat p - Z_{a/2}\sqrt{\frac{\hat p(1-\hat p)}{n}} = 0.32 - (1.96)(0.038) = 0.245$
$\hat p + Z_{a/2}\sqrt{\frac{\hat p(1-\hat p)}{n}} = 0.32 + (1.96)(0.038) = 0.395$
95% 신뢰구간:
$(0.245, 0.395)$
import numpy as np
x=48
n=150
phat = x / n
alpha=0.05
zalpha = scipy.stats.norm.ppf (1 - alpha/2)
sd = np.sqrt (phat*(1 - phat)/n)
print("phat %.3f, zalpha : %.3f, sd : %.3f"%(phat, zalpha , sd ))
ci = [phat - zalpha * sd , phat + zalpha * sd ]
print(ci)
// phat 0.320, zalpha : 1.960, sd : 0.038
// [0.24534963990338954, 0.3946503600966105]
Notice
코드에 대해 좀 더 궁금하신 분들은 아래 링크를 참고해 주세요.
https://gist.github.com/KrGil/39eae24c21aa5cffc4ecaf915c3a9e80
'CS > AI' 카테고리의 다른 글
[AI] 석사 1학기 수강 후기 (0) | 2023.06.16 |
---|---|
[AI] 모평균 (0) | 2023.06.07 |
[AI] 확률 (0) | 2023.05.08 |
[AI]선형변환(linear_transformation) (0) | 2023.04.11 |
[AI] LU 분해(scipy.linalg.lu()) (0) | 2023.03.30 |