CS/AI

[AI] 모평균

뱅타 2023. 6. 7. 10:56

모평균 μ

모평균의 추정에 대해 정리해 보려고 합니다. 수업이 가면 갈수록 어려워지네요. 요즘들어 학창시절 수학 공부를 하지 않았던 저 자신이 후회되는 시간을 자주 갖는 듯 합니다. 뒤처진 만큼 꾸준히 해나가야할 듯 합니다.

국민대 인공지능수학 13주차 수업 자료를 바탕으로 작성되었습니다.

모평균의 추정

  • 모평균이 정규분포인 경우

    • 표본평균을 사용
      $$
      \overline{X} = \frac{X_1+X_2+\dots+X_n}{n}= \frac{\sum_{i=1}^{10}X_1}{n}
      $$

종류

1. 점추정

  • 표본평균이 점 추전값 (추정량)이 됨
import numpy as np
## 표본추출
samples = [9,4,0,8,1,3,7,8,4,2]
## 표본의 평균 = 모집단의 점추정 값
print(np.mean(samples))
// 4.6

2. 구간추정

  • 모평균 μ의 100(1 - α)% 신뢰구간(confidence interval)
    • (μ의 추정량(점추정값)) $±Z_{α/2}$ (추정량의 표전편차)
  • 정규분포에서 σ를 알 때
    • $(\overline{X} - Z_{a/2}\frac{σ}{\sqrt{n}}, \overline{X} + Z_{a/2}\frac{σ}{\sqrt{n}})$
    • 단점: 정규분포가 아니거나 표준편차(시그마: σ)가 알려져 있는 경우가 잘 없음
  • 표본의 크기가 클 때 중심극한 정리 사용
    • (μ의 추정량(점추정값)) $±Z_{α/2}$ (추정량의 표전편차)
    • $(\overline{X} - Z_{a/2}\frac{S}{\sqrt{n}}, \overline{X} + Z_{a/2}\frac{S}{\sqrt{n}})$
    • s: 표본표준편차

예제 1

한 학교의 남학생의 평균키를 추정하기 위해 36명의 표본으로 추출하여 평균키에 대한 95% 신뢰 구간을 구하려 한다. 표본평균이 $\overline{X}=173.6$ 이고 표본표준편차가 $s=3.6$일 때, 평균키에 대한 95% 신뢰 구간을 구하라.

신뢰구간: $95% = 100(1 - α)%$

α = 0.05

$\overline{X} = 173.6$

$Z_{a/2} = Z_{0.025}$ = 1.96

(1 - 0.025) = 0.975 => 정규분포표에서 0.975 찾으면 1.96이 나옴

$Z_{a/2}\frac{s}{\sqrt{n}} = 1.96*\frac{3.6}{\sqrt{36}} = 1.96 * \frac{3.6}{6} = 1.176$

95% 신뢰 구간

$(\overline{X} - Z_{a/2}\frac{S}{\sqrt{n}}, \overline{X} + Z_{a/2}\frac{S}{\sqrt{n}})$

$(173.6 - 1.176, 173.6 + 1.176) = (172.4, 174.8)$

(172.4, 174.8) 의미:

  • 36개의 표본을 100번을 뽑아 평균을 구했을 때 그 중 95번 정도는 172.4, 174.8 값 사이에 있을 것이다를 뜻합니다.

  • α 값이 0.05이기 때문에 5%의 확률로 모평균이 위의 값 안에 들어가지 않는다는 것을 의미합니다.

  • α 값을 더 작게 만들게 되면 신뢰구간의 간격이 벌어지게 된다는 것을 뜻합니다.

예제 2

어떤 농장에서 생산된 계란 30 개의 표본을 뽑았더니 그 무게가 아래와 같다.

w=[10.7, 11.7, 9.8, 11.4, 10.8, 9.9, 10.1, 8.8, 12.2, 11.0, 11.3, 11.1, 10.3, 10.0, 9.9, 11.1, 11.7, 11.5, 9.1, 10.3, 8.6, 12.1, 10.0, 13.0, 9.2, 9.8, 9.3, 9.4, 9.6, 9.2]

계란의 평균 무게에 대한 95% 신뢰 구간을 구하시오.

import scipy.stats
import math

w=[10.7, 11.7, 9.8, 11.4, 10.8, 9.9, 10.1, 8.8, 12.2, 11.0, 11.3, 11.1, 10.3, 10.0, 9.9, 11.1, 11.7, 11.5, 9.1, 10.3, 8.6, 12.1, 10.0, 13.0, 9.2, 9.8, 9.3, 9.4, 9.6, 9.2] 

xbar = np.mean(w)
sd = np.std(w, ddof=1)
print('평균: %.2f, 표준편차: %.2f' %(xbar, sd))

alpha = 0.05
zalpha = scipy.stats.norm.ppf(1-alpha/2)
print('zalpha: ', zalpha)

# Z_a/2 * s/sqrt(n) 
za = zalpha * sd / math.sqrt(30)

## 95% 신뢰구간
pre = xbar - za
pos = xbar + za

print(f'95% 신뢰구간: ({pre:.3f}, {pos:.3f})')

// 평균: 10.43, 표준편차: 1.11
// zalpha:  1.959963984540054
// 95% 신뢰구간: (10.033, 10.827)
728x90
반응형

'CS > AI' 카테고리의 다른 글

[AI] 석사 1학기 수강 후기  (0) 2023.06.16
[AI] 모비율  (0) 2023.06.12
[AI] 확률  (0) 2023.05.08
[AI]선형변환(linear_transformation)  (0) 2023.04.11
[AI] LU 분해(scipy.linalg.lu())  (0) 2023.03.30