1 / 51

표 본 분 포

7. 표 본 분 포. 1. 모집단분포와 표본분포. 2. 표본평균의 분포. 3. 정규모집단에 관련된 분포의 응용. 4. 표본비율의 분포. 1. 모집단분포와 표본분포. 모집단 분포와 확률표본의 의미 , 표본분포와 통계량에 대하여 알아본다. ▶. 모집단 분포 ( population distribution ) : 어떤 통계적 실험의 대상이 되는 모든 대상물인 모집단의 정보로부터 얻어지는 확률 분포. ▶. 모수 ( parameter ) : 모집단의 특성을 나타내는 수치

Download Presentation

표 본 분 포

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 7 표 본 분 포 1 모집단분포와 표본분포 2 표본평균의 분포 3 정규모집단에 관련된 분포의 응용 4 표본비율의 분포

  2. 1 모집단분포와 표본분포 모집단 분포와 확률표본의 의미, 표본분포와 통계량에 대하여 알아본다.

  3. 모집단 분포(population distribution) : 어떤 통계적 실험의 대상이 되는 모든 대상물인 모집단의 정보로부터 얻어지는 확률 분포 ▶ 모수(parameter) : 모집단의 특성을 나타내는 수치 모평균, 모분산, 모표준편차, 모비율, 모상관관계 • 대부분의 모집단 분포는 완전하게 알려진 것이 없으며, 따라서 모집단 분포의 • 정확한 중심의 위치나 산포도 등을 알 수 없다. • 모집단의 확률분포를 비롯한 특성을 알기 위하여 전수조사를 한다는 것은 • 경제적, 공간적 또는 시간적인 제약에 의하여 거의 불가능 표본을 선정

  4. ? 추 론 임의 추출 정보수집 어느 배터리 제조회사에서 특별한 모델의 cell phone에 사용될 새로운 배터리를 생산하고자 한다면, 이 회사에서 생산될 배터리의 수명이 어떠한 확률분포에 따르는지 알 수 없다. 따라서 몇 개의 배터리를 표본으로 추출하여 실제로 cell phone에 사용하여 얻은 배터리 수명에 대한 측정값을 구한다. 그러면 이러한 측정값들(표본)은 이 회사에서 생산될 배터리들의 확률분포(모집단 분포)로부터 추출된 표본을 구성하게 된다. 이때 앞으로 생산될 배터리의 수명은 갖는 알려지지 않은 확률분포 f(x)에 따른다.

  5. 확률표본(random sample) : 모집단을 형성하고 있는 모든 대상들이 선정될 가능성을 동등하게 부여하고, 객관적이고 임의적으로 각 대상을 선정한 표본 ▶ 통계량(statistics) : 표본으로 산출된 통계적인 양 표본평균, 표본분산, 표본표준편차, 표본비율, 표본상관관계 통계량은 표본을 어떻게 선정하느냐에 따라서 그 값이 다르게 나타난다. 즉, 동일한 모집단에서 동일한 크기의 표본을 선정하더라도 각 표본의 평균은 서로 다르게 나타남. • 통계량은 확률변수 • 통계량의 확률분포를 표본분포라 한다.

  6. 표 본 모집단 x3 x2 x4 x7 f(x):미지의 모집단 분포 m: 모평균 s2:모분산 x1 x5 x8 x9 x6 1 1 … x10 xn n n 1 1 n-1 n-1 x1:첫 번째 추출된 관찰값 X1 ∼ f(x) x2:두 번째 추출된 관찰값 X2 ∼ f(x) E(Xi) = m … Var(Xi) =s2 xn:n번째 추출된 관찰값 Xn ∼ f(x) n X = S Xi S2 = S (Xi – X )2 i = 1 n 관찰된 표본평균 : n x = S xi s2 = S (xi – x )2 i = 1 i = 1 표본평균 : n 관찰된 표본분산 : i = 1 표본분산 :

  7. 1 9 1 표 본 10 전체 배터리 수명 관찰된 표본평균 : x = S xi = 804.9 s2 = S (xi – 804.9 )2 = 5488.77 637 835 10 768 i = 1 f(x):미지의 모집단 분포 m: 모평균 s2:모분산 764 830 835 10 관찰된 표본분산 : 840 790 i = 1 840 910 생산된 10개의 배터리를 표본으로 추출하여 얻은 측정값 835  637  764  830  768  840  790  835  840  910 표본평균과 표본분산의 관찰값 = ? 예

  8. 2 표본평균의 분포 표본평균의 평균과 모평균, 표본평균의 분산과 모분산의 관계 그리고 중심극한정리에 의한 표본평균의 분포의 변화, 두 독립인 표본평균의 차에 대한 분포 등에 대하여 알아본다.

  9. 76 80 63  x1 x2 x x1 x2 x x1 x2 x 63 x1과x2그리고 x가 취할 수 있는 모든 경우 80 63 71.5 63 84 73.5 77 84 80.5 91 84 80 76 78.0 63 91 77.0 77 79 78.0 79 84 77 80 63 71.5 76 63 69.5 77 80 78.5 80 80 77 78.5 76 77 76.5 77 84 80.5 80 84 82.0 76 84 80.0 77 91 84.0 80 79 79.5 76 79 77.5 84 79 81.5 2개 80 80 80.0 76 80 78.0 84 80 82.0 80 84 82.0 76 84 80.0 84 84 84.0 x1 80 91 85.5 76 91 83.5 84 91 87.5 x2 63 76 69.5 63 77 70.0 79 80 79.5 63 63 63.0 63 84 73.5 79 84 81.5 63 77 70.0 63 79 71.0 79 91 85.0 63 84 73.5 63 80 71.5 80 84 82.0 63 79 71.0 63 84 73.5 80 91 85.5 x1 + x2 63 80 71.5 63 91 77.0 84 91 87.5 표본평균 : X = 2 ☞ 1) 표본평균과 모평균(비복원 추출)

  10. X의 평균: E(X) = 77.7 X의 분산: Var(X) = 31.3 X 의 확률분포와 확률히스토그램 x 63.0 69.5 70.0 71.0 71.5 73.5 76.5 77.0 77.5 78.0 78.5 확률 0.0222 0.0444 0.0444 0.0444 0.0889 0.0889 0.0222 0.0444 0.0222 0.0667 0.0444 x 79.5 80.0 80.5 81.5 82.0 83.5 84.0 85.0 85.5 87.5 계  확률 0.0444 0.0667 0.0444 0.0444 0.0889 0.0222 0.0444 0.0222 0.0444 0.0444  1.00

  11. 모집단의 확률분포 s2 N - n • n N - 1 = 70.41 10 - 2 = 31.3 = Var(X) • 2 10 - 1 • 표본평균의 평균과 모평균은 동일하다. • 표본평균의 분산 = s2 N - n • n N - 1 모평균 :m = E(X) = 77.7 모분산 :s2 = Var (X) = 70.41

  12. 76 80 63   x1 x2 63 76 77 79 80 84 91 63 x1과x2그리고 x가 취할 수 있는 모든 경우 91 84 79 63 63.0 69.5 70.0 71.0 71.5 73.5 77.0 84 77 0.04 0.02 0.02 0.02 0.04 0.04 0.02 80 76 69.5 76.0 76.5 77.5 78.0 80.0 83.5 0.02 0.01 0.01 0.01 0.02 0.02 0.01 77 70.0 76.5 77.0 78.0 78.5 80.5 84.0 2개 0.02 0.01 0.01 0.01 0.02 0.02 0.01 79 71.0 77.5 78.0 79.0 79.5 81.5 85.0 x1 0.02 0.01 0.01 0.01 0.02 0.02 0.01 x2 80 71.5 78.0 78.5 79.5 80.0 82.0 85.5 0.04 0.02 0.02 0.02 0.04 0.04 0.02 84 73.5 80.0 80.5 81.5 82.0 84.0 87.5 0.04 0.02 0.02 0.02 0.04 0.04 0.02 91 77.0 83.5 84.0 85.0 85.5 87.5 91.0 x1 + x2 X = 표본평균 : 0.02 0.01 0.01 0.01 0.02 0.02 0.01 2 x x 의 확률 ☞ 2) 표본평균과 모평균(복원 추출)

  13. X 의 확률분포와 확률히스토그램 x 63.0 69.5 70.0 71.0 71.5 73.5 76.0 76.5 77.0 77.5 78.0 78.5 확률 0.04 0.04 0.04 0.04 0.08 0.08 0.01 0.02 0.05 0.02 0.06 0.04 x 79.0 79.5 80.0 80.5 81.5 82.0 83.5 84.0 85.0 85.5 87.5 91.0 확률 0.01 0.04 0.08 0.04 0.04 0.08 0.02 0.06 0.02 0.04 0.04 0.01 s2 = s2 2 n X의 평균: E(X) = 77.7 X의 분산: Var(X) = 35.21 70.41 = 35.21 2 모분산 :s2= Var (X) = 70.41 • 표본평균의 평균과 모평균은 동일하다. • 표본평균의 분산 =

  14. 구 분 평 균 분 산 모집단 m s2 비복원추출인 경우 X m= E(X) s2 N - n • n N - 1 복원추출인 경우 X m= E(X) s2 n ☞ 3) 표본평균과 모평균의 비교 ⊙ 모평균 m와 모분산 s2을 갖는 크기 N인 모집단으로부터 크기 n인 확률표본을 추출할 경우 ※ N이 충분히 크면 비복원 추출과 복원 추출이 동일한 결과를 나타낸다. 특별한 언급이 없는 한 복원 추출인 경우를 다룬다.

  15. x1 + x2 표본평균 : X = 의 확률분포 ? 2 x1 x2 1 2 3 4 5 6 fX (x) (x1, x2)의 취하는 값 : (1, 1), (1, 2), …, (6, 6) 1 1/36 1/36 1/36 1/36 1/36 1/36 1/6 2 1/36 1/36 1/36 1/36 1/36 1/36 1/6 3 1/36 1/36 1/36 1/36 1/36 1/36 1/6 x1 + x2 x = 가 취하는 값 : 1, 1.5, 2, 2.5 3, 3.5 4, 4.5 5, 5.5, 6 4 1/36 1/36 1/36 1/36 1/36 1/36 1/6 2 5 1/36 1/36 1/36 1/36 1/36 1/36 1/6 6 1/36 1/36 1/36 1/36 1/36 1/36 1/6 fX (x) 1/6 1/6 1/6 1/6 1/6 1/6 1 ☞ 4) 중심극한정리에 의한 표본평균의 변화 주사위 2번 던지기 게임 (n=2인 경우) X1과 X2의 결합분포 X1과 X2가 취하는 값 :1, 2, 3, 4, 5, 6 2 P(X1 = x, X2 = y) = P(X1 = x)• P(X2 = y) 1

  16. 표본평균 X 의 확률분포 : 1 1.5 2 2.5 3 3.5 4 4.5 5 5.5 6 X 확률 0.028 0.056 0.083 0.111 0.139 0.166 0.139 0.111 0.083 0.056 0.028 표본 평균 모집단 E(X) = SxP(X=x) = 3.5 E(X2) = Sx2 P(X=x) = 13.7083 Var(X) = E(X2) – E(X)2 = 1.4583 모평균: m= (1+6)/2 = 3.5 모분산: s2= (62 -1)/12 = 2.9167 m = E(X) = 3.5, s2 = 2Var(X) = 2.9167

  17. 표본평균 X 의 확률분포 : x1 + x2+ x3 표본평균 : X = 의 확률분포 ? 3 X 1.00 1.33 1.67 2.00 2.33 2.67 3.00 3.33 확률 0.005 0.014 0.028 0.046 0.069 0.097 0.116 0.125 3.67 4.00 4.33 4.67 5.00 5.33 5.67 6.00 확률 0.125 0.116 0.097 0.069 0.046 0.028 0.014 0.005 m = E(X) = 3.5, s2 = 3Var(X) = 2.9167 X 주사위 3번 던지기 게임 (n=3인 경우)

  18. x1 + x2+ x3+ x4 표본평균 : 의 확률분포 ? X = 4 1.00 1.25 1.50 1.75 2.00 2.25 2.50 2.75 3.00 3.25 3.50 X 확률 0.001 0.003 0.008 0.015 0.027 0.043 0.062 0.080 0.097 0.108 0.113 3.75 4.00 4.25 4.50 4.75 5.00 5.25 5.50 5.75 6.00 확률 0.108 0.097 0.080 0.062 0.043 0.027 0.015 0.008 0.003 0.001 X x1 + x2+ x3+ x4 + x5 표본평균 : 의 확률분포 ? X = 5 1.0 1.2 1.4 1.6 1.8 2.0 2.2 2.4 2.6 2.8 3.0 3.2 3.4 X 확률 0.0001 0.0006 0.0019 0.0045 0.0090 0.0162 0.0264 0.0398 0.0541 0.0693 0.0838 0.0945 0.1002 3.6 3.8 4.0 4.2 4.4 4.6 4.8 5.0 5.2 5.4 5.6 5.8 6.0 확률 0.1002 0.0945 0.0838 0.0693 0.0541 0.039 0.0264 0.0162 0.0090 0.0045 0.0019 0.0006 0.0001 X 주사위 4번 던지기 게임 (n=4인 경우) 주사위 5번 던지기 게임 (n=5인 경우)

  19. ● 모집단분포와 크기에 따른 표본평균의 분포 비교 n이 커질수록 표본평균의 분포는 종모양에 가까워진다.

  20. ( ) n n n E(X) = E S Xi = S E(Xi) = Sm = (nm) = m i=1 i=1 i=1 1 1 1 1 1 1 1 1 1 n n n2 n2 n n n n n2 n n n ( ) Var(X) = Var S Xi = S Var(Xi) = Ss2 = (ns2) = i=1 i=1 i=1 S.D(X) = Var(X) = s s2 s2 n n n n X = S Xi의 평균과 분산 : i=1 f(x):미지의 모집단 분포 m: 모평균,s2:모분산 Xi ~ i.i.d. f(x) , i = 1, 2, 3, …, n E(Xi) = m, Var(Xi) =s2 크기 n인 표본 E(Xi) = m, Var(Xi) =s2 , i = 1, 2, 3, …, N 복원추출 ( ) ※중심극한정리에 의하여 미지의 모집단 분포f(x)에 대하여 X ~ Nm, . .

  21. X가 취할 수 있는 값들의 집합 : {1.5, 2, 2.5, 3, 3.5} X = 1.5 {X1 = 1, X2 = 2}, {X1 = 2, X2 = 1} X = 2 {X1 = 1, X2 = 3}, {X1 = 3, X2 = 1}, X = 2.5 {X1 = 1, X2 = 4}, {X1 = 2, X2 = 3}, {X1 = 3, X2 = 2}, {X1 = 4, X2 = 1} X = 3 {X1 = 2, X2 = 4}, {X1 = 4, X2 = 2} X = 3.5 {X1 = 3, X2 = 4}, {X1 = 4, X2 = 3} 모집단 분포가 다음과 같은 모집단으로부터 비복원추출에 의하여 크기 2인 확률표본 X1, X2에 대한 표본평균의 확률분포와 평균 그리고 분산 모집단 {1,2,3,4}에서 비복원추출에 의하여 크기 2인 확률표본을 뽑을 수 있는 모든 경우 : {1, 2}, {1, 3}, {1, 4}, {2, 1}, {2, 3}, {2, 4}, {3, 1}, {3, 2}, {3, 4}, {4, 1}, {4, 2}, {4, 3}

  22. 1 1 1 = 1.5 = 2 , i, j = 1, 2, 3, 4, i ≠ j 2.5 3 3.5 x • 4 3 12 확률 1/6 1/6 2/6 1/6 1/6 1.5 + 2 + (2.5)•2 + 3 + 3.5 E(X) = = 2.5 6 X의 확률분포 : 2.25 + 4 + (6.25)•2 + 9 + 12.25 E(X2 ) = = 6.67 6 Var(X) = E(X2) – E(X)2 = 0.417 비복원추출에 의하여 표본을 선정 P(X1 = i, X2 = j) = P(X1 = i)• P(X2 = j|X1 = i)

  23. 예제1의 모집단분포로부터 크기 10인 표본을 임의 추출하였을 때, (1) X의 평균과 분산 (2) X가 2.75이상 3.5이하일 근사확률 s2 10 X X m= 2.5,s2= = 0.125 (2) 표본평균의 근사분포 : X ~ N(2.5, 0.125) . . 2.75 – 2.5 3.5 – 2.5 ( ) P(2.75 ≤ X ≤ 3.5) = P ≤ X ≤ 0.354 0.354 = P(0.71 ≤ Z ≤ 2.82) = F(2.82) – F(0.71) = 0.9976 – 0.7611 = 0.2365 . . 모집단 분포 : (1) m = 2.5, s2 = 1.25, n = 10

  24. X = SXi ~ N(60, 0.4) 1 E(X) = m= 60, Var(X) =s2/10 = 0.4 10 0.4 0.4 58.5 – 60 61.5 – 60 ( ) (2) P(58.5 ≤ X ≤ 61.5) = P ≤ X ≤ = P(-2.37 ≤ Z ≤ 2.37) = 2[F(2.37) – 0.5] = 2(0.9911 – 0.5) = 0.9822 . . 확률분포가 N(60, 4)인 모집단에서 크기 10인 표본을 임의 추출하였을 때, (1) X의 확률분포, 평균과 분산 (2) X가 58.5이상 61.5이하일 확률 (1) X1, X2, …, X10 ~ i.i.d. N(60, 4)

  25. X – 68.3 ( ) P(X ≥ x0) = P ≥ ( ) = P Z ≥ = P(Z ≥ z0.05) = 0.05 = z0.05 = 1.645 ; x0 – 68.3 x0 – 68.3 x0 – 68.3 X – 68.3 ( ) P(X ≥ 69) = P ≥ = P(Z ≥ 0.57) = 1 - F(0.57) = 1 – 0.7157 = 0.2843 69 – 68.3 69 – 68.3 0.15 0.15 1.5 1.5 0.15 0.15 0.15 0.15 X – 68.3 ( ) P(X ≥ 69) = P ≥ = P(Z ≥ 1.81) = 1 - F(1.81) = 1 – 0.9649 = 0.0351 고교 3학년 학생 1,000명을 대상으로 수학 모의시험을 실시한 결과 평균 68.3이고 분산 1.5인 정규분포 (1) 임의로 한 명을 선정하였을 때, 이 학생이 69점 이상일 확률 (2) 10명을 임의로 선정하였을 때, 이 학생들의 평균 점수가 69점 이상일 확률 (3) 10명의 평균 점수가 상위 5%안에 들어가기 위한 최하 점수 (1) 임의로 선정한 학생의 점수 :X ∼ N(68.3, 1.5) (2) 10명의 평균점수 : X ~ N(68.3, 0.15) (3) z0.05 = 1.645이므로 x0 = 68.937 ; 69점이상

  26. Xi ~ N(m1, s1 ), i = 1, 2, …, n ; Yj ~ N(m2, s2 ), j = 1, 2, …, m ; 2 1 1 n m 2 n X = S Xi ~ N(m1, s1 /n) 2 i = 1 m Y = S Yj ~ N(m2, s2 /m) 2 j = 1 ( ) X – Y ~ N m1 - m2, 2 2 s1 2 s2 2 이면, s1 = s2= s2 + n m 1 1 ( ) + ( ) X – Y ~ N m1 - m2, s2 n m ☞ 5) 두 표본평균의 차에 대한 확률분포 X와 Y가 독립이므로

  27. 임의의 확률분포인 경우 Xi ~ f1(x) ; 평균 m1, 분산s1, i = 1, 2, …, n ; Yj ~ f2(x) ; 평균m2, 분산s2, j = 1, 2, …, m ; 2 2 1 1 n m n X = S Xi ~ N(m1, s1 /n) 2 . . i = 1 m Y = S Yj ~ N(m2, s2 /m) 2 . . j = 1 ( ) X – Y ~ N m1 - m2, . . 2 2 s1 2 s2 2 이면, s1 = s2= s2 + ( ) ( ) n m X – Y ~ N m1 - m2, s2 1 1 . . + n m X와 Y가 독립이므로

  28. 12.25 15.15 200 150 X – Y -22.5 22 - 22.5 0.4056 0.4056 ( ) P(X ≥ Y +22) = P(X - Y ≥ 22) = P ≥ X – Y ~ N(22.5, (0.405)2 ) = P(Z ≥ -1.23) = P(Z ≤ 1.23) = 0.8907 . . . . 남학생 200명과 여학생150명을 임의로 선정한 결과 남학생의 평균 몸무게가 여학생의 평균 몸무게보다22 kg이상 더 많을 근사확률 남학생의 평균 몸무게 :X 여학생의 평균 몸무게 : Y ( ) X ~ N 69.75, = N(69.75, (0.25)2 ) . . ( ) Y ~ N 47.25, = N(47.25, (0.318)2 ) . .

  29. 3 정규모집단에 관련된 분포의 응용 표본분산과 합동표본분산에 관련된 분포, 표본표준편차에 관련된 분포 그리고 두 표본분산의 비(ratio)에 관한 분포 등에 대하여 알아본다.

  30. X ~ N( m, s2/n) X - m ~ N(0, 1) Z = Z2 ~ c2(1) SZi ~ c2(n) , i = 1, 2, …, n n n n n SZi = S (Xi – m)2 = S[(Xi – X) + (X – m)]2 , Zi ~ i.i.d N(0, 1), i = 1, 2, …, n 2 2 i=1 i=1 i=1 i=1 n-1 n = S(Xi – X)2 + (X – m)2 s s s n n n s2 n-1 1 i=1 • n-1 s2 X – m 1 1 1 n n 2 ( ) = S(Xi – X)2 + s2 s2 s2 s2 i=1 X – m 2 ( ) = S2 + ☞ 1) 표본분산에 대한 확률분포

  31. n SZi ~ c2(n) 2 X – m ( ) 2 i=1 ~ c2(1) : 독립 모분산을 추정하기 위한 통계량 : E S2 = n-1 E(S2) = s2 n-1 n-1 n-1 V = S2 s n s2 s2 s2 S2 ~ c2(n-1) 카이제곱분포의 기대값 :

  32. 104 + 110 + 100 + 98 + 106 5 5 s2 = S(xi – 103.6)2 = =22.8 i=1 91.2 4•(22.8) 1 n-1 4 4 25 s2 V = S2 = = 3.648 정규모집단 N(m, 25)에서 추출된 크기 5인 확률표본 [104, 110, 100, 98, 106] (1) 카이제곱분포의 자유도를 구하고, 관찰된 통계량의 값 (2) S2이 (1)에서 구한 통계량의 값보다 클 근사확률 (1) 확률표본의 크기가 5이므로 카이제곱분포의 자유도는 4 표본평균 : x = = 103.6 표본분산 : 모분산이 25이므로 관찰된 통계량의 값 : (2) ==> 문제 이상!!

  33. 정규모집단 N(m, 25)에서 크기 5인 확률표본을 추출할 경우, • 표본분산 S2이 37.44 보다 클 확률은? • 표본분산 S2이 12보다 작을 확률은

  34. 1 n-1 n S2 = S (Xi – X )2 1 i = 1 독립 m S2 = S (Yj – Y )2 2 j = 1 n-1 1 1 s2 m-1 n+m-2 S2 ~ c2(n-1) , 1 m-1 S2 ~ c2(m-1) m n 2 s2 [ ] 합동표본분산(pooled sample variance) : S2 = S (Xi – X )2 + S (Yj – Y )2 p j = 1 i = 1 ☞ 2) 동일한 모분산을 갖는 두 모집단에 대한 합동표본분산 Xi ~ N(m1, s2) , i = 1, 2, …, n Yj ~ N(m2, s2) , j =1, 2, …, m

  35. n+m-2 1 1 m n S2 = S (Xi – X )2 + S (Yj – Y )2 s2 s2 s2 p j = 1 i = 1 m n + S (Yj – Y)2 = S (Xi – X)2 j=1 i=1 ~ c2(n+m-2) m-1 n-1 = S2 S2 + 2 1 s2 s2 n-1 m-1 1 1 1 • • m-1 n-1 s2 s2 n+m-2 합동표본분산의 확률분포 ⊙ 합동표본분산의 다른 표현 방법 : 2 2 2 Sp = [(n-1)S1 + (m-1)S2]

  36. 2 V = 8Sp / 25 ~ c2(8) 2 8Sp ( ) 2 P(Sp > 62.78) = P = P(V > 20.09) = 0.01 > 25 8•(62.78) 25 독립인 두 정규모집단 N(2, 25)와 N(5, 25)에서 각각 크기 5인 확률표본을 추출 P(Sp > 62.78) = ? 2 이므로

  37. Z V/r X - m ~ N(0, 1) , X - m n-1 X - m s s s n n n s2 = ~ t(n-1) n -1 S2 n -1 s2 S2 ~ c2(n-1) ☞ 3) 표본표준편차에 관련된 확률분포 Xi ~ N(m, s2) , i = 1, 2, …, n t- 분포의 정의 () 에 의하여 T =

  38. 예제 1에서 표본표준편차를 구하고, P(|X – m| < t0) = 0.99인 t0을 구하고, 표본평균의 관찰값 x를 이용하여 모평균 m의 범위를 구하여라. s2 = 22.8, s = 22.8 = 4.775 , 이고 이므로 X - m X - m X - m X - m = ~ t(4) = 1.135 4.775 5 한편, P(|T| < t0.005) = 0.99 ; t0.005 = 4.604 s s n n x = 103.6 |x – m| < 5.226 ; |103.6 – m| < 5.226 ; 98.374 < m < 108.828 예제 1에서 구하고자 하는 t0와 m의 범위 : t0 = t0.005• (1.135) = 4.604 •(1.135) = 5.226

  39. 1 1 n m n X = S Xi ~ N(m1, s1 /n) 2 i = 1 ( ) X - Y - (m1 – m2) X – Y ~ N m1 - m2, s2 m Y = S Yj ~ N(m2, s2 /m) 2 s (1/n) + (1/m) j = 1 ~ t(n + m – 2) n +m -2 X - Y - (m1 – m2) S2 n + m -2 p = s2 Sp (1/n) + (1/m) 1 1 + ( ) n m ☞ 4) 합동표본표준편차에 관련된 확률분포

  40. 0.254 1 1 1 1 + + 1 1 n n m m + 9 7 새로운 방법에 의한 평균 수명 :X예전 방식에 의한 평균 수명 :Y y = 58.84 x = 62.58 , s1 = S(xi – 62.58)2 = 2.30 s2 = S(yj – 58.84)2 = 3.76 2 2 sp• 2 2 sp = (8• s1 + 6•s2 ) = 2.926 , 2 = (1.71)•(0.504) = 0.862 합동표본분산 : = = 0.504 = 1 1 1 sp = 2.926 = 1.71 8 6 9 + 7 - 2 타이어 공정 방법 예전 방식과 새로운 방법에 의한 수명에 대한 예비실험 :평균수명이 동일하다 새로운 방법에 의하여 생산된 타이어가 예전 방식에 의하여 생산된 타이어에 비하여 평균수명이 1,518㎞이상 더 클 확률 (단위 : 1,000㎞)

  41. X - Y X - Y X - Y - (m1 – m2) = ~ t(14) Sp 0.862 0.862 (1/n) + (1/m) ( ) 1.518 P(X - Y ≥ 1.518) = P ≥ 0.862 = P(T ≥ 1.761) = 0.05 예비실험으로부터 두 모평균이 동일하다는 결론을 얻었으므로 mX – mY = 0 구하고자 하는 확률 :

  42. 1 n-1 n S2 = S (Xi – X )2 1 i = 1 독립 m S2 = S (Yj – Y )2 2 j = 1 n-1 1 s2 m-1 2 2 S1 / s1 (n-1) (n-1) S2 ~ c2(n-1) , 1 2 2 m-1 S1 / s1 S2 ~ c2(m-1) 2 2 (m-1) S2 / s2 ~ F(n-1, m-1) = 2 s2 2 2 S2 / s2 (m-1) ☞ 5) 두 표본분산의 비(ratio)에 관련된 확률분포

  43. 2 S1 / 1.2 ~ F(15, 19) 2 S2 / 1.0 2 2 2 S1 / 1.2 S1 / S2 0.05 = P = P > 2.23 = P(S1 / S2 > 2.676) 1.2 2 S2 / 1.0 2 2 남학생의 폐활량 ~ N(m1, 1.2) 여학생의 폐활량 ~ N(m2, 1.0) 남•여학생 각각 16명과 20명씩 임의로 추출할 경우, 추출된 남학생과 여학생의 폐활량의 분산의 비가 x0이상일 확률이 0.05일 때, x0 = ? 추출된 남학생의 표본분산 :S1 추출된 남학생의 표본분산 :S2 x0 = 2.676

  44. 표본비율(sample proportion) : 확률표본을 이루는 원소 수에 대한 특정한 성질을 갖는 원소 수의 비율(p) ∧ 모집단의 원소의 수 :N 표본의 원소 수 :n 모집단이나 표본 안에 어느 특정한 성질을 갖는 원소의 수 :x x x 모비율 : 표본비율 : ∧ p = p = N n 4 표본비율의 분포 ▶ 모비율(population proportion) : 모집단을 형성하고 있는 모든 원소 수에 대한 특정한 성질을 갖고 있는 원소 수의 비율 (p) ▶

  45. 1 ,표본의 i번째 성분이 특정 성질을 갖는 경우 0 ,그렇지 않은 경우 Xi = 1 n 표본에서 성공의 횟수 : X = X1 + X2 + … + Xn n X = S Xi ∧ p = 표본비율 : n i=1 ☞ 1) 표본비율에 관련된 확률분포

  46. X ~ N(np, np(1-p)) . . p(1-p) p(1-p) n n 특정한 성질을 갖는 성분의 수의 확률분포 : ( ) ∧ p ~ N p, 표본비율의 확률분포 : . . 4•3절로부터 X ~ B (n, p) E(X) = np, Var(X) = np(1-p) Xi ~ B(1, p), i = 1, 2, …, n E(Xi) = p, Var(Xi) = p(1-p) ∧ 표본비율의 평균 : E(p) = E(X/n) = p 표본비율의 분산 : Var(p) = Var(X/n) = ∧ 표본의 크기 n이 충분히 크다면, np > 5, n(1-p) > 5이면 중심극한정리에 의하여

  47. P(X ≥ 100) = P 49.595 49.595 X - 91 99.5 - 91 ≥ = P(Z ≥ 1.21) = 1 – 0.8869 = 0.1131 . . • 지난 선거에서 A후보자에 대한 지지도는 45.5%이었다. 이번에 보궐선거 실시 • 유권자 200명을 임의로 선정하여 조사한 결과 적어도 100명이 A후보자를 • 지지할 확률 • (2) A후보자에 대한 보궐선거 지지율이 45%와 46%사이일 확률 (1) A후보자를 지지하는 유권자의 수 :X n = 200, p = 0.455 np = 91, np(1-p) = 49.595 연속성수정에 의한 정규근사를 위하여 X ≈ N(91, 49.595)

  48. 0.45 – 0.455 p – 0.455 0.46 – 0.455 ≤ ≤ 0.035 0.035 0.035 (0.455)•(0.545) ∧ P(0.45 ≤ p ≤ 0.46) = P 200 ∧ p ~ N 0.455, = N(0.455, (0.035)2) . . = P(-0.14 ≤ Z ≤ 0.14) = 2(F(0.14) – 0.5) = 2(0.5557 -0.5) = 0.1114 . . ∧ p (2) 200명의 유권자에 대한 A후보자의 지지율 :

  49. ( ) ∧ p1 ~ N p1, . . ∧ ∧ p1 – p2 ~ N p1 – p2 , . . ( ) ∧ p2 ~ N p2, . . + p2(1-p2) p2(1-p2) p1(1-p1) p1(1-p1) p2(1-p2) p1(1-p1) m n n m m n ∧ ∧ (p1 – p2) – (p1 – p2) 표준화 ~ N(0, 1) . . + ☞ 2) 두 표본비율의 편차에 관련된 확률분포

  50. ∧ 0.15 – 0.18 (p1 – p2) – 0.18 ≤ ∧ ∧ 0.022 (p1 – p2) – 0.18 0.022 ~ N(0, 1) ∧ . . ∧ P(p1 – p2≤ 0.15) = P = 0.022 0.022 p2(1-p2) p1(1-p1) m n (0.54)•(0.46) (0.36)•(0.64) = P(Z ≤ -1.36) = 1 - F(1.36) = 1 – 0.9131 = 0.0869 + . . 1000 1000 = + 대한가족계획협회에서 1998년 7월 미혼인 남자 470명과 여자 619명을 조사결과 : 남자 254명과 여자 223명이 성인전용 극장의 허용을 지지 이 사실을 기초로, 올해 남자와 여자 각각 1,000명씩 조사할 경우, 지지율의 차가 15%이하로 줄어들 확률 남자의 지지율 :p1 =254/470=0.54 여자의 지지율 :p2 =223/619=0.36 지지율의 편차 : p1 – p2 = 0.54 – 0.36 = 0.18 남자와 여자 각각 1,000명씩 조사하므로 지지율의 차의 확률분포 :

More Related