1 / 19

분산분석

분산분석. 보일러열효율. 한국소비자원에서는 소비자에게 가정용 기름보일러에 관한 정보를 제공 하기 위해 우리나라 가정용 기름보일러 시장의 대부분을 점유하고 있는 A, B, C 세 회사의 제품을 9 개씩 무작위로 추출하여 열효율을 조사하였다 . 그 결과는 다음과 같다. 열효율은 실내온도와 배출가스온도와의 차이이며 차이가 작을 수록 열효율이 높다 . 세 회사 제품의 열효율에 차이가 있다고 할 수 있는가 ?. H 마트 진열효과실험. 전국적으로 점포를 가지고 있는 H 마트는 다양한 상표의 등산화와 함께

usoa
Download Presentation

분산분석

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 분산분석

  2. 보일러열효율 한국소비자원에서는 소비자에게 가정용 기름보일러에 관한 정보를 제공 하기 위해 우리나라 가정용 기름보일러 시장의 대부분을 점유하고 있는 A, B, C 세 회사의 제품을 9개씩 무작위로 추출하여 열효율을 조사하였다. 그 결과는 다음과 같다. 열효율은 실내온도와 배출가스온도와의 차이이며 차이가 작을 수록 열효율이 높다. 세 회사 제품의 열효율에 차이가 있다고 할 수 있는가?

  3. H마트 진열효과실험 전국적으로 점포를 가지고 있는 H마트는 다양한 상표의 등산화와 함께 중견 등산용품업체가 생산한 등산화에 자체 상표를 붙여 판매하고 있다. H마트 본사의 K부장은 등산화를 진열하는 방법이 매출에 영향을 주는가를 파악하기 위해 28개 점포를 선택하여 4가지 진열방법을 실험하였다. 28개의 점포를 임의로 4개 집단에 할당하고 각 집단별로 각각 A, B, C, D 방법으로 등산화를 진열하도록 지시하였다. 1개월 후 각 점포별로 등산화 매출에서 H마트 등상화가 차지하는 비율을 조사한 결과는 다음과 같다. B방법을 적절하게 실행하지 못한 한 점포의 자료는 생략하였다. 진열방법이 매출에 영향을 주는가?

  4. 분산분석 분산분석(分散分析, analysis of variance : ANOVA) 두 개 이상의 모집단 평균간의 차이를 검정하는 방법 cf.) 두 개의 모집단 평균간의 차이를 검정하는 방법 - Z검정, t검정 : 모집단(population)을 나타내는 첨자변수 ‘보일러열효율’에서는 3개의 보일러 제조회사가 생산한 보일러의 열효율의 차이를 검정하고자 한다. 즉 보일러 제조회사가 모집단을 구분하는 기준으로서의 역할을 하며, 각 모집단은 ‘A회사’, ‘B회사’, ‘C회사’ 등이다. [Q] ‘H마트 진열효과실험’에서는 몇 개의 모집단이 있는가? 각 모집단은 무엇인가? [Q] ‘H마트 진열효과실험’에서는 어떤 특성의 차이를 검정해야 하는가?

  5. mi/실험단위 : 모집단 i의 (비교하고자 하는 특성의) 평균 ‘보일러열효율’에서 mi는 제조회사 i가 생산한 보일러의 평균 열효율을 의미한다. [Q] ‘H마트 진열효과실험’에서 μi가 의미하는 바는? 실험단위(實驗單位, experimental unit) 관측 또는 측정이 이루어지는 단위를 실험단위라고 한다. ‘보일러열효율’에서는 보일러의 열효율을 측정하며 따라서 ‘보일러’가 실험단위이다. [Q] ‘H마트 진열방법실험’에서 실험단위는 무엇인가?

  6. 독립변수 독립변수(獨立變數, independent variable) 실험단위를 다수의 모집단으로 분류하는 기준 변수를 나타냄 명목척도나 순위척도로 정성적 변수이어야 함 독립변수는 ‘요인(要因, factor)’으로 부르기도 함 구분된 각 모집단은 ‘요인수준(要因水準, factor level)’이라고 부름 ‘보일러열효율’에서는 ‘제조회사’가 실험단위인 ‘보일러’를 분류하는 기준변수 즉 요인이며, 요인수준은 ‘A회사’, ‘B회사’, ‘C회사’ 등이다. [Q] ‘H마트 진열방법실험’에서 요인과 요인수준은 무엇인가?

  7. 종속변수 종속변수(從屬變數, dependent variable) 비교대상이 되는 변수 반응변수(反應變數, response variable)로 부르기도 함 반응변수의 값은 ‘반응(反應, response)’이라고 함 ‘보일러열효율’에서는 ‘보일러’의 ‘열효율’의 평균이 ‘제조회사’에 따라 다른가를 검토하며 따라서 비교대상이 되는 변수는 ‘열효율’이다. [Q] ‘H마트 진열방법실험’에서 반응변수는 무엇인가?

  8. 일원배치/이원배치/처리 일원배치분산분석(一元配置分散分析, oneway ANOVA) 요인이 하나인 경우 이원배치분산분석(二元配置分散分析, twoway ANOVA) 요인이 둘인 경우 처리(處理, treatment) 각 요인의 요인수준들의 조합 ‘보일러열효율’에서는 집단을 분류하는 기준변수로 ‘제조회사’1개가 사용되었다. 따라서 일원배치분산분석이 적용되어야 한다. [Q] ‘H마트 진열방법실험’에서는 요인이 몇 개인가?

  9. Oneway ANOVA의 자료구조 i : 요인수준(구분된 모집단) c : 요인수준(구분된 모집단)의 개수 k : 실험단위(관측 또는 측정이 이루어지는 단위) ni : 요인수준(모집단) i 에서 추출한 실험단위의 개수 = 표본i의 크기 nT : 전체 실험단위의 개수 = n1+n2+…+nc Xik : 요인수준(모집단) i 에서 추출한 실험단위 k 에 대한 반응변수의 측정결과 : 요인수준 i 에서 추출한 실험단위들 즉 표본i의 반응변수의 평균 : 전체의 반응변수의 평균 표본1 표본2 표본 c 실험단위 1 1 1 2 2 2 … … … … n1 n2 nc 여기서

  10. Oneway ANOVA의 자료구조 ‘보일러열효율’에서 요인수준1(‘A회사’)에서 추출한 실험단위1(첫 번째 ‘보일러’) 요인수준1(‘A회사’)에서 추출한 실험단위2(두 번째 ‘보일러’) 요인수준3(‘C회사’)에서 추출한 실험단위9(아홉 번째 ‘보일러’) 표본1(‘A회사’)의 반응변수의 평균 표본2(‘B회사’)의 반응변수의 평균 전체의 반응변수의 평균

  11. 모집단 1 모집단 2 모집단 c … 정규분포 정규분포 정규분포 표본1 1 1 1 표본2 표본 c 2 2 2 … … … … n1 n2 nc Oneway ANOVA의 가정 및 가설 ① 표본i는 평균 mi와 분산 si2의 정규분포인 모집단i에서 추출한 확률표본이다. ② s12,s22,…,sc2의 값은 모르지만 s12 =s22 =…=sc2 (=s2)이다. ③ 표본i, i=1,2,…,c는 서로 독립이다. ①,②,③을 가정(아래그림 참조)하고 우도비검정원리를 적용하면 이 아니다(적어도 한 모집단의 평균은 같지 않다). Hogg, McKean, and Craig 2003 pp.537~541 의 검정통계량, 기각영역, p값을 다음과 같이 구할 수 있다.

  12. Oneway ANOVA의 검정통계량 변동(제곱합) 자유도 평균변동(분산) 관측값F 변동의 원천 처리 오차 총변동 Oneway ANOVA의 가정 ①,②,③을 가정하고 귀무가설 H0 : m1 = m2 =…= mc이 사실이면 Fo는 df1=c-1, df2=nT-c의 F분포를 갖는다. 여기서 : 분자(numerator)의 자유도 : 분모(denominator)의 자유도 Cf.) H1이 사실이면 Fo는 F분포를 갖지 않는다.

  13. Oneway ANOVA의 검정통계량 만약 귀무가설이 사실이라면 모집단의 평균들이 모두 같을 것이고 이 경우 표본평균들은 서로 비슷한 값을 나타낼 것이다. 그러나 대립가설이 사실이라면 일부의 표본평균들이 큰 차이를 나타낼 것이다. 따라서 SSTR의 값이 크다는 것은 귀무가설이 사실이 아님을 나타내는 즉 대립가설을 지지하는 증빙이 된다. 귀무가설이 사실일 경우 MSTR은 모집단의 분산 s2에 대한 불편추정량이다. 즉 E(MSTR) = s2이다. 그러나 대립가설이 사실일 경우 E(MSTR) = s2 + (∑initi2)/(c-1) 로 MSTR은 모집단의 분산 s2에 대한 불편추정량이 되지 못한다. 한편 MSE는 귀무가설이 사실일 경우와 대립가설이 사실일 경우에서 모두 s2에 대한 불편추정량이다. 즉 E(MSE) = s2이다. 따라서 귀무가설이 사실이라면 Fo = MSTR / MSE의 값은 1에 가깝고 귀무가설이 사실이 아니라면 Fo는 1보다 큰 값을 나타낼 것이다.

  14. Oneway ANOVA의 검정통계량 MSE는 두 모집단 평균차이(μ1-μ2)에 관한 t검정에서 사용되는 분산 s2에 대한 결합추정량 sp2을 확장한 것이다. 으로 나타내면 즉 표본i의 분산을 이면 MSE는 다음과 같이 나타낼 수 있다.

  15. Oneway ANOVA의 검정통계량 총변동, 오차변동, 처리변동은 SST = SSTR + SSE 의 관계를 갖는다. [증명] 을 으로 대체하면

  16. Oneway ANOVA의 기각영역,p값 유의수준 α의 기각영역 : 분자자유도 c-1, 분모자유도 nT-c의 F확률변수 : 자유도 c-1, nT-c의 F분포에서 오른쪽 면적이 α인 의 값, ‘=FINV(α,c-1,nT-c)’로 계산 기각영역 채택영역 =FINV(α,c-1,nT-c) 기각영역이 검정통계량 분포의 오른쪽에 위치  우측검정 p값 p값 의 확률 : 검정통계량의 관측값 p값=FDIST( ,c-1,nT-c) p값=FDIST( ,c-1,nT-c)

  17. ‘보일러열효율’의 가설 세 회사 제품의 열효율에 차이가 있다고 할 수 있는가? 이 아니다(적어도 한 모집단의 평균은 같지 않다). 에 맞추어 가설을 설정 m1 : ‘A회사’가 생산한 보일러의 평균 열효율 m2 : ‘B회사’가 생산한 보일러의 평균 열효율 m3 : ‘C회사’가 생산한 보일러의 평균 열효율 ‘세 회사 제품의 열효율에 차이가 없다’ 이 아니다 ‘세 회사 제품의 열효율에 차이가 있다’ [Q] ‘H마트 진열효과실험’에서 m1이 의미하는 바는?

  18. ‘보일러열효율’의 검정통계량 및 p값 (Excel ‘도구’‘데이터분석’활용) 결과해석 α를 0.05라고 하자. p값은 0.000213이고 α는 0.05이다. p값이 α보다 작으므로 귀무가설을 기각한다. 따라서 유의수준 0.05에서 ‘세 회사 제품의 열효율에 차이가 있다’라고 할 수 있다.

  19. 제품관리(Product Management) ‘인하식품’의 제품관리를 담당하고 있는 L부장은 최근 개발된 새로운 포장베이컨의 가격을 얼마로 설정하는 것이 적절한지 그리고 소매점포에 제공하는 광고지원수준을 어느 정도로 책정하는 것이 적절한지를 결정하기 위해 시장반응실험을 수행하기로 하였다. 신제품의 가격수준은 ‘저가’, ‘중간’, 및 ‘고가’의 3개 수준에 대해 시장반응을 살펴보기로 하고, 소매점포에 대한 광고지원수준은 ‘소규모’ 및 ‘대규모’의 2개 수준으로 시장반응을 살펴보기로 하였다. L부장은 ‘인하식품’의 제품이 판매되는 24개 점포를 임의로 선정한 후 이들 점포를 6개 집단으로 분류하여 6개월간의 판매실적을 조사하였다.

More Related