1 / 89

제 7 장

제 7 장. 실험계획법. 1. 실험계획법의 개요 2. 실험계획의 순서 3. 분산분석의 이해 4. 일부실시법의 이해 5. 교락법의 이해. 개 요. 실험계획법은 문제해결을 위하여 , 또는 시스템의 성격을 알기 위하여 실험을 실시할 때 가능한 최소의 노력으로 최대의 정보를 얻을 수 있고 적법한 통계 분석 이 가능하도록 실험방법을 결정하려는 통계방법이다 . 실험의 기본원리인 랜덤화 , 반복 , 블록화의 개념을 이해하고 , 실험계획법을 사용

moswen
Download Presentation

제 7 장

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 제 7 장 실험계획법 1. 실험계획법의 개요 2. 실험계획의 순서 3. 분산분석의 이해 4. 일부실시법의 이해 5. 교락법의 이해 개 요 실험계획법은 문제해결을 위하여, 또는 시스템의 성격을 알기 위하여 실험을 실시할 때 가능한 최소의 노력으로 최대의 정보를 얻을 수 있고 적법한 통계 분석 이 가능하도록 실험방법을 결정하려는 통계방법이다. 실험의 기본원리인 랜덤화, 반복, 블록화의 개념을 이해하고, 실험계획법을 사용 할 때 고려해야 될 제반 문제와 실험의 순서 등을 다룬다.

  2. 학습 목표 1. 실험계획법의 개념과 수학적 이론을 알 수 있도록 한다. 2. 분산분석의 개념과 일원분산분석 및 이원분산분석의 실시하는 방법을 습득한다. 3. 설계하고자 하는 DATA의 특성 및 조건에 대하여 분산분석(ANOVA)을 이용하여 DATA를 관리할 수 있는 방법을 습득한다. 주요 용어 • ANOVA : ANalysis Of Variance Analysis 의 약어로서 분산을 분석한다는 의미 이며, 보편적으로 분산분석이라고 한다. • 일부실시법: 고차의 교호작용이 거의 존재하지 않는다는 가정하에 최소의 실험만을 통하여 얻고자 하는 DATA를 추출하는 실험계획 방법을 의미한다. 즉, 다섯가지 이상의 요인을 갖는 공정에서 변동의 근원을 찾기 위해 부분적인 실험을 실시하여 동일한 결론을 만들어 내는 실험 계획임. • 교락법: 실험횟수를 늘리지 않고 실험전체를 몇 개의 블록으로 나누어 배치시킴으로써, 동일 환경내의 실험횟수를 적게 하도록 고안해 낸 배치법을 교락법이라고 한다. • 즉, 두 개 이상 인자의 효과가 함께 나타나고 그 효과를 각각의 인자에 의한 효과로 분리해 • 낼 수 없을 경우, 그 인자들은 교락(Confounding)되어 있다고 한다.

  3. 왜 실험설계를 하는가? • 어떤 원인이 반응에 유의한 영향을 주고 있는가를 파악하고그 영향이 양적으로 어느 정도 큰가를 알아내고자 실시함(추정과 검정) 적은 영향밖에 미치지 못하는 요인들은 전체적으로 어느 정도 영향을 주고 있으며, 측정오차는 어느 정도인가를 알아내고자 실시함(오차항 추정) 유의한 영향을 미치는 원인들이 어떠한 조건을 가질 때 가장 바람직한 반응을 얻을 수 있는가를 알아내기 위해서 실시함(최적화)

  4. 실험계획법의 목적 Screening 중요한 요인을 발견하고 특성을 파악 Optimizing 최적의 조건을 찾는다. Screening의 주요개념 중요한 요인들을 분리하기 위해서 Screening을 함. 이런 종류의 계획은 1. 요인들에 대해서 많은 지식을 필요로 하지 않는다. 2. 처음에는 모든 요인들이 포함된다. 3. 하나의 요인에 두 수준만을 준다. 4. Screening 계획은 최적화하는 단계로 넘어간다.

  5. 실험계획법의 종류 스크리닝(Screening) - 완전요인 배치 계획(Full Factorial Design) - 2k배치 계획(2k Factorial Design) - 일부 실시법(Fractional Factorial Design) 최적화(Optimization) - 반응표면 분석법(Respons Surface Method) - 혼합물 실험(Mixture Experiment) - EVOP(Evolutionary Operation)

  6. Randomization - 실험의 랜덤화 선정된 인자 외에 기타 원인들의 영향이 실험결과에 편의되게 미치는 것을 없앨 수 있다. 시간에 따라 변하는 인자의 효과나 경향을 실험을 시간대에 대해 균일하게 배치 함으로서 약화시킬 수 있다. 주관적인 판단이 개입되는 실험에는 항상 사용되어야 한다. 종종 실험을 어렵게 만든다.  Blocking 동일한 성질을 가진 단위들의 집합 (Block) 실험전체를 시간적 혹은 공간적으로 분할하여 Block을 만들어 주면 각 Block 내에서는 실험환경이 균일하게 되어 정도 좋은 결과를 얻을 수 있다. Block은 실험계획시 또 다른 독립변수(요인)로 취급해야 한다. # 실험이 이틀에 걸쳐서 수행되었다고 하면 실험일을 Block 이라 한다.

  7.  Confounding - 교락 두개 이상 인자의 효과가 함께 나타나고 그 효과를 각각의 인자에 의한 효과로 분리해 낼 수 없을 경우를 의미한다. 구할 필요가 없는 2인자 교호작용이나 고차의 교호작용을 블록 또는 주효과와 교락시켜 실험의 효율을 높일 수 있다.  Screening 여러 Factor 들 중 어떤 Factor가 중요한가를 단계적으로 결정하는 것을 말하며, 이때에는 보통 각 Factor에 대하여 2개의 수준을 적용한다. Screening 을 할 때에는 완전배치를 사용하는 것은 흔하지 않으며, 부분배치법 (Fractional Factorial Design)을 주로 사용한다.

  8.  Replication ; 반복(오류를 줄이기 위한 실험상의 반복) 실험조건을 처음부터 다시 setup 하여 실험하는 것 실험의 재현성을 알아보기 위한 방법 : 실험결과의 신뢰성을 높일 수 있다. 하나의 Treatment에 해당하는 시료를 여러 개 만들어 한번씩 실험하는 것 개개의 응답치를 분석 시에 사용한다.  Repetition ; 반복, 재현 같은 시료에 대해 즉시 반복실험 하는 것 측정이나 실험과정상의 에러를 보상하는 방법이다. 하나의 Treatment 에 해당하는 시료를 여러 개 만들어 한번씩 실험하는 것 개개의 응답치의 평균을 분석 시에 사용한다.

  9. 실험계획법 용어  요인(인자, Factor) - 실험에 참여하는 모든 변수 - 반응에 영향을 미치는 변수로써 X로 표현됨 - 인자는 온도나 시간처럼 정략적일 수 있고 또한 다른 기계, 다른 작업자, 또는 환경처럼 정성적일 수 있음  수준(Level) - 인자 수준이란 실험에서 조절될 수 있는 인자 값 교호작용(Interaction) - 두 인자들 사이의 조합에서 일어나는 효과

  10. 전달함수 (Transfer Function) CTQ(Y) = F(X’s) + ε 정확한 정의 - 이론적 지식으로부터 - 근본 가설로부터 - 절차상의 정의로부터 근사 함수를 만든다. - 비슷한 함수 이행 - 통계적 자료수집(실험계획법, 시뮬레이션)

  11. 물리적 모형: m: 질량, v:속도 정확한 전달함수 모형(1)

  12. 정확한 전달함수 모형(2) 화학적 모형: 2H2O 2H2 + O2

  13. 정확한 전달함수 모형(3) EOQ Model Y = 최소 연간 재고 비용 XQ=주문량 XF=주문빈도 XD=평균수요량 XL=리드타임 XC=단위 당 재고의 평균 운반비용 XO=발주비용

  14. 실제 모델 모집단 결 과 샘플 실험계획법 시뮬레이션 유사 모델 샘플 Noise 근사한 모델이 설명할 수 있는 영역 유사 전달 함수(1)

  15. Vital Few Pareto Principle : 20%의 요인들이 80%의 영향을 미친다는 원리. Occam’s Razor:같은 현상에 대해서 복잡한 설명보다는 간단한 설명이 더 좋다. KISS(Keep It Statistically Simple):필요한 통계자료만 사용하여라.

  16. X1 X2 X8 70-80% X14 X15 X16 X5 X10 X13 X11 X9 X7 X12 X17 X21 X4 X6 X18 X19 X3 X20 20-30% Vital Few가 발생시키는 문제의 점유율 FMEA Vital Few Fish-bone Brain-storming experience 모델 변수들의 집합 변수들의 모델 설명 비율

  17. CTQ(Y) = F(X’s) + ε Stochastic Deterministic 온도와 반응시간을 어떻게 조절하면 좀 더 높은 수율을 얻을 수 있을까? 실험계획법의 전략 (결정인자) (확률변수) Ex) 수율이 온도와 반응시간의 함수인 공정에서 - 과거의 정보 : 온도 155℃, 반응시간 1.7시간 조건에서 75% 정도의 수율을 얻을 수 있음. - 공정 조건(온도, 반응시간)을 변화시키면 더 높은 수율을 얻을 수 있음 을 알고 있음.

  18. 한 번에 한 요인(One Factor at a Time) 접근법: 각 요인(factor)의 수준을 결정하고 다른 요인들의 수준을 똑같이 유지하면서 한 인자의 수준만을 변화시키며 실험을 진행하는 방법.

  19. 한 번에 한 요인(One Factor at a Time) 접근법: 온도를 그대로 유지하면서 반응시간을 조정한 경우 반응시간을 그대로 유지하면서 온도를 조절한 경우

  20. 한 번에 한 요인(One Factor at a Time) 접근법: 어떻게 결론을 내릴 것인가? 하지만 실제적인 반응표면법을 보면 최적의 조건은 우리의 관심 영역 밖에 있다.

  21. 한 번에 한 요인(One Factor at a Time) 접근법 교호작용(Interaction) • 근본적으로 교호작용이란 A인자가 반응에 미치는 영향이 B인자의 어느 수준 이 선택되는지에 의존된다는 것이다. • 한 번에 한 요인씩(one-factor-at-a-time)접근방법을 사용하면 교호작용은 무시되고 영향은 1차 관계로 나타난다.

  22. 실험 목적의 설정 특성치의 선택 인자와 인자수준의 선택 데이터의 분석 실험의 실시 실험의 배치와 실험순서의 랜덤화 ANOVA 상관분석 회귀분석 • 요인배치법 • 일부실시법 • 다구찌실험 분석결과의 해석 및 조치 실험계획의 순서 Technical Review

  23. 실험계획의 Guide Line 실험목적을 명확하게 설정 실험 목적에 대한 유용한 정보를 제공하는 특성치를 선택 실험에 관련된 모든 인자를 선택 실험 배치와 실험순서의 구체적 계획 및 실험의 블럭화, 랜덤화 고려 실험의 실시 - 일정한 기준에 의해서 실험을 실시하며 보조 측정치도 기록 어떠한 통계적 방법을 사용하여 Data를 분석할 것인가를 결정 분석결과의 해석과 조치 - 결론이 가지고 있는 기술적인 의미를 생각 - 최적조건의 특성치에 대한 추정 및 확인실험을 통한 재현성 확인

  24. 데이터의 분석 ANOVA(Analysis of Variance): 분산분석 SS Total = SST treatment + SSE error 총변동 = 요인 변동 + 오차 변동 요인 A에 의한 변동 요인 B에 의한 변동 오차에 의한 변동 요인에 의한 변동과 오차에 의한 변동의 비율로 요인의 유효성을 판단하고자 함. 요인 C에 의한 변동

  25. 도막두께 SST(전체변동) SSW(군내변동) SSB(군간변동) 분무시간(sec) 데이터의 분석 변동의 이해 적정한 도막두께는 제품의 외관품질에 치명적인 요인이 되는데, 이 도막 두께의 결정은 도장공정에서 분체 도료의 분무 시간이 치명인자로 품질 및 소요 재료비에 많은 영향을 주고 있다. 개선 Project의 목표인 적정한 도막두께를 얻기 위한X인자인 분무 시간별로 도막두께(Y)를 평가한 결과이다. 이때, X의 분무시간은 3수준으로 평가하였음. ☞ ANOVA는 각 수준의 평균값 차이(SSB, 군간 변동)에 의한 변동량이 각 수준 내에서 발생하는(SSW, 군내 변동) 변동량 보다 더 큰지 확인하여 치명인자를 결정함

  26. 2m 1.8m 2m 12 inch 1.8m  자유도(Degree of Freedom) 일반적인 의미: 중복이 없이 결론을 내리기 위해서 필요한 비교 수 실험계획법에서의 의미 - 실험계획법에서 어느 수준이 얼마나 더 좋은지를 결정하는데 필요한 요인들 이나 교호작용들 사이의 비교 수 자유도 1 2명의 농구선수, 1명의 비교대상 6 inch 12 inch 자유도 2 3명의 농구선수, 2명의 비교대상

  27. 분산분석(ANalysis Of VAriance - ANOVA) 의 개념 특성치의 산포를 제곱합(sum of square : 변동, 혹은 제곱 합이라고도 부른다) 으로 나타내고 이 제곱합을 실험과 관련된 요인마다의 제곱합으로 분해하여 오차에 비해 특히, 영향을 주는 요인이 무엇인가를 찾아 내는 분석방법이다. 비교대상이 되는 집단들 간의 평균의 차이를 검정하기 위해 총변동을 요인의 수준 차이로 설명되는 변동과 설명될 수 없는 변동으로 분해하여 이 두 변동의 비가 통계적 으로 유의한가를 검정하는 분석방법 총 변 동 오차에 의한 변동 수준차에 의한 변동  수준1 수준2

  28. 총 변 동 오차에 의한 변동 수준차에 의한 변동  수준1 수준2 = i 번째 수준에서 j번째 값 = i 번째 수준의 샘플의 평균 = 총 평균 = i 번째 수준내에서 측정된 총수 변동의 분해 - 1인자의 경우

  29. 단기공정 변동(σst) 장기공정 변동(σlt) 측정환경의 변동 부품간의 변동 측정자의 변동 측정 Sys의 변동 재현성 선형성 안정성 반복성 정확도 변동의 일반적인 형태 (측정data의 변동요인) Data의 변동요인 측정 Sys의 변동 요인 실제 참값 측정 평균 측정 Data 정확도 재현성 측정자1의 측정자2의 평균 공정의 변동 평균 반복성

  30.  ANOVA 사용의 가정 • ANOVA 분석은 각 수준(level) 에서의 산포가 같다는 것을 가정한다. • 따라서 한 수준의 산포가 상대적으로 커서 수준간의 차이가 한 수준의 산포에 영향을 • 받게 되면 수준간의 차이를 파악하기가 어렵다. • 따라서 ANOVA 적용전에 먼저 각 산포들에 대한 정규성 검정(Normality Check)을 • 실시하고, 각 산포가 서로 동일하다고 통계적으로 말할 수 있는지를 확인해야 한다. • ANOVA 분석의 가설

  31.  ANOVA Table 일원배치법의 ANOVA Table ( k개 수준을 가진 인자로 n 번 반복실험 )

  32.  ANOVA Table 의 해석 분산분석표에서 얻어진 F 값을 통한 해석 - 주어진 유의수준에 해당하는 F 값을 F 분포표에서 찾은 후 이 값( F0 )이 구해진 F값보다 작으면 귀무가설을 기각 => 수준간에 유의한 차이가 있음 P 값을 통한 해석 - 구해진 F 값에서 얻어진 유의수준인 p 값을 구한 후 이 값이 유의수준보다 작으면 귀무가설을 기각 P값  (유의수준) F F0

  33.  ANOVA Table 이원배치법의 ANOVA Table (인자 A가 a수준, 인자 B가 b수준, r 번 반복 )

  34. Planned Experiment Planned Experiment - 실험의 목적 설정 L회사에 근무하는 G씨는 몇 달 전 새 골프클럽을 구입후 점수가 전보다 개선이 되었으나 그것이 우연히 그렇게 된 것인지 다른 원인에 기인한 것인지가 궁금 하게 되었다.  Planned Experiment - 인자의 선택 근래의 G씨의 점수변동에 따른 요인을 보면 1. 골프클럽 2. 주간, 야간 경기 이다.

  35. 골프클럽 + 골프 점수 게임시간 관심 요인 오차 변동 Planned Experiment - 변동의 원인 이것을 G씨가 관심을 가지고 있는 부분과 관심을 두고 있지 않은 부분으로 나누면 아래의 그림과 같다.

  36. 군내변동과 군간변동의 비교 군간변동(SSB) 군내변동(SSW) F = 군간 변동 (SSB) 인자에 의한 변동량 결과치 전체의 변동량 (SST) 만약, 1. F > 1 이면, 군간변동이 군내변동보다 큼 → 인자의 영향도가 큼 2. F ≤ 1 이면, 군간변동이 군내변동보다 작거나 같음 → 인자의 영향도가 적음 오차에 의한 변동량 군내변동 (SSW) Planned Experiment - 변동의 원인 변동의 구분 • 전체체동(SST) : 결과치(Y)의 변동의 Total • 군간변동(SSB) : 인자(X)의 변동에 따른 결과치(Y)의 변동량 • 군내변동(SSW) : 동일한 인자(X)의 조건 하에서 결과치(Y)의 변동량, 오차에 의한 변동 인자가 하나이면서 이 인자의 수준이 변하는 경우

  37. 군간변동(SSB1) 군내변동(SSW) 군간 변동 (SSB1) 인자1에 의한 변동량 F1 = 결과치 전체의 변동량 (SST) 군간변동(SSB2) 군내변동(SSW) 인자2에 의한 변동량 군간 변동 (SSB2) F2 = 오차에 의한 변동량 군내변동 (SSW) 여기서. 1. F값이 1보다 큰 인자가 중요인자가 되며 2. F1과 F2를 비교하여 큰 F값을 가지는 인자가 두 인자 중 치명인자가 됨 Planned Experiment - 변동의 원인 인자가 두개이면서 이 인자의 수준이 변하는 경우

  38. 일원배치의 ANOVA(1) - 일원배치 여기한회사의개발기술자가있다고하자. 그는합성 섬유에서면(cotton)의 무게 비율이 인장강도에 영향을 미치는지를 결정하고 싶다.그는5개의수준과5번의 반복 수를가지는완전랜덤계획법(completely randomized design)을 실시하였다. 아래에그데이터들이나와있다

  39. 일원배치의 ANOVA(2) Worksheet에 Data 입력 각 수준을 입력 각 수준에 따른 실험 반응치를 입력

  40. 일원배치의 ANOVA(3) Stat > ANOVA > One-way 특성치의 이름을 입력한다. 인자의 이름을 입력한다. 잔차를 Worksheet에 저장한다.

  41. 일원배치의 ANOVA(4) Comparison의 이유 : ANOVA분석은 단순히 평균치가 모두 같은지 아닌지만 판단하기 때문에 어떤 Treatment가 좋은지 알 수 없다. 그래서 각각의 Treatment에 대한 비교를 통해서 제일 좋은 조건을 찾을 수 있다.

  42. 일원배치의 ANOVA(5) P값이 0.05보다 작기 때문에 이 인자는 유의한 영향을 미침 결론 : 면 중량은 인장강도에 영향을 미친다.

  43. Planned Experiment - 인자의 수준 결정 2개의 관심 요인에 대해서, 각 요인마다 2개의 수준이 있다. 예) Target Day 생산수율 = 특성치 Control Item 생산온도 = 요인(인자) Control Factor Night 생산온도의 세분화된 분류 = 수준(Level) New Old 골프클럽

  44. MINITAB을 이용한 ANOVA(1) - 이원배치 Cell을 선택하고 요인 입력 Cell을 선택하고 데이터 입력

  45. MINITAB을 이용한 ANOVA(2) - 이원배치 Stat > ANOVA > Two-way Row factor별 평균값을 보여 줌. Column factor별 평균값을 보여 줌. 잔차값을 분석후 Worksheet에 저장함. 교효작용이 없을 때 표시함.

  46. MINITAB을 이용한 ANOVA(3) - 이원배치 ANOVA의 가정 0.05보다 작지 않으므로 귀무 가설 채택 0.05보다 작지 않으므로 귀무 가설 채택

  47. MINITAB을 이용한 ANOVA(4) - 이원배치 분석 클럽에 대한 변동과 경기시간에 대한 변동이 오차항의 변동에 비해서 유의할 정도로 크게 나오지 않았다. P > 0.05 ∴ 골프점수는 우연히 잘 나온 것이다.

  48. Minitab에서 구 분 설 명 균형설계 Two-way, Balanced ANOVA 두개의 인자에 대해 각 수준별로 하나의 Data를 취한 경우 반복없음 불균형설계 General Linear Model(GLM) Two-way, Balanced ANOVA 두개의 인자에 대해 각 수준별로 2회 이상의 Data를 취한 경우 균형설계 반복있음 불균형설계 General Linear Model(GLM) 이원분산분석(Two-way ANOVA) 결과치(Y)에 영향을 미치는 영향인자가 두개인 경우, 각 인자의 변동이 오차에 의한 변동과 비교하여 유의한 인자인지 파악 각 인자 서로의 영향도를 파악하여 어느 인자의 영향도가 더 큰지를 파악하여 중요인자를 선정함. * 반복이 있는 Sample Data를 구한 경우의 장점 → 많은 Data로써 오차의 영향을 정확하게 평가할 수 있다. → 각 인자의 교호작용까지 평가가 가능함. <이원분산분석의 종류>

  49. 이원분산분석(Two-way ANOVA) [문제]주물 공장에서 생산되는 주물은 주물의 용해과정에서 투입되는 혼합물의 종류 및 그 양에 따라 주물의 파괴강도가 달라지게 된다. 주물의 파괴강도를 향상시키기 위해 투입되는 혼합물A, 혼합물B 두가지의 영향도 및 투입되는 양의 어떤 수준의 조합에서 높은 파괴 강도를 가지는가를 알아보기 위해 실험을 실시 하였다. 실험 전 다음과 같이 수준을 설정하여 각각 2회에 걸쳐 실험하여Data를 추출하였다. 인자의 수준 혼합물A : 3수준(0.01%, 0.05%, 0.1%) 혼합물B : 2수준(0.08%, 0.15%)

More Related