470 likes | 592 Views
第 1 章 導論 Introduction. ‧ 十本書讀一次,不如一本書讀十次。 ‧ 仔細記住本書試驗設計的原則,要判斷資 料分析如何採用適當的統計方法就容易了。. 1.1 試驗設計的原理 資料分析要學好,試驗設計不可少。 一般試驗資料統計分析的要領通常是根據試驗設計的原則來判斷的 , 謹記本章說明之原理. 醫師 vs. 統計師. 疾病診斷 - 試驗設計 ( 望 . 聞 . 問 . 切 ) ( 停 . 看 . 聽 ) 望者看氣色也 停者靜下心也 聞者聽聲音也 看者細看資料結構分布也 問者問病情也 聽者傾聽試驗過程也 切者切六脈也
E N D
第1章 導論Introduction ‧十本書讀一次,不如一本書讀十次。 ‧仔細記住本書試驗設計的原則,要判斷資 料分析如何採用適當的統計方法就容易了。
1.1 試驗設計的原理 資料分析要學好,試驗設計不可少。 一般試驗資料統計分析的要領通常是根據試驗設計的原則來判斷的,謹記本章說明之原理
醫師 vs. 統計師 疾病診斷 -試驗設計 (望.聞.問.切) (停.看.聽) 望者看氣色也 停者靜下心也 聞者聽聲音也 看者細看資料結構分布也 問者問病情也 聽者傾聽試驗過程也 切者切六脈也 然後: 採用有效處方 - 採用有效統計方法 (處方有千萬種) (方法只有7、8種)
試驗研究五步驟 1 嚴謹設計 2 資料搜集 3 資料整理 4 統計分析 5 合理推論
試驗研究重要三原則 • 設置重複(set up replication) • 隨機排列(random arrangement) • 誤差控制(error control) 一個好的研究必須要有嚴謹的設計 ,客觀的試驗過程及合理的推論。因此試驗時必須遵守下列三個原則
A A A A B B B B C C C C 設置重複 試驗地(A、B、C代表作物品種) 同一處理(如食品、藥品、療法,品種,技術,技能)所使用的試驗單位(人)數即為重複。 主要作用是估算試驗誤差以備統計推論之用。 若試驗只做一次(重複一次),則無法估算試驗誤差,也就無法做統計推論 重複次數愈多,理論上試驗誤差愈小,試驗結果會愈準確可靠。 一般來說,計量資料,如果誤差控制得好,設計均衡,10-20次即可,甚至還可小一些;而計數資料,即使誤差控制得好,也需要30-100左右 農作物田間試驗則僅需4-6次 ←試區 (系統排列法不妥當)
B C B A A B C C C A A B 隨機排列 試驗地之地利或水分均衡 哪一個處理被安排於哪個試驗單位要機會均等,不能有人為的主觀偏見。 隨機排列與重複相結合,試驗資料就能估算無偏的(unbiased)試驗誤差,統計推論才合理可靠。 隨機法有:拋硬幣,擲骰子,抽籤,利用亂數字表 (各處理隨機排列法)
誤差控制 誤差來源有兩種 系統誤差(systematic error) 隨機誤差(random error) (後面要談的試驗設計就是根據此兩種誤差而厘定的)
系統誤差 同一處理以不同儀器,或同儀器不同人或同人不同時間測得的資料皆不相同,而有偏差(bias),這種偏差稱為系統誤差。 系統誤差是一種有原因、有方向的偏差,這種偏差會影響試驗結果的準確性(accuracy)。 導致系統誤差的原因可能不只一種,方向也不一定相同。 (規劃各種試驗設計就是用來排除系統誤差)
試驗地之 地力或水分不均衡 Ⅰ Ⅱ Ⅲ Ⅳ 區集內試區之 地力相似 區 集 區集間試區之 地力相異 (參試處理在各區集內隨機排列) 系統誤差示意圖
系統誤差示意圖人因遺傳質與體質不同,絕對是具有系統誤差系統誤差示意圖人因遺傳質與體質不同,絕對是具有系統誤差
隨機誤差 測驗一批性質相同的物品時,即使儀器相同,也由同一人同一時間測量,結果各個測量資料卻不會相同,這表示實驗資料有誤差,這種誤差完全不知道什麼原因造成的,是偶然發生的,我們稱之為隨機誤差。 隨機誤差就是試驗誤差,有正值,也有負值。 試驗過程中涉及隨機誤差的原因很多,如田間試驗的土壤差異,動物試驗的體質差異,甚至工作人員的操作不穩都可能是隨機誤差的來源 隨機誤差不能避免,但可以減小,這有賴試驗者的安排控制
B C B A A B C C C A A B Ⅰ Ⅱ Ⅲ Ⅳ B C A C A B C B A A C B 隨機誤差示意圖 僅有隨機誤差 區 集 包括系統誤差及隨機誤差
1.3 規劃試驗設計三原則 根據下列三原則可規劃出幾種常用試驗設計 試驗材料(如人、動物、植物、昆蟲、 微生物、土壤等):是同質或異質。 試驗空間(環境):是相同或不同。 試驗時間 :各處理是否同時進行試驗。
B C B A A B C C C A A B Ⅰ Ⅱ Ⅲ Ⅳ B C A C A B A C B B C A A C B A B C 同質與異質比較示意圖 同質、同時、同空間 異質或異時或異空間 1 2 3 Ⅰ Ⅱ Ⅲ C A B 兩向異質或異時及異空間
1.4 有效控制試驗誤差四種基本試驗設計 由上述試驗設計三原則可規劃出下列四種常用試驗設計 1.完全隨機設計(Completely Randomized Design:CRD) 適用于單向變方(變異數)分析(one-way analysis of variance: one-way anova ) (見第6章) 2. 隨機完全區集設計(Randomized Complete Block Design:RCBD)(見第7章) 適用于雙向變方(變異數)分析(two-way analysis of variance) 3.拉丁方設計(Latin square Design:LSD) 適用于雙向變方分析(見第8章)
4. 交叉設計或輪換設計(Cross-over Design or Change- over Design:COD)(見第9章) 適用于雙向變方分析 * 規劃各種設計的主要原理是要讓參予試驗的各處理 有相同的待遇(均衡原則)
附記 基本統計值描述(the description of basic statistic)
其程序如下: • dm”clear log”;dm”clear output”; • title “statistical descriptions”; • option nodate ls=78 ps=120; • data dd; • *infile “c:\ddn\des2-1.txt”; • input x @@; • cards; • 1 2 2 3 3 3 4 4 5 • ; • proc univariate data=dd normal plot; • var x; • run;quit;
如 *infile “c:\ddn\des2-1.txt”; 如把*號取消,則程序恢復功能,如 Infile “c:\ddn\des2-1.txt”; 即由磁碟C之子目錄ddn讀取外部資料檔des2-1.txt資料 這時cards以及資料行必須取消,或計以*號,如下
以程序檔名des2-1.sas保存(save)如下 • dm”clear log”;dm”clear output”; • title “statistical descriptions”; • option nodate ls=78 ps=120; • data dd; • infile “c:\ddn\des2-1.txt”; • input x @@; • proc univariate data=dd normal plot; • var x; • run;quit;
Test -Statistic- -----p Value------ Student's t t 7.348469 Pr > |t| <.0001 Sign M 4.5 Pr >= |M| 0.0039 Signed Rank S 22.5 Pr >= |S| 0.0039 學生氏t=7.348469 , p<0.001 (平均值與0比較結果不為0 訊號檢定法(Sign)(見第21章),m=4.5(平均值與0比較結果不為0) Wilcoxon檢定法(見第21章),S=(平均值與0比較結果不為0) Tests for Normality Test --Statistic--- -----p Value------ Shapiro-Wilk W 0.963072 Pr < W 0.8299 Kolmogorov-Smirnov D 0.166667 Pr > D >0.1500 Cramer-von Mises W-Sq 0.047247 Pr > W-Sq >0.2500 Anderson-Darling A-Sq 0.260986 Pr > A-Sq >0.2500