270 likes | 469 Views
第十二章 单因素试验结果的统计分析. 试验设计 对比法和间比法试验的统计分析 完全随机和随机区组试验的统计分析 拉丁方试验的统计分析 试验结果的缺失数据. 一 对比法分析. 第一节 对比法和间比法分析. 二 间比法试验结果统计分析. 品系 各重复小区产量 总和 平均 对照 ck 平均 对 ck Ⅰ Ⅱ Ⅲ Ⅳ Ⅴ 平均的 % ck1 35.9 40.5 28.2 31.9 29.0 165.5 33.1
E N D
第十二章 单因素试验结果的统计分析 试验设计 对比法和间比法试验的统计分析 完全随机和随机区组试验的统计分析 拉丁方试验的统计分析 试验结果的缺失数据
一 对比法分析 第一节 对比法和间比法分析
二 间比法试验结果统计分析 品系 各重复小区产量 总和 平均 对照ck平均 对ck Ⅰ Ⅱ Ⅲ Ⅳ Ⅴ 平均的% ck1 35.9 40.5 28.2 31.9 29.0 165.5 33.1 A 37.1 39.4 34.0 36.9 35.8 183.1 36.6 33.3 109.9 B 39.8 42.0 36.8 41.4 28.9 188.9 37.8 33.3 113.5 C 38.2 39.9 25.4 33.1 28.9 165.5 33.1 33.3 99.4 D 37.3 43.2 39.1 34.9 34.0 188.5 37.7 33.3 113.2 ck2 33.0 42.1 29.0 34.6 28.8 167.5 33.5 E 38.0 40.2 34.5 39.8 37.5 190.0 38.5 34.2 111.1 F 36.1 34.3 32.8 27.1 29.7 160.0 32.0 34.2 93.6 G 37.8 36.3 41.3 34.2 39.9 189.0 37.8 34.2 110.5 H 34.0 39.1 27.3 34.7 28.9 164.0 32.8 34.2 95.9 ck3 36.0 40.1 31.5 37.8 29.6 175.0 35.0 I 29.0 38.1 40.0 34.3 31.1 172.534.533.7 102.4 J 36.3 36.0 38.2 39.1 37.4 187.0 37.4 33.7 111.0 K 43.0 34.2 41.2 39.9 36.2 194.5 38.9 33.7 115.4 L 29.4 23.0 30.8 34.1 32.9 150.5 30.1 33.7 89.3 Ck4 35.2 38.7 27.4 32.5 28.2 162.0 32.4
7.2.1 完全随机设计(completely random design) 第二节 完全随机和随机区组统计分析 1、特点:使用了试验设计三个原则中的两个(重复、随机),能够得到无偏的误差估计值,但控制试验环境误差的能力不强。 2、常用于试验环境因素相当均匀的场合,如实验室培养试验、网室温室的盆钵试验。
3、设计示例 有三种生长激素,分别用A、B、C代替,测定其对小麦株高的影响,包括对照(用等量的清水)在内,共4个处理,进行盆栽试验,每盆小麦为一个单元,每处理用4盆(重复4次)共16盆。 第一步:用数字代表处理 A:1-4,B:5-8,C:9-12,CK:13-16 第二步:抽签或查随机数字表,得到随机数字 14、9、7、1、5、12、16、3、11、8、4、2、6、13、10、15
第三步:将随机数字对应的处理安排到相应的盆内。第三步:将随机数字对应的处理安排到相应的盆内。 ck C B A B C ck A C ck B A A B C ck
7.3.2随机区组设计试验结果的统计分析 一、单因素随机区组试验结果的方差分析 可将处理看作A因素,区组看作B因素,其余部分则为试验误差。设试验有k个处理,n个区组,则自由度与平方和的分解为: nk-1= (n-1) + (k-1) + (n-1)(k-1) 总自由度=区组自由度+处理自由度+误差自由度
总平方和=区组平方和+处理平方和 +误差平方和 [例12.3P228]有一小麦品比试验,其有A、B、C、D、E、F、G、H8个品种(k=8),其中A是标准品种(ck),采用随机区组设计,重复3次(n=3),小区计产面积25m2,其产量如下,试作分析。
1.自由度与平方和分解 (1)自由度的分解 总DFT=nk-1=(3×8)-1=23 区组DFR=n-1=3-1=2 品种DFt=k-1=8-1=7 误差DFe=(n-1)(k-1)=(3-1)(8-1)=14 (2)平方和的分解
3.品种平均数的比较 本例目的是测验各供试品种是否与标准品种A有显著差异,宜应用LSD法。 由于ν=14时,t0.05=2.145, t0.01=2.977,故 LSD0.05=1.05×2.145=2.25(kg) LSD0.01=1.05×2.977=3.13
(四) 平均数比较 新复极差测验结果 品种 产量 差异显著性 5% 1% E 14.2 a A B 12.4 ab AB G 11.9 ab AB H 11.4 b AB C 11.4 b AB F 10.8 b AB A 10.7 b AB D 10.0 b B
第三节 拉丁方试验的统计分析 水稻品比5X5拉丁方试验的产量结果 横行区组 纵行区组 Tr Ⅰ Ⅱ Ⅲ Ⅳ Ⅴ Ⅰ D(37)A(38)C(38) B(44) E(38) 195 Ⅱ B(48)E(40)D(36) C(32) A(35) 191 Ⅲ C(27)B(32)A(32) E(30) D(26) 147 Ⅳ E(28)D(37)B(43) A(38) C(41) 187 Ⅴ A(34)C(30)E(27) D(30) B(41) 162 Tc 174 177 176 174 181 T=882
品种总和和品种平均数 品种 Tt 平均 A 38+35+32+38+34=177 35.4 B44+48+32+43+41=208 41.5 C 38+32+27+41+30=168 33.6 D 37+36+26+37+30=166 33.2 E 38+40+30+28+27=163 33.6
1 自由度和平方和的分解 (1)自由度的分解 总DF= 横行DF=k-1=4 纵行DF=k-1=4 品种DF=k-1=4 误差DF=(k-1)(k-2)=12
(2)平方和的分解 矫正数C= 总 横行区组 纵行区组 品种 误差
2 方差分析和F测验 方差分析表 变异来源DF SS MS F F0.05 横行区组4 348.64 87.16 纵行区组4 6.64 1.66 品种4 271.44 67.86 4.33 * 3.26 试验误差12 188.32 15.69 总变异24 815.04
3 品种平均数的比较 LSR法 水稻品比试验的新复极差测验 品种 平均产量 差异显著性 5% 1% B 41.6 a A A 35.4 b AB C 33.6 b AB D 33.2 b B E 32.6 bB
第四节 试验结果的缺失数据问题 ☺ 缺失数据的原因 ☺ 缺失数据的估计 ☺ 估计结果的分析
在实验过程中,由于意外或偶然原因造成一个或几个实验单元无法获得有效的观察值,这些缺失的观察值叫做缺失数据。缺失数据会造成两个后果,一是实验信息损失;二是实验结果无法按常规的方法进行方差分析。为此应该了解农业实验中常见的缺失数据原因,防患于未然。还应了解一旦缺失一个或几个数据时,如何进行统计分析的方法。在实验过程中,由于意外或偶然原因造成一个或几个实验单元无法获得有效的观察值,这些缺失的观察值叫做缺失数据。缺失数据会造成两个后果,一是实验信息损失;二是实验结果无法按常规的方法进行方差分析。为此应该了解农业实验中常见的缺失数据原因,防患于未然。还应了解一旦缺失一个或几个数据时,如何进行统计分析的方法。
一、缺失数据的原因 在田间实验中,造成缺失数据的常见原因有以下几个方面。 第一,处理不当。实验有一个或若干个实验单元(小区)未按计划实施处理,诸如,未实施处理、处理剂量不正确、处理实施时间有误等等。 第二,实验材料遭受损坏。几乎所有的田间实验都是要求全部小区的植株完好无损,但事实并非总是如此。栽培管理中的机械损害、虫鸟兽等常造成植株生长异常甚至死亡。 第三,样品丢失。有些实验指标必须从田间取样后在室内进行测量,如蛋白质含量,百粒(果)重等。 第四,异常数据。与上述情形相反,异常数据不是在数据收集记录之前发生的,而是在记录和转抄之后被发现的。异常数据是指数据值超出实验材料正常反应的合理范围,只有真正由于失误造成的异常数据才可以视为缺失数据。比如,读数错误、抄写错误、抽样技术不当或者仪器仪表使用不当等。
二、缺失数据的估计 对于一个含有k个处理n次重复的随机完全区组设计, 其估计公式为 y' = 一般采用公式法进行估计 式中,y‘为缺失数据的估计值, 为所在区组的实际平均数, 为 所在处理的实际平均数, 为全部实际数据中与 既不在同一区组也不在同一处理者的平均数。(补缺失数据原则:使补上缺失的数据之后,所得到的误差平方和最小。)
三、估计结果的分析 将缺失数据的估计值填入表内,以标准的方差分析方法分析时,必须作以下三方面的校正。 (1)总自由度和误差自由度比标准方法少1。 (2)处理平方和减去偏倚校正数C‘,重新作F检验。 (3)处理平均数多重比较时,若两处理平均数未缺失数 据,则平均数及其差数的标准误与标准方法相同。对于含缺失数值估计的处理与其它处理的比较,则按下式计算之。这可用于PLSD和DMR法。