540 likes | 678 Views
数理统计部分. 专题一:方差分析与协方差分析 专题二:回归方程 1. 一元回归 2. 多元回归 3. 逐步回归 4. 标准化回归 专题三:非参数统计. 专题一:方差分析与协方差分析. 一、单因素方差分析. 1. 单因素试验及有关的基本概念. 在试验中,有可能影响试验指标并且有可 能加以控制的试验条件称为因素。通过试 验的设计,在试验中只安排一个因素有所 变化、取不同的状态或水平,而其余的因 素都在设计的状态或水平下保持不变的试 验称为单因素试验。. 可设单因素试验的因素为 A ,共有 A 1 、 A 2 、
E N D
数理统计部分 • 专题一:方差分析与协方差分析 • 专题二:回归方程 1.一元回归 2.多元回归 3.逐步回归 4. 标准化回归 专题三:非参数统计
专题一:方差分析与协方差分析 一、单因素方差分析 1. 单因素试验及有关的基本概念 在试验中,有可能影响试验指标并且有可 能加以控制的试验条件称为因素。通过试 验的设计,在试验中只安排一个因素有所 变化、取不同的状态或水平,而其余的因 素都在设计的状态或水平下保持不变的试 验称为单因素试验。
可设单因素试验的因素为A,共有A1、A2、 …、Ar等r个水平、分别安排了n1、n2、…、 nr次重复试验,其中的第i个水平Ai安排了ni 次重复试验,所得到的样本为Xi1、Xi2、…、 Xini,相应的观测值为xi1、xi2、…、xini,式中 的n1+n2+…+nr= n。 水平 观测值 A1x11x12 …x1n1 A2x21x22 …x2n2 …… Arxr1xr2 …xrnr
在单因素试验中,假设有r个编号为i=1至 r的正态总体,它们分别服从N(μi,σ2)分布,
当μi及σ2未知时,要根据取自这r个正态总 体的r个相互独立且方差相同的样本检验原 假设H0:各μi(i=1至r)相等,所作的检验以 及对未知参数的估计称为方差分析。 μ称为总平均值,
结论2) 结论3)当H0为真时, 结论4)当H0为真时,SSE、SSA相互独立;
2 单因素方差分析的计算 • data ex;do a=1 to 3;input n @@; • do i=1 to n; input x @@; • Output;end;end; • Cards; • 8 21 29 24 22 25 30 27 26 • 10 20 25 25 23 29 31 24 26 20 21 • 6 24 22 28 25 21 26 • ; • procanova; class a;model x=a; • means a/duncan cldiff;run;
处理 未切去胚乳 切去一半胚乳 切去全部胚乳 每株粒重 21,29,24,22,25,30,27,26 20,25,25,23,29,31,24,26,20,21 24,22,28,25,21,26 例1.1《切胚乳试验》用小麦种子进行切胚 乳试验,设计分3种处理,同期播种在条件较 为一致的花盆内,出苗后每盆选留2株,成熟 后测量每株粒重(单位:g),得到数据如下:
自由度 2 21 23 均方和 3.39 10.65 显著性 N 方差来源 A 误差 总和 平方和 6.77 223.73 230.50 F值 0.32
处理 1 2 3 4 苗 高 19, 23, 21, 13 21, 24, 27, 20 20, 18, 19, 15 22, 25, 27, 22 例1.2《药剂处理》用4种不同的药剂处 理水稻种子,发芽后观测到苗高(单位: cm)如下:
data ex;do a=1 to 3;do i=1 to 5 ; input x @@; output;end;end; cards; 19 23 21 13 21 24 27 20 20 18 19 15 22 25 27 22 ; procanova; class a;model x=a; means a/duncan cldiff;run;
自由度 3 12 15 均方和 34.67 9.83 显著性 * 方差来源 A 误差 总和 平方和 104 118 222 F值 3.53
二、双因素方差分析 (一)不考虑交互作用的双因素方差分析 1.理论 通过试验的设计,在试验中只安排两个因素有所变化、取不同的状态或水平,而其他的因素都在设计的状态或水平下保持不变的试验称为双因素试验。
可设双因素试验的一个因素为A,共有A、A、…、A等r个水平,另一个因素为B,共有B、B、…、B等s个水平。可设双因素试验的一个因素为A,共有A、A、…、A等r个水平,另一个因素为B,共有B、B、…、B等s个水平。 这两个因素的水平互相搭配各安排一次试验,其中A因素的A水平与B因素的B水平搭配安排试验所得到的样本为X,相应的观测值为x
服从F(r-1,(r-1)(s-1))分布 服从 F(s-1,(r-1)(s-1))分布
data ex;do a=1 to 4;do b=1 to 5; input x @@;output;end;end; cards; 53 56 45 52 49 47 50 47 47 53 57 63 54 57 58 45 52 42 41 48 ; procanova;class a b;model x=a b; means a b/duncan cldiff;run;
(二)考虑交互作用的双因素方差分析 • 1.理论考虑交互作用的双因素试验 • 可设双因素试验的一个因素为A,共有A1、A2、…、Ar等r个水平,另一个因素为B, • 共有B1、B2、…、Bs等s个水平。这两个因素的水平互相搭配各安排m次试验,其中A因 • 素的A水平与B因素的B水平搭配安排试验所得到的样本为X,相应的观测值为x。
服从F(r-1,rs(m-1))分布 服从 F(s-1,rs(m-1) )分布 服从 F((r-1)(s-1),rs(m-1))分布
data ex;do a=1 to 4;do b=1 to 3;do i=1 to 2; input x @@;output;end;end;end; cards; 58.2 52.6 56.2 41.2 65.3 60.8 49.1 42.8 54.1 50.5 51.6 48.4 60.1 58.3 70.9 73.2 39.2 40.7 75.8 71.5 58.2 51 48.7 41.4 ; procanova;class a b;model x=a b a*b;means a b/duncan cldiff;run;
统计控制的基本概念 • 如果在单因素、双因素或多因素试验中有无法控制的因素x影响试验的结果Y,且x可以测量、x与Y之间又有显著的线性回归时,常常利用线性回归来矫正Y的观测值、消去x的差异对Y的影响。例如,研究施肥对苹果树产量的影响,由于苹果树的长势不齐,必须消去长势对产量的影响。又如,研究饲料对动物增重的影响,由于动物的初重不同,必须消去初重对增重的影响。这种不是在试验中控制某个因素,而是在试验后对该因素的影响进行估计,并对试验指标的值作出调整的方法称为统计控制,可以作为试验控制的辅助手段。以统计控制为目的,综合线性回归分析与方差分析所得到的统计分析方法,称为协方差分析,所需要统计控制的一个或多个因素,例如苹果树的长势,又如动物的初重等等称为协变量。
data ex; do a=1 to 3;do i=1 to 8; • input x y @ @;output ;end;end; • cards; • 47 54 58 66 53 63 46 51 49 56 56 66 54 61 44 50 • 52 54 53 53 64 67 58 62 59 62 61 63 63 64 66 69 • 44 52 48 58 46 54 50 61 59 70 57 64 58 69 53 66 • ; • procglm;class a;model y=x a/solution; • lsmeans a/stderr pdiff;run;
四、双因素协方差分析 • (一)不考虑交互作用的双因素协方差分析
data ex;do a=1 to 3 ;do b=1 to 5 ; input x y @ @;output; end; end; cards; 8 2.85 10 4.24 12 3.00 11 4.94 10 2.88 10 3.14 12 4.50 7 2.75 12 5.84 10 4.06 12 3.88 10 3.86 9 2.82 10 4.94 9 2.89 ; procglm;class a b ;model y=x a b/solution; lsmeans a b/stderr pdiff;run;
各小区的产量矫正后没有显著的差异,各品种的产量矫正后有极显著的差异。各小区的产量矫正后没有显著的差异,各品种的产量矫正后有极显著的差异。