480 likes | 658 Views
八、协方差分析. 协方差分析的原理:方差分析 + 回归分析 协方差分析的应用:校正非处理因素 UN;. 协方差分析 GLM 过程的调用. PROC GLM; CLASS 效应名 ; MODEL 因变量 = 效应名 自变量 /SOLUTION; MEANS 效应名 /DUNCAN; LSMEANS 效应名 /STDERR PDIFF TDIFF;. INPUT T$ X Y@@; CARDS; CK 1.50 12.40 CK 1.85 12.00 CK 1.35 10.80 CK 1.45 10.00 CK 1.40 11.00 CK 1.45 11.80
E N D
八、协方差分析 • 协方差分析的原理:方差分析+回归分析 • 协方差分析的应用:校正非处理因素UN;
协方差分析GLM过程的调用 PROC GLM; CLASS 效应名; MODEL 因变量=效应名 自变量/SOLUTION; MEANS 效应名 /DUNCAN; LSMEANS效应名 /STDERR PDIFF TDIFF;
INPUT T$ X Y@@; CARDS; CK 1.50 12.40 CK 1.85 12.00 CK 1.35 10.80 CK 1.45 10.00 CK 1.40 11.00 CK 1.45 11.80 CK 1.50 12.50 CK 1.55 13.40 CK 1.40 11.20 CK 1.50 11.60 CK 1.60 12.60 CK 1.70 12.50 1 1.35 10.20 1 1.20 9.40 1 1.45 12.20 1 1.20 10.30 1 1.40 11.30 1 1.30 11.40 1 1.15 12.80 1 1.30 10.90 1 1.35 11.60 1 1.15 8.50 1 1.35 12.20 1 1.20 9.30 2 1.15 10.00 2 1.10 10.60 2 1.10 10.40 2 1.05 9.20 2 1.40 13.00 2 1.45 13.50 2 1.30 13.00 2 1.70 14.80 2 1.40 12.30 2 1.45 13.20 2 1.25 12.00 2 1.30 12.80
3 1.20 12.40 3 1.00 9.80 3 1.15 11.60 3 1.10 10.60 3 1.00 9.20 3 1.45 13.90 3 1.35 12.80 3 1.15 9.30 3 1.10 9.60 3 1.20 12.40 3 1.05 11.20 3 1.10 11.00 ; PROC GLM; CLASS T; MODEL Y= T X/SOLUTION; MEANS T/DUNCAN; LSMEANS T/STDERR PDIFF TDIFF; RUN;
实行内容 • 一元协方差分析 • 多因素协方差分析 • 多元协方差分析
九、非线性回归分析 • 非线性模型---线性模型 • 非线性模型的建立 • 模型参数的估计
牛产犊月份-产奶量 • t :牛产犊月份 • Y: 305天产奶量
奶牛泌乳曲线 • t: 产奶时间 • yt: 产奶量 • a*b*c>0 • a:反映奶牛的产奶潜力 • b:反映奶牛达到产奶高峰的速率 • c:反映奶牛达到产奶高峰后下降的速率
动物生长曲线 • yt:时间t时的体重 • a:反映体重极限 • k:反映接近这一极限的速率 • b:反映达到最大生长率的时间
产蛋曲线 • y(t):时间t时的产蛋量 • t:产蛋时间 • a:反映群体最大的产蛋潜力 • b:反映群体产蛋能力的衰减速度 • c:反映了开产日龄的变异情况 • d:反映开产日龄
非线性模型参数的估计方法 • 线性化后的最小二乘估计法 • — REG 过程 或者 GLM过程 • 直接求解法 • — NLIN 过程
data ; • input t y @@; • t2= t*t; • cards; • 1 3833 2 3812 3 3769 4 3566 5 3482 6 3373 7 3477 9 3466 10 3809 11 3817 12 3885 • ; • PROC REG; MODEL Y=T T2; RUN; • PROC GLM; MODEL Y=T T2/SOLUTION; RUN;
REG过程的参数估计结果 GLM过程的参数估计结果
直接求解法 — NLIN 过程 • PROC NLN 选项; • MODEL 因变量=模型表达式; • PARMS 参数=初始值; • DER.参数=偏导表达式; METHOD=迭代方法 GUASS(高斯-牛顿法) MARQUARDT(麦夸特法) NEWTON(牛顿法) GRADIENT(梯度法) DUD(试位法) SMETHOD=步长决定方法 HALVE(步长减半法) GOLDEN(黄金分割法) ARMGOLD(Goldstein-Armijo 法) CUBIC(三次曲线插值法)
奶牛泌乳曲线 • t: 产奶时间 • yt: 产奶量 • a*b*c>0 • a:反映奶牛的产奶潜力 • b:反映奶牛达到产奶高峰的速率 • c:反映奶牛达到产奶高峰后下降的速率
DATA; • INPUT T Y@@; • CARDS; • 1 1200 2 1260 3 1310 4 1420 5 1320 6 1280 7 1200 8 1140 9 930 10 840 • ; • PROC NLIN METHOD=DUN; • MODEL Y=a*t**b*EXP(-c*t); • PARMS a=1000 b= 0.4 c=0.2; • RUN;
DUD Initialization • Dependent Variable Y • DUD Initialization • Sum of • DUD A B C Squares • -4 1000.0 0.4000 0.2000 3156653 • -3 1100.0 0.4000 0.2000 2515449 • -2 1000.0 0.4400 0.2000 2758027 • -1 1000.0 0.4000 0.2200 3844078
Iterative Phase • Sum of • Iter A B C Squares • 0 1100.0 0.4000 0.2000 2515449 • 1 1156.0 0.3001 0.0947 172852 • 2 1225.6 0.3739 0.1085 54163.0 • 3 1270.5 0.4085 0.1287 37199.3 • 4 1274.7 0.4013 0.1255 34866.0 • 5 1303.7 0.4202 0.1337 32302.0 • 6 1302.6 0.4234 0.1344 32299.9 • 7 1301.5 0.4221 0.1338 32287.7 • 8 1301.3 0.4219 0.1337 32287.6 • 9 1301.0 0.4220 0.1337 32287.0 • 10 1301.0 0.4220 0.1337 32287.0 • 11 1301.0 0.4221 0.1338 32287.0 • 12 1301.0 0.4221 0.1338 32287.0
NOTE: Convergence criterion met.Estimation Summary • Method DUD • Iterations 12 • Object 6.33E-10 • Objective 32286.98 • Observations Read 10 • Observations Used 10 • Observations Missing 0
Estimation Summary • Estimation Summary • The NLIN Procedure • Sum of Mean Approx Source DF Squares Square F Value Pr > F Regression 3 14418713 4806238 1042.02 <.0001 residual 7 32287.0 4612.4 Uncorrected Total 10 14451000 Corrected Total 9 290000
Approx • Parameter Estimate Std Error • Approximate 95% • Confidence Limits • A 1301.0 57.4655 1165.1 1436.9 • B 0.4221 0.0871 0.2162 0.6280 • C 0.1338 0.0216 0.0827 0.1849
Approximate Correlation Matrix • Approximate Correlation Matrix • A B C • A 1.0000000 -0.5013475 -0.2347389 • B -0.5013475 1.0000000 0.9490135 • C -0.2347389 0.9490135 1.0000000
奶牛泌乳曲线 • t: 产奶时间 • yt: 产奶量 • a*b*c>0 • a:反映奶牛的产奶潜力 • b:反映奶牛达到产奶高峰的速率 • c:反映奶牛达到产奶高峰后下降的速率
十、 绘图过程1—GCHART • PROC GCHART; • HBAR <变量名> / [选项] ; 绘出条形图 • VBAR <变量名> / [选项]; 绘出水平条形图 • BLOCK <变量名> / [选项]; 绘出三维直方图 • PIE <变量名> / [选项]; 绘出饼图 • STAR <变量名> / [选项]; 绘出星状图 • AXISn [选项]; 控制坐标轴的形状和颜色 • BY <变量名列>; 按该变量取值分层绘制,要求数据集已按该变量排序
选项 • TYPE=做图类型关键字 指定要做图的类型,即图中条块代表的含义,可选的关键字有: • FREQ 要求按指定变量的频数做图。 • PERCENT 要求按在横轴刻度表示范围内出现的频数占总数的百分比做图。 • CFREQ 按累计频数做图。 • CPERCENT 按累计百分比做图。 • LEVAL=n 如果绘图变量是连续变量,用该选项产生有N个组段的图形。 • GROUP=分组变量 要求产生以分组变量的值分组的并排图。 • SUBGROUP=亚组变量 要求每个图形内部再按亚组变量的值分块。 • CAXIS=颜色 指定坐标轴的颜色。 • CTEXT=颜色 指定坐标轴文本的颜色。
举例 • PROC GCHART; • HBAR X; • VBAR Y; • BLOCK X/TYPE=FREQ; • PIE Y/TYPE=CPERCENT; • STAR Y; • RUN;
绘图 PLOT过程 • PROC GPLOT ; • PLOT 纵坐标变量*横坐标变量/ [选项]; • PLOT2 纵坐标变量*横坐标变量/ [选项]; • SYMBOLn [选项]定义符号、添加趋势线、定义点和线的颜色 • BY <变量名列>;
举例 • procgplot; • plot y*x/ ctext=blue; • symbol value=star color=GREEN width=5; • run;
十一、次数资料的适合性(独立性)检验 • 原理:χ2检验是通过将观察值与理论值进行比较,确定两者的符合程度(或两因素之间相互独立性)。若符合程度高,则表明观察值可用某种理论比例去解释(或两因素之间相互独立);反之,就应该淘汰这一假设理论,换另一种理论去解释(或两因素之间相互有关联)。 • 应用:次数性资料比较中的显著性检验
χ2检验的SAS过程 • PROC FREQ 选项; • TABLES 要求/选项; • WEIGHT 变量;
适合性检验:举例 • 猪场 300头仔猪,公猪有160 头,母猪140头,检验这群仔猪性别比例是否符合1:1的理论比例。 • 公 母 • 实际比例 160 140 • 理论比例 150 150
Data ; • Do A=1 to 2; Do B=1 to 2; • Input X @@; output; • end; end; • Cards; • 160 140 150 150 • ; • ProcFREQ; • Tables A*B/chisq nocol norow ; • Weight X; • Run;Run;
Table of A by B • A B • Frequency‚ • Percent ‚ 1‚ 2‚ Total • ======================= • 1 ‚ 160 ‚ 140 ‚ 300 • ‚ 26.67 ‚ 23.33 ‚ 50.00 • ---------------------------------------- • 2 ‚ 150 ‚ 150 ‚ 300 • ‚ 25.00 ‚ 25.00 ‚ 50.00 • ========================= • Total 310 290 600 • 51.67 48.33 100.00
Statistics for Table of A by B • Statistic DF Value Prob • ========================================= • Chi-Square 1 0.6674 0.4140 • Likelihood Ratio Chi-Square 1 0.6675 0.4139 • Continuity Adj. Chi-Square 1 0.5406 0.4622 • Mantel-Haenszel Chi-Square 1 0.6663 0.4143 • Phi Coefficient 0.0334 • Contingency Coefficient 0.0333 • Cramer's V 0.0334
独立性检验—举例 • 请对格陵兰岛和冰岛人的M-N基因型频率进行卡方检验,计算显著性概率值。 • MM MN NN • 格林兰人 475 89 5 569 • 冰岛人 233 385 129 747
Data ; • Do A=1 to 2; Do B=1 to 3; • Input X @@; output; • end; end; • Cards; • 475 89 5 233 385 129 • ; • ProcFREQ; • Tables A*B/chisq nocol norow ; • Weight X; • Run;
A B • Frequency‚ • Percent ‚ 1‚ 2‚ 3‚ Total • -------------------------------------------------- • 1 ‚ 475 ‚ 89 ‚ 5 ‚ 569 • ‚ 36.09 ‚ 6.76 ‚ 0.38 ‚ 43.24 • ----------------------------------------------------- • 2 ‚ 233 ‚ 385 ‚ 129 ‚ 747 • ‚ 17.71 ‚ 29.26 ‚ 9.80 ‚ 56.76 • ------------------------------------------------------ • Total 7 08 474 134 1316 • 53.80 36.02 10.18 100.00
实习内容 • 为了比较不同日粮对于仔猪增重效果的影响,用三种日粮和标准日粮进行了12头仔猪的饲养实验 ,哺乳期30天,试分析不同日粮对于仔猪哺乳期日增重的影响。 • 具体资料如下: