1 / 48

八、协方差分析

八、协方差分析. 协方差分析的原理:方差分析 + 回归分析 协方差分析的应用:校正非处理因素 UN;. 协方差分析 GLM 过程的调用. PROC GLM; CLASS 效应名 ; MODEL 因变量 = 效应名 自变量 /SOLUTION; MEANS 效应名 /DUNCAN; LSMEANS 效应名 /STDERR PDIFF TDIFF;. INPUT T$ X Y@@; CARDS; CK 1.50 12.40 CK 1.85 12.00 CK 1.35 10.80 CK 1.45 10.00 CK 1.40 11.00 CK 1.45 11.80

tierra
Download Presentation

八、协方差分析

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 八、协方差分析 • 协方差分析的原理:方差分析+回归分析 • 协方差分析的应用:校正非处理因素UN;

  2. 协方差分析GLM过程的调用 PROC GLM; CLASS 效应名; MODEL 因变量=效应名 自变量/SOLUTION; MEANS 效应名 /DUNCAN; LSMEANS效应名 /STDERR PDIFF TDIFF;

  3. INPUT T$ X Y@@; CARDS; CK 1.50 12.40 CK 1.85 12.00 CK 1.35 10.80 CK 1.45 10.00 CK 1.40 11.00 CK 1.45 11.80 CK 1.50 12.50 CK 1.55 13.40 CK 1.40 11.20 CK 1.50 11.60 CK 1.60 12.60 CK 1.70 12.50 1 1.35 10.20 1 1.20 9.40 1 1.45 12.20 1 1.20 10.30 1 1.40 11.30 1 1.30 11.40 1 1.15 12.80 1 1.30 10.90 1 1.35 11.60 1 1.15 8.50 1 1.35 12.20 1 1.20 9.30 2 1.15 10.00 2 1.10 10.60 2 1.10 10.40 2 1.05 9.20 2 1.40 13.00 2 1.45 13.50 2 1.30 13.00 2 1.70 14.80 2 1.40 12.30 2 1.45 13.20 2 1.25 12.00 2 1.30 12.80

  4. 3 1.20 12.40 3 1.00 9.80 3 1.15 11.60 3 1.10 10.60 3 1.00 9.20 3 1.45 13.90 3 1.35 12.80 3 1.15 9.30 3 1.10 9.60 3 1.20 12.40 3 1.05 11.20 3 1.10 11.00 ; PROC GLM; CLASS T; MODEL Y= T X/SOLUTION; MEANS T/DUNCAN; LSMEANS T/STDERR PDIFF TDIFF; RUN;

  5. 实行内容 • 一元协方差分析 • 多因素协方差分析 • 多元协方差分析

  6. 九、非线性回归分析 • 非线性模型---线性模型 • 非线性模型的建立 • 模型参数的估计

  7. 牛产犊月份-产奶量 • t :牛产犊月份 • Y: 305天产奶量

  8. 奶牛泌乳曲线 • t: 产奶时间 • yt: 产奶量 • a*b*c>0 • a:反映奶牛的产奶潜力 • b:反映奶牛达到产奶高峰的速率 • c:反映奶牛达到产奶高峰后下降的速率

  9. 动物生长曲线 • yt:时间t时的体重 • a:反映体重极限 • k:反映接近这一极限的速率 • b:反映达到最大生长率的时间

  10. 产蛋曲线 • y(t):时间t时的产蛋量 • t:产蛋时间 • a:反映群体最大的产蛋潜力 • b:反映群体产蛋能力的衰减速度 • c:反映了开产日龄的变异情况 • d:反映开产日龄

  11. 非线性模型参数的估计方法 • 线性化后的最小二乘估计法 • — REG 过程 或者 GLM过程 • 直接求解法 • — NLIN 过程

  12. 线性化后的最小二乘估计法— GLM过程

  13. data ; • input t y @@; • t2= t*t; • cards; • 1 3833 2 3812 3 3769 4 3566 5 3482 6 3373 7 3477 9 3466 10 3809 11 3817 12 3885 • ; • PROC REG; MODEL Y=T T2; RUN; • PROC GLM; MODEL Y=T T2/SOLUTION; RUN;

  14. REG过程的参数估计结果 GLM过程的参数估计结果

  15. 直接求解法 — NLIN 过程 • PROC NLN 选项; • MODEL 因变量=模型表达式; • PARMS 参数=初始值; • DER.参数=偏导表达式; METHOD=迭代方法 GUASS(高斯-牛顿法) MARQUARDT(麦夸特法) NEWTON(牛顿法) GRADIENT(梯度法) DUD(试位法) SMETHOD=步长决定方法 HALVE(步长减半法) GOLDEN(黄金分割法) ARMGOLD(Goldstein-Armijo 法) CUBIC(三次曲线插值法)

  16. 奶牛泌乳曲线 • t: 产奶时间 • yt: 产奶量 • a*b*c>0 • a:反映奶牛的产奶潜力 • b:反映奶牛达到产奶高峰的速率 • c:反映奶牛达到产奶高峰后下降的速率

  17. DATA; • INPUT T Y@@; • CARDS; • 1 1200 2 1260 3 1310 4 1420 5 1320 6 1280 7 1200 8 1140 9 930 10 840 • ; • PROC NLIN METHOD=DUN; • MODEL Y=a*t**b*EXP(-c*t); • PARMS a=1000 b= 0.4 c=0.2; • RUN;

  18. DUD Initialization • Dependent Variable Y • DUD Initialization • Sum of • DUD A B C Squares • -4 1000.0 0.4000 0.2000 3156653 • -3 1100.0 0.4000 0.2000 2515449 • -2 1000.0 0.4400 0.2000 2758027 • -1 1000.0 0.4000 0.2200 3844078

  19. Iterative Phase • Sum of • Iter A B C Squares • 0 1100.0 0.4000 0.2000 2515449 • 1 1156.0 0.3001 0.0947 172852 • 2 1225.6 0.3739 0.1085 54163.0 • 3 1270.5 0.4085 0.1287 37199.3 • 4 1274.7 0.4013 0.1255 34866.0 • 5 1303.7 0.4202 0.1337 32302.0 • 6 1302.6 0.4234 0.1344 32299.9 • 7 1301.5 0.4221 0.1338 32287.7 • 8 1301.3 0.4219 0.1337 32287.6 • 9 1301.0 0.4220 0.1337 32287.0 • 10 1301.0 0.4220 0.1337 32287.0 • 11 1301.0 0.4221 0.1338 32287.0 • 12 1301.0 0.4221 0.1338 32287.0

  20. NOTE: Convergence criterion met.Estimation Summary • Method DUD • Iterations 12 • Object 6.33E-10 • Objective 32286.98 • Observations Read 10 • Observations Used 10 • Observations Missing 0

  21. Estimation Summary • Estimation Summary • The NLIN Procedure • Sum of Mean Approx Source DF Squares Square F Value Pr > F Regression 3 14418713 4806238 1042.02 <.0001 residual 7 32287.0 4612.4 Uncorrected Total 10 14451000 Corrected Total 9 290000

  22. Approx • Parameter Estimate Std Error • Approximate 95% • Confidence Limits • A 1301.0 57.4655 1165.1 1436.9 • B 0.4221 0.0871 0.2162 0.6280 • C 0.1338 0.0216 0.0827 0.1849

  23. Approximate Correlation Matrix • Approximate Correlation Matrix • A B C • A 1.0000000 -0.5013475 -0.2347389 • B -0.5013475 1.0000000 0.9490135 • C -0.2347389 0.9490135 1.0000000

  24. 奶牛泌乳曲线 • t: 产奶时间 • yt: 产奶量 • a*b*c>0 • a:反映奶牛的产奶潜力 • b:反映奶牛达到产奶高峰的速率 • c:反映奶牛达到产奶高峰后下降的速率

  25. 十、 绘图过程1—GCHART • PROC GCHART; • HBAR <变量名> / [选项] ; 绘出条形图  • VBAR <变量名> / [选项]; 绘出水平条形图  • BLOCK <变量名> / [选项]; 绘出三维直方图  • PIE <变量名> / [选项]; 绘出饼图  • STAR <变量名> / [选项]; 绘出星状图  • AXISn [选项]; 控制坐标轴的形状和颜色  • BY <变量名列>; 按该变量取值分层绘制,要求数据集已按该变量排序

  26. 选项 • TYPE=做图类型关键字 指定要做图的类型,即图中条块代表的含义,可选的关键字有: • FREQ 要求按指定变量的频数做图。 • PERCENT 要求按在横轴刻度表示范围内出现的频数占总数的百分比做图。 • CFREQ 按累计频数做图。 • CPERCENT 按累计百分比做图。 • LEVAL=n 如果绘图变量是连续变量,用该选项产生有N个组段的图形。 • GROUP=分组变量 要求产生以分组变量的值分组的并排图。 • SUBGROUP=亚组变量 要求每个图形内部再按亚组变量的值分块。 • CAXIS=颜色 指定坐标轴的颜色。 • CTEXT=颜色 指定坐标轴文本的颜色。

  27. 举例 • PROC GCHART; • HBAR X; • VBAR Y; • BLOCK X/TYPE=FREQ; • PIE Y/TYPE=CPERCENT; • STAR Y; • RUN;

  28. 绘图 PLOT过程 • PROC GPLOT ; • PLOT 纵坐标变量*横坐标变量/ [选项]; • PLOT2 纵坐标变量*横坐标变量/ [选项]; • SYMBOLn [选项]定义符号、添加趋势线、定义点和线的颜色  • BY <变量名列>;

  29. 举例 • procgplot; • plot y*x/ ctext=blue; • symbol value=star color=GREEN width=5; • run;

  30. 十一、次数资料的适合性(独立性)检验 • 原理:χ2检验是通过将观察值与理论值进行比较,确定两者的符合程度(或两因素之间相互独立性)。若符合程度高,则表明观察值可用某种理论比例去解释(或两因素之间相互独立);反之,就应该淘汰这一假设理论,换另一种理论去解释(或两因素之间相互有关联)。 • 应用:次数性资料比较中的显著性检验

  31. χ2检验的SAS过程 • PROC FREQ 选项; • TABLES 要求/选项; • WEIGHT 变量;

  32. 适合性检验:举例 • 猪场 300头仔猪,公猪有160 头,母猪140头,检验这群仔猪性别比例是否符合1:1的理论比例。 • 公 母 • 实际比例 160 140 • 理论比例 150 150

  33. Data ; • Do A=1 to 2; Do B=1 to 2; • Input X @@; output; • end; end; • Cards; • 160 140 150 150 • ; • ProcFREQ; • Tables A*B/chisq nocol norow ; • Weight X; • Run;Run;

  34. Table of A by B • A B • Frequency‚ • Percent ‚ 1‚ 2‚ Total • ======================= • 1 ‚ 160 ‚ 140 ‚ 300 • ‚ 26.67 ‚ 23.33 ‚ 50.00 • ---------------------------------------- • 2 ‚ 150 ‚ 150 ‚ 300 • ‚ 25.00 ‚ 25.00 ‚ 50.00 • ========================= • Total 310 290 600 • 51.67 48.33 100.00

  35. Statistics for Table of A by B • Statistic DF Value Prob • ========================================= • Chi-Square 1 0.6674 0.4140 • Likelihood Ratio Chi-Square 1 0.6675 0.4139 • Continuity Adj. Chi-Square 1 0.5406 0.4622 • Mantel-Haenszel Chi-Square 1 0.6663 0.4143 • Phi Coefficient 0.0334 • Contingency Coefficient 0.0333 • Cramer's V 0.0334

  36. 独立性检验—举例 • 请对格陵兰岛和冰岛人的M-N基因型频率进行卡方检验,计算显著性概率值。 • MM MN NN • 格林兰人 475 89 5 569 • 冰岛人 233 385 129 747

  37. Data ; • Do A=1 to 2; Do B=1 to 3; • Input X @@; output; • end; end; • Cards; • 475 89 5 233 385 129 • ; • ProcFREQ; • Tables A*B/chisq nocol norow ; • Weight X; • Run;

  38. A B • Frequency‚ • Percent ‚ 1‚ 2‚ 3‚ Total • -------------------------------------------------- • 1 ‚ 475 ‚ 89 ‚ 5 ‚ 569 • ‚ 36.09 ‚ 6.76 ‚ 0.38 ‚ 43.24 • ----------------------------------------------------- • 2 ‚ 233 ‚ 385 ‚ 129 ‚ 747 • ‚ 17.71 ‚ 29.26 ‚ 9.80 ‚ 56.76 • ------------------------------------------------------ • Total 7 08 474 134 1316 • 53.80 36.02 10.18 100.00

  39. 实习内容 • 为了比较不同日粮对于仔猪增重效果的影响,用三种日粮和标准日粮进行了12头仔猪的饲养实验 ,哺乳期30天,试分析不同日粮对于仔猪哺乳期日增重的影响。 • 具体资料如下:

More Related