SAS
This presentation is the property of its rightful owner.
Sponsored Links
1 / 70

SAS 菜单系统 — 分析家模块 S tatistical A nalysis S ystem PowerPoint PPT Presentation


  • 209 Views
  • Uploaded on
  • Presentation posted in: General

SAS 菜单系统 — 分析家模块 S tatistical A nalysis S ystem. — A nalyst A pplication. 公共卫生学院信息数据处理教学实验室. SAS 软件简介. 1966 年美国 North Carolina 大学的两位生物统计学教授开始研制 SAS 系统,直至 1976 年成立了 SAS 软件研究所,正式推出了 SAS 软件, 1985 年推出微机版 SAS 。

Download Presentation

SAS 菜单系统 — 分析家模块 S tatistical A nalysis S ystem

An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -

Presentation Transcript


Sas s tatistical a nalysis s ystem

SAS菜单系统—分析家模块

Statistical Analysis System

—Analyst Application

公共卫生学院信息数据处理教学实验室


Sas s tatistical a nalysis s ystem

SAS软件简介

1966年美国North Carolina大学的两位生物统计学教授开始研制SAS系统,直至1976年成立了SAS软件研究所,正式推出了SAS软件,1985年推出微机版SAS。

SAS是用于决策支持的大型集成信息系统,软件系统最早的功能限于统计分析,现在统计分析功能也仍是它的重要组成部分和核心功能。SAS现在的最新版本为9.1版,大小约为2GB。


Sas s tatistical a nalysis s ystem

学习SAS软件时,需要用户有基本的统计学知识,对所选用的统计方法有较清楚的了解,没有统计学基础知识要掌握SAS软件较为困难。

由于SAS是从大型机上的系统发展而来,在设计上也是完全针对专业用户进行设计,因此操作以SAS语言编程为主,同时也有非编程方式的菜单系统。


Sas s tatistical a nalysis s ystem

第一节 SAS软件的使用基础

一、SAS的启动和退出

  • 启动SAS

    • 双击桌面SAS图标

    • 开始菜单  程序  SAS SAS9.1(中文)

    • 直接双击SAS应用程序

  • 退出SAS

    • 标题栏关闭按钮

    • 菜单栏 文件 退出

    • 在命令框键入“Bye”或“Endsas”


Sas s tatistical a nalysis s ystem

二、SAS的工作窗口

标题栏、菜单栏、命令框、工具栏

  • 编辑器 程序编辑窗口

  • 日志 运行过程记录窗口

  • 输出 结果输出窗口

  • 结果/资源管理器


Sas s tatistical a nalysis s ystem

三、SAS中的几个菜单模块

  • 分析家模块

    菜单栏 解决方案 分析 分析家

  • 交互式数据分析模块菜单栏 解决方案 分析 交互式数据分析

  • 向导式数据分析模块菜单栏 解决方案 分析 向导式数据分析

  • ASSIST模块

    菜单栏 解决方案 ASSIST


Sas s tatistical a nalysis s ystem

  • 分析家模块


Sas s tatistical a nalysis s ystem

交互式数据分析模块


Sas s tatistical a nalysis s ystem

  • ASSIST模块


Sas s tatistical a nalysis s ystem

第二节 SAS数据集

SAS数据集(SAS Dataset)

数据值被安排在一个矩阵式的表格结构中

每一行数据表示一个观测(Observation)

每一列数据表示一个变量(Variable)

  • 变量命名:1~8个字符,第1个字符必须是字母,后面可以是字母、数字和下划线

  • 变量类型:数值型、字符型和日期时间型

    字符型变量名后加“$”表示,

    日期型: '16OCT98'D,时间型: '9:25:30'T

  • 变量缺失值:用“.”表示


Sas s tatistical a nalysis s ystem

一、SAS数据集的种类

  • 临时SAS数据集

    不保存,一旦退出SAS就消失。

  • 永久SAS数据集

    保存在用户指定的文件夹里。

    需要指定用户文件夹的位置(创建库标记)。


Sas s tatistical a nalysis s ystem

二、创建SAS永久数据集

1. 创建新的库标记

点工具栏 按钮,打开 新建逻辑库 对话框

在 名称 框中键入库标记名

在 路径 框中指定相对应的文件夹,OK

可以按 浏览 查找文件夹位置

可以在右上角 启动时启用 前打钩,即启动SAS就自动建立这个库标记。


Sas s tatistical a nalysis s ystem

2. 建立新的SAS数据集

菜单栏 解决方案 分析 分析家

  • 打开分析家窗口直接输入数据

  • 保存数据:文件 保存(工具栏 )

    在 逻辑库 框中选择已建立的库标记

    • 选Work 可以建临时数据集

    • 也可在此建立新的库标记

      在下面的成员名框中键入数据集文件名,保存


Sas s tatistical a nalysis s ystem

三、由其它类型数据文件转换成SAS数据集

菜单栏 文件 导入数据SAS可以直接与下列格式文件互相转换

  • Microsoft Excel 97/2000/2002 File (*.xls)

  • Microsoft Access 97/2000/2002 Database

  • dBASE/FoxBASE File (*.dbf)

  • Lotus 1/3/4 File (*.wk1/3/4)

  • Delimited File (*.*) 空格分隔

  • Tab Delimited File (*.txt) 制表符分隔

  • Comma Separated Velues(*.csv)逗号分隔


Sas s tatistical a nalysis s ystem

第三节 描述性统计

1. 打开已有的SAS数据集:

  • 常用工具栏 打开按钮

  • 菜单栏 文件 打开(按SAS名称打开)

    2. 现场输入数据:

    在类似 Excel的工作表中的某一列第一行开始输入数据,每一个变量输在一列中,如果有20个人(观测)每人有4个变量:性别、年龄、身高和体重,建成的数据集应该有4列20行。(单击列标题可以改变量名)


Sas s tatistical a nalysis s ystem

一、数值变量的描述性统计

(1)作简单统计描述(每个变量输在1列中)

菜单栏 统计 描述性统计 汇总统计量

把要分析的变量选入Analysis窗口

有分组变量可以选入Class窗口

选Statistics可以选更多的统计分析结果

选Plots可以作箱式图或直方图

选Variables可以对变量有更多的选择方式, 如频数变量的选入

OK 完成


Sas s tatistical a nalysis s ystem

(2)作详细统计描述

菜单栏 统计 描述性统计 分布

把要分析的变量选入Analysis窗口

有分组变量可选入Class窗口

选Plots可以作箱式图、直方图或概率图

选Fit可以在直方图中加上指定的曲线

选Variables可以对变量有更多的选择方式,如频数变量的选入

OK 完成


Sas s tatistical a nalysis s ystem

详细描述结果(1)

N 24 权重总和 24

均值 1.2846 观测总和 30.83

标准偏差 0.4687 方差 0.2196

偏度 0.1060 峰度 -0.9930

未校平方和ΣX2 44.6555 校正平方和 5.0518

变异系数 36.4835 标准误差均值 0.0957

基本统计测度

位置 变异性

均值 1.284583 标准偏差 0.46866

中位数 1.270000 方差 0.21964

众数 1.200000 极差 1.57000

四分位极差 0.79000


Sas s tatistical a nalysis s ystem

详细描述结果(2) 位置检验: Mu0=0

检验 --统计量--- -------P 值-------

t 检验 学生 t t 13.4279 Pr > |t| <.0001

符号检验 符号 M 12 Pr >= |M| <.0001

符号秩和检验 符号秩 S 150 Pr >= |S| <.0001

分位数(定义 5)

分位数 估计值

100% 最大值 2.110

99% 2.110

95% 2.070

90% 1.870

75% Q3 1.615

50% 中位数 1.270

分位数 估计值

25% Q1 0.825

10% 0.640

5% 0.640

1% 0.540

0% 最小值 0.540


Sas s tatistical a nalysis s ystem

极值观测

----最小值---- ----最大值----

值 观测 值 观测

0.54 12 1.80 8

0.64 14 1.87 9

0.64 13 1.87 24

0.75 15 2.07 10

0.76 16 2.11 11


Sas s tatistical a nalysis s ystem

二、分类变量的描述性统计

  • 作一维频数表

    菜单栏 统计 描述 频数统计

    把变量选入Frequencies 窗口,OK

  • 作二维频数表

    菜单栏 统计 表分析

    分别把变量选入Row、Column、Strata窗口,OK

    用Tables可以选择在每个格中出现更多结果


Sas s tatistical a nalysis s ystem

一维频数表结果

变量名

G 频数 百分比 累计频数 累计百分比

2 78 30.2 78 30.2

3 85 32.9 163 63.2

4 95 36.8 258 100.0


Sas s tatistical a nalysis s ystem

二维频数表结果

B (行变量名)

频数|

百分比 | C(列变量名)

行百分比|

列百分比| 1 | 2 | 3 | 4 | 合计

---------+--------+---------+---------+--------+

1 | 0 | 6 | 37 | 26 | 69

| 0.00 | 6.32 | 38.95 | 27.37 | 72.63

| 0.00 | 8.70 | 53.62 | 37.68 |

| . | 75.00 | 67.27 | 81.25 |

---------+--------+---------+---------+--------+

2 | 0 | 2 | 18 | 6 | 26

| 0.00 | 2.11 | 18.95 | 6.32 | 27.37

| 0.00 | 7.69 | 69.23 | 23.08 |

| . | 25.00 | 32.73 | 18.75 |

---------+--------+---------+---------+--------+

合计  0 8 55 32 95

0.00 8.42 57.89 33.68 100.00


Sas s tatistical a nalysis s ystem

第四节 数值变量资料假设检验

一、未知总体与己知总体均数比较

把一组样本的数据输在一列中

菜单栏 统计 假设检验  均值的单样本 t 检验  

在Variable窗口选入变量,Mean 窗口输入μ, OK

选Plots可以作箱式图、条图或 t 分布曲线图

  • μ和σ己知时可选均值的单样本 u 检验,

    在 Mean 窗口输入μ, Std Dev窗口输入σ。


Sas s tatistical a nalysis s ystem

单样本 t 检验结果

One Sample t-test for a Mean

Sample Statistics for x (样本统计量)

N Mean Std. Dev. Std. Error

15 3236.67 586.60 151.46

Hypothesis Test (假设检验)

Null hypothesis: H0 Mean of x = 3000

Alternative: H1 Mean of x ^= 3000

t Statistic Df Prob > t

t值 自由度 P值

1.563 14 0.1405


Sas s tatistical a nalysis s ystem

二、配对设计资料比较的 t检验

配对的数据分别输在两列中

菜单栏 统计 假设检验 均值的双样本成对 t 检验

分别选入第一列和第二列变量 ,OK

选Plots可以作箱式图、均值条图或 t 分布曲线图


Sas s tatistical a nalysis s ystem

配对t检验结果

Two Sample Paired t-test for the Means of X1 and X2

Sample Statistics (样本统计量)

Group N Mean Std. Dev. Std. Error

X1 10 70.7 14.568 4.6069

X2 10 69.8 14.793 4.6781

Hypothesis Test (假设检验)

Null hypothesis: H0 Mean of (X1 - X2) = 0

Alternative: H1 Mean of (X1 - X2) ^= 0

t Statistic Df Prob > t

t值 自由度 P值

1.247 9 0.2440


Sas s tatistical a nalysis s ystem

三、完全随机设计两总体均数比较 t检验

分析的变量和分组变量各输在一列中

菜单栏 统计 假设检验 均值的双样本 t 检验

在Dependent窗口选入要分析的变量

在Group窗口选入分组变量,OK

选Plots可以作箱式图、均值条图或 t 分布曲线图


Sas s tatistical a nalysis s ystem

两样本均数比较 t 检验结果

Two Sample t-test for the Means of X within G

Sample Statistics 样本统计量

Group N Mean Std. Dev. Std. Error

0 11 1.5209 0.4218 0.1272

1 13 1.0846 0.4221 0.1171

Hypothesis Test 假设检验

Null hypothesis: H0 Mean 1 - Mean 2 = 0

Alternative: H1 Mean 1 - Mean 2 ^= 0

If Variances Are t statistic Df Pr > t

Equal 方差齐2.524 22 0.0193

Not Equal方差不齐 2.524 21.35 0.0196


Sas s tatistical a nalysis s ystem

四、两组完全随机设计资料方差齐性检验

分析的变量和分组变量各输在一列中

菜单栏 统计 假设检验 方差的双样本检验

在Dependent窗口选入要分析的变量

在Group窗口选入分组变量,OK


Sas s tatistical a nalysis s ystem

两样本方差齐性检验结果

Two Sample Test for Variances of X within G

Sample Statistics (样本统计量)

Group N Mean Std. Dev. Std. Error

0 11 1.5209 0.4218 0.1272

1 13 1.0846 0.4221 0.1171

Hypothesis Test (假设检验)

Null hypothesis: H0 Variance 1 / Variance 2 = 1

Alternative: H1 Variance 1 / Variance 2 ^= 1

- Degrees of Freedom自由度-

F Numer. Denom. Pr > F

F值 分子 分母 P值

1.00 10 12 0.9874


Sas s tatistical a nalysis s ystem

第五节 方差分析

一、单因素方差分析

分析的变量和分组变量各输在一列中

菜单栏 统计 方差分析 单向方差分析

在 Dependent 窗口选入分析变量

在 Independent 窗口选入分组变量

  • 需要作均数间两两比较时选 Means,

    在 Comparison Mathod 窗口中选两两比较的方法,在 Main Effacts 窗口选中分组变量,Add OK

  • 需要作方差齐性检验时选Tests,在Tests for Equal variance 中选择一种方法,OK


Sas s tatistical a nalysis s ystem

方差分析结果Analysis of Variance Procedure

Dependent Variable: X

Source DF Sum of Squares Mean Square F Value Pr > F

变异来源 自由度 SS MS F P

Model模型2 2384.02550505 1192.01275253 5.85 0.0077

Error误差27 5497.83616162 203.62356154

Total总29 7881.86166667

R-Square R2 C.V. Root MSE Sy.x X Mean

0.302470 12.93519 14.26967279 110.31666667

Source DF Anova SS Mean Square F Value Pr > F

变异来源 自由度 SS MS F P

G组间2 2384.02550505 1192.01275253 5.85 0.0077


Sas s tatistical a nalysis s ystem

Student-Newman-Keuls test for variable: X

均数间两两比较q检验(SNK法)

Means with the same letter are not significantly different.

相同字母表示的均数无显著性差别

SNK Grouping Mean N G

A 122.800 10 3

B 105.455 11 1

B

B 102.389 9 2

表示第三组均数大于前两组,而前两组均数之间的差异无统计学意义。


Sas s tatistical a nalysis s ystem

二、两因素、三因素方差分析

分析变量输在一列中,两因素时分组变量

输两列,三因素时分组变量输三列。

菜单栏 统计 方差分析 因子方差分析

在Dependent窗口选入分析变量

在Independent 窗口选入各分组变量

(交叉设计可按三因素方差分析方法作)

需要作均数间两两比较时选 Means Comparison

Means Breakdown 可以分组作统计描述


Sas s tatistical a nalysis s ystem

三、析因设计资料的方差分析

数据输入方法同两因素、三因素

菜单栏 统计 方差分析 因子方差分析

在Dependent窗口选入分析变量

在Independent 窗口选入各分组变量

  • 交互作用分析选Model, 在 Standard Models 窗口中选2-way interaction 或 3-way interaction

    把分组变量和交互项选入Effects in model


Sas s tatistical a nalysis s ystem

四、正交试验设计资料的方差分析

输入正交试验表中各主效应列水平和实验结果

如:应用L8(27)表的正交试验结果

SAS中输入数据


Sas s tatistical a nalysis s ystem

四、正交试验设计资料的方差分析

菜单栏 统计 方差分析 因子方差分析

在Dependent窗口选入分析变量

在Independent 窗口选入各分组变量

  • 交互作用分析选Model, 在 Independent 窗口逐一选

    中交互作用项,点Cross,把主效应和交互效应项选

    入Effects in model,OK

    有重复测量的数据输入时,正交表中各主效应列也要重复输,如重复实验3次,同一实验号正交表输3行,各行分别对应一次实验结果。


Sas s tatistical a nalysis s ystem

五、裂区设计资料的方差分析

数据输入方法同两因素、三因素

菜单栏 统计 方差分析 因子方差分析

在Dependent窗口选入分析变量,在Independent 窗口选入分组变量A(大区)、 B(小区)、 C(区组)

  • 选Model Standard Models Effects up to2-way interaction Effects in model窗口中 B*C Remove OK

  • 选Test 在Effects窗口中 A*BError

    在Effects窗口中 A、B Add OK OK


Sas s tatistical a nalysis s ystem

六、重复测量资料的方差分析

数据输入方法同两因素、三因素

菜单栏 统计 方差分析 重复测量

在Dependent窗口选入分析变量X,在Independent 窗口选入分组变量A(处理)、B(个体)、C(时间)

选 Model功能

  • 选Subjects,选independent中变量B Add,变量A nest

  • 选Model Standard Models Effects up to2-way interaction 选中Effects in model窗口中B、A*C、B*C Remove(只留A、C、A*C)

  • 选Repeated ,选 independent 中变量CAdd

    需要作两两比较时选Means LS Means,需要比较的变量选入LS Means框中,选中Computer pairwise differences

    OK OK


Sas s tatistical a nalysis s ystem

七、协方差分析(1)

数据输入时协变量X、分析变量Y、分组变量G各输成一列,先检验是否满足协方差分析的条件

1.各样本变量Y均来自方差齐的正态分布总体

①正态性检验

菜单栏 统计 描述性统计 分布

在Analysis窗口选入要分析的变量Y,在Classification窗口选入分组变量,打开 Fit 窗口选 Normal,OK OK

②方差齐性检验

菜单栏 统计 方差分析 单向方差分析

在 Dependent 窗口选入分析变量Y,在 Independent 窗口选入分组变量,打开Tests窗口,选Bartlett’s test OK


Sas s tatistical a nalysis s ystem

七、协方差分析(2)

2. 各样本的协变量与分析变量间有直线关系,

即各回归系数均有统计学意义

菜单栏 统计 回归 简单

把分析变量Y选入Dependent框,协变量选入Explanatory框,打开Variables窗口,把分组变量选入By Group框,OK

打开Plots窗口Predicted Plot Observed VS Independent OK ,可以分组作散点图。


Sas s tatistical a nalysis s ystem

七、协方差分析(3)

3.作各回归系数间比较:

菜单栏 统计 方差分析 线性模型

在Dependent窗口选入分析变量Y,在Class 窗口选入分组变量G,在Quantitative窗口选入协变量X

选 Model功能,将 Independent 中协变量X和分组变量G选中,Cross,OK OK

4.作修正均数间比较:

选Model功能,将Effects in model中X*G选中,Remove , OK OK

5.修正均数间两两比较:

选Means LS Means,将分组变量G选入LS Means框中,选中Computer pairwise differences, OK


Sas s tatistical a nalysis s ystem

协方差分析结果1:各回归系数间比较

Source DF Sum of Squares Mean Square F Value Pr > F

Model 5 104.3919881 20.8783976 28.98 <.0001

Error 24 17.2908786 0.7204533

Total 29 121.6828667

Source DF Type I SS Mean Square F Value Pr > F

X 1 11.21842140 11.21842140 15.57 0.0006

A 2 93.04995906 46.52497953 64.58 <.0001

X*A 2 0.12360759 0.06180380 0.09 0.9181

即:

变异来源 DF SS MS F P

回归系数间 2 0.12360759 0.06180380 0.09 0.9181

组内 24 17.2908786 0.7204533


Sas s tatistical a nalysis s ystem

协方差分析结果2:修正均数间比较

Source DF Sum of Squares Mean Square F Value Pr > F

Model 3 104.2683805 34.7561268 51.89 <.0001

Error 26 17.4144862 0.6697879

Total 29 121.6828667

Source DF Type III SS Mean Square F Value Pr > F

X 1 19.62837379 19.62837379 29.31 <.0001

A 2 93.04995906 46.52497953 69.46 <.0001

即:

变异来源 DF SS MS F P

修正均数间 2 93.04995906 46.52497953 69.46 <.0001

公共 26 17.4144862 0.6697879


Sas s tatistical a nalysis s ystem

第六节 定性资料假设检验

一、样本率与总体率比较

把样本的数据(必须是两分类)输在一列中

菜单栏 统计 假设检验  比例的单样本检验  

在Variable窗口选入变量

在Level of interest 窗口下箭头选择代表

阳性水平的数值,

在Prop 窗口输入π, OK


Sas s tatistical a nalysis s ystem

二、两样本率比较— u检验

分析变量(必须是两分类)和分组变量各输在一列中

菜单栏 统计 假设检验  比例的双样本检验  

  • 在Dependent窗口选入分析变量,

  • 在Level of interest 窗口下箭头选择代表

    阳性水平的数值,

  • 在Group 窗口选入分组变量。


Sas s tatistical a nalysis s ystem

三、样本率之间比较—χ2检验

分别输入行变量、列变量和频数共三列

菜单栏 统计 表分析

把行变量选入Row,列变量选入Column,

频数选入Cell counts,打开Statistics窗口选择

统计量:

Chi-square Statistics 计算χ2统计量

Measures of association 计算关联性统计量

Mantel-Haenszel Statistics 队列研究和病例对照研究

Measures of Agreement 配对一致性检验

Exact test for (r×c) tables计算行×列表的确切概率


Sas s tatistical a nalysis s ystem

A * B表的统计量

统计量 自由度 值 概率

卡方(χ2) 1 6.133 0.013

似然比卡方 1 6.304 0.012

连续校正卡方 1 5.118 0.024

Mantel-Haenszel卡方1 6.084 0.014

Phi系数 0.221

列联系数 0.215

Cramer 的 V 0.221

Fisher精确概率

单元格(1,1)频数(F) 15

左侧 Pr<=F 0.997

右侧 Pr>=F 0.011

表概率(P) 0.009

双侧 Pr<=P 0.018


Sas s tatistical a nalysis s ystem

配对四格表(Measures of Agreement)检验结果:

McNemar检验

统计量(S) 10.756

DF 1

P > S 0.0001

简单 Kappa 系数

Kappa 0.174

渐近标准误差 0.086

95%置信下限 0.006

95%置信上限 0.346

样本大小= 132


Sas s tatistical a nalysis s ystem

第七节 非参数检验

一、 配对设计资料(单样本)

输入一列差值后,可以用详细描述过程作符号检验和符号秩和检验

菜单栏 统计 描述性统计 分布

符号秩和检验(Sgn Rank)

为正秩和与平均秩和之差: T+-(T++T-)/2


Sas s tatistical a nalysis s ystem

详细描述结果(2)

Basic Statistical Measures基本统计测度

Location 位置 Variability变异度

Mean 均数 70.48 Std Deviation标准偏差 6.66

Median中位数 70.00 Variance 方差 44.37

Mode 众数 70.00 Range 极差 31.00

Interquartile Range 四分位极差 9.00

Tests for Location: Mu0=0位置检验

Test检验Statistic统计量p-valueP值

t 检验学生 t 146.2393 Pr > |t| <.0001

符号检验 符号 M 95.5 Pr >= |M| <.0001

符号秩和检验符号秩 S 9168 Pr >= |S| <.0001


Sas s tatistical a nalysis s ystem

二、完全随机设计资料

数值变量数据输入同单因素方差分析过程

等级资料频数表输入同χ2检验

菜单栏 统计 方差分析 非参数单向方差分析

把要分析的变量选入Dependent窗口,分组变量选入Independent 窗口,频数表资料需点开Variables窗口,选中频数,frequency, OK


Sas s tatistical a nalysis s ystem

Wilcoxon Scores (Rank Sums) for Variable X Classified by Variable G

Sum of Expected Std Dev Mean

G N Scores Under H0 Under H0 Score

秩和 理论秩和 标准差 平均秩和

1 7 93.5 63.0 10.23 13.36

0 10 59.5 90.0 10.23 5.95

Average Scores Were Used for Ties(相同秩次已经校正求平均)

Wilcoxon Two-Sample Test

Statistic(n较小的样本秩和) 93.5000

Normal Approximation(正态近似)

Z (u) 2.93129

One-Sided Pr< Z 0.0018 Two-Sided Pr > |Z| 0.0034

t Approximation (t 近似)

One-Sided Pr< Z 0.0023 Two-Sided Pr > |Z| 0.0098

Kruskal-Wallis Test

CHISQ = 8.8813 DF = 1 Prob > CHISQ = 0.0034


Sas s tatistical a nalysis s ystem

三、随机区组设计资料

数据输入同两因素方差分析格式,但不输入实测值,而输入秩次。

菜单栏 统计 表分析

把行变量选入Strata,列变量选入Row,

秩次选入Column,打开Statistics窗口,

选中 Mantel-Haenszel Statistics

选中Print statistics only (no tables),

OK OK


Sas s tatistical a nalysis s ystem

结果中第二个表:

B(列) * C(秩次)的汇总统计量

A(行) 的控制

Cochran-Mantel-Haenszel 统计量 (基于表得分)

统计量 对立假设 自由度 值 概率

1 非零相关 1 23.400 0.001

2 行均值得分差值 3 23.5380.001

3 一般关联 12 66.000 0.001

Total Sample Size = 32

(Friedman χ2c)


Sas s tatistical a nalysis s ystem

第八节 相关回归分析

一、相关分析和散点图

自变量和因变量各输一列

菜单栏 统计 描述性统计 相关

在Correlate框选入自变量和因变量 OK

  • 选Plots可作散点图:Scatter PlotsOK

  • 选Options计算等级相关系数:Correlation types

    SpearmanOK


Sas s tatistical a nalysis s ystem

Simple Statistics

Variable N Mean Std Dev Sum Minimum Maximum

Y 12 2.90 0.4144 34.83 2.20 3.50

X 12 49.33 5.2800 592.00 42.00 58.00

Pearson Correlation Coefficients / Prob > |R| under Ho: Rho=0 / N = 12

X Y

X 1.0000 0.74948 (r)

0.0000 0.0050 (P)

Y 0.74948 1.0000

0.0050 0.0000

相关系数 r=0.74948 P=0.005


Sas s tatistical a nalysis s ystem

二、直线回归分析

菜单栏 Statistics Regression Simple…

因变量 Dependent框,自变量 Explanatory

  • 打开 Statistics可选作标准化回归系数和回归系数的可信区间

  • 打开Predictions选中 Predict Original Simple和List Predictions可计算 值,再选中 prediction Limits 可以计算出 总体均数的可信区间

  • 打开Plots窗口,选 Predicted 标签

    选 Plot observed vs Independent可作回归线图

    选 Confidence limits可作总体回归线可信区间图

    选 Prediction limits可作个体Y值容许区间图


Sas s tatistical a nalysis s ystem

  • 打开Plots窗口,选 Predicted 标签

    选 Plot observed vs Independent可作回归线图

    选 Confidence limits可作总体回归线可信区间图

    选 Prediction limits可作个体Y值容许区间图

  • 打开Residual窗口,可作各种残差分布图


Sas s tatistical a nalysis s ystem

Analysis of Variance

Source DF Sum of Squares Mean Square F Value Prob>F

Model 1 1.06122 1.06122 12.817 0.0050

Error 10 0.82800 0.08280

C Total 11 1.88922

Root MSE (Sy.x) 0.28775 R-square (R2) 0.5617

Dep Mean ( ) 2.90250 Adj R-sq (校正R2) 0.5179

C.V. 9.91388

Parameter Estimates(参数估计)

Parameter Standard T for H0: Prob

Variable DF Estimate b Error Sb Parameter=0 > |T|

INTERCEP 1 0.000413 0.8149 0.001 0.9996

X 1 0.058826 0.0164 3.580 0.0050


Sas s tatistical a nalysis s ystem

三、多元线性回归分析

每个自变量和因变量各输成一列

菜单栏 Statistics Regression Linear… Y

Dependent 自变量 Quantitative OK

逐步回归

在Model窗口选择筛选变量的方法

在Criteria选项中可改变选入剔除变量的α水准

在statistic窗口可选择标准化偏回归系数

在 test选项中可选择作共线性诊断(不能对截距进行校正)


Sas s tatistical a nalysis s ystem

四、Logistic回归分析

1.成组设计(非条件)Logistic回归

每个自变量和因变量(分类变量)各输成一列

菜单栏 Statistics Regression Logistic

因变量Y Dependent

在Model Pr框中选定病例组的水平

自变量 Quantitative OK

逐步回归筛选变量

点开Model对话框,在selection中选一种筛选变量的方法,在Criteria窗口可以改变选入剔除变量的检验水准OK OK


Sas s tatistical a nalysis s ystem

2. 匹配设计(条件)Logistic回归

除原有的各自变量和因变量Y各输成一列外,需增加配对编号和虚拟时间变量两列

(虚拟时间变量:病例=1,对照=2)

StatisticsSurvival Proportional Hazards

虚拟时间变量选入Time、因变量Y选入Censoring,

其它自变量选入Explanatory 框中,

点开Variables对话框,把配对编号选入Strata。

点开Methods对话框,可以选作可信区间

点开Model对话框,可以选择逐步筛选变量

在Criteria窗口可以改变选入剔除变量的检验水准


Sas s tatistical a nalysis s ystem

第九节 随访资料生存率分析

1. 生存率分析

除时间变量外,需增加一列是否截尾值(二分类变量),大样本资料还可以有一列频数。

菜单栏 StatisticsSurvival Life Tables

时间变量选入Time、截尾值选入Censoring,

  • 打开Method窗口可以选PL法或LT法估计生存率

  • 大样本资料选LT法时在Variables窗口选入频数

  • 打开PLOTS窗口可以选作生存率曲线的几种图


Sas s tatistical a nalysis s ystem

乘积极限法Product-Limit Survival Estimates

时间 生存率 死亡率Survival Number Number

T Survival Failure Std Err Failed Left

0.00 1.0000 0 0 0 15

2.00 0.9333 0.0667 0.0644 1 14

3.00 0.8667 0.1333 0.0878 2 13

9.00 0.8000 0.2000 0.1033 3 12 10.00 . . . 4 11

10.00 0.6667 0.3333 0.1217 5 10

12.00* . . . 5 9

15.00 0.5926 0.4074 0.1288 6 8 15.00* . . . 6 7

16.00 0.5079 0.4921 0.1354 7 6

18.00* . . . 7 5

24.00* . . . 7 4

30.00 0.3810 0.6190 0.1497 8 3

36.00* . . . 8 2

40.00* . . . 8 1

45.00* . . . 8 0

* Censored Observation *为截尾值


Sas s tatistical a nalysis s ystem

Summary Statistics for Time Variable T

Point 95% Confidence Interval

Quantile Estimate [Lower, Upper)

75% . 16.0000 .

中位生存时间 50% 30.0000 10.0000 .

25% 10.0000 3.0000 30.0000

平均生存时间 Mean 19.9704Standard Error 3.0406

两组生存率比较 Test of Equality over Strata

Pr >

Test Chi-Square DF Chi-Square

对数秩检验 Log-Rank 5.6049 1 0.0179

Wilcoxon 5.3379 1 0.0209

-2Log(LR) 6.3132 1 0.0120


Sas s tatistical a nalysis s ystem

寿命表法

Conditional

Effective Conditional Probability

Interval Number Number Sample Probability Standard

[L, Up) Failed Censored Size of Failure Error Survival Failure

时间 死亡数 删失数 校正数 死亡概率 标准误 生存率 死亡率

0 1 59 63 553.5 0.1066 0.0131 1.0000 0

1 2 69 71 427.5 0.1614 0.0178 0.8934 0.1066

2 3 43 55 295.5 0.1455 0.0205 0.7492 0.2508

3 4 30 38 206.0 0.1456 0.0246 0.6402 0.3598

4 5 13 31 141.5 0.0919 0.0243 0.5470 0.4530

5 6 7 26 100.0 0.0700 0.0255 0.4967 0.5033

6 7 14 21 69.5 0.2014 0.0481 0.4619 0.5381

7 8 4 11 39.5 0.1013 0.0480 0.3689 0.6311

8 9 3 15 22.5 0.1333 0.0717 0.3315 0.6685

9 . 0 12 6.0 0 0 0.2873 0.7127


Sas s tatistical a nalysis s ystem

2. 生存率比较(Log-rank法)

数据有三列:时间变量、截尾值和分组变量,

大样本资料还可以有一列频数。

菜单栏 StatisticsSurvival Life Tables

时间变量选入Time、截尾值选入Censoring,

分组变量选入 strata

  • 打开Method窗口可以选PL法或LT法估计生存率

  • 大样本资料选LT法时在Variables窗口选入频数

  • 打开PLOTS窗口可以选作生存率曲线的几种图


Sas s tatistical a nalysis s ystem

3. Cox 比例风险模型 (Cox回归)

各自变量、时间变量和截尾值各输一列

StatisticsSurvival Proportional Hazards

时间变量选入Time、截尾值选入Censoring,

其它自变量选入Explanatory 框中,

点开Methods对话框,可以选作可信区间

点开Model对话框,可以选择逐步筛选变量

Criteria窗口可以改变选入剔除变量的检验水准

点开Plots对话框,可以作生存率曲线


  • Login