790 likes | 960 Views
医学统计软件应用. 唐景霞 0993-2399498 tjx_hhh@163.com. 序 言. 统计分析软件是数据分析的主要工具 完整的数据分析过程包括: 数据的收集 数据的整理 数据的分析 统计学为数据分析过程提供一套完整的科学的方法论。统计软件为数据分析提供了实现手段。. 统计分析软件的 一般特点 功能全面,系统地集成了多种成熟的统计分析方法; 有完善的数据定义、操作和管理功能; 方便地生成各种统计图形和统计表格; 使用方式简单,有完备的联机帮助功能; 软件开放性好,能方便地和其他软件进行数据交换.
E N D
医学统计软件应用 唐景霞 0993-2399498 tjx_hhh@163.com
序 言 • 统计分析软件是数据分析的主要工具 • 完整的数据分析过程包括: • 数据的收集 • 数据的整理 • 数据的分析 • 统计学为数据分析过程提供一套完整的科学的方法论。统计软件为数据分析提供了实现手段。
统计分析软件的一般特点 • 功能全面,系统地集成了多种成熟的统计分析方法; • 有完善的数据定义、操作和管理功能; • 方便地生成各种统计图形和统计表格; • 使用方式简单,有完备的联机帮助功能; • 软件开放性好,能方便地和其他软件进行数据交换
统计软件的发展,也使得统计从统计学家的工具变成了大众的游戏。只要你输入数据,点几下鼠标,做些选项,马上得到漂亮结果。统计软件的发展,也使得统计从统计学家的工具变成了大众的游戏。只要你输入数据,点几下鼠标,做些选项,马上得到漂亮结果。 • 是否傻瓜式的统计软件的使用可以代替统计课程了? • 数据的整理和识别,方法的选用,计算机输出结果的理解都不象使用傻瓜相机那样简单可靠。
国外法律或医学方面的软件都有不少警告,不时提醒你去咨询律师或医生。国外法律或医学方面的软件都有不少警告,不时提醒你去咨询律师或医生。 • 但统计软件则不那么负责。只要数据格式无误、方法不矛盾(比如不用零作为除数)就一定给你结果,而且一般没有任何警告。 • 另外,统计软件输出的结果太多;即使是同样的方法,不同软件输出的内容还不一样;有时同样的内容名称也不一样。这就使得使用者大伤脑筋。没有统计学家能解释软件的所有的输出。因此,就应该特别留神,明白自己是在干什么。不要在得到一堆毫无意义的垃圾之后还沾沾自喜。
统计软件的种类很多。有些功能齐全,有些价格便宜;有些容易操作,有些需要更多的实践才能掌握。统计软件的种类很多。有些功能齐全,有些价格便宜;有些容易操作,有些需要更多的实践才能掌握。 • 还有些是专门的软件,只处理某一类统计问题。 • 面对太多的选择往往给决策带来困难。 • 这里介绍最常见的几种。
常用统计软件简介 • SAS (Ver9.0) --真正的巨无霸。被誉为国际上的标准统计软件和最权威的组合式优秀统计软件。 • 尽管价格相当不菲,许多公司,特别是美国制药公司,还是因为其功能众多和某些美国政府机构认可而使用。尽管现在已经尽量“傻瓜化”(远不如SPSS“傻”),但仍然需要一定的训练才可以进入。 • 人机对话界面太不友好 • 图形操作界面比较糟糕 • 一切围绕编程设计 • 学习起来较困难(编程) • 说明书非常难懂 • 价格贵的人直跳
SPSS (Ver16) --统计软件中的贵族 • 操作界面极为友好 • 所有统计软件中最友好的 • 精心设计的图形操作界面 • 美观的结果输出 • 强大的辅助教学功能 • 输出结果与中文WORD尚存在一定兼容问题 • 在国内深受欢迎,特别是市场调研行业 • 在欧洲各研究机构中得到广泛应用
S-Plus(Ver?) • S语言(AT&T贝尔实验室)的后续发展 • 极为强大的统计功能和绘图能力 • 应用上以理论研究、统计建模为主 • 需要有较好的数理统计背景 • 对编程能力要求极高 • Stata (Ver10) • 软件小巧 • 绘图美观 • 统计分析能力极强 • 数据接口差 • 不提供对话框界面,命令行方式操作 • E-Views • 使计量经济学得到长足进步,可以对时间序列和非时间序列(截面)数据进行分析
Excel:严格说来并不是统计软件,但作为数据表格软件,必然有一定统计计算功能。而且凡是有Microsoft Office的计算机,基本上都装有Excel。但要注意,有时在装Office时没有装数据分析的功能,那就必须装了才行。当然,画图功能是都具备的。对于简单分析,Excel还算方便,但随着问题的深入,Excel就不那么“傻瓜”,需要使用函数,甚至根本没有相应的方法了。多数专门一些的统计推断问题还需要其他专门的统计软件来处理。
统计分析软件的基本使用方式 • 人机对话方式 • 批处理(程序)方式 • 菜单方式和对话框方式 • 窗口方式
学习使用统计分析软件的基本方法 • 弄清分析的目的 • 正确收集待处理和分析的数据(目的、影响因素的剔除)。 • 弄清统计概念和统计含义,知道统计方法的适用范围,无需记忆公式。 • 选择一种或几种统计分析方法探索性地分析数据。 • 读懂计算机分析的数据结果,发现规律,得出分析
推荐SPSS学习网址 • SPSS中文论坛 http://www.spssbj.com.cn/bs/ • 诊断试验评价与数据挖掘http://go.6to23.com/statdtedm/ • SPSS for Windows 简明教程目录http://www.fjmu.edu.cn/news/spss/doc3/index.htm • 生物医学统计咨询网http://asp2.6to23.com/stathlp/index.asp • 医学统计之星http://www.medstatstar.com/
推荐SPSS学习书目 • 书 名:高等学校教材- SPSS系统分析基础教程SPSS统计分析高级教程作 者:张文彤 出版日期:2004年9月1日出版社: 高等教育出版社图书发行部
SPSS是软件英文名称的首字母缩写,原意为Statistical Package for the Social Sciences,即“社会科学统计软件包”。但是随着SPSS产品服务领域的扩大和服务深度的增加,SPSS公司已于2000年正式将英文全称更改为Statistical Product and Service Solutions,意为“统计产品与服务解决方案”,标志着SPSS的战略方向正在做出重大调整。
功能强大、实用与美观统一的视窗风格—— • SPSS最突出的特点就是操作界面极为友好,他使用Windows的窗口方式展示各种管理和分析数据方法的功能,使用对话框展示出各种功能选择项,只要掌握一定的Windows操作技能,粗通统计分析原理,就可以使用该软件为特定的科研工作服务。 • 输出结果十分美观漂亮(从国外的角度看) ,存储时则是专用的SPO格式,可以转存为HTML格式和文本格式。
非专业统计人员的首选统计软件 • SPSS采用类似EXCEL表格的方式输入与管理数据,数据接口较为通用,能方便的从其他数据库中读入数据。 • 其统计过程包括了常用的、较为成熟的统计过程,完全可以满足非统计专业人士的工作需要。 • 对于熟悉老版本编程运行方式的用户,SPSS还特别设计了语法生成窗口,用户只需在菜单中选好各个选项,然后按“粘贴”按钮就可以自动生成标准的SPSS程序,极大的方便了中、高级用户。
历 史 • 20世纪60年代 • 1975年在芝加哥组建了SPSS总部。 • 1984年SPSS总部首先推出了世界上第一个统计分析软件微机版本SPSS/PC+ • 1994至1998年间,SPSS公司陆续购并了SYSTAT公司、BMDP软件公司、Quantime公司、ISL公司等,并将各公司的主打产品收纳SPSS旗下,从而使SPSS公司由原来的单一统计产品开发与销售转向企业、教育科研及政府机构提供全面信息统计决策支持服务,成为走在了最新流行的“数据仓库”和“数据挖掘”领域前沿的一家综合统计软件公司。
应 用 • 广泛的应用于统计、应用数学、经济、市场营销、心理、卫生统计、生物、企业管理、气象、社会学等领域。 • 其分析过程包括:调查设计、数据收集、数据存取和管理、数据分析、数据检验、数据挖掘、数据展示等。还有一系列附加模块和独立模块产品以加强它的分析功能。它的图形窗口界面使其非常简单易用但却具有满足各种分析要求的数据管理、统计分析功能及各种报表方法。
缺 点 由于在SPSS公司的产品线中,SPSS软件属于中、低档(SPSS公司共有二十余个产品),因此从战略的观点来看,SPSS显然是把相当的精力放在了用户界面的开发上。该软件只吸收较为成熟的统计方法,而对于最新的统计方法,SPSS公司的做法是为之发展一些专门软件,如针对树结构模型的Answer Tree,针对神经网络技术的Neural Connection、专门用于数据挖掘的Clementine等,而不是直接纳入SPSS,因此他们在SPSS中均难觅芳踪。另外,其输出结果虽然漂亮,但不能为WORD等常用文字处理软件直接打开,只能采用拷贝、粘贴的方式加以交互。这些都可以说是SPSS软件的致命伤。
SPSS基础 主要窗口及功能 • 数据编辑窗口(data editor) • 结果输出窗口(viewer) • 语句编辑窗口(syntax editor)
SPSS基础 • 数据编辑窗口(data editor ) • 功能:对SPSS的数据进行定义、录入、修改、管理等基本操作的窗口 • 组成:窗口主菜单(File、Data、Transform、Analyze、Graphs)、工具栏、数据编辑区、状态显示区 • SPSS运行过程中自动打开;新版本可同时打开若干窗口;运行过程中无法关闭 • SPSS中各统计分析功能都是针对该窗口中的数据进行的;窗口中的数据以.sav存于磁盘上
SPSS基础 • 结果输出窗口(viewer ) • 功能:SPSS统计分析报表及图形的输出窗口 • 组成:窗口主菜单、工具栏、结果显示区、状态显示区 • 在进行第一次分析时自动打开,也可手工打开;可以手工打开若干个可相互切换的viewer窗口;输出窗口可以关闭; • 状态栏上的!表示当前输出窗口 • 窗口内容以.spo存于磁盘上
SPSS基础 • 语句编辑窗口(syntax editor) • 功能:编辑命令语句 • 窗口内容以.sps存于磁盘上
SPSS基础 • 软件运行方式 • 完全菜单方式 • 程序方式 • 混合方式
SPSS基础 • 利用SPSS做数据分析的一般步骤 • 建立SPSS 数据文件 • 定义数据文件结构 • 录入修改和编辑待分析的数据 • 分析数据 • 统计分析之前的数据预处理 • 统计分析和建模 • 结果的说明和解释 • 数据和分析结果的保存
SPSS数据文件的建立与管理 • 数据文件的特点 • 结构的定义 • 数据的录入和保存 • 数据的编辑 • 与其他软件数据共享
SPSS数据文件的特点 • SPSS数据文件是一种有结构的数据文件 变量名 一条记录 数据 一个变量
定义数据文件的结构 • 1.name:变量名,是变量存取的唯一标志 • 2.type:变量类型 • 数值型:常用标准数值型(Numeric):默认类型8.2如:12345678、12345.67、-1234.56 • 字符型(String): 存储字符数据8位。如:beijing处理时用双引号扩起来 • 日期型(Date):存储日期数据,如:20-AUG-1999 • 注意:显示宽度不影响数据的存储 • 3.width:变量宽度,默认为8
定义数据文件的结构 • 4.Decimals:小数位数,默认为2 • 5.label:变量名标签 • 6.Values:变量值标签 • 7.Missing:缺失值 • 8. Column:变量列宽,默认为8。 • 9.Align:对齐,默认右对齐(Right) • 10. Measure:变量度量,包括三类: • 数值变量(Scale), • 名义变量(Nominal), • 有序变量(Ordinal)。
数据的录入和保存 • 统计软件中数据的录入原则: 1.同一观察对象的数据应独占一行 2.同一个指标的测量值都应当录入到同一个变量中(除外配对数据和重复测量数据) 3.最终的数据集应当能够包含原始数据的所有信息 • 数据可保存为各种格式
数据的编辑 • 打开数据文件 • 数据定位 • 插入和删除记录 • 插入和删除变量 • 数据单元数据的移动和复制
数据的编辑 • 读取一个数据文件。SPSS数据文件:*.sav , 常用的其他外部数据文件:*.xls , *.dbf , *.txt , *.dat。 • 注意:医学领域常用数据库EpiData软件,先将数据文件*.rec转换为*.sps文件,然后在SPSS的语法窗口运行,生成*.sav文件。
其他软件共享数据 • 打开其他格式的数据文件 • 直接打开 • 在SPSS 10以后的版本已经可以直接读入许多常用格式的数据文件 • 使用数据库查询打开 • 利用通用数据库ODBC接口读取数据文件 • 在9.0及以前版本中非常重要 • 使用文本导入向导读入文本文件 • 和大型机交换文件时常用
SPSS 数据的基本加工和处理 • 数据文件的整理 个案排序、个案选取、文件合并、文件转置 • 数据加工 计算变量、产生计数变量、分类汇总 • 数据分组 手工分组 • 数据文件的其他处理功能 指定加权变量、SPSS变量集的定义和使用
数据文件的整理 • 记录排序(sort) • 将所有个案按照用户指定的某一个或多个变量的变量值的升序或降序重新排列 • 快速查找异常值、极端值 • 文件转置(transpose) • 将数据文件行列互换,即:将记录转为变量,变量转为记录 • 文件合并(merge file) • 将两个SPSS数据文件合并到一个数据文件中 • 纵向合并、横向合并 • 分类汇总(aggregate) • 根据某一分类变量,对其他变量进行汇总
记录选取(select cases) • 文件拆分(split file) • 数据加权(weight)