540 likes | 734 Views
2008 年临床研究生. 医学统计学. 王晓莉 xlwang@bjmu.edu.cn http://www.qingis.com/wang.htm. 2007 年临床研究生. 难,为什么还要学习? 为什么大家认为难? 难 → 易?. 实用. 特点: 抽象、复杂. 生动具体熟悉 抽象的统计学概念 探讨其本质 复杂性. 尽量做到 …. 以老师为中心 以学生为中心 以教为中心 以学为中心 以知识为中心 以问题为中心.
E N D
2008年临床研究生 医学统计学 王晓莉 xlwang@bjmu.edu.cn http://www.qingis.com/wang.htm 2007年临床研究生
难,为什么还要学习? • 为什么大家认为难? • 难 → 易? 实用 特点:抽象、复杂
生动具体熟悉 抽象的统计学概念 探讨其本质 复杂性
尽量做到… • 以老师为中心 以学生为中心 • 以教为中心 以学为中心 • 以知识为中心 以问题为中心
教师:如何讲解统计学 • 重点讲解统计原理、思想 • 重点和非重点明确 • 结合实际多举例子 • 以学生为中心:随时关注学生反馈 • 以问题为中心:多提问题、多思考 • 劳役结合,调整课堂气氛,提高听课效率
学生:如何学习统计学 • 理解基本统计概念和原理 • 培养逻辑思维的能力 • 掌握具体统计方法 • 上好实习课 • 多阅读文献(设计和资料处理方法) • 应用:分析数据、写论文
课程安排 • 承担单位:公共卫生学院 • 课时: 理论课:24学时, 8次 实习课:33学时,11次 考 试: 3学时 共 计: 60学时
1班课程安排 • 理论课:王晓莉、罗树生、康楚云 时间:周一晚上6:30 地点: 5教 • 实习课: 康楚云、罗树生 、 王海俊、周虹 分组: 按照报名顺序,从前到后分为2组: 1-33A组,34-65B组 时间:星期三晚上6:30-9:30, 本周开始上课 地点: 逸夫楼 A-802,B-809
授课方式:讲解重点、难点(以复习为主) • 考核方式:平时作业30%,考试70%(开卷) • 教材: 实习课: 有实习指导 理论课: 无指定教材 参考文献: 1.方积乾主编.卫生统计学.人民卫生出版社,第五版,2003.8 2.王燕,安琳主编. 卫生统计学.北京大学医学出版社. 3.余松林主编.医学统计学.人民卫生出版社.2003.3 4.卢纹岱、朱一力等主编.SPSS FOR WINDOWS从入门到精通.电子工业出版社 5.魏宗舒、施锡铨等主译.统计学.中国统计出版社 6.王燕,康晓平主编.卫生统计学教程. 北京大学医学出版社.2006年7月
授课内容(包括主要SPSS操作程序) 第一讲:绪论 第二讲:计量资料的统计描述及应用 第三讲:计量资料的假设检验 第四讲:方差分析、直线相关与回归、偏相关 第五讲:计数资料的统计描述及假设检验 第六讲:多元线性回归分析 第七讲:因子分析 第八讲:Logistic回归分析
第一章 绪论 一、什么是统计学 二、研究(统计)工作的步骤 三、基本的统计学概念
一、什么是统计学 研究对象:数据 统计学就是研究数据及其存在规律的科学。 包括数据的收集、整理、分析以及对结果的解释。
常见的统计学问题 • 食用醋能预防感冒吗? • 奥运会后房价会降吗? • 治疗艾滋病的新药有效吗? • 体育彩票能否中(大)奖? • 小明的身高能超过他爸爸吗? 个税起征点多少合适?
《医学统计学》与专业….. • 学习统计学的目的?(应用) • 与专业的关系:(辅助、服务、工具)
与临床工作的关系 • 从临床实践中如何寻找规律?
二、研究(统计)工作的步骤 • 第一步 研究设计(Design) • 第二步 收集资料(Collection of data) • 第三步 整理资料(Sorting data) • 第四步 分析资料(Analysis of data) 这四个步骤包括了一个研究的全部过程。
第一步: 研究设计(design) 开题报告:意义、目的、方法、内容、对象、主要指标、进度、预期结果等 (在文献综述基础上进行)其中有可能涉及到的统计内容是什么?
实验设计与调查设计 (前者与临床关系更密切) 举例说明以下因素: • 目的:观察不同处理因素的效应。 • 基本要素:处理因素和非处理因素、受试对象、指标的选择和观察(准确性、灵敏性、稳定性) • 基本原则:对照的原则(空白、安慰剂、自身、相互)、重复原则(样本量)、随机化原则(随机抽样,随机分配,随机接受处理因素) • 样本量估计(由指标和设计确定,计算公式不同)
常用的设计类型(贯穿在课程中,穿起之间联系)常用的设计类型(贯穿在课程中,穿起之间联系) • 一组样本与总体的比较 • 单因素两组样本的比较(成组和配对)√ • 单因素多组样本的比较(成组设计) √ • 双因素多组样本的比较(配伍组设计) √ • 三因素三组及以上设计(拉丁方设计) • 三个或以上因素并交互作用(正交设计)
第二步 收集资料(collection of data) 是计划的实施和执行过程,常常需要漫长的时间,关键是保证前后的一致性和资料的完整性。 例如:临床病例收集、实验室实验、现场调查等 注意:资料的真实性!
第三步 整理资料(sorting data) • 建立数据库、过录、输入、逻辑检错等。(分析资料的基础和数据质量)
第四步 分析资料(analysis of data) 各种描述、统计检验方法、多元回归等 注意: 选择正确的分析方法
三、基本的统计学概念 • 总体与样本(Population and sample) • 变量(Variable) • 变异(Variation) • 误差 (Error) • 概率(Probability)
1.总体与样本(population & sample ) 总体:根据研究目的确定的同质的、观察单位的全体。 2007级北京大学医学部女研究生身高; 2007级北京女研究生的身高; 女研究生的身高(高血压病人; 肥胖病人)
分类: 有限总体:理论上说,观察单位的数量是可知的、有限的。 无限总体:没有时间和地点的限制,观察单位总数量是不可知的。
鉴于总体的巨大或不可知性 不可能或没有必要对全体中的每一个进行研究 能否研究其中的一部分?
样本(sample) 概念:总体中有代表性的一部分。 如何从中得到有代表性的一部分? 得到多少合适呢?
2007年4.15日对北京市医院服务满意度进行调查。总体与样本?2007年4.15日对北京市医院服务满意度进行调查。总体与样本? 调查结果:满意度95.5% ? 样本不能代表总体的情况
概率(随机)抽样 误差大小:整群抽样单纯随机抽样系统抽样分层抽样 等概率抽样 非等概率抽样 简单随机抽样 系统抽样 分层抽样 整群抽样
随机抽样-样本 样本量的计算公式-样本量
其中的总体和样本: 260名女研究生中65名; 50万女研究生中的1000名; 肥胖病人中的100名。 对其中这些样本进行研究即可
从样本推回到总体的方法: 统计推断(假设检验等),是统计分析的主要内容。
随机抽样 统计推断
2.变量(Variable) • 变量:在确定了研究总体之后,研究者要对每个观察单位的某项特征进行测量和观测,这种特征称为变量。 • 变量值:变量的测得值或观察值叫变量值,也叫做资料。 • 资料分类:计量资料、计数资料、等级资料 (资料性质不同,分析方法不同)
数值变量(Numerical variable) 也叫计量资料 • 定义:通过度量衡的方法,测量每一个观察单位的某项研究指标的量的大小,得到的一系列数据资料。 • 特点: 有度量衡单位 多为连续性资料
分类变量(Categorical variable) 也叫计数资料 • 定义:将全体观测单位按照某种性质或特征分组,然后再分别清点各组观察单位的个数。 • 特点: 没有度量衡单位 多为间断性资料
3.变异(variation ) 概念:研究对象具有的相同的状况或属性等共性称同质或同质性;对于同质的各观察单位,其某变量值之间的差异,称为变异。 同质事物个体间的差异。 来源于一些未加控制或无法控制的甚至不明原因的因素。 例如:双胞胎
例如:研究某新药治疗胃溃疡的效果,所有研究对象都必须是确诊为胃溃疡的病人且病情相似,在这种同质的基础上观察治疗效果,有的人治愈,有的人未愈,这种差异就是变异。例如:研究某新药治疗胃溃疡的效果,所有研究对象都必须是确诊为胃溃疡的病人且病情相似,在这种同质的基础上观察治疗效果,有的人治愈,有的人未愈,这种差异就是变异。
快速反应:变异产生的原因是什么? • 如何处理变异? • 统计学就是研究变异的科学。 • 透过偶然,发现必然!
4.误差(Error) 统计上所说的误差泛指测量值与真值之差,样本指标与总体指标之差。主要有以下二种: 系统误差 随机误差:随机测量误差、抽样误差
系统误差 • 概念:指数据搜集和测量过程中由于仪器不准确、标准不规范等原因,造次观察结果呈倾向性的偏大或偏小,这种误差称为系统误差。 • 特点:具有累加性。
随机测量误差 概念:由于非人为的偶然因素,对于同一样本多次测定结果不完全一样,结果有时偏大有时偏小,无法预测,这种误差叫随机测量误差。 特点:没有倾向性,在大量重复测量中,具有统计规律。(多次测量计算平均值可以减小甚至消除随机测量误差。)
抽样误差 概念:样本指标与总体指标之间的差别。 特点:有抽样, 抽样误差就不可避免。统计上可以计算并在一定范围内控制抽样误差。 例如:
减少抽样误差的方法: (1)改进抽样方法(增加样本的代表性) 误差从大到小: 整群抽样单纯随机抽样系统抽样分层抽样 (2) 增加样本量; (3)选择变异程度较小的研究指标。
问题:哪类误差用统计学方法可以控制?为什么?问题:哪类误差用统计学方法可以控制?为什么?
5、概 率(probability) • 概念:描述随机事件发生可能性大小的数值,常用P来表示。 • 大小:P的大小在0和1之间。通常一个事件的发生小于5%,就叫小概率事件。 • 小概率:统计学推断的基本思想之一