610 likes | 754 Views
医学统计课程理论复习. 上海第二医科大学 生物统计教研室. 一. 基本概念 统计学是研究怎样去有效地收集 , 整理和分析带有随机性的数据 , 以对所考察的问题作出推断和预测 , 直至为采取一定的决策和行动提供依据和建议的科学。 (P1,L1) 医学统计学的主要内容有统计研究设计 , 统计描述,统计推断,因素间的关系、分类和检测等研究。 (P1,L10). 统计研究设计主要有两类 : 调查研究设计和实验研究设计。 (P1,L14) 调查研究又称观察性研究,只能就研究对象作被动观察,而不能对观察对象添加干预。
E N D
医学统计课程理论复习 上海第二医科大学 生物统计教研室
一. 基本概念 统计学是研究怎样去有效地收集,整理和分析带有随机性的数据,以对所考察的问题作出推断和预测,直至为采取一定的决策和行动提供依据和建议的科学。(P1,L1) 医学统计学的主要内容有统计研究设计, 统计描述,统计推断,因素间的关系、分类和检测等研究。(P1,L10)
统计研究设计主要有两类:调查研究设计和实验研究设计。(P1,L14)统计研究设计主要有两类:调查研究设计和实验研究设计。(P1,L14) 调查研究又称观察性研究,只能就研究对象作被动观察,而不能对观察对象添加干预。 实验研究是将实验对象随机分配到两种或多种处理组,观察比较不同处理的结果,它能人为设置处理因素或水平,受试对象接受何种处理因素或水平是由随机分配而定的。
统计描述指用统计指标、统计表、统计图等方法,对资料的数量特征及其分布规律进行测定和描述,不涉及由样本推断总体问题。(P1,-L1)统计描述指用统计指标、统计表、统计图等方法,对资料的数量特征及其分布规律进行测定和描述,不涉及由样本推断总体问题。(P1,-L1) 统计推断指用样本推断总体。 (P2,L3) 一个统计问题所研究的对象的全体称为总体。 按随机的方式从总体中抽取若干个体构成一个样本。
用于描述总体分布的数字特征的量称为参数,例如总体均数μ、总体标准差σ、总体率π、总体回归系数β、总体相关系数ρ等都是总体的参数,总体参数一般是未知的。用于描述总体分布的数字特征的量称为参数,例如总体均数μ、总体标准差σ、总体率π、总体回归系数β、总体相关系数ρ等都是总体的参数,总体参数一般是未知的。 (P2,L7) 不包含总体中任何未知参数的样本指标和样本数据的函数称为统计量,例如样本均数、样本标准差S、样本率P、样本回归系数b、样本相关系数r等都是统计量。
统计推断可以分为二个部分:参数估计和假设检验。 (P2,L12) 参数估计就是根据总体中所抽得的样本, 由样本统计量估计总体分布中的未知参数。可分为点估计和区间估计。 选择一个适当的样本统计量作为总体参数的估计值称为点估计。
根据一定的正确度和精确度要求确定一个概率水平, 由样本统计量计算出一个适当的区间作为未知总体参数真值所在的范围,称为区间估计。称此概率水平为可信度或置信度,也可称为可信水平,或置信水平。所估计的区间称为可信区间或置信区间,区间的端点称为可信限。 (P2,L16) 可信区间的大小与样本含量及可信度的大小有关,一般地说,随着可信度的加大,可信区间也加大,随着样本含量的加大,可信区间缩小。(P2,-L7)
假设检验又称显著性检验,先对总体的参数或分布作出某种假设,假设有两种(1)检验假设用H0表示,(2)对立假设或备择假设用H1表示,H0与H1是相互联系、相互对立的假设。然后选择适当的样本统计量,进行统计推断,究竟是拒绝H0,还是不拒绝H0。假设检验又称显著性检验,先对总体的参数或分布作出某种假设,假设有两种(1)检验假设用H0表示,(2)对立假设或备择假设用H1表示,H0与H1是相互联系、相互对立的假设。然后选择适当的样本统计量,进行统计推断,究竟是拒绝H0,还是不拒绝H0。 其基本步骤为: (1)建立H0,H1。 (2)选择合适的统计检验方法,计算统计量。 (3)根据检验统计量的分布,计算概率P值,或者根据其临界值表,决定P的大小。 (P2,-L4)
P值是H0成立的情况下,由于抽样误差得到的样本之差异大于等于计算出的统计量的概率。 如果P>0.05,结论为差异无统计学意义; 如果P≤0.05,结论为差异在=0.05水平上有统计学意义。 如果P≤0.01,结论为差异在=0.01水平上有统计学意义。
单侧检验和双侧检验与假设检验的目的有关。 当H0: μ1=μ2 ,H1: μ1≠μ2时,就是双侧检验; 当H0: μ1=μ2 ,H1: μ1>μ2或H1: μ1<μ2时,就是单侧检验。(P4,L19) 其主要区别在备择假设H1上面。 如果H1: μ1≠μ2时就用到二侧(即μ1>μ2 ,或μ2>μ1);如果μ1>μ2就只用到一侧。如t值表中由于 t分布左右对称,双侧的概率P就是单侧概率P之二倍,单侧概率P较小, 故易于产生拒绝H0之统计推断。因而单侧检验如果误认为是双侧的,就不易拒绝H0;而双侧检验如误用单侧就较易拒绝H0了。
必须根据实际问题本身决定使用单侧还是双侧,决不能因为单侧易于拒绝H0就盲目选用。通常进行的都为双侧检验;进行单侧检验时必须特别说明,要有充分的理由,并且在实验设计阶段就要预先规定好。(P4,-L5)必须根据实际问题本身决定使用单侧还是双侧,决不能因为单侧易于拒绝H0就盲目选用。通常进行的都为双侧检验;进行单侧检验时必须特别说明,要有充分的理由,并且在实验设计阶段就要预先规定好。(P4,-L5)
由假设检验作出统计推断时,不论是拒绝H0,还是不拒绝H0 ,都有可能发生误差(或称错误),根据所犯误差的性质,可以区分为第一类误差(用α表示)和第二类误差(用β表示)。 (P4,-L1) 当拒绝了实际上成立的H0时,称为犯第一类误差,不拒绝实际上不成立的H0时,称为犯第二类误差。
用假设检验作统计推断时,第一类误差α常是已知的,β常常未知,1-β又称为检验的效能,即当H0实际上不成立时假设检验拒绝H0的概率。当1-β很大时,表明该统计检验效能很高。实际应用中需根据专业知识、检验的目的和犯二类误差的代价大小决定α,β之取值。例如用某方法进行疾病普查时,为确保少漏掉病人,故β应很小。在资料一经确定后, 缩小β的代价必将扩大α,反之亦然,要同时降低α,β值的唯一办法是加大样本。(P4,L9)
资料一般可分成三大类,即计量资料、计数资料和等级资料。(P3,L22)资料一般可分成三大类,即计量资料、计数资料和等级资料。(P3,L22) (1)计量资料又称测量资料, 它是测量每个观察单位某项指标值的大小所得的资料。 (2)计数资料,将观察单位按某种属性或类别分组计数,得到各类别观察单位计数的资料,称为计数资料。 (3)等级资料又称为半定量资料,它是将观察单位按某种属性的不同程度分组计算所得出的各个不同程度的观察单位计数的资料。
不同的资料类型,其统计指标、统计检验的方法是不相同的。(P4,L1)不同的资料类型,其统计指标、统计检验的方法是不相同的。(P4,L1) 计量资料的统计指标为均数,标准差等,统计检验方法为t检验,方差分析等;当不符合条件时用为非参数统计分析法。 计数资料的统计指标为率,构成比等,统计检验方法为χ2检验; 等级资料的统计指标也为率, 构成比等,统计检验方法为非参数统计分析法。
二. 计量资料的统计指标 正态分布资料的平均水平和离散程度常用均数和标准差表示。 非正态分布资料的平均水平和离散程度常用中位数和四分位数间距表示。(P43,L2) 几何均数适用于成倍数关系的资料,如抗体滴度、效价等,也用于对数正态分布的资料如某些传染病的潜伏期等。(P39,L19)
百分位数主要用于描述一组资料在各个百分位置上的水平,用一组百分位数如P5,P25, P50, P75, P95,可以描述总体或样本的分布特征,如集中位置、变异度等。百分位数还可用以确定医学正常值范围。 (P41,L4) 变异系数无量度单位,而且消除了原始资料的平均水平的影响,因此常用于比较量度单位不相同的指标或者平均水平相差悬殊的指标的变异程度。 (P42,L16) 统计量的标准误描述样本统计量抽样误差,标准误小,表示抽样误差小,统计量较稳定,与参数较接近。 (P49,L6)
三. t检验 要检验总体均数是否为某值: 用样本均数与总体均数比较的t检验。 配对资料的两组比较,或处理前后的比较: 用配对t检验。 按完全随机化设计的两个样本均数的比较: 用团体t检验。
t检验条件 样本均数与总体均数比较的t检验要求样本来自正态分布的总体。 配对t检验要求差值d来自正态分布的总体。 团体t检验要求两个样本都来自正态分布并具有相同的方差。 如不符合要求可作变量置换或用非参数统计分析方法。 小样本团体t检验如方差不齐时可用t'检验。
四.方差分析 方差分析主要用于检验计量资料中两个或两个以上均数间差别显著性的方法。要求各样本都来自正态总体, 且有一个相同的方差σ2,仅仅均数可以不相同;还需假定每一个观察值都由若干部分累加而成,也即总的效果可分成若干部分,而每一部分都有一个特定的含义,称之谓效应的可加性。(P60,L4)
方差分析法的基本思想为:根据效应的可加性,将总的离均差平方和分解成若干部分,每一部分都与某一种效应相对应,总自由度也被分为相应的各个部分, 各部分的离均差平方和除以相应自由度得出各个均方,然后列出方差分析表算出F值, 作出统计推断。分解越细致,各部分含义就越明确。效率也越高。(P60, L9)
若发现方差不齐性时,先从实验本身检查,能否找到可能的解释,如果找不到适当的理由,可考虑作变量置换。 (P61,-L9) 对于服从对数正态分布的资料可用对数变换,即将主要变量取对数值后再作方差分析; 对于服从泊松分布的资料可用平方根变换; 对于表达成百分数的资料可用平方根反正弦变换。 如果变量置换也无法克服方差不齐性,或者变量置换方法在实验中无法得到合理的解释时,可使用非参数统计分析方法。
单因素方差分析用于按完全随机化设计资料的样本均数的比较。单因素方差分析用于按完全随机化设计资料的样本均数的比较。 随机单位组设计方差分析用于比较某因素各水平的样本均数,同时控制另一个分类因素的作用。 拉丁方设计方差分析用于比较某因素各水平的样本均数,同时控制另二个分类因素的作用。 析因设计方差分析是一种多因素的设计;能检验每个因素各水平均数间的差异,也能检验因素间的交互影响。
协方差分析是将方差分析和回归分析结合起来的一种统计分析方法,它利用回归分析方法扣除协变量的影响,再对修正的Y均值作方差分析。用于校正计量指标的方差分析。 (P96,L6) 该方法需满足下述假定: (1)各样本来自具有相同方差σ2的正态分布总体,即要求各组方差齐性。 (2)协变量与主要变量Y间的总体回归系数不等于0。 (3)各组的回归线平行,即回归系数 β1=β2=……。
五. 直线相关与回归 在医学研究中常常要分析两个变量间的关系, 两变量间如果存在一定的因果关系,则常可将一个变量看作自变量, 而另一个变量则看作为应变量,然后以一个直线方程将两者联系起来,利用这方程可以由自变量的值来估计应变量的值,这种方程称为直线回归方程,研究这类问题的方法称为回归分析。 如果两变量间虽有一定的关系存在,但不是因果关系,此时就只能进行相关分析,这种关系就称为相关。(P107,L1)
相关分析只是以相关系数来描述两个变量间线性相关的程度和方向,并不阐明事物间存在联系的本质,也不是两事物间存在联系的证据。要阐明两事物间的本质联系,必须凭专业知识从理论上加以论证。(P109,L13)相关分析只是以相关系数来描述两个变量间线性相关的程度和方向,并不阐明事物间存在联系的本质,也不是两事物间存在联系的证据。要阐明两事物间的本质联系,必须凭专业知识从理论上加以论证。(P109,L13)
两变量间如果存在回归关系,则它们之间也必然是相关的。两变量间如果存在回归关系,则它们之间也必然是相关的。 H0:β=0,H1:β≠0,与 H0:ρ=0,H1:ρ≠0,是完全一致的。 所以通常作直线回归分析时, 只须利用计算器直接求得b,a和r后,再查r界值表判定r的显著性后,即可得知回归方程是否有显著意义,不必另行检验。(P112,L7)
六. 多元回归及相关 偏回归系数bi的意义是指当其他的作用都被固定时,Xi改变一个单位时Y平均改变的bi个单位。(P124,-L5) 标准偏回归系数可用于比较各自变量对Y的作用大小。(P128,L7) 复相关系数,用R表示,它是Y与Y的估计值之间的简单相关系数,也可理解为Y与自变量组合之间的相关系数。(P129,-L3)
R2称为多元回归方程的决定系数, 表示Y的变异中可由方程中的自变量组合所决定的部分占多少;R2越接近1, 说明回归方程的效果越好,即Y的变异中可由方程中的自变量组合所决定的部分越多;R2越接近0, 说明回归方程的效果越差,即Y的变异中只有很少一部分能由方程中的自变量组合所决定,即使该方程有显著意义,也不能认为该方程的效果可以令人满意, 启示我们还应进一步寻找其他对Y可能有显著作用的变量或变量组合。(P129,-L2)
七. 逐步回归及最优子集回归 逐步回归得到的“最优”回归方程仅保证方程内自变量都显著而方程外自变量都不显著;并不能保证得到校正R2最大,或CP统计量最小, 或剩余标准差最小的回归方程。 (P139,L2)
最优子集回归中常用的最优准则有以下三种: 1. 相关指数R2最大。本法不宜用于不同自变量数的方程之间的比较,常用于比较相同自变量数的方程之间哪个为最优。 2.校正R2最大 3.CP统计量最小 校正R2和CP统计量使用方程内的自变量数进行了校正,因此可用于不同自变量数方程之间比较。(P141,L9) 最优子集回归不能保证方程内自变量都显著而方程外自变量都不显著。
考察两指标间有无关系 • 1. 两指标均为正态计量指标用相关系数。 • 2. 两指标为非正态计量指标用秩相关系数。 • 3. 两指标均为等级指标用秩相关系数。 • 4. 两指标为计数指标用列联系数,卡方检验。 • 5. 一个为等级指标,另一个为计量指标用秩相关系数,或者用方差分析。 • 6. 一个为计数指标,另一个为计量指标用 t 检验或者方差分析。
八. 计数资料的统计分析 • 计数资料的描述性统计指标主要是:率和构成比。(P177,L11) • 率说明某种现象发生的频率或强度。 • (P177,L17) • 构成比表示事物或现象内部各构成部分的比重,通常以100作为比例基数, 故常称为百分比。 • (P178,L2) • 构成比和率是两个不同的相对数,不能混淆。
四格表和2×K表卡方检验用于两个或多个率差异的比较。四格表和2×K表卡方检验用于两个或多个率差异的比较。 行×列表卡方检验用于两个或多个构成比差异的显著性检验以及两种属性间独立性检验。
四格表卡方检验 当总例数大于等于40,各理论频数大于等于5,不须校正。 当总例数大于等于40,有一格理论频数小于5,但大于等于1,用卡方校正公式。 当总例数小于40,或有一格理论频数小于1,不能用卡方检验,必须用确切概率计算。常用Fisher’s确切概率计算。 (P184, L12)
行×列表卡方检验 如果1/5以上格子的理论频数小于5,或有1格理论频数小于1,则卡方检验不是一个有效的检验。 解决方法: (1)增加例数。 (2)合并相邻的行或列(合并要合理)。 (3)用确切概率计算。
九. 非参数统计 • (1)用于不满足参数检验方法的计量资料。 • (2)等级资料。 • (3)不能测量具体数值,其观测结果往往只有程度上的区别,如颜色深浅,凝集反应的强弱等。 • (4)有不能测量的很大或很小的值。 • (P208)
符号秩和检验用于配对资料,相当于配对t检验。符号秩和检验用于配对资料,相当于配对t检验。 Willcoxon秩和检验,适用于未配对两样本检验。相当于团体t检验。 Kruskal Wallis 检验(K-W检验)。适用于多样本检验。相当于单因素方差分析。
秩相关(rank correlation)又称等级相关,它是一种分析x,y两个变量的等级间是否相关的方法。适用于某些不能准确地测量指标值而只能以严重程度,名次先后,反应大小等定出等级的资料,也适用于某些不呈正态分布或难于判断分布类型的资料。
九. 正常值范围 正常值范围的主要用途: (1)划分正常与异常的界限,用作为诊断指标 (2)反映某人群的某项指标的动态变化。 (P249,L7)
保证研究对象同质性的常用方法: (1)分组。如按地区、民族、性别、年龄等分组。 (2)严格体检。按具体要求排除特殊对象,如:妊娠 、短期内曾服某药, 有某病或其它病史者。 (3)调查不同季节、不同时间的正常人,确定常年 适用的正常值范围。 (4)限定试验条件,如规定晨起空腹等。 (5)使用合适的统计方法校正某相关因素的影响。
正常值范围并非指所有正常人都在这个范围内,而是指绝大多数正常人的观察值都在此范围内,有80%、90%、95%、99%等,其中最常用的是95%。正常值范围并非指所有正常人都在这个范围内,而是指绝大多数正常人的观察值都在此范围内,有80%、90%、95%、99%等,其中最常用的是95%。 为了鉴别诊断或选定科研病例,其主要目的是减少误诊,可取95%或99%, 普查时,其主要目的是减少漏诊,可取80%或90%。
估计正常值范围的统计方法: 正态分布法用于服从正态分布资料。 对数正态分布法用于对数正态分布资料。 当测定的例数较多,不论总体如何,都可用百分位数法估计正常值范围。 当非正态分布时,必须用百分位数法估计正常值范围。。 用百分位数法估计正常值范围时,要求例数较多,起码100例以上。。
十. 危险度分析和Logistic回归 • 相对危险度是人群中暴露于某因素者的发病率P1与不暴露于某因素者的发病率P0之比值。(P315,-L3) • RR>1时,表示该因素为危险因素,使发病危险度增大; • RR<1时,表示该因素为保护因素,使发病危险度减少; • RR=1时,表示该因素对疾病的发病无影响。
研究方法 队列研究为前瞻性研究, 在这类研究中观察人群按是否暴露于某危险因素分组,然后进行追踪观察,比较两组人群的发病率,计算相对危险度。 队列研究优点: 前瞻性,从因到果,合理,可靠 队列研究缺点: 研究难度大,随访时间长,研究发病率低的疾病时需要很大样本。
病例对照研究是一种回顾性研究方法,这种研究需要两类对象:病例和对照。分别调查这二类对象过去是否接触危险因素,然后由这二类对象接触该危险因素的不同程度,估计发病与危险因素之间的关系,这类研究中无法直接计算暴露与非暴露组的发病率;所比较的是病例组和对照组中暴露者比数,两个比数之比值称为比数比。在发病率较低的疾病中可由比数比来近似地估计相对危险度。 病例对照研究优点: 简单易行,不需长期随访,特别适用于研究发病率低的疾病。 病例对照研究缺点: 回顾性研究,从果到因,不合理,可靠性差。
Logistic回归的应用 1. 在队列研究中用于预测。 2. 因素分析 (偏回归系数)。 3. 求各因素在排除其它因素的影响后,对于发病的相对危险度(或比数比)。 4. 比较各因素对于发病的相对重要性 (标准偏回归系数) 5. 考察因素之间的交互作用。 6. Logistic回归也可用于二类间的判别分析。
Logistic回归结果: 指标 偏回归系数 标准误 P值 标准偏回归系数 常数项 -2.8770 2.0954 0.1697 . X3C 2.2844 1.0210 0.0253 0.519452 X5 1.0102 0.3147 0.0013 0.931773 X6 1.6321 0.5449 0.0027 0.837360 X8 -0.5764 0.1874 0.0021 -0.917033 X9 0.000386 0.000186 0.0384 0.392918
各指标的相对危险度: 大体类型为浸润对于非浸润3年内死亡的相对危险度为: e2.2844=9.82 胃癌深度级别每增加1级: e1.0102=2.75 淋巴结转移级别每增加1级: e1.6321=5.11 血色素每减少1g/L: e0.5764=1.78 白细胞数每增加1000个/mm3: e0.386 =1.47
从标准偏回归系数的绝对值大小可得: 胃癌深度级别,淋巴结转移级别和血色素对于手术后3年生存率的影响较大,胃癌的大体类型和白细胞数淋巴结转移级别和血色素对于手术后3年生存率的影响较小。