slide1 n.
Download
Skip this Video
Loading SlideShow in 5 Seconds..
医 学 统 计 学 PowerPoint Presentation
Download Presentation
医 学 统 计 学

Loading in 2 Seconds...

play fullscreen
1 / 261

医 学 统 计 学 - PowerPoint PPT Presentation


  • 114 Views
  • Uploaded on

医 学 统 计 学. 四川大学华西公共卫生学院 卫生统计学教研室 张 强 ( 副教授). 总体与样本 参数和统计量 同质与变异 抽样误差 概率 变量. 例 2.1 某市 110 名 7 岁男童的身高 (cm )资料如下,请作统计描述。 114.4 119.2 124.7 125.0 115.0 112.8 120.2 110.2 120.9 120.1 125.5 120.3 122.3 118.2 116.7 121.7 116.8 121.6 115.2 122.0

loader
I am the owner, or an agent authorized to act on behalf of the owner, of the copyrighted work described.
capcha
Download Presentation

PowerPoint Slideshow about '医 学 统 计 学' - lotta


An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -
Presentation Transcript
slide1

医 学 统 计 学

四川大学华西公共卫生学院

卫生统计学教研室

张 强(副教授)

slide3

总体与样本

参数和统计量

同质与变异

抽样误差

概率

变量

slide7

例2.1 某市110名7岁男童的身高(cm)资料如下,请作统计描述。

114.4 119.2 124.7 125.0 115.0 112.8 120.2110.2 120.9 120.1

125.5 120.3 122.3 118.2 116.7 121.7 116.8 121.6 115.2 122.0

121.7 118.8 121.8 124.5 121.7 122.7 116.3 124.0 119.0 124.5

121.8 124.9 130.0 123.5 128.1 119.7 126.1 131.3 123.8 114.7

122.2 122.8 128.6 122.0 132.5 122.0 123.5 116.3 126.1 119.2

126.4 118.4 121.0 119.1 116.9 131.1 120.4 115.2 118.0 122.4

114.3 116.9 126.4 114.2 127.2 118.3 127.8 123.0 117.4 123.2

119.9 122.1 120.4 124.8 122.1 114.4 120.5 115.0 122.8 116.8

125.8 120.1 124.8 122.7 119.4 128.2 124.1 127.2 120.0 122.7

118.3 127.1 122.5 116.3 125.1 124.4 112.3 121.3 127.0 113.5

118.8 127.6 125.2 121.5 122.5 129.1 122.6 134.5 118.3 132.8

slide11

用加权法可求某市110名7岁男孩身高均数如下:用加权法可求某市110名7岁男孩身高均数如下:

slide17

正态分布

标准正态分布

slide20

正态分布的特点:

1.单峰,钟形

2.以均数为中心,两侧对称

3.尾端不与横轴相交

4.均数—位置,标准差—形状

5.曲线下面积分布有特殊规律

slide22

表3.1 110名7岁男童身高频数实际分布与理论分布的比较

slide25

例3.3 已得110名7岁男童身高

,现欲估计该地1995年身高界于116.5cm 到119.0cm范围内的7岁男童比例及110名7岁男童中身高界于116.5~119.0cm范围的人数。

slide29

1.选取适当数量的“正常”人

2.控制测量误差

3.确定单、双侧

4.确定适当的范围大小

5.确定正确的统计方法—正态分布法

百分位数法

slide30

总体和样本

随机抽取

总体

population

有限总体

无限总体

统计描述

样本

sample

统计推断、外推

slide32

抽样研究

总体————样本

slide37

数理统计推理和中心极限定理(central limit theorem)表明: 从正态总体N(, )中,随机抽取例数为n的样本,样本均数 也服从正态分布;即使从偏态总体随机抽样,当n足够大时(如n>50), 也近似正态分布。

slide40

例4.2 现测得某地25名1岁婴儿血红蛋白的平均值为123.7(g/L),求其95%可信区间。

本例n=25, S=11.9g/L, 按式(4.2)算得样本均数的标准误为: (g/L)

=n1=251=24, 取双尾0.05,查附表2,t值表得 。按式(4.4)得:

即 (118.79, 128.61)g/L

故该地1岁婴儿血红蛋白平均值95%的可信区间为(118.79, 128.61)g/L。

slide41

例4.4 某地抽得正常成人200名,测得其血清胆固醇的均数为3.64mmol/L,标准差为1.20mmol/L,试估计该地正常成人血清胆固醇均数的95%可信区间。

本例n=200>50,故采用正态近似的方法按式(4.7)计算可信区间。今 =3.64, S=1.20, 取双尾0.05得 。

即(3.47, 3.81)mmolL

故该地正常成人血清胆固醇均数的95%可信区间为(3.47, 3.81)mmolL。

slide44

假设检验

例 3.4 据大量调查知,健康成年男子脉搏的均数为72次/分,某医生在山区随机调查了25名健康成年男子,其脉搏均数为74.2次/分,标准差为6.5次/分,能否认为该山区成年男子的脉搏高于一般人群?

返回1返回2

slide45

未知总体

已知总体

72次/分

样本

  • 两均数不相等的原因有两种可能:

①由于抽样误差所致;

②样本来自另一总体(由于环境条件的影响,山区成年男子的脉搏确实高于一般)。

判断的方法:假设检验

slide46

(1) 建立检验假设,确定检验水准

H0:=0山区成年男子平均脉搏数与一般人群相等

H1:>0 山区成年男子平均脉搏数高于一般人群

单侧 =0.05

(2) 计算统计量

(3) 确定P值,作出统计推断

查附表2,t界值表,t0.05,24=1.711,t0.10,24=1.318,得0.10>P>0.05,按=0.05水准不拒绝H0,尚不能认为该山区健康成年男子的脉搏均数高于一般健康成年男子的脉搏均数。

slide48

例3.6 为探讨MRI无创性测量肺脉舒张压(PADP)的新途径,分别用MRI和右心导管两种方法测量12名患者的肺脉舒张压,资料如表3.1,问两种方法的检测结果有无差别?

slide49

表3.1 两种方法检测12名患者的肺脉舒张压(kPa)结果

slide50

(1) 建立假设检验,确定检验水准

H0:两方法检验结果相同,即d=0

H1:两方法检验结果不同,即d0

双侧=0.05

(2) 计算统计量

=n-1=12-1=11

(3) 确定P值,作出统计推断

查附表2,t界值表,得0.20>P>0.10,按=0.05水准不拒绝H0 ,尚不能认为两种方法检查的结果不同。

slide52

3.成组设计的t检验

  • 例3.7 某医生研究野木瓜用于手术后的镇痛疗效,以哌替啶作为对照,观察两药的镇痛时间(h),得到下表3.2结果,问野木瓜与哌替啶的术后平均镇痛时间是否不同?
slide54

(1) 建立假设检验,确定检验水准

H0:1=2 ,即两总体均数相等

H1:12 , 即两总体均数不相等

双侧=0.05

slide56

(3) 确定P值,作出统计推断

查附表2 , t界值表, 得P<0.001 ,按=0.05水准拒绝H0,接受H1,差异有统计学意义,故可认为野木瓜与哌替啶的术后平均镇痛时间不同,野木瓜液的镇痛时间较长。

slide59

例3.8 为了摸清高碘是否影响儿童的智力发育,造成智力低下,研究者抽样调查了农村地区的高碘地区100名小学生和非高碘区105名小学生的智商(IQ)得到如表3.3结果,问该农村地区的高碘地甲病区小学生智商水平是否与非高碘区不同?(假定两组受教育年限、学校规模、师资水平、经济状况、生活水平相近)

能否用两样本均数比较的t检验?

slide60

(1) 建立假设检验,确定检验水准

H0:该市高碘区与非高碘区儿童智力均数相等,即1=2

H1:该市高碘区与非高碘区儿童智力均数不等,即12

双侧=0.05

(2) 计算统计量

(3) 确定P值,作出统计推断

查附表2,t界值表(=时),得P<0.001,按=0.05水准拒绝H0,接受H1,差异有统计学意义,可认为该农村高碘区与非高碘区儿童智力均数不等,高碘区较低。

slide61

I 型错误与II 型错误

  • 拒绝了实际上成立的H0,这类“弃真”的错误为I 型错误(type I error);
  • 不拒绝实际上不成立的H0,这类“存伪”的错误为II 型错误(type II error)。
slide62

客观实际 拒绝H0不拒绝H0

H0成立 I 型错误() 推断正确(1-)

H0不成立 推断正确(1-) II 型错误()

slide63

, 的关系

  • 通常当n固定时,愈小,愈大;反之,愈大,愈小。
  • 增大n,可同时减小,。
slide64

检验效能

  • 1-称为或把握度(power of a test),其统计学意义是若两总体确有差别,按水准能检出其差别的能力。
  • 值的大小很难确切估计,只有在已知样本含量n、两总体参数差值以及所规定的检验水准的条件下, 才能估算出大小。

或通过非中心的t界值表得到。

slide65

假设检验中的注意事项

  • 要保证组间的可比性
  • 要根据研究目的、设计类型和资料类型选用适当的检验方法
  • 正确理解差别有无显著性的统计学意义
  • 结论不能绝对化
  • 单、双侧检验应事先确定
slide66

假设检验常见结果:

  • 专业有意义,统计学检验无意义;
  • 专业无意义,统计学检验有意义;
  • 专业有意义,统计学检验有意义。
slide68

问题的提出:

研究者希望了解该新药(或检验方法)与常规药物(或检验方法)有效率是否相近或相等,以便代替原用的药物。

若用前述的一般假设检验方法,P,可得出不拒绝H0的统计结论,即尚不能认为两种处理有差别;

  • 问题:

能否认为两药等效?Why?

slide69

例3.12

为评价厄贝沙坦治疗轻、中度高血压病人的临床疗效,以录沙坦为对照。选取轻、中度高血压病人,采用双盲双模拟、随机对照法,治疗4周时的收缩压改变值的均数及标准差列入表3.5中,能否认为两种药物的降压效果等效?

slide71

(1) 建立假设

样本均数与总体均数 两样本均数

H0:|-0|H0:|1-2|

H1:|-0|<H1:|1-2|<

=0.05 =0.05

是等效界值, 应在进行等效检验时, 事先给定。 是一个有临床意义的值,一般由研究者根据专业知识确定。

slide72

(2) 计算统计量

1) 样本均数与总体均数比较

2) 两样本均数比较

slide73

(3) 确定P值,作出统计推断

根据=n-1(样本与总体)或=n1+n2-2(两样本),查t界值表,确定P值。若P,拒绝H0,可认为两总体均数等效。

slide74

例3.12 根据表3.5的资料能否认为两种药物的降压效果等效?

表3.5 厄贝沙坦与氯沙坦的4周降压效果(kPa)

slide75

1) 建立假设检验,确定检验水准

H0:|1-2|0.67 kPa

H1:|1-2|<0.67 kPa

=0.05

slide77

3) 确定P值,作出统计推断

查附表2,t界值表,得0.025<P<0.05,按=0.05水准拒绝H0,接受H1,可认为两种药物的降压效果等效。

slide78

(4) 注意事项

1) 值的选定在等效检验中十分重要。若确定过大,将把不等效的处理措施判断为等价;若确定过小,则很难得到等效的结果。

2) 惯用的假设检验与等效检验H0与H1的比较。

惯用的假设检验 等效检验

H0:1=2H0:|1-2|

H1:12H1:|1-2|<

slide80

例5.1 某社区随机抽取了30名糖尿病患者、IGT异常和正常人进行载脂蛋白(mg/dL)测定,结果见表5.2,问三种人的载脂蛋白有无差别?

slide81

糖尿病

105.45

IGT

102.39

122.80

正常人

85.70

96.00

144.00

105.20

124.50

117.00

109.50

105.10

110.00

96.00

76.40

109.00

115.20

95.30

103.00

95.30

110.00

123.00

110.00

95.20

127.00

100.00

99.00

121.00

125.60

120.00

159.00

111.00

115.00

106.50

表5.2 糖尿病患者、IGT异常及正常人的载脂蛋白测定结果

slide87

(1) 建立检验假设和确定检验水准

H0:三种人载脂蛋白的总体均数相等,即μ1=μ2=μ3

H1:三种人载脂蛋白的总体均数不全相等

α=0.05

slide92

ν总=N-1=30-1=29

ν组间=k-1=3-1=2

ν组内=N-k=30-3=27

MS组间=SS组间/ν组间=2384.026/2=1192.013

MS组内=SS组内/ν组内=5497.84/27=203.62

F=MS组间/MS组内=1192.013/203.62=5.854

slide93

变异来源

SS

ν

MS

F

P

组间

2384.03

2

1192.01

5.8540

<0.01

组内

5497.84

27

203.62

7811.87

29

表5.4 例5.1的方差分析结果

slide94

(3) 确定P值和作出推断结论

以ν组间为ν1,ν组内为ν2查F界值表,得F0.05(2,27)=3.35,F0.01(2,27)=5.49,本例F=5.8547>F0.01(2,27),故P<0.01。在α=0.05水准上拒绝H0,接受H1,可以认为三种人的载脂蛋白不同。

slide95

例5.2 对小白鼠喂以A、B、C三种不同的营养素,目的是了解不同营养素增重的效果。采用随机区组设计方法,以窝别作为划分区组的特征,以消除遗传因素对体重增长的影响。现将同品系同体重的24只小白鼠分为8个区组,每个区组3只小白鼠。三周后体重增量结果(克)列于表5.5,问小白鼠经三种不同营养素喂养后所增体重有无差别?

slide96

区组号

A营养素

B营养素

C营养素

1

50.10

58.20

64.50

2

47.80

48.50

62.40

3

53.10

53.80

58.60

4

63.50

64.20

72.50

5

71.20

68.40

79.30

6

41.40

45.70

38.40

7

61.90

53.00

51.20

8

42.20

39.80

46.20

表5.5 A、B、C三种营养素喂养小白鼠所增体重(克)

slide98

(1) 建立检验假设和确定检验水准

H0:三种营养素喂养的小白鼠体重增量相等,即μ1=μ2=μ3

H1:三种营养素喂养的小白鼠体重增量不全相等

α=0.05

slide102

ν总=N-1=24-1=23

ν处理=k-1=3-1=2

ν区组=n-1=8-1=7

ν误差=(k-1)(n-1)=27=14

slide103

MS处理=SS处理/ν处理=144.92/2=72.46

MS误差=SS误差/ν误差=340.54/14=24.32

F=MS处理/MS误差=72.46/24.32=2.979

slide104

变异来源

SS

ν

MS

F

P

处理间

144.92

2

72.46

2.98

>0.05

区组间

2376.38

7

339.48

13.96

<0.01

误差

340.54

14

24.32

2861.84

23

表5.7 例5.2的方差分析结果

slide105

(3) 确定P值和作出推断结论:以ν处理(即ν1)=2和ν误差(即ν2)=14查F界值表,得F0.05(2,14)=3.74,本例F=2.98<F0.05(2,14),故P>0.05。根据α=0.05的水准,不拒绝H0,尚不能认为三种营养素喂养的小白鼠体重增量有差别。

slide108

SNK-q检验。SNK为Student-Newman-Keuls三人姓氏的缩写,检验统计量为q值,又常称为q检验。一般在方差分析结果拒绝H0:1=2=…=k时,再用SNK-q检验进行多重比较。SNK-q检验。SNK为Student-Newman-Keuls三人姓氏的缩写,检验统计量为q值,又常称为q检验。一般在方差分析结果拒绝H0:1=2=…=k时,再用SNK-q检验进行多重比较。

slide110

例5.5 对例5.1资料作两两比较。

H0:任两对比组的总体均数相等,即μA=μB

H1:任两对比组的总体均数不等,即μA≠μB

α=0.05

slide111

组次

1

2

3

均数

102.39

105.45

122.80

组别

IGT异常

糖尿病患者

正常人

将三个样本均数从小到大依次排列,并编上组次:

slide113

变量变换的类型:

1.对数变换

2.平方根变换

3.倒数变换

4.平方根反正弦变换

slide115

构成比

相对比

动态数列

slide117

发病率

患病率

slide120

疾 病

病例数

构成比(%)

(1)

(2)

(3)

脑血管疾病

3805

48.19

心血管疾病

1365

17.29

恶性肿瘤

1067

13.51

意外伤害

931

11.79

呼吸系统疾病

728

9.22

合 计

7896

100.00

表4.1 某地2000年5种慢性疾病构成比

slide122

标准化率

直接法

间接法

slide123

表4.4 甲、乙两厂各年龄组人数及糖尿病患病率(%)

slide124

表4.6 直接法计算甲、乙两厂糖尿病标准化患病率(%)

slide125

表4.7 利用标准人口年龄构成计算标准化患病率(%)

slide127

1.计算相对数时分母不宜太小;

2.分析时不能以构成比代替率;

3.对观察单位数不等的几个率,不能直接相加求其总率;

4.比较相对数时应注意可比性;

5.对样本资料的比较应随机抽样, 并作假设检验。

slide128

表4.2 2000年某地区不同年龄组恶性肿瘤死亡构成比与死亡率

slide130

二项分布 特点

Poisson分布

slide136

总体率的区间估计

查表法

正态近似法

slide138

例7.7 在某地随机抽取329人,作血清登革热血凝抑制抗体反应检验,结果29人阳性,估计该地人群血清登革热血凝抑制抗体阳性率。

样本率为 =8.81%,率的标准误为:

=1.56%

故该地人群血清登革热血凝抑制抗体反应阳性率的95%可信区间为:

(8.81%-1.96×1.56% ,8.81%+1.96×1.56%)

=(5.75%, 11.87%)

slide139

例7.8 据以往经验新生儿染色体异常率为0.01,某研究者想了解当地新生儿染色体异常是否低于一般,随机抽查当地400名新生儿,结果1名染色体异常,请作统计推断。

slide140

H0: =0.01

H1: <0.01

=0.05

P(X≤1)= P(X=0)+ P(X=1)

=(0.99)400+ (0.99)399(0.01)

=0.0180+0.0725=0.0905

P(X≤1)=0.0905> ,尚无理由拒绝H0,据此样本尚不能认为该地新生儿染色体异常率低于一般新生儿。

slide141

例7.9 十八世纪天花在人群中的自然感染率高达90%。1798年英国医生琴纳对23名志愿者作牛痘免疫试验,发现这23名接种了牛痘疫苗的人接触天花病毒后竟无一人感染。试从统计学的角度来推断牛痘疫苗是否有预防天花的作用。

slide142

接种人群与不接种人群天花感染率相 等,即

接种人群比不接种人群天花感染率低,即

单侧

在 成立的前提下,23人中自然感染人数

, 无一人感染的概率为

slide143

23人中自然免疫的概率微乎其微(P〈0.0001),按 的检验水平,拒绝 ,接受 ,无人感染并非偶然性所致,牛痘抗天花得到了有力的佐证。

slide144

例7.10 根据以往经验,一般胃溃疡患者有20%发生胃出血症状。现观察某医院65岁以上溃疡病人304例,有31.6%发生胃出血症状,问老年胃溃疡患者是否较容易出血。

slide145

老年胃溃疡患者出血率等于一般胃溃疡患者,即

老年胃溃疡患者出血率高于一般胃溃疡患者,

单侧

本例n=304,p=0.316, =0.2,按式(5.12)有

slide146

查u界值表(附表2, 时的t界值表),得 ,故 , 按单侧 水平拒绝 ,接受 ,认为老年胃溃疡患者较一般患者易于出血。

slide148

四格表

行列表

列联表

slide151

例8.1 为了解铅中毒病人是否有尿棕色素增加现象,分别对病人组和对照组的尿液作尿棕色素定性检查,结果见表8.1,问铅中毒病人与对照人群的尿棕色素阳性率有无差别?

slide152

表8.1 两组人群尿棕色素阳性率比较

—————————————————————————————————

组别 阳性数 阴性数 合计 阳性率 (%)

—————————————————————————————————

铅中毒病人 29 (18.74) 7 (17.26) 36 80.56

对照组 9 (19.26) 28 (17.74) 37 24.32

__________________________________________________________________

合计 38 35 73 52.05

—————————————————————————————————

注:括号内为理论频数

slide153

H0: 1=2,即两总体阳性率相等;

H1: 12,即两总体阳性率不等;

=0.05。

=(2-1)(2-1)=1

20.05=3.84,20.01=6.63, 本例2=23.12,故P<0.01,按=0.05水准拒绝H0,接受H1,因而可认为两总体阳性率有差别(统计学推论)。结果说明,铅中毒病人有尿棕色素增高现象(结合样本率作实际推论)。

slide154

表8.3 穿新旧两种防护服工人的皮肤炎患病率比较

__________________________________________________

防护服种类 皮肤炎症 合 计 患病率(%)

——————————

阳性例数 阴性例数

—————————————————————————

新 1 (3.84) 14 (11.16) 15 6.7

旧 10 (7.16) 18 (20.84) 28 35.7

————————————————————

合 计 11 32 43 25.6

__________________________________________________

slide155

H0:两组工人皮肤炎总体患病率相等,即1=2H0:两组工人皮肤炎总体患病率相等,即1=2

H1:两组工人皮肤炎总体患病率不等,即12

=0.05

校正2值为

查2界值表得,0.10>P>0.05,按=0.05水准不拒绝H0,尚不能认为穿不同防护服的两组工人的皮肤炎患病率有差别。

slide156

表8.4 两种血清学检验结果比较

_______________________

甲 法 乙 法 合计

+ -

_______________________

+ 45 (a) 22 (b) 67

- 6 (c) 20 (d) 26

_______________________

合 计 51 42 93

_______________________

slide158

H0:两法总体阳性检出率无差别,即B=C,

H1:两法总体阳性检出率不同, 即BC;

=0.05。

查2界值得P<0.005,按=0.05水准拒绝H0,接受H1,故可认为甲乙两法的血清学阳性检出率不同。参照所得结果,说明甲法的阳性检出率较高。

slide159

表8.5 某省三个地区花生的黄曲霉毒素B1污染率比较

__________________________________________________

地 区 检验的样品数 合计 污染率(%)

未污染 污染

__________________________________________________

甲 6 23 29 79.3

乙 30 14 44 31.8

丙 8 3 11 27.3

__________________________________________________

合 计 44 40 84 47.6

__________________________________________________

slide161

H0:三个地区花生污染黄曲霉毒素B1污染率相等H0:三个地区花生污染黄曲霉毒素B1污染率相等

H1:三个地区花生污染黄曲霉毒素B1污染率不全相等

=0.05

=(3-1)(2-1)=2

查2界值得P<0.005,按=0.05水准拒绝H0,接受H1,故可认为三个地区花生污染黄曲霉毒素B1污染率不相等,有地区性差异。

slide162

表8.6 鼻咽癌患者与眼科病人血型构成比较

__________________________________________________

组别 A型 B型 O型 AB型 合计

__________________________________________________

鼻咽癌患者 55 45 57 19 176

眼科病人 44 23 36 9 112

__________________________________________________

合 计 99 68 93 28 288

__________________________________________________

slide163

H0:鼻咽癌患者与眼科病人血型的总体构成比相同,H0:鼻咽癌患者与眼科病人血型的总体构成比相同,

H1:鼻咽癌患者与眼科病人血型的总体构成比不全相同,

=0.05。

=(2-1)(4-1)=3

查2界值得P>0.25,按=0.05水准不拒绝H0,故尚不能认为鼻咽癌患者与眼科病人的血型构成有差别。即尚不能认为血型与鼻咽癌发病有关。

slide164

表8.7 不同期次矽肺患者肺门密度级别分布

__________________________________________________

矽肺期次 肺门密度级别 合计

十 卄 卅

__________________________________________________

Ⅰ 43 188 14 245

Ⅱ 1 96 72 169

Ⅲ 6 17 55 78

__________________________________________________

合计 50 301 141 492

__________________________________________________

slide165

H0:各期矽肺构成比相同并且各级肺门密度构成比相同,即矽肺期次与肺门密度无关联;H0:各期矽肺构成比相同并且各级肺门密度构成比相同,即矽肺期次与肺门密度无关联;

H1:各期矽肺构成比不全相同或各级肺门密度构成比不全相同,即矽肺期次与肺门密度有关联;

=0.05

查2界值得P<0.005,按=0.05水准拒绝H0,接受H1,故可认为肺门密度与矽肺期次有关联。结合本资料可见肺门密度有随矽肺期次增高而增加的趋势。

slide167

当率是按自然顺序的等级分层或者在连续性资料等级化后再分层的情况下,可采用Cochran Armitage趋势检验(Cochran Armitage trend test)以分析率随该分层变化的趋势,检验公式如下:

slide170

:该市中学生吸烟率无随年级增加而增高的趋势:该市中学生吸烟率无随年级增加而增高的趋势

:该市中学生吸烟率有随年级增加而增高的趋势

由于本例是按性质分组的资料,评分为1,2,3,4, 5,6。趋势检验所需中间结果见表6.10的后4列,用式(6.10)计算得 值为:

slide171

查附表5,得P<0.005。按 水准,拒绝 ,接受 。故可以认为该市中学生吸烟率有随年级增加而增高的趋势。

slide173

H0:1-2,即两总体率不等

价;

H1:1-2,即两总体率等价。

slide177

例8.10 为研究国产与进口特布他林注射液对支气管炎(哮喘)和喘息性支气管炎(喘支炎)的平喘效果,临床试验结果见表6.14,问国产与进口的特布他林的疗效是否等价?(=0.1, =0.05)

slide179

本例,国产组 p1=0.9000,n1=200

进口组 p2=0.8647,n2=207

一般 检验结果为 =1.22,=1,0.25<P<0.50, 差别无统计学意义,尚不能认为国产与进口的特布他林的平喘疗效有差别。但因不知其II型错误概率的大小,故还难以判断它们的疗效是否相同。

slide180

1. 建立检验假设和确立检验水准

H0:两种药物治疗效果不等效,即 >

H1:两种药物治疗效果等效,即 

=0.05

slide181

2. 计算检验统计量

按式(6.12)(6.17)和式(6.1)计算理论频数和 值

试验组

对照组

slide182

3. 确定P值和作出推断结论

查附表3, 界值表,得0.025P<0.05。按

=0.05水准,拒绝H0,接受H1,故可以认为国产与进口的特布他林的平喘效果等价。

slide183

本例如作u检验(单侧),按式(6.18)计算统计量:

查附表2,t界值表(=),得0.01P0.025。结论同前。

slide185

1. 等效检验的目的在于推断两总体率是否等效,须在试验设计时规定检验水准 ;

slide186

2. 两样本率比较的等效检验,两样本率差值必须小于等效界值,有人建议最大不应超过对照组样本率的20。

slide187

3. 等效界值是一个有临床意义的值,如在新药研究时,规定新药有效率比标准药提高多少才有意义的值。等效界值的选定至关重要,唯一的途径是由该研究领域的专家,从专业角度反复论证,并结合成本效益估计出一个允许的差值。

slide188

4. 等效检验与一般的假设检验有所不同,估计样本含量的方法也略有差别。

slide189

应用条件

计算过程

注意事项

slide190

非参数统计

秩和检验

slide191

参数统计与非参数统计的区别

秩和检验的计算过程(编秩)

slide192

非参数统计的概念(nonparametric test)

  • 参数统计:在样本所来自的总体分布型已知(如:

正态分布)的基础上,对总体参数进

行估计或检验。如:t检验、方差分析。

  • 非参数检验:不依赖总体的分布型,不对总体参

数进行推断,只是通过样本观 察值

推断总体的分布位置。 如:秩和检

验、 Ridit分析。

slide193

非参数检验的优缺点

  • 优点
    • 不受总体分布的限制,适用范围广。
    • 可以是计量资料、等级资料以及一端或两端无确切数据的资料。
    • 计算简便,易于掌握。
  • 不足

对于符合参数检验条件的资料其检验效能较低,因而,对这类资料应首选参数检验;不满足者,则用非参数检验才是准确的。

slide194

表7.1 10名健康人用离子交换法与蒸馏法测定尿汞值(g/l)

slide195

检验步骤:

(1)建立检验假设,确定检验水准。

H0:差值总体中位数Md=0

H1: Md≠0

slide196

(2)计算检验统计量 T

  • 求差值,见表7.1(4)
  • 编秩
    • 差值为0,则不计该例。
    • 如两差值相等,则取其平均秩次。
  • 给秩添加符号,见表7.1(5)。
  • 求秩和并确定检验统计量。

本例T=18.5。

slide197

(3)确定P值,并作出统计推断。

A. 当n≤50时,查附表6,T界值表。

本例n=9,T=18.5,查表得双侧P>0.10,按

双侧水准不拒绝H0 , 尚不能认为两法测定

尿汞值有差别。

B. 当n>50时,用正态近似法 (u检验),按式

(7.1) 计算u值。

slide198

2.成组设计两样本比较的秩和检验(Wilcoxon 两样本比较法)

(1)原始数据的两样本比较

例7.3 某实验室观察局部温热治疗小鼠移植肿

瘤的疗效,以生存日数作为观察指标实

验结果见表7.3,试检验两组小鼠生存数

有无差别?

slide200

检验步骤:

(1)建立检验假设,确定检验水准。

H0:两组小鼠生存日数总体分布相同

H1:两组小鼠生存日数总体分布不同

slide201

(2)计算检验统计量 T

  • 编秩
    • 将两组数据由小到大统一编秩
    • 如原始数据相同则取其平均秩次
  • 求秩和并确定检验统计量T

本例n1=10,n2=12,检验统计量T=170。

slide202

(3)确定P值,并作出统计推断。

A. 查附表7,T界值表.本例n1=10,n2- n1=2,

T=170,查表得P<0.05,按双侧 ,故

可认为实验组生存日数较对照组长。

B. 若n1、 n2- n1超出附表7的范围, 则用正态

近似法 ,可按式(7.3)计算u值:

(7.3)

式中,N= n1+n2, 0.5: 连续性校正系数

slide203

直线相关

直线回归

slide210

某地一年级12名女大学生的体重与肺活量的数据如下,试求肺活量(L)对体重(kg)X的直线相关与回归方程。某地一年级12名女大学生的体重与肺活量的数据如下,试求肺活量(L)对体重(kg)X的直线相关与回归方程。

体重(kg) X 42 42 46 46 46 50 50 50 52 52 58 58

肺活量(L)Y 2.55 2.20 2.75 2.40 2.80 2.81 3.41 3.10 3.46 2.85 3.50 3.00

slide211

检验女大学生体重与肺活量间是否有直线相关关系。检验女大学生体重与肺活量间是否有直线相关关系。

Ho: =0,两变量间无直线相关关系

H1: ≠0,两变量间有直线相关关系

=0.05

本例n=12,r=0.7495,按式(10.18)

=12-2=10

查附表2,t界值表,得0.005>p>0.002,按

=0.05水准拒绝Ho,接受H1,故可以认为一年级女大学生体重与肺活量间呈正的直线关系。

slide216

  (1) 描述两变量的依存关系

(2)利用回归方程进行预测(forecast)

(3)利用回归方程进行统计控制(statistical control)

slide217

应用直线回归应注意的问题

直线回归应用很广泛,但应注意防止不恰当的使用。

1. 作回归分析要有实际意义,不能把毫无关联的两种现象勉强作回归分析,即便有回归关系也不一定是因果关系,还必须对两种现象间的内在联系有所认识,即能从专业理论上作出合理解释或有所依据。

slide218

2. 在进行直线回归分析前,应绘制散点图,当观察点的分布有直线趋势时,才适宜作直线回归分析。散点图还能提示资料有无异常点(outlier),即对应于残差绝对值特别大的观测数据。异常点的存在往往对回归方程中的系数的估计产生较大的影响。因此,需要复查此异常点,若是测定、记录或计算机录入错误,应予修正或删除。

slide224

3. 直线回归方程的适用范围一般以自变量的取值范围为限,在此范围内求出的估计值,一般称为内插(interpolation)。超过自变量取值范围所计算的值称为外延(extrapolation)。若无充分理由证明超过自变量取值范围还是直线,应该避免外延。

slide226

一、区别

(一)资料要求不同

回归要求因变量Y服从正态分布; X是可以精确测量和严格控制的变量,一般称为Ⅰ型回归。

相关要求两个变量X、Y服从双变量正态分布。这种资料若进行回归分析称为Ⅱ型回归。可以计算两个回归方程

由X推Y的回归方程

由Y推X的回归方程

slide227

(二)应用情况不同

说明两变量间依存变化的数量关系用回归,说明变量间的相关关系用相关。

slide228

二、联系

(一)方向一致

对一组数据若同时计算r与b,它们的正负号是一致的。r为正号说明两变量间的相互关系是同向变化的。b为正,说明X增(减)一个单位,Y平均增(或减)b个单位。

slide229

(二)假设检验等价

对同一样本,r和b的假设检验得到的t值相等。由于r的假设检验可直接查表,而b的假设检验计算较繁,故在实际应用中常以前法代替后法。

slide232

秩相关,又称等级相关(rank correlation)是用双变量等级数据作直线相关分析,适用于下列资料: ①不服从双变量正态分布而不作积差相关分析 ②总体分布型未知 ③用等级表示的原始数据。

slide234

多元线性回归

协方差分析

logistic回归

Cox回归

聚类分析

判别分析

主成份分析

因子分析

多水平模型

slide235

统计图与

统计表

slide236

列表的基本要求;

常用统计图的适用条件与要求。

slide238

(1)标题。概括表的内容,写于表的上方,必要时注明时间与地点。(1)标题。概括表的内容,写于表的上方,必要时注明时间与地点。

(2)标目。以横、纵向标目分别说明主语与述语,文字简明,层次清楚。

(3)线条。表格常用三条线表示,即略粗的顶、底线及纵标目下的横线,其余线条一般省去。

slide239

(4)数字。以阿拉伯数字表示,暂缺与无数字分别以“…”、“—”表示,为“0”者记作“0”,不应有空项,为核实与分析,表常应有合计。(4)数字。以阿拉伯数字表示,暂缺与无数字分别以“…”、“—”表示,为“0”者记作“0”,不应有空项,为核实与分析,表常应有合计。

(5)不列备注。必要说明者标“*”号,于表下方说明。

slide240

某地1998年男、女肺结核患病率

性别 调查人数 患病人数 患病率(1/10万)

男 84562 445 520.70

女 83926 534 636.27

合计 168488 979 581.05

slide242

(1)标题:说明资料的内容,位于图的下方,必要时注明时间、地点。(1)标题:说明资料的内容,位于图的下方,必要时注明时间、地点。

(2)纵、横轴注明标目单位,尺度一般自左而右,自下而上,分别由小而大,为美观长宽比例一般为7∶5,有时为便于表达,尺度可以“∥”符号折断。

(3)可用不同颜色或线条说明不同的事物,并常于右上角附图例说明,但不宜过多。

slide247

实验

1组

实验

2组

实验

3组

对照组

图12.10 抑肿瘤药不同剂量与对照组用药后小白鼠肿瘤重量的比较

slide248

实验设计

调查设计

slide249

调查研究和实验研究的特点

调查设计的基本内容和步骤

常用的概率抽样方法

实验设计的基本原则

实验设计的基本内容和步骤

常用的实验设计方法

slide250

人口统计

疾病统计

slide253

寿命表的概念

寿命表的分类

寿命表的分析和应用

slide255

死亡概率

生存概率

生存率

乘积极限法

寿命表法

slide259

诊断试验的定义

诊断试验(diagnostic test)是指应用实验、仪器设备等手段检查就诊者,对疾病进行诊断的一切检测方法。包括各种实验室检查(生物化学、免疫学、微生物学、寄生虫学、病理学等)、影像诊断(超声波、CT、X线、核磁共振等)、仪器检查(心电图、脑电图、核素扫描、内窥镜等),还包括病史询问、体格检查等。诊断试验的目的是把病人与可疑有病但实际无病的人区别开来,以便对确诊的病人给予相应的治疗。

slide260

筛检试验的定义

筛检试验(screening test)是指应用简便快速的实验或其他检测方法,从大量表面健康的人群中查出某病可疑患者的试验方法。筛检试验不是诊断试验,只是一个初步检查,主要目的是早期发现那些处于临床前期或临床初期的病人,以便用更完善的诊断试验进行确诊,最后对确诊病人进行治疗。例如检查尿糖筛检糖尿病,对阳性者再作血糖等检查进行确诊,然后对确诊病人及时治疗。