1 / 133

第三讲 基本统计描述

3.1. 均值(Mean)和均值标准误差(S.E.mean). 3.2. 中位数(Median). 3.3. 众数(Mode). 3.5. 方差(Variance) 、 标准差(Standard Deviation). 3.4. 3.6. 全距(Range). 四分位数(Quartiles)、十分位数 (Deciles)和百分位数(Percentiles). 3.7. 频数(Frequency). 第三讲 基本统计描述. 3.8. 峰度(Kurtosis). 3.9. 偏度(Skewness). 3.10. 标准化Z分数及其线性转换.

zenda
Download Presentation

第三讲 基本统计描述

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 3.1 均值(Mean)和均值标准误差(S.E.mean) 3.2 中位数(Median) 3.3 众数(Mode) 3.5 方差(Variance)、 标准差(Standard Deviation) 3.4 3.6 全距(Range) 四分位数(Quartiles)、十分位数 (Deciles)和百分位数(Percentiles) 3.7 频数(Frequency) 第三讲 基本统计描述

  2. 3.8 峰度(Kurtosis) 3.9 偏度(Skewness) 3.10 标准化Z分数及其线性转换 3.12 交叉列联表分析 3.11 3.13 探 索 分 析 多选项分析 3.14 基本统计分析的报表制作

  3. SPSS基本统计分析是进行其他统计分析的基础和前提。通过基本统计方法的学习,可以对要分析数据的总体特征有比较准确的把握,从而有助于选择其他更为深入的统计分析方法。 本讲主要介绍如何在SPSS中进行平均数、中位数、众数、方差、百分位、频数、峰度、偏度、探索分析、交叉联列表分析、多选项分析、基本统计报表制作等的操作。

  4. 一、均值和均值标准误差(S.E.mean) 均值,又称平均值、平均数(Mean),表示的是某变量所有取值的集中趋势或平均水平。 例如,学生某门学科的平均成绩、公司员工的平均收入、某班级学生的平均身高等。 均值标准误差(Standard Error of Mean,S.E. mean)就是描述这些样本均值与总体均值之间平均差异程度的统计量。

  5. SPSS中实现过程 研究问题 求某班级学生在一次数学测验中的平均成绩,数据如下表所示。 某班级的数学成绩

  6. 实现步骤 在Analyze菜单中选择“Frequencies”命令

  7. “Frequencies”对话框(一)

  8. 图3-3 “Frequencies:Statistics”对话框(一)

  9. 结果和讨论

  10. 二、中位数(Median) 定义:把一组数据按递增或递减的顺序排列,处于中间位置上的变量值就是中位数。它是一种位置代表值,所以不会受到极端数值的影响,具有较高的稳健性。

  11. SPSS中实现过程 研究问题 求某班级学生身高的中位数,数据如下表所示。 某班级学生的身高

  12. 实现步骤 “Frequencies:Statistics”对话框(二)

  13. 结果和讨论

  14. 三、众数(Mode) 众数是指一组数据中,出现次数最多的那个变量值。众数在描述数据集中趋势方面有一定的意义。例如,制鞋厂可以根据消费者所需鞋的尺码的众数来安排生产。

  15. SPSS中实现过程 研究问题 求某医院当天出生新生儿的体重的众数,数据如下表所示。 新生儿的体重

  16. 实现步骤 图3-5 “Frequencies:Statistics”对话框(三)

  17. 结果和讨论

  18. 四、全距(Range) 全距也称为极差,是数据的最大值与最小值之间的绝对差。在相同样本容量情况下的两组数据,全距大的一组数据要比全距小的一组数据更为分散。 计算公式:最大值-最小值。

  19. 3.4.2 SPSS中实现过程 研究问题 求某班级学生数学成绩的全距,数据如表3-4所示。 表3-4 某班级的数学成绩

  20. 实现步骤 图3-6 “Frequencies:Statistics”对话框(四)

  21. 结果和讨论

  22. 五、方差和标准差 方差(Variance)是所有变量值与平均数偏差平方的平均值,它表示了一组数据分布的离散程度的平均值。 标准差(Standard Deviation)是方差的平方根,表示一组数据平均数的平均离散程度。 方差和标准差越大,说明变量值之间的差异越大,距离平均数这个“中心”的离散趋势越大。

  23. SPSS中实现过程 研究问题 求某班级学生数学成绩的方差和标准差,数据如下表所示。

  24. 实现步骤 在菜单中选择“Descriptives”命令

  25. “Descriptives”对话框(一)

  26. 、 “Descriptives:Options”对话框(一)

  27. 结果和讨论

  28. 六、四分位数、十分位数和百分位数 四分位数(Quartiles)、是将一组个案由小到大(或由大到小)排序后,用3个点将全部数据分为四等份,与3个点上相对应的变量称为四分位数,分别记为Q1(第一四分位数)、Q2(第二四分位数)、Q3(第三四分位数)。 四分位差越小,说明中间的数据越集中;四分位数越大,则意味着中间部分的数据越分散。

  29. 十分位数(Deciles)是将一组数据由小到大(或由大到小)排序后,用9个点将全部数据分为十等份,与9个点位置上相对应的变量称为十分位数,分别记为D1,D2,…,D9,表示10%的数据落在D1下,20%的数据落在D2下,90%落在D9下。十分位数(Deciles)是将一组数据由小到大(或由大到小)排序后,用9个点将全部数据分为十等份,与9个点位置上相对应的变量称为十分位数,分别记为D1,D2,…,D9,表示10%的数据落在D1下,20%的数据落在D2下,90%落在D9下。

  30. 百分位数(Percentiles)是将一组数据由小到大(或由大到小)排序后分割为100等份,与99个分割点位置上相对应的变量称为百分位数,分别记为P1,P2,…,P99,表示1%的数据落在P1下,2%的数据落在P2下,…,99%落在P99下。百分位数(Percentiles)是将一组数据由小到大(或由大到小)排序后分割为100等份,与99个分割点位置上相对应的变量称为百分位数,分别记为P1,P2,…,P99,表示1%的数据落在P1下,2%的数据落在P2下,…,99%落在P99下。

  31. SPSS中实现过程 研究问题1 求某班级学生数学成绩的四分位数,数据如下表所示。

  32. 实现步骤 “Frequencies:Statistics”对话框(五)

  33. 研究问题2 测量54个某种机械零件的重量(克),求零件重量的D6,数据如下表所示。

  34. 实现步骤 “Frequencies:Statistics”对话框(六)

  35. “Frequencies:Statistics”对话框(七)

  36. 研究问题3 测量出54个某种机械零件的重量(克),求零件重量的P37,数据如下表所示。

  37. 实现步骤 “Frequencies:Statistics”对话框(七)

  38. 结果和讨论 研究问题1的程序运行结果如下表所示。

  39. 研究问题2的程序运行结果如下表所示。

  40. 研究问题3的程序运行结果如下表所示。

  41. 七、频数(Frequency) 频数就是一个变量在各个变量值上取值的个案数。如要了解学生某次考试的成绩情况,需要计算出学生所有分数取值,以及每个分数取值有多少个人,这就需要用到频数分析。

  42. SPSS中实现过程 研究问题 10个学生在某次数学、语文、化学考试中成绩如下表所示,试求学生在3门课程上的频数分布。

  43. 学生成绩

  44. 实现步骤 “Frequencies”对话框(二)

  45. 结果和讨论 程序运行结果如下表所示。

  46. 八、峰度(Kurtosis) 峰度是描述某变量所有取值分布形态陡缓程度的统计量。这个统计量是与正态分布相比较的量,峰度为0表示其数据分布与正态分布的陡缓程度相同;峰度大于0表示比正态分布高峰要更加陡峭,为尖顶峰;峰度小于0表示比正态分布的高峰要平坦,为平顶峰。

  47. SPSS中实现过程 研究问题 某班级40个学生的年龄分布如下表所示,试求学生年龄峰度。

  48. 实现步骤 在Data菜单中选择“Weight Cases”命令

  49. 结果和讨论

  50. 九、偏度(Skewness) 偏度也是描述数据分布形态的,它是描述某变量取值分布对称性的统计量。

More Related