1 / 12

第二节 样本分布函数 直方图

我们把总体的分布函数 称为总体分布函数.从总体中抽取容量为 的样本得到 个样本观测值,若样本容量 较大,则相同的观测值可能重复出现若干次,为此,应当把这些观测值整理,并写出下面的样本频率分布表:. 第二节 样本分布函数 直方图. 一、样本分布函数. 其中. 定义 设函数. 其中和式 是对小于或等于 的一切 的频率 求和,则称 为 样本分布函数 , 经验分布函数 。 易知样本分布函数 具有下列性质:. (3).

Download Presentation

第二节 样本分布函数 直方图

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. 我们把总体的分布函数 称为总体分布函数.从总体中抽取容量为 的样本得到 个样本观测值,若样本容量 较大,则相同的观测值可能重复出现若干次,为此,应当把这些观测值整理,并写出下面的样本频率分布表: 第二节 样本分布函数 直方图 一、样本分布函数

  2. 其中

  3. 定义 设函数 其中和式 是对小于或等于 的一切 的频率 求和,则称 为样本分布函数,经验分布函数。 易知样本分布函数 具有下列性质:

  4. (3) (4) 在每个观测值 处是右连续的,点 是 的跳跃间断点, 在该点的跃度就等于频率 样本分布函数 的图形如图5-1所示 (1) (2) 是非减函数;

  5. 图5-1

  6. 对于任意的实数 总体分布函数 是事件 的概率;样本分布函数 是事件 的频率。根据伯努利大数定理可知, 当 时,对于任意的正数 ,有 格利文科(Glivenko)进一步证明了 当 时,样本分布函数 与总体分布函数 之间存在着更密切的近似关系的结论。这些结论就是我们在数理统计中可以依据样本来推断总体的理论基础。

  7. 数理统计中研究连续随机变量 的样本分布时,通常需要作出样本的频率直方图(简称直方图),作直方图的步骤如下: 1 找出样本观测值 中的最小值与最大值,分别记作 与 ,即 2 适当选取略小于 的数 与略大于 的数 ,并用分点 把区间 分成 个子区间 第 个子区间的长度为 二、 直方图

  8. 各子区间的长度可以相等,也可以不等;若使各子区间的长度相等,则有各子区间的长度可以相等,也可以不等;若使各子区间的长度相等,则有 此外,为了方便起见,分点 应比样本观测值 多取一位小数。 3 把所有样本观测值逐个分到各子区间内,并计算样本观测值落在各子区间内的频数 及频率 子区间的个数一般取为8至15个,太多则由于频率的随机摆动而使分布显得杂乱,太少则难于显示分布的特征。

  9. 4 在 轴上截取各子区间,并以各子区间为底, 以 为高作小矩形,各个小矩形的面积 就等于样本观测值落在该子区间内的频率,即 所有小矩形的面积的和 因为样本容量 充分大时,随机变量 落在各个子区间 内的频率近似等于其概率 即 所以直方图大致地描述了总体 的概率分布。 这样作出的所有小矩形就构成了直方图。

  10. 测量100个某种机械零件的质量,得到样本观测值如下(单位:g) 246 251 259 254 246 253 237 252 250 251 249 244 249 244 243 246 256 247 252 252 250 247 255 249 247 252 252 242 245 240 260 263 254 240 255 250 256 246 249 253 246 255 244 245 257 252 250 249 255 248 258 242 252 259 249 244 251 250 241 253 250 265 247 249 253 247 248 251 251 249 246 250 252 256 245 254 258 248 255 251 249 252 254 246 250 251 247 253 252 255 254 247 252 257 258 247 252 264 248 244 写出零件质量的频率分布表并作直方图。

  11. 零件质量/ 频数 频率 236.5~239.5 1 0.01 239.5~242.5 5 0.05 242.5~245.5 9 0.09 245.5~248.5 19 0.19 248.5~251.5 24 0.24 251.5~254.5 22 0.22 254.5~257.5 11 0.11 257.5~260.5 6 0.06 260.5~263.5 1 0.01 263.5~266.5 2 0.02 总计 100 1.00 解 因为样本观测中最小值为237,最大值为265, 所以我们把数据的 分布区间确定为 (236.5,266.5) 由此得到零件质量的频率分布表: 并把这个区间等分 为10个子区间 (236.5,239.5), ( 239.5,242.5), …, ( 263.5,266.5)

  12. 直方图如图5-2所示 图5-2

More Related