1.06k likes | 1.27k Views
美国渔业和野生动物保护机构规定 :“ 每个扇贝肉 的重量至少 1/36 磅才可以捕捞” 。 . !. ?. 这艘渔船上的扇贝符合捕捞标准吗?. 第九章 抽样估计. 第一节 抽样估计概论 第二节 抽样估计的基本概念 第三节 简单随机抽样的抽样误差测定 第四节 简单随机抽样的抽样估计 第五节 必要抽样单位数的确定 第六节 抽样方案设计. 第一节 抽样估计概论. 一 、 抽样估计的概念 二、抽样估计的特点 三、 抽样估计的用途 四、 抽样估计的步骤. 一、抽样估计的概念 抽样估计即根据 样本统计量 推断 总体参数 的过程。.
E N D
美国渔业和野生动物保护机构规定:“每个扇贝肉美国渔业和野生动物保护机构规定:“每个扇贝肉 的重量至少1/36磅才可以捕捞”。 ! ? 这艘渔船上的扇贝符合捕捞标准吗?
第九章 抽样估计 • 第一节 抽样估计概论 • 第二节 抽样估计的基本概念 • 第三节 简单随机抽样的抽样误差测定 • 第四节 简单随机抽样的抽样估计 • 第五节 必要抽样单位数的确定 • 第六节 抽样方案设计
第一节 抽样估计概论 • 一、抽样估计的概念 • 二、抽样估计的特点 • 三、抽样估计的用途 • 四、抽样估计的步骤
一、抽样估计的概念抽样估计即根据样本统计量推断总体参数的过程。一、抽样估计的概念抽样估计即根据样本统计量推断总体参数的过程。 分为:点估计和区间估计 全及总体指标:参数(未知量) 统计推断 样本总体指标:统计量(已知量)
二、抽样估计的特点 特点之一:按随机原则抽取样本 随机样本:与总体分布特征趋同 并非所有的抽样估计都按随机原则抽取样本。也有非随机抽样。 非随机样本:与总体分布特征不同
抽样估计的理论基础 大 数 定 律 中 心 极 限 定 理 二、抽样估计的特点 特点之二:具有科学的理论基础,其估计结果具有可靠性。
登记误差 代表性误差 二、抽样估计的特点 特点之三:存在估计误差,并可加以控制。 用设计、培训、管理等方法消除 抽样调查误差 用抽样方法、样本容量等手段控制
三、抽样估计的用途 • 抽样估计可用于四种情况: • 不可能进行全面调查时 • 不必要进行全面调查时 • 来不及进行全面调查时 • 对全面调查补充修订时 统计法对调查方法的规定:以周期性的普查为 基础,以抽样调查为主要方法,以其他方法为 辅助手段。
四、抽样估计的步骤 抽取样本单位 收集样本数据 计算样本统计量 重点掌握 推断总体参数
指直接以样本指标来估计总体指标,也叫定值估计指直接以样本指标来估计总体指标,也叫定值估计 点估计
区间估计 指根据样本指标和抽样极限误差以一定的可靠程度推断总体指标的可能范围。
2005年中国消费者协会的主题是 “健康·维权”.想象你是中国消费者协会的官员,负责治理缺斤少两的不法行为。 • 假设你对可口可乐公司生产的一种瓶装雪碧(包装上标明其净含量是500ml)进行调查。在市场上随机抽取了50瓶,测得其平均净含量为499.5ml,标准差为0.63ml。其中要做的一件事情就是: • 做出一个估计:你有95.45%的把握说该种包装的雪碧平均净含量在498.24~500.76ml之间,然后向消协写份报告。
随机性原则 • 所谓随机性原则,就是在抽选样本单位时,总体中每一个单位被抽中的机会相等,样本单位的抽中与否完全是偶然的。 • 例如:一些彩票的中奖号码; 电脑抽取中奖的身份证号或手机号等等.
第二节 抽样估计的基本概念 一、全及总体和抽样总体 二、总体指标和样本指标 三、抽样框 四、有限总体与无限总体 五、简单随机样本 六、重复抽样与不重复抽样 七、样本容量与可能的样本数目 八、抽样分布
(一)全及总体和抽样总体 1.全及总体 全及总体简称总体或母体,它是指所要调查研究对象的全体。全及总体的单位数用字母N表示。 【例】研究某学校5000名学生的学习情况,则该校的5000名学生即构成全及总体。 注意 全及总体是样本所赖以抽取的母体。对于某 一具体问题来说,全及总体是唯一确定的。 2.抽样总体。 抽样总体简称样本或子样,它是指在全及总体中按随机原则抽取的那一部分单位所构成的集合体。
概念 抽样总体的单位数称为样本容量,通常用字 母n表示。 注意 通常,样本容量n远小于总体单位数N。在抽样中,n≥30的样本称为大样本, n<30的样本称为小样本。样本总体不是唯一确定的,因为从总体N中抽取容量为n的样本(当n< N)时,共有 【例】从全校10000名学生中随机抽取100名学生进行健康状况调查,请举出由100人构成的一个抽样总体。共有多少种抽样总体?
(二)总体指标和样本指标 1.总体指标 总体指标也称为母体参数、总体参数或全及总体,它是根据总体各单位的标志值或标志特征计算的,反映总体某种属性的综合指标。 注意 一个总体常常有多个总体参数,它们从不同的角度反映了总体分布的基本状况和主要特征。由于全及总体是唯一确定的,因此,依据全及总体的数据计算的全及指标也是唯一确定的。
常用的总体指标有总体平均数 、总体比率P、总体标准差σ或方差 以及总体标志总量N或总体中某一部分单位总数 等。 则,(1)总体平均数的计算公式为: 计算 公式 总体指标的计算 设总体中,N个总体单位按某项标志的标志值分组,分组结果为:
概念 (4)总体比率 在抽样估计中,比 率习惯上称为成数,也就是总体中具有某一属性的单位占总体全部单位数的比重。 (2)总体方差的计算公式为: (3)总体标准差的计算公式为:
(5)是非标志 ①是非标志 指总体中全部单位只具有“是”或“否”、“有”或“无”两种表现形式的标志,又叫交替标志 为了研究是非标志总体的数量特征,令
②是非标志总体的指标 成数 实际上,就是非标志总体中具有某种表现或不具有某种表现的单位数占全部总体单位总数的比重。 具有某种标志表现的 单位数所占的成数 不具有某种标志表现 的单位数所占的成数
均 值 标 准 差 方差
标准差系数 〖例〗某厂某月份生产了400件产品,其中合格品380件,不合格品20件。求产品质量分布的集中趋势与离散趋势。 解:
2.样本指标 样本指标也称为统计量或抽样指标,它是根据抽样总体各单位的标志值或标志特征值计算的、用以估计和推断相应总体指标的综合指标。 一个样本总体也常常有多个样本指标,它们从不同的角度反映了样本分布的基本状况和主要特征。但由于样本总体不是唯一确定的,因此,依据样本总体的数据计算的样本指标也不是唯一确定的。
常用的样本指标有样本平均数 、样本比率P、样本标准差s或方差 以及样本总体总量n或样本中某一部分单位总数 等。 计算 公式 设样本中,n个总体单位按某项标志的标志值分组,分组结果为: 则,(1)样本平均数的计算公式为:
注意 样本单位数减1,主要是满足统计量要符合三个评选标准:①无偏性②一致性③有效性 (2)无偏样本方差的计算公式为: (3)无偏样本标准差的计算公式为:
注意 有偏样本方差,主要是不满足统计量要符合的三个评选标准:①无偏性②一致性③有效性 (2)有偏样本方差的计算公式为: (3)有偏样本标准差的计算公式为:
(4)样本比率 在抽样估计中,比 率习惯上称为成数,也就是样本中具有某一属性的单位占总体全部单位数的比重。 指样本总体中全部单位只具有“是”或“否”、“有”或“无”两种表现形式的标志,又叫交替标志 (5)是非 标志 为了研究是非标志样本总体的数量特征,令
成数 实际上就是非标志样本总体中具有某种表现或不具有某种表现的单位数占全部总体单位总数的比重。 具有某种标志表现的 单位数所占的成数 不具有某种标志表现 的单位数所占的成数
均 值 方差 标 准 差
〖例1〗一批货物(1800箱)运抵仓库,随机抽取2%进行检验,获得下列资料。〖例1〗一批货物(1800箱)运抵仓库,随机抽取2%进行检验,获得下列资料。 求该批货物每箱平均重量、该批货物重量的方差、标准差。 解: 由于这批货物运抵仓库后,是随机抽取 2%进行检验来获得上面资料的。因此,上述资料属于抽样资料,要用样本指标计算。
〖例2〗辽宁省1984年第二季度城市居民家庭生活基本情况一次性调查资料见表1〖例2〗辽宁省1984年第二季度城市居民家庭生活基本情况一次性调查资料见表1 求月平均收入、月收入的方差、标准差。 解:
(三)有限总体与无限总体 以下内容被视为属于无限总体: 单位数太多的总体; 一个正在进行的过程; 预期将会发生的某个总量。 在抽样估计中,总体单位为有限个、且可以逐个调查登记的总体称为有限总体。 总体单位为无限个、或总体单位虽然有限但不可能逐个调查的总体称为无限总体。
有限总体与无限总体 有限总体:N已知,可以排队编号并利用随机数表抽取样本单位。 无限总体:N未知,不能编号,不能使用随机数表。
抽样框 编号 001 002 003 004 005 006 007 008 009 010 姓 名 身高 体重 (cm)(kg) 丁 一 182 70 于 峰 175 62 马 宁 160 50 王一波 172 66 王忠烈 169 62 王洪宇 182 70 刘可心 166 61 李元元 152 48 李 煌 188 90 李一民 173 63 抽样框:包含所有总体单位的名单框架。 仅对有限总体而言
抽样框 应当调查的对象(居民户) 已购或未购微波炉的住户 已购该公司微波炉的住户 有购买微波炉意向的住户 某外国公司在大连进行微波炉市场调查: 微波炉普及情况 居民的喜好特征 居民购买力水平 公司产品知名度 公司产品信誉度 中山区…沙河口区 星海街道… 黑石礁街道 尖山一委…尖山二委 居民一组 居民二组 … 在商场的大门口 在微波炉柜台前 在市区街道旁边 在某个住宅小区
抽样框 连续出产的产品总体可以编制抽样框:均匀的出产时间、可以预见到的产品总量。 连续到加油站加油的汽车总体无法编制抽样框:时间不定、总量也无法确定。
简单随机样本 自有限总体抽取的简单随机样本:各样本单位以相等的概率被抽出。 在不对总体进行划分、排队的情况下按随机原则抽取样本单位的方法称为简单随机抽样,抽取出的样本称为简单随机样本。 自无限总体抽取的简单随机样本:各样本单位来自于同一总体;各单位的抽取是相互独立的。
重复抽样与不重复抽样 通常只在必须使样本单位能重复出现时使用 某彩票中奖号码(号码不重复出现): 1 2 3 4 5 6 重复抽样放回抽样: 总计:12345个 至少占总数1% 11、 121 、122 、 1231 、1232 、1233 、 12341 、12342 、12343 、12344、 123451、123452、123453、123454、 123455 抽出个体 登记特征 放回总体 继续抽取 失去中奖机会的号码
最为常用的抽样方法,用于无限总体和许多有限总体的抽样。最为常用的抽样方法,用于无限总体和许多有限总体的抽样。 重复抽样与不重复抽样 不重复抽样无放回抽样: 抽出个体 登记特征 继续抽取
重复抽样与不重复抽样 有限总体修正系数 当N足够大时 < 用于不重复抽样 用于重复抽样
样本容量与可能的样本数目 样本容量:一个样本中包含的样本单位数。通常用n来表示。 大样本:n≥30 小样本:n < 30
样本容量与可能的样本数目 • 1、考虑顺序的不重复抽样 • 2、考虑顺序的重复抽样 • 3、不考虑顺序的不重复抽样 • 4、不考虑顺序的重复抽样
抽样分布 抽样分布:样本统计量所有可能值的概率分布。 样本统计量 总体未知参数 样本统计量 样本统计量 分布的形状及接近总体参数的程度 样本统计量 样本统计量 样本统计量 样本统计量 样本统计量 样本统计量 样本统计量 样本统计量 样本统计量 样本统计量
抽样分布 样本主要统计量 平均数 比率(成数) 方差 分布的特征值:均值和标准差
平均数的抽样分布 平均数的抽样分布 学生 A B C D E F G 成绩 30 40 50 60 70 80 90 按随机原则抽选出4名学生,并计算平均分数。 二者均值相等
《统计学》第四章 抽样估计 学生 A B C D E F G 成绩 30 40 50 60 70 80 90 离差 -30 -20 -10 0 10 20 30
第三节 简单随机抽样的抽样误差测定 一、抽样误差概述 二、抽样平均误差 三、抽样极限误差
一、抽样误差概述 ㈠抽样估计的可能误差 ㈡抽样误差的控制
抽样估计的可能误差 登记误差 由人为原因造成的、可以避免的误差:非抽样误差 抽样推断误差 代表性误差 非人为原因造成的、无法避免的误差:抽样误差