1 / 86

Analytical Chemistry

Analytical Chemistry. 第二章. 误差与分析数据处理. ( 1 ) ( 2 ). 第二章 误差与分析数据的处理. §2.1 有关误差的一些基本概念 2.1.1 准确度与精密度 2.1.2 误差与偏差 2.1.3 系统误差与随机误差 2.1.4 系统误差与准确度 §2.2 随机误差的分布 2.2.1 频率分布 2.2.2 正态分布 2.2.3 随机误差的区间概率. §2.3 有限数据的统计处理 2.3.1 集中趋势和分散趋势的表示 2.3.2 平均值的置信区间 2.3.3 显著性检验

Download Presentation

Analytical Chemistry

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Analytical Chemistry 第二章 误差与分析数据处理 (1) (2)

  2. 第二章 误差与分析数据的处理 §2.1 有关误差的一些基本概念 2.1.1 准确度与精密度 2.1.2 误差与偏差 2.1.3 系统误差与随机误差 2.1.4 系统误差与准确度 §2.2 随机误差的分布 2.2.1 频率分布 2.2.2 正态分布 2.2.3 随机误差的区间概率

  3. §2.3 有限数据的统计处理 2.3.1 集中趋势和分散趋势的表示 2.3.2 平均值的置信区间 2.3.3 显著性检验 2.3.4 离群值的取舍 2.3.5 误差的传递 2.3.6 标准曲线及线性回归 §2.4 提高分析准确度的方法 2.4.1 减小测量误差 2.4.2 控制随机误差 2.4.3 消除系统误差

  4. §2.5 有效数字 §2.6 分析测试的质量保证 2.6.1 测试过程中的质量保证 2.6.2 有效测量系统

  5. 2.1.1 准确度与精密度 • 准确度 Accuracy 准确度表征测量值与真实值的符合程度。准确度用误差表示。 • 精密度 precision 精密度表征平行测量值的相互符合程度。精密度用偏差表示。

  6. D 测量点 C 平均值 B 真值 A 2.1.1 准确度与精密度 • 准确度与精密度的关系 例:A、B、C、D 四个分析工作者对同一铁标样(WFe=37.40%)中的铁含量进行测量,得结果如图示,比较其准确度与精密度。 表观准确度高,精密度低 (不可靠) 准确度高,精密度高 准确度低,精密度高 准确度低,精密度低 36.00 36.50 37.00 37.50 38.00

  7. 准确度与精密度的关系 • 结论: 1、精密度是保证准确度的前提。 2、精密度高,不一定准确度就高。

  8. 2.1.2 误差与偏差 对一B物质客观存在量为T 的分析对象进行分析,得到n个个别测定值 x1、x2、x3、••• xn,对n 个测定值进行平均,得到测定结果的平均值,那么: 个别测定的误差为: • 误差(Error) : 表示准确度高低的量。 测定结果的绝对误差为: 测定结果的相对误差为:

  9. 2.1.2 误差与偏差 • 真值T (True value) 某一物理量本身具有的客观存在的真实值。真值是未知的、客观存在的量。在特定情况下认为是已知的: 1、理论真值(如化合物的理论组成) 2、计量学约定真值(如国际计量大会确定的长度、质量、物质的量单位等等) 3、相对真值(如高一级精度的测量值相对于低一级精度的测量值) 例如,标准样品的标准值

  10. 2.1.2 误差与偏差 • 偏差(deviation): 表示精密度高低的量。偏差小,精密度高。 偏差的表示有: 偏差 di 平均偏差 极差 R 标准偏差 S 相对标准偏差 (变异系数)CV 具体定义和计算在后续内容中介绍。

  11. 2.1.3 系统误差与随机误差 • 系统误差 (Systematic error)—某种固定的因素造成的误差。 • 随机误差 (Random error)—不定的因素造成的误差 • 过失误差 (Gross error, mistake)

  12. 系统误差与随机误差的比较

  13. 系统误差的校正 • 方法系统误差——方法校正 • 主观系统误差——对照实验(外检) • 仪器系统误差——对照实验 • 试剂系统误差——空白实验

  14. 绝对误差 = 系统误差 系统误差与准确度 Bias and accuracy 测量值的误差: 可以写成: 注:系统误差 systematic error 或者 bias 对单一测量值 : 误差 = 随机误差 + 系统误差 Error = random error + bias 由足够多的单一测量求得的“稳定”的平均值:

  15. 系统误差与准确度 Bias and accuracy 无限次测量求平均值,得到的总体平均值  绝对误差 = 总体平均值 – 真值 = 系统误差

  16. 误差的分配 系统误差 = 实验室系统误差+方法系统误差 注:实验室系统误差指单一实验室内重复测量所表现出的系统误差。 有 j 个实验室对同一样品进行分析,每个实验室得到 i 个测量值,将单一测量值表示为 xij 实验室1 实验室2 …… 实验室 j

  17. 实验室1 实验室2 …… 实验室 j 单一实验室的误差分配 方法系统误差 + 实验室系统误差 正态分布的 实验室内随机误差 重现性 Repeatability 方法系统误差 正态分布的实验室系统误差 正态分布的 实验室内随机误差 随机误差 再现性Reproducibitity 实验室间误差分配 误差分配示意图

  18. 74.24% 88.38% 2.2.1频率分布 某大学的学生对海水中的卤素进行测定,得到: 数据集中与分散的趋势

  19. 海水中卤素测定值频率密度直方图 海水中卤素测定值频率密度分布图

  20. 2=0.023 1=0.047  x 测量值与随机误差的正态分布 测量值正态分布N (,2) 的概率密度函数:  总体平均值,表示无限次测量值集中的趋势。  总体标准偏差,表示无限次测量分散的程度。 y 概率密度 x个别测量值 x- 随机误差 测量值的正态分布 0 x- 随机误差的正态分布

  21. 总体标准偏差 相同,总体平均值不同 原因: 1、总体不同 2、同一总体,存在系统误差 总体平均值相同,总体标准偏差不同 原因: 同一总体,精密度不同

  22. 平均值 测量值和随机误差的正态分布体现了随机误差的概率统计规律: 1、小误差出现的概率大,大误差出现的概率小;特别大的误差出现的概率极小。 2、正误差出现的概率与负误差出现的概率相等。 3、x = 时,y 值最大,体现了测量值的集中趋势。集中的程度与 有关。 结论:增加平行测量次数可有效减小随机误差。

  23. u 68.3% 95.5% 99.7% 标准正态分布曲线 N (0,1) 令: 正态分布函数转换成标准正态分布函数:

  24. 随机误差的区间概率 正态分布概率积分表(部分数值)

  25. 正态分布概率积分表(部分数值) 返回例题21 返回例题22 测量值与随机误差的区间概率

  26. 0.62% 例题2-1: 一样品,标准值为1.75%,测得 = 0.10, 求结果落在(1)1.750.15% 概率;(2)测量值大于2 %的概率。 (1)解: 查表:u=1.5 时,概率为:2  0.4332 = 0.866 = 86.6 % (2)解: P 86.6% 查表:u >2.5 时,概率为: 0.5 – 0.4938 = 0.0062 =0.62% ½ a ½ a a显著性水平 P 置信度 P + a = 1

  27. 有限数据的统计处理 总体 样本 样本容量 平均值 甲 平行测定 3 次 500g 乙 平行测定 4 次 丙 平行测定 4次 有限数据的处理:  计算 估计 显著性检验 没有系统误差,  = T 有系统误差,  T

  28. 2.3.1数据集中趋势和分散程度的表示 ——对和的估计 数据集中趋势的表示:对一B物质客观存在量为T 的分析对象进行分析,得到n个个别测定值 x1、x2、x3、••• xn, 平均值 Average : 中位数Median : 有限次测量:测量值向平均值 集中 无限次测量:测量值向总体平均值 集中

  29. 数据分散程度的表示 相对平均偏差 relative mean deviation 极差R Range 相对极差R 标准偏差 standard deviation 偏差 Deviation 平均偏差 Mean deviation 相对标准偏差(变异系数) Relative standard deviation (Coefficient of variation , CV )

  30. 总体标准偏差与标准偏差的比较 无限次测量, 对总体平均值的离散 总体标准偏差: 有限次测量 对平均值的离散 标准偏差: 计算一组数据分散度的独立偏差数 自由度: 自由度的理解:例如,有三个测量值,求得平均值,也知道x1和x2与平均值的差值,那么,x3与平均值的差值就是确定的了,不是一个独立的变数。

  31. 平均值的标准偏差 设有一样品,m个分析工作者对其进行分析,每人测 n次,计算出各自的平均值,这些平均值的分布也是符合正态分布的。 样本1 样本2 …… 样本m 试样总体 平均值的总体标准偏差: 对有限次测量:

  32. 测量次数 对有限次测量: 结论: 1、增加测量次数可以提高精密度。 2、增加(过多)测量次数的代价不一定能从减小误差得到补偿。

  33. 估计 在 的某个范围 内包含  的把握 有多大? 2.3.2 总体平均值的置信区间 ——对  的区间的估计 对一样品分析,报告出: 例如 无限次测量: 问题: 对有限次测量 这个问题涉及两个方面: 2、区间界限,多大区间 1、把握程度,多少把握 置信水平 Confidence level 置信区间 Confidence interval 置信度Degree of confidence Probability level 置信界限 Confidence limit 必然的联系 平均值的置信区间的问题

  34. 概率 区间大小 总体平均值的置信区间 例:  包含在 把握相对大  包含在 把握 相对小 100%的把握 无意义  包含在

  35. u 随机误差  测量值 ± 0 x- 2=0.023 1=0.047  x 复习区间概率的概念 1、对一个样品进行无限次测定,可以得到和,测量值和随机误差遵从正态分布规律。 2、若用 u表示随机误差,可得到一个随机误差的标准正态分布; 3、根据随机误差的标准正态分布,可求得随机误差出现在某一区间的概率,根据u的定义,也可求出x出现在某一区间的概率。

  36. 即: • 这是一个区间概率的问题,是说测量值落在 范围内的概率为95%。 若用单次测量值来估计的区间: • 这是一个在一定置信度下总体平均值的置信区间的问题,是说有95%的把握说 包含在 的范围内。 是说有一定的把握说 包含在 的范围内。 区间概率与置信区间 查表得: 例2-2: • 实际分析工作中通常是以样本平均值估计总体平均值 则有:

  37. u分布曲线 t 分布曲线 1、t 分布曲线 无限次测量,得到:   有限次测量,得到: s

  38. 6次测量,随机误差落在±2.57 范围内的概率为95%。 无限次测量,随机误差落在±1.96范围内的概率为95%。 t 分布值表 , 显著性水平 P = 1 - , 置信度 返回例题2-4 返回例题2-31 返回例题2-5 返回例题2-32

  39. 时: 是说当测定n次时,有一定的把握说总体平均值包含在 的范围里。 2、置信区间 有限次测量: 服从自由度 f的 t分布 也写成: t 代入,得 改写为: 置信度为(1-)100%的  的置信区间为

  40. 例题2-3 分析铁矿中的铁的质量分数,得到如下数据:37.45,37.20,37.50,37.30,37.25(%)。 (1)计算此结果的平均值、中位值、极差、平均偏差、标准偏差、变异系数和平均值的标准偏差。 (2)求置信度分别为95%和99%的置信区间。 解(1):

  41. 续解(1): 分析结果:

  42. 解(2): 求置信度分别为95%和99%的置信区间。 (1)的 结果: 结论 置信度高,置信区间大。区间的大小反映估计的精度,置信度的高低说明估计的把握程度。 置信度为95%,即1- = 0.95, = 0.05,查表: t 0.05, 4 = 2.78  的95%置信区间: 置信度为99%,即1- = 0.99, = 0.01,查表: t 0.01,4= 4.60  的99%置信区间:

  43.  未知  已知 置信度为95%,t 0.05, 4 = 2.78 置信度为95%,u 0.05= 1.96 总体标准偏差已知情况下的总体平均值的置信区间 常规例行分析,每天进行,可认为n, 是已知的,t分布还原为 u 分布,总体平均值的置信区间为: 例如,比较总体标准偏差已知与未知情况下的总体平均值的置信区间

  44. 系统误差 (1)对含量真值为T的某物质进行分析,得到平均值 ,但 ; 随机误差 (2)用两种不同的方法、或两台不同的仪器、或两个不同的实验室对同一样品进行分析,得到平均值 ,但 ; 显著性 检验 2.3.3 显著性检验 Significant Test 问题的提出: 是由随机误差引起,或存在系统误差? 显著性检验 显著性差异 校正 非显著性差异 正常

  45. 是由于随机误差引起的,测量误差应满足t 分布, 表示 落在 为中心的某一指定概率之外。在一次测定中,这样的几率是极小的,故认为是不可能的,拒绝接受。 根据 计算出的t 值应落在指定的概率区间里。否则,假设不满足,表明存在着显著性差异。 习惯上说 表明有系统误差存在。 1.平均值与标准值的比较 t 检验法 假设不存在系统误差,那么: 1、根据 计算出t 值。 t 检验法的方法 2、给出显著性水平或置信度 3、将计算出的t 值与表上查得的t 值进行比较,若

  46. 某化验室测定CaO的质量分数为30.43%的某样品中CaO的含量,得如下结果:某化验室测定CaO的质量分数为30.43%的某样品中CaO的含量,得如下结果: 例题2-4 问此测定有无系统误差?(给定 = 0.05%) 解: 假设: = T 查表: 说明和T 有显著差异,此测定有系统误差。 比较:

  47. u检验法 u 检验法与t 检验的不同在于用u分布,而不是用t分布。 例题2-5: 某炼铁厂生产的铁水,从长期经验知道它的碳含量服从正态分布,T为4.55%,为0.08%。现在又生产了5炉铁水,其碳含量分别为4.28%,4.40%, 4.42%, 4.35%, 4.37%。试问均值有无变化?(给定 = 0.05%) 解: 假设: = T 查表: 比较: 结论:平均值比原来的降低了。 注意:得到这个结论的前提是:测试是可靠的,测试过程不存在系统误差。

  48. 是由于随机误差引起的,应满足自由度 f =(n1 + n2 –2) 的 t 分布, 2、两组平均值的比较 两个实验室对同一标样进行分析,得到: 假设不存在系统误差,那么:

  49. 两组平均值的比较的方法 1、F 检验法检验两组实验数据的精密度S1和S2之间有无显著差异: 查表: 精密度无显著差异。 2、t检验确定两组平均值之间有无显著性差异 3、查表: 4、比较: 非显著差异,无系统误差 具体计算见教材的例题。

  50. 置性度95%时部分F值(单边)置信度90%时部分F值(双边)置性度95%时部分F值(单边)置信度90%时部分F值(双边)

More Related