第二章分析试样的采取与预处理

第二章分析试样的采取与预处理 • 知识要点回顾 • 了解定量分析的五个步骤； • 熟悉采样的一般原则：真实性、准确性、 • 代表性、合理性、及时性等； • 掌握试样的采取、制备和保存的一般方法； • 了解试样预处理的一般过程及原则； • 熟悉试样分解的注意事项及一般方法。

第四章误差与实验数据的处理 • 误差的基本概念 • 随机误差的正态分布 • 有限测定数据的统计处理 • 提高分析结果准确度的方法 • 有效数字及其运算规则

定量分析的目的： • 准确测定试样中物质的含量。 • 误差（Error） E = x - T x：测定值 T ：真实值误差越小，准确度越高。

第一节误差的基本概念 1、准确度与误差 1. 准确度（Accuracy）：表示测定值与真实值接近的程度，误差越小，准确度越高。 • 准确度的表示：误差 • 误差越小，准确度越高。

Ea = x - T或 Ea = x - T x：单次测定值；T：真实值； x：平均值误差（E）的表示方法： ①绝对误差 E(absolute error)：如 E＞0，则 x 偏高；E＜0，则 x 偏低。 ②相对误差 Er (relative error)：在绝对误差相同的条件下，待测组分含量越高，相对误差越小，反之，相对误差越大。

例4-1 用沉淀滴定法测定纯NaCl中氯的质量分数为60.56%、60.46%、60.70%、60.65% 和60.69%。试计算测定结果的绝对误差和相对误差。解：纯NaCl中氯的质量分数的理论值为T。

精密度的定义（P recision）： • 表示各次分析结果相互接近的程 • 度，如果数据较分散，则精密度较差。 • 精密度的表示：偏差 (Deviation) 2、精密度与偏差 a. 绝对偏差、平均偏差、相对平均偏差 b. 标准偏差和相对标准偏差 c. 平均值的标准偏差

以打靶为例来比较说明精密度、准确度之间的关系。图中靶心为射击目标，相当于真值，每次测量相当于一次射击。以打靶为例来比较说明精密度、准确度之间的关系。图中靶心为射击目标，相当于真值，每次测量相当于一次射击。 • （a）准确度低、（b）精密度高、（c）精密度、准确 • 精密度低准确度低度均高

平均值（）Average 在无系统误差时，一组测量数据的算术平均值为最佳值。

（1）绝对偏差：单次测量值与平均值之差 （2）平均偏差：各测量值绝对偏差的算术平均值（3）相对平均偏差：平均偏差与平均值的百分比率平均偏差和相对平均偏差均为正值。

标准偏差和相对标准偏差 研究对象的全体称为总体（母体）；其中的每个单元叫做个体；从总体中随机取出的一组数据叫样本（Sample）；样本所含测量值的数目n叫样本容量(样本的大小)。例如，对某矿石中铜的含量作了无限次测定，所得无限多个数据的集合就是总体，其中每个数据就是个体，从中随机取出一组数据（例如10个数据）就是样本，样本容量为10。

若样本容量为n，则其平均值为 当测量次数无限多时，所得平均值即为总体平均值μ (mju)：若没有系统误差，则总体平均值µ就是真实值T。在分析化学中，广泛采用标准偏差来衡量数据的精密度，即分散程度。

总体标准偏差σ(sigma)表示各测量值xi对总体平均值µ的偏离程度。总体标准偏差σ(sigma)表示各测量值xi对总体平均值µ的偏离程度。式中对各测定值与µ 之差进行了平方，不仅避免了单次测定偏差相加时正负抵消，而且强化了大偏差数据的作用，故σ较平均偏差能更灵敏地反映测定值的精密度。σ2称为方差。

当测量值不多（n ＜ 20），总体平均值又未知时，用样本的标准偏差s来衡量该组数据的分散程度。式中，n-1称为自由度。当测量次数非常多时，测量次数n与自由度（n-1）的区别就很小了，此时趋近于µ。

样本的相对标准偏差sr ，也称为变异系数 实际工作中，通常用相对标准偏差sr表示分析结果的精密度。

例4-2 用克式定氮法测定某蛋白质中氮的质量分数，5次平行测定结果为12.78%，12.79 %,12.71 %,12.84 %和12.88 %。计算平均值、中位值、平均偏差、相对评价偏差、标准偏差和相对标准偏差。平均值中位值 12.71 %, 12.78%，12.79 %, 12.84 %，12.88 % 单次测定值的绝对偏差

平均偏差 相对平均偏差标准偏差相对标准偏差

平均值的标准偏差 设有一样品，m个分析工作者对其进行分析，每人测 n次，计算出各自的平均值样本1 样本2 …… 样本m 试样总体平均值的总体标准偏差

对有限次测量： 平均值的标准偏差结论： 1、增加测量次数可以提高精密度。 2、增加（过多）测量次数的代价不一定能从减小误差得到补偿。一般平行测定3-4次

D 测量点 C 平均值 B 真值 A 准确度与精密度的关系例：A、B、C、D 四个分析工作者对同一铁标样（WFe= 37.40%) 中的铁含量进行测量，得结果如图示，比较其准确度与精密度。 D表观准确度高，精密度低（不可靠） C准确度高，精密度高 B准确度低，精密度高 A准确度低，精密度低 36.00 36.50 37.00 37.50 38.00

D 测量点 C 平均值 B 真值 A • 结论： 1、精密度是保证准确度的前提。 2、精密度高，不一定准确度就高。准确度及精密度都高－结果可靠

实际工作中，真值常常是未知的，故精密度就成为衡量测定准确性的重要因素。在分析化学中，有时还用重现性和再现性表示精密度。重现性表示同一分析人员在同一实验室条件下所得分析结果的精密度。再现性表示不同分析人员或不同实验室之间在各自的条件下所得分析结果的精密度。误差表示分析结果偏离真值的程度，而偏差表示数据分散的程度。前者与准确度相关，后者与精密度相关，两者不是一个概念。

3、系统误差和随机误差 1、系统误差：由某种固定原因产生。 (1)特点： (2)产生原因：具有单向性、重复性和理论可测性。 • 方法误差:分析方法本身不够完善所造成的。如溶解损失、终点误差、干扰组分的影响等－用其他方法校正 • 仪器误差:仪器不精确（刻度不准、砝码磨损）或未经校准－校准(绝对、相对)

试剂误差:试剂不纯或未经标定等－空白实验 • 操作误差:分析者未按正确的操作规程进行操作，如试样预处理、终点判断不当等 • 主观误差（个人误差）:分析者主观因素造成的，如终点颜色的观测等 (3)影响：准确度

2、随机误差(偶然误差)： 由一些难以控制、无法避免的偶然因素造成的误差。 • 特点：①不确定性，波动性，可变性，无法避免；例如：已知某矿石中 Fe2O3真实含量为 50.36%，测量值具波动性如下所示： 50.40%, 50.30%, 50.25%, 50.37%; ②符合统计规律：正态分布规律。 • 影响：精密度

系统误差与随机误差的比较

例：指出下列情况所引起的误差的性质或原因(系统误差或随机误差，过失)。如果是系统误差，应采用什么方法避免？ 1. 重量法测定SiO2的含量时，试液中硅酸沉淀不完全。系统误差中的方法误差。消除方法：可采用辅助方法(如吸光光度法)测出试液中未沉淀的硅的含量，并加进已沉淀部分的结果中，由此校正硅酸沉淀不完全带来的负误差

练习： 2. 称量时，试样吸收了少量水分(事先干燥过) 总体上属于系统误差中的试剂误差。但吸收水分的多少有随机性。消除方法：熟练掌握称量操作，尽快称量完毕 3. 用移取管移取溶液后，试液在管中残留量稍有不同？随机误差。每次有移液管中放出溶液时均应按规程操作，并最后停留10-15s。

复习从精密度好就可以判定分析结果可靠的前提是： • 随机误差小 • 系统误差小 • 平均偏差小 • 相对偏差小系统误差影响准确度随机误差影响精密度可靠：准确度和精密度都高

第二节随机误差的正态分布 随机误差是由一些偶然因素造成的误差，其大小、方向都不固定，难以预计，不能测量也无法消除。它的出现似乎很不规律，但实质上，它的出现和分布服从统计规律——正态分布规律。

1、正态分布（高斯Gauss分布） 正态分布在概率统计中占有特别重要的地位，因为许多随机变量都服从或近似服从正态分布，分析测定中的随机误差也是这样的。其数学表达式为：（4－13）式中y－为概率密度 x－为测量值

µ为总体平均值，即无限次测定数据的平均值，相应于曲线最高点的横坐标值。在没有系统误差时，它即为真值T，反映了无限个测量数据分布的集中趋势。µ为总体平均值，即无限次测定数据的平均值，相应于曲线最高点的横坐标值。在没有系统误差时，它即为真值T，反映了无限个测量数据分布的集中趋势。 σ为总体标准偏差，是µ到曲线拐点间的距离，它表征数据的分散程度，σ小，数据集中，曲线瘦高；σ大，数据分散，曲线矮胖。 x-µ表示随机误差，若以x-µ为横坐标，则曲线最高点横坐标为0，这时表示的即为随机误差的正态分布曲线。

x=µ时，y最大，对应曲线最高点的横坐标值。曲线以x=µ这点的垂直线为对称轴。 x=µ时，概率密度，此时y只与σ有关。 σ小，数据集中，曲线瘦高；σ大，数据分散，曲线矮胖。一旦µ和 σ确定后，正态分布曲线的位置和形状就确定了。图4-5 正态分布曲线

由图4-5可看到随机误差有以下规律性： (1) 偏差σ大小相等、符号相反的测定值出现的概率大致相等； (2) 偏差小的测定值比偏差较大的测定值出现的概率大，偏差很大的测定值出现的概率极小，趋近于0； (3) 大多数测定值集中在µ的附近，所以µ为最可信赖值或最佳值。 ξ (ksi)

正态分布曲线随µ、σ值不同而不同，应用起来不方便，为此，采用变量转换的方法，将其化为同一分布——标准正态分布。正态分布曲线随µ、σ值不同而不同，应用起来不方便，为此，采用变量转换的方法，将其化为同一分布——标准正态分布。即令，代入（ 4－13 ）式得又所以

将上式转化为只有变量µ的方程： Φ (fai) 因此曲线的形状与σ大小无关，即不同σ曲线皆合为同一条μ=0，σ2=1的标准正态分布曲线。图4-6 标准正态分布曲线

2、随机误差的区间概率 正态分布曲线与横坐标-∞到＋∞之间所夹的面积代表全部数据出现概率P的总和，显然应当是100％，即即为1： (4－16) 随机误差或测量值在某一区间出现的概率可取不同u值进行定积分，求得面积（即为概率），并制得标准正态分布概率积分表。

由于积分上下限不同，表的形式有很多种。为了区别，在表上方一般绘图说明表中所列值是什么区间的概率，表中列出的面积与图中阴影部分相对应，表示随机误差在此区间的概率，若是求[-u, +u]区间的概率，利用正态分布的对称性，所查值必须乘以2。

从计算结果可知，分析结果落在μ±2σ 区间的概率达95.5％，而落在μ±2σ 区间之外的概率仅为4.5％；分析结果落在μ±3σ 区间的概率达99.7％，而落在μ±3σ 区间之外的概率仅为0.3％。这表明多次重复测定中，出现特别大误差的概率很小。实践中，如果多次测定中的个别值的误差大于3σ，统计学上可认为其不是由于随机因素引起的，而应当将其舍去。从概率积分表的概率也可以确定误差的界限。

第三节有限测定数据的统计处理 对无限次测量（大于20次）而言，总体平均值µ衡量数据的集中趋势，总体标准差σ反映了数据的离散程度，数据的分布规律符合正态分布曲线。但是，分析化学中常常只作有限次测定（小于20次），其随机误差不再服从正态分布。下面将讨论如何通过有限次测定结果对µ和σ进行估计，从而合理地推断总体的特性。

1、t分布曲线 正态分布是无限次测量数据的分布规律，而实际测定只能是有限次，其分布规律不可能完全相同。在µ和σ未知的情况下，只能用标准偏差s来表示数据的离散程度，但不能简单的用s替代σ 。英国的统计学家兼化学家戈塞特提出了t值代替u值，以对误差进行补偿。此时，随机误差不再遵循正态分布，而呈t分布。

t分布曲线反映了有限次测定数据及其随机误差的分布规律。纵坐标仍为概率密度，横坐标为t。t分布曲线与正态分布曲线相似，都是对称的，只是t分布曲线随自由度f（f= n-1)而改变。当n ∞ 时，t分布趋近于标准正态分布。图4-7 t分布曲线

与正态分布曲线一样，t分布曲线下面一定范围内的面积，也是该范围内测定值出现的概率，但应注意，对于正态分布曲线，只要u值一定，相应的概率也就一定；但对于t分布曲线，当t一定时，由于f不同，相应曲线所包括的面积也不同，即概率也就不同。为此引入置信度的概念，置信度P－人们对所作判断的把握程度，其实质为某事件出现的概率，表示某一t值时，平均值落在（μ±ts）区间内的概率。落在此范围之外的概率为（1－P)，称为显著性水平，用α表示。与正态分布曲线一样，t分布曲线下面一定范围内的面积，也是该范围内测定值出现的概率，但应注意，对于正态分布曲线，只要u值一定，相应的概率也就一定；但对于t分布曲线，当t一定时，由于f不同，相应曲线所包括的面积也不同，即概率也就不同。为此引入置信度的概念，置信度P－人们对所作判断的把握程度，其实质为某事件出现的概率，表示某一t值时，平均值落在（μ±ts）区间内的概率。落在此范围之外的概率为（1－P)，称为显著性水平，用α表示。

不同概率P与f值所对应的t值，表示为tP, f。如 t 0.95,10代表置信度95％，自由度为10时的t值。由表4-3中的数据可知，f越小，t与u相差越大；随着f增大，t逐渐减小并与接近。当f=20时，t与u已经相当接近。当f趋近于∞时， t趋近于u，而s趋近于σ。在用t分布时，其置信度一般取为95％。

作业 P113、114 2、11、12、13、14题

第二章 分析试样的采取与预处理