⑴ 可疑数据的处理方法和步骤
在一组条件完全相同的重复试验中,可能会出现个别异常的测量值。这些异常值可能过大或过小,与正常测量数据相比显得不正常,也称为可疑数据。为了判断这些可疑数据的真伪并决定是否保留,可以采用数理统计方法。常用的判别方法包括拉依达法、肖维纳特法(Chavenet)和格拉布斯法(Grubbs)等。
通常以倍标准偏差(3S)作为判断可疑数据取舍的标准。如果某一测量数据(x)与其差值大于3倍标准偏差,即 x > 3S 或 x < -3S,那么该测量数据应该被舍弃。这种方法被美国混凝土标准所采用,并被称为3倍标准偏差法或3S法。其依据是正态分布的统计规律,这样的差异出现的概率很低,大约只有0.27%,即在近400次试验中可能只出现一次,因此被视为小概率事件。在实际操作中,一旦出现这种差异,就认为该数据不可靠,应予以舍弃。
当测量值与平均值之差超过2倍标准偏差(即 |x - x̄| > 2S),则该测量值应保留但需标记为可疑。如果在生产或试验过程中发现有可疑的变异,那么即使测量值在正常范围内,也应该舍弃。
拉依达法操作简便,不需要查表,但其适用条件较为宽松。在试验次数较多或要求不严格的情况下可以使用,而当试验次数较少(n < 10)时,即使在数据集中存在异常值,也可能无法单独舍弃。
⑵ 如何统一Q检验法对一个以上可疑值的取舍问题
在定量分析工作中,通常要对同一试样做几份平行测定,然后求出平均值。但所测结果总会有大有小,如果数据中出现显着性差异,即有的数据特大或特小(称为可疑值或离群值),是否都能参加平均值的计算呢?这就需要用统计学方法进行检验,不得随意弃去或保留可疑值。取舍可疑值的方法很多,其中Q检验是一种简便易行、比较常用的方法。具体怎么检验,与可疑值的分布情况有关。可疑值的分布,一般可分三种情况: (1)在一组由小到大排列的数据中,一个可疑值分布于平均值的一侧‘。 (2)两个可疑值分布于平均值的两侧。 (3)两个可疑值分布于平均值的同侧。 对第一类情况,检验比较简单,处理方法比较一致,无需重新提出讨论。对第二类型的Q检验,在现有分析化学教材资料中,出现了三种不同的处理方法【’一”1,而且影响到检验结果的一致性,使读者无所适从,给统一教学和实际问题的处理带来了一定困难。本文通过同一实例,运用多种可靠的检验方法作比较,试图从中找出统一的检验模式,并提出第三类型的检验处理方法,以便统一检验结果,统一教学方法。下面讨论后两种分布的检验问题。
⑶ 什么是q检验法,f检验法和t检验法
【Q检验法】
Q检验法又叫做舍弃商法,是迪克森(W.J.Dixon)在1951年专为分析化学中少量观测次数(n<10)提出的一种简易判据式。
按以下步骤来确定可疑值的取舍:
(1)将各数据按递增顺数排列:X1,X2,X3,…,Xn-1,Xn。
(2)求出最大值与最小值的差值(极差)Xmax-Xmin.
(3)求出可疑值与其最相邻数据之间的差值的绝对值。
(4)求出Q(Q等于(3)中的差值除以(2)中的极差)。
(5)根据测定次数n和要求的置信水平(如95%)查表(见下)得到值
(6)判断:若计算Q>Q表,则舍去可疑值,否则应予保留。
【F检验法】
F检验法是英国统计学家Fisher提出的,主要通过比较两组数据的方差S2,以确定他们的精密度是否有显着性差异。至于两组数据之间是否存在系统误差,则在进行F检验并确定它们的精密度没有显着性差异之后,再进行t
检验。
样本标准偏差的平方,即:
两组数据就能得到两个S²值,
由表中f大和f小(f为自由度n-1),查得F表,
然后计算的F值与查表得到的F表值比较,如果
F
<
F表
表明两组数据没有显着差异;
F
≥
F表
表明两组数据存在显着差异。
【T检验法】
T检验法,亦称student
t检验(Student's
t
test),主要用于样本含量较小(例如n<30),总体标准差σ未知的正态分布资料。
t检验是用t分布理论来推论差异发生的概率,从而比较两个平均数的差异是否显着。它与f检验、卡方检验并列。t检验是戈斯特为了观测酿酒质量而发明的。戈斯特在位于都柏林的健力士酿酒厂担任统计学家,基于Claude
Guinness聘用从牛津大学和剑桥大学出来的最好的毕业生以将生物化学及统计学应用到健力士工业程序的创新政策。戈斯特于1908年在Biometrika上公布t检验,但因其老板认为其为商业机密而被迫使用笔名(学生)。实际上,跟他合作过的统计学家是知道“学生”的真实身份是戈斯特的。
⑷ 判断可疑测量值取舍常用的检验方法有哪些
判断可疑测量值取舍常用的检验方法常用的有四倍法、Q检验法、迪克逊(Dixon)检验法和格鲁布斯(Grubbs)检验法。
在实际分析工作中,常常会遇到一组平行测量数据中有个别的数据过高或过低这种数据称为可以数据,也称异常值或逸出值。
(4)可疑值取舍常用的方法扩展阅读:
在一组分析数据中,往往有个别数据与其他数据相差较大,这种个别数据成为可疑值。对可疑值的处理,应首先回顾和检查生产可疑值的实验过程,有无可觉察到的技术上的异常原因。但原因不明时,必须按一定的数理统计方法进行处理,决定保留还是舍弃。
在定量分析化学实验中,实验结束后,必须对分析数据进行处理,这样能拓宽分析化学实验的应用面,以适应厂矿化验室实际工作的需要。同时也增强实验员分析化学的理论和实验必备素质。