❶ 判断可疑测量值取舍常用的检验方法有哪些
判断可疑测量值取舍常用的检验方法常用的有四倍法、Q检验法、迪克逊(Dixon)检验法和格鲁布斯(Grubbs)检验法。
在实际分析工作中,常常会遇到一组平行测量数据中有个别的数据过高或过低这种数据称为可以数据,也称异常值或逸出值。
(1)如何判断用哪种方法计算可疑值扩展阅读:
在一组分析数据中,往往有个别数据与其他数据相差较大,这种个别数据成为可疑值。对可疑值的处理,应首先回顾和检查生产可疑值的实验过程,有无可觉察到的技术上的异常原因。但原因不明时,必须按一定的数理统计方法进行处理,决定保留还是舍弃。
在定量分析化学实验中,实验结束后,必须对分析数据进行处理,这样能拓宽分析化学实验的应用面,以适应厂矿化验室实际工作的需要。同时也增强实验员分析化学的理论和实验必备素质。
❷ 可疑数据的取舍方法
可疑数据的取舍方法如下:
在一组条件完全相同的重复试验中,个别的测量值可能会出现异常。 如测量值过大或过小,这些过大或过小的测量数据是不正常的,或称为可疑的。
对于这些可疑数据应该用数理统计的方法判别其真伪,并决定取舍。 常用的方法有拉依达法、肖维纳特(Chavenet)法。 格拉布斯(Grubbs)法等。
倍标准偏差(3S)作为确定可疑数据取舍的标准。 当某一测量数据(x)之差大于3倍标准偏差时,用公式表示为:>3S则该测量数据应舍弃。
因而在实际试验中,一旦出现, 就认为该测量数据是不可靠的,应将其舍弃。
另外,当测量值与平均值之差大于2倍标准偏差(即| x; -x1 > 2S) 时,则该测量值应保留,但需存疑。如发现生产(施T)、试验过程屯有可疑的变异时,该测量值则应予舍弃。
拉依达法简单方便,不需查表,但要求较宽,当试验检测次数较多或要求不高时可以应用,当试验检测次数较少时(如n<10)在一组测最值中即使混有异常值,也无法舍弃。
❸ Q检验法的依据是什么
Q检验法(又叫做舍弃商法)是一种由迪克森在1951年专为分析化学中少量观测次数(n<10)提出的简易判据式。
按以下步骤来确定可疑值的取舍:
(1)将各数据按递增顺序排列:X1,X2,X3,…,Xn-1,Xn。
(2)求出最大值与最小值的差值(极差)Xmax-Xmin.
(3)求出可疑值与其最相邻数据之间的差值的绝对值。
(4)求出Q(Q等于(3)中的差值除以(2)中的极差)。
(5)根据测定次数n和要求的置信水平(如95%)。
(6)判断:若计算Q>Q表,则舍去可疑值,否则应予保留。
(3)如何判断用哪种方法计算可疑值扩展阅读:
例如现场仪器测在同一点上4次测出:0.1014,0.1012,0.1025,0.1016,其中0.1025与其他数值差距较大,是否应该舍去。
根据“Q值检验法”:
(1)对数据进行从小到大排列:0.1012,0.1014,0.1016,0.1025;
(2)求出最大值与最小值的差值=0.1025-0.1012=0.0013
(3)求出可疑数据与其相邻数值的差值的绝对值=0.1025-0.1016=0.0009
(4)计算Q1=0.0009/0.0013=0.692
(5)测试次数为4,置信水平为0.9时的Q2=0.76
(6)由于Q1<Q2,所以,0.1025不应舍弃。
❹ 数据处理——剔除异常值的两种方法
数据处理中剔除异常值的两种方法主要包括拉依达准则和格拉布斯准则。以下是这两种方法的详细解释:
一、拉依达准则
拉依达准则是一种基于实验标准偏差来判断异常值的方法。当重复测试次数远大于10次时,可以使用该方法。具体步骤如下:
计算实验标准偏差s:
使用贝赛尔公式计算n个测试结果的实验标准偏差s。
判断可疑值:
对于某个可疑值$x_{a}$,计算其与n个结果的平均值$bar{x}$之差的绝对值,即$|x_{a} - bar{x}|$。
如果$|x_{a} - bar{x}|$大于等于3s,则判定$x_{a}$为异常值。
剔除异常值并重新计算:
剔除判定为异常值的$x_{a}$后,重新计算剩余数据的平均值和实验标准偏差s。
重复上述判断步骤,直到所有剩余数据均不满足异常值条件为止。
二、格拉布斯准则
格拉布斯准则是一种更为严格的判断异常值的方法,适用于各种大小的样本量。具体步骤如下:
计算残差:
对于n个测试数据,计算每个数据与平均值的残差,即$upsilon = x_{i} - bar{x}$(其中$x_{i}$为单个数据,$bar{x}$为平均值)。
确定可疑值:
在所有残差中,找出绝对值最大的残差对应的可疑值$x_{b}$。
判断异常值:
根据给定的置信区间p(通常为0.99或0.95,即显着水平$alpha$为0.01或0.05),查找格拉布斯准则的临界值表,得到G($alpha$,n)。
计算可疑值$x_{b}$的标准化残差$frac{nu}{s}$(其中$nu$为可疑值的残差,s为实验标准偏差)。
如果$frac{nu}{s}$大于等于G($alpha$,n),则判定$x_{b}$为异常值。
剔除异常值并重新计算:
剔除判定为异常值的$x_{b}$后,重新计算剩余数据的平均值、实验标准偏差s以及每个数据的残差。
重复上述判断步骤,直到所有剩余数据均不满足异常值条件为止。
总结:
在实际应用中,可以根据数据的特性和需求选择合适的方法来剔除异常值,以确保数据处理的准确性和可靠性。