⑴ 可疑數據的處理方法和步驟
在一組條件完全相同的重復試驗中,可能會出現個別異常的測量值。這些異常值可能過大或過小,與正常測量數據相比顯得不正常,也稱為可疑數據。為了判斷這些可疑數據的真偽並決定是否保留,可以採用數理統計方法。常用的判別方法包括拉依達法、肖維納特法(Chavenet)和格拉布斯法(Grubbs)等。
通常以倍標准偏差(3S)作為判斷可疑數據取捨的標准。如果某一測量數據(x)與其差值大於3倍標准偏差,即 x > 3S 或 x < -3S,那麼該測量數據應該被舍棄。這種方法被美國混凝土標准所採用,並被稱為3倍標准偏差法或3S法。其依據是正態分布的統計規律,這樣的差異出現的概率很低,大約只有0.27%,即在近400次試驗中可能只出現一次,因此被視為小概率事件。在實際操作中,一旦出現這種差異,就認為該數據不可靠,應予以舍棄。
當測量值與平均值之差超過2倍標准偏差(即 |x - x̄| > 2S),則該測量值應保留但需標記為可疑。如果在生產或試驗過程中發現有可疑的變異,那麼即使測量值在正常范圍內,也應該舍棄。
拉依達法操作簡便,不需要查表,但其適用條件較為寬松。在試驗次數較多或要求不嚴格的情況下可以使用,而當試驗次數較少(n < 10)時,即使在數據集中存在異常值,也可能無法單獨舍棄。
⑵ 如何統一Q檢驗法對一個以上可疑值的取捨問題
在定量分析工作中,通常要對同一試樣做幾份平行測定,然後求出平均值。但所測結果總會有大有小,如果數據中出現顯著性差異,即有的數據特大或特小(稱為可疑值或離群值),是否都能參加平均值的計算呢?這就需要用統計學方法進行檢驗,不得隨意棄去或保留可疑值。取捨可疑值的方法很多,其中Q檢驗是一種簡便易行、比較常用的方法。具體怎麼檢驗,與可疑值的分布情況有關。可疑值的分布,一般可分三種情況: (1)在一組由小到大排列的數據中,一個可疑值分布於平均值的一側『。 (2)兩個可疑值分布於平均值的兩側。 (3)兩個可疑值分布於平均值的同側。 對第一類情況,檢驗比較簡單,處理方法比較一致,無需重新提出討論。對第二類型的Q檢驗,在現有分析化學教材資料中,出現了三種不同的處理方法【』一」1,而且影響到檢驗結果的一致性,使讀者無所適從,給統一教學和實際問題的處理帶來了一定困難。本文通過同一實例,運用多種可靠的檢驗方法作比較,試圖從中找出統一的檢驗模式,並提出第三類型的檢驗處理方法,以便統一檢驗結果,統一教學方法。下面討論後兩種分布的檢驗問題。
⑶ 什麼是q檢驗法,f檢驗法和t檢驗法
【Q檢驗法】
Q檢驗法又叫做舍棄商法,是迪克森(W.J.Dixon)在1951年專為分析化學中少量觀測次數(n<10)提出的一種簡易判據式。
按以下步驟來確定可疑值的取捨:
(1)將各數據按遞增順數排列:X1,X2,X3,…,Xn-1,Xn。
(2)求出最大值與最小值的差值(極差)Xmax-Xmin.
(3)求出可疑值與其最相鄰數據之間的差值的絕對值。
(4)求出Q(Q等於(3)中的差值除以(2)中的極差)。
(5)根據測定次數n和要求的置信水平(如95%)查表(見下)得到值
(6)判斷:若計算Q>Q表,則捨去可疑值,否則應予保留。
【F檢驗法】
F檢驗法是英國統計學家Fisher提出的,主要通過比較兩組數據的方差S2,以確定他們的精密度是否有顯著性差異。至於兩組數據之間是否存在系統誤差,則在進行F檢驗並確定它們的精密度沒有顯著性差異之後,再進行t
檢驗。
樣本標准偏差的平方,即:
兩組數據就能得到兩個S²值,
由表中f大和f小(f為自由度n-1),查得F表,
然後計算的F值與查表得到的F表值比較,如果
F
<
F表
表明兩組數據沒有顯著差異;
F
≥
F表
表明兩組數據存在顯著差異。
【T檢驗法】
T檢驗法,亦稱student
t檢驗(Student's
t
test),主要用於樣本含量較小(例如n<30),總體標准差σ未知的正態分布資料。
t檢驗是用t分布理論來推論差異發生的概率,從而比較兩個平均數的差異是否顯著。它與f檢驗、卡方檢驗並列。t檢驗是戈斯特為了觀測釀酒質量而發明的。戈斯特在位於都柏林的健力士釀酒廠擔任統計學家,基於Claude
Guinness聘用從牛津大學和劍橋大學出來的最好的畢業生以將生物化學及統計學應用到健力士工業程序的創新政策。戈斯特於1908年在Biometrika上公布t檢驗,但因其老闆認為其為商業機密而被迫使用筆名(學生)。實際上,跟他合作過的統計學家是知道「學生」的真實身份是戈斯特的。
⑷ 判斷可疑測量值取捨常用的檢驗方法有哪些
判斷可疑測量值取捨常用的檢驗方法常用的有四倍法、Q檢驗法、迪克遜(Dixon)檢驗法和格魯布斯(Grubbs)檢驗法。
在實際分析工作中,常常會遇到一組平行測量數據中有個別的數據過高或過低這種數據稱為可以數據,也稱異常值或逸出值。
(4)可疑值取捨常用的方法擴展閱讀:
在一組分析數據中,往往有個別數據與其他數據相差較大,這種個別數據成為可疑值。對可疑值的處理,應首先回顧和檢查生產可疑值的實驗過程,有無可覺察到的技術上的異常原因。但原因不明時,必須按一定的數理統計方法進行處理,決定保留還是舍棄。
在定量分析化學實驗中,實驗結束後,必須對分析數據進行處理,這樣能拓寬分析化學實驗的應用面,以適應廠礦化驗室實際工作的需要。同時也增強實驗員分析化學的理論和實驗必備素質。