統計檢驗亦稱「假設檢驗」。根據抽樣結果,在一定可靠性程度上對一個或多個總體分布的原假設作出拒絕還是不拒絕(予以接受)結論的程序。決定常取決於樣本統計量的數值與所假設的總體參數是否有顯著差異。這時稱差異顯著性檢驗。檢驗的推理邏輯為具有概率性質的反證法。
選擇
顯著性水平和否定域
有了與問題相關的抽樣分布,我們便可以把所有可能的結果分成兩類:一類是不大可能的結果;另一類人們預料這些結果很可能發生。既然如此,如果我們在一次實際抽樣中得到的結果恰好屬於第一類,我們就有理由對概率分布的前提假設產生懷疑。
在統計檢驗中,這族銀些不大可能的結果稱為否定域。如果這類結果真的發生了,我們將否定假設;反之就不否定假設。概率分布的具體形式是由假設決定的,假設肯定不止一個。在統計檢驗中,通常把被檢驗的那個假設稱為零假設(或稱原假設,用符號H0表示),並用它和其他備擇假設(用符號H1表示)相對比。
值得注意的是,假設只能被檢驗,從來不能加以證明。統計檢驗可以幫助我們否定一個假設,卻不能幫助我們肯定一個假設。為了使檢驗更嚴格、更科學,還需要更多的東西。首先,我們必須確定冒犯第一類和第二類錯誤的風險的程度;其次,要確定否定域是否要包含抽樣分布的兩端。
第一類錯誤是,零假設H0實際上是正確的,卻被否定了。第二類錯誤則是,H0實際上是錯的,卻沒有被否定。第二類錯誤是,零假設H0實際上是錯誤的,卻沒有被否定。遺憾的是,不管我們如何選擇否定域,都不可能完全避免第一類錯誤和第二類錯誤,也不可能同時把犯兩類錯誤的危險壓縮到最小。
對任何一個給定的檢驗而言,第一類錯誤的危險越小,第二類錯誤的概率就越大;反之亦然。一般來講,不可能具體估計出第二類錯誤的概率值。第一類錯誤則不然,犯第一類燃顫錯誤的概率是否定域內各種結果的概率之和。
由於犯第一類錯誤的危險和犯第二類錯誤的危險呈相背趨向,所以統計檢驗時,我們必須事先在冒多大第一類錯誤的風險和多大第二類錯誤的風險之間作出權衡。被我們事先選定的可以犯第一類錯誤的概率,叫做檢驗的顯著性水平(用α表示),它決定了否定域的大小。
如果抽樣分布是連續的,否定域可以建立在想要建立的任何水平上,否定域的大小可以和顯著性水平的要求一致起來(後面的正態檢驗就如此)。如果抽樣分布是非連續的,就要用累計概率的方法找出一組構成否定域的結果。
即在已知概率分布表上,從兩端可能性最小的概率開始向中心累計,直至概率之和略小於選定的顯著性水平為止。在許多場合,我們能預測偏差的方向,或只對一個方向的偏差感興趣。每當方向能被預測的時候,在同樣顯著性水平的條件下,單側檢驗比雙側檢驗更合適。
因為否定域被集中到抽樣分布更合適的一側,可以得到一個比較大的尾端。這樣做,可以在犯第一類錯誤的危險不變的情況下,減少了犯第二類錯誤的危險。
(1)如何區分統計推理檢查方法擴展閱讀
選擇統計檢驗程序的方法時需考慮以下條件:
1、看總體分布是否已知。如果已知,看是不是正態分布。如果已知樣本分布為常態分布就可以選擇參數檢驗法,如果總體分布未知就用非參數檢驗法。
2、在參數檢驗中,如果總體分布為正態,總體方差已知,兩樣本獨立或相關都可以採用Z檢驗;如果總體方差未知,根據樣本方差,採取不同的t檢驗。如果總體分布非正態,總體方差已知,根據樣本獨立或相關採取Z』檢驗;如果總體方差未知,根據獨立和相關採取不同的Z『檢驗。
3、根據題目考慮用單側還是雙側檢驗。
4、在非參數檢驗中,按照兩兆段宴個樣本相關和不相關、精度與容量等,可以採用符號檢驗、秩和檢驗等方法。