導航:首頁 > 計算方法 > 非參數檢驗的計算方法

非參數檢驗的計算方法

發布時間:2022-04-21 03:23:07

㈠ 參數檢驗和非參數檢驗分別有哪些

1、非參數檢驗

SPSS單樣本非參數檢驗是對單個總體的分布形態等進行推斷的方法,其中包括卡方檢驗、二項分布檢驗、K-S檢驗以及變數值隨機性檢驗等方法。

2、參數檢驗

當總體分布已知(如總體為正態分布),根據樣本數據對總體分布的統計參數進行推斷。

此時,總體的分布形式是給定的或是假定的,只是其中一些參數的取值或范圍未知,分析的主要目的是估計參數的取值,或對其進行某種統計檢驗。這類問題往往用參數檢驗來進行統計推斷。它不僅僅能夠對總體的特徵參數進行推斷,還能夠實現兩個或多個總體的參數進行比較。

(1)非參數檢驗的計算方法擴展閱讀

1、參數檢驗一般對總體有一定的要求,而非參數檢驗對總體無特殊的需求,因此,非參數檢驗比參數檢驗應用范圍要廣。

2、符合參數檢驗條件,也符合非參數檢驗,我們選擇哪種方法進行分析呢?答案是選擇參數檢驗。因為參數檢驗的准確度比非參數檢驗要高;

3、對於同時符合參數與非參數檢驗的數據,如果參數檢驗P<0.05,非參數檢驗不一定P<0.05。

4、對於同時符合參數與非參數檢驗的數據,如果非參數檢驗P<0.05,那麼參數檢驗一定P<0.05。

5、很多人採用非參數檢驗得到P<0.05的結果時,發在表文章時不自信,總認為自己的數據不好,其實大可不必。

㈡ 非參數檢驗的介紹

非參數檢驗(Nonparametric tests)是統計分析方法的重要組成部分,它與參數檢驗共同構成統計推斷的基本內容。參數檢驗是在總體分布形式已知的情況下,對總體分布的參數如均值、方差等進行推斷的方法。但是,在數據分析過程中,由於種種原因,人們往往無法對總體分布形態作簡單假定,此時參數檢驗的方法就不再適用了。非參數檢驗正是一類基於這種考慮,在總體方差未知或知道甚少的情況下,利用樣本數據對總體分布形態等進行推斷的方法。由於非參數檢驗方法在推斷過程中不涉及有關總體分布的參數,因而得名為「非參數」檢驗。

㈢ SPSS非參數檢驗 單樣本

SPSS非參數檢驗:單樣本
一、概念:
單樣本非參數檢驗使用一個或多個非參數檢驗識別單個欄位中的差別。非參數檢驗不假定您的數據呈正態分布。非參數檢驗(Nonparametrictests)是統計分析方法的重要組成部分,它與參數檢驗共同構成統計推斷的基本內容。參數檢驗是在總體分布形式已知的情況下,對總體分布的參數如均值、方差等進行推斷的方法。但是,在數據分析過程中,由於種種原因,人們往往無法對總體分布形態作簡單假定,此時參數檢驗的方法就不再適用了。非參數檢驗正是一類基於這種考慮,在總體方差未知或知道甚少的情況下,利用樣本數據對總體分布形態等進行推斷的方法。由於非參數檢驗方法在推斷過程中不涉及有關總體分布的參數,因而得名為「非參數」檢驗。
二、目標(分析-非參數檢驗-單樣本-目標)
您的目標是什麼?目標允許您快速指定常用的不同檢驗設置。
2.1、自動比較觀察數據和假設數據。該目標對僅具有兩個類別的分類欄位應用二項式檢驗,對所有其他分類欄位應用卡方檢驗,對連續欄位應用Kolmogorov-Smirnov檢驗。
2.2、檢驗隨機序列。該目標使用遊程檢驗來檢驗觀察到的隨機數據值序列。
2.3、自定義分析。當您希望手動修改「設置」選項卡上的檢驗設置時,選中此選項。注意,如果您隨後在「設置」選項卡上更改了與當前選定目標不一致的選項,則會自動選擇該設置。
三、選擇檢驗(分析-非參數統計-單樣本-設置-選擇檢驗)
1、根據數據自動選擇檢驗。該設置對僅具有兩個有效(非缺失)類別的分類欄位應用二項式檢驗,對所有其他分類欄位應用卡方檢驗,對連續欄位應用Kolmogorov-Smirnov檢驗。
2、自定義檢驗。這些設置允許您選擇要執行的特定檢驗。
2.1、比較觀察二分類可能性和假設二分類可能性(二項式檢驗)。二項式檢驗可以應用到所有欄位。這將生成一個單樣本檢驗,可以檢驗標記欄位(只有兩個類別的分類欄位)的觀察分布是否與指定的二項式分布期望相同。此外,您還可以請求置信區間。
2.2、比較觀察可能性和假設可能性(卡方檢驗)。卡方檢驗可以應用到名義和有序欄位。這將生成一個單樣本檢驗,它可以根據欄位類別的觀察和期望頻率間的差異來計算卡方統計量。
2.3、檢驗觀察分布和假設分布(Kolmogorov-Smirnov檢驗)。Kolmogorov-Smirnov檢驗可以應用到連續欄位。這將生成一個單樣本檢驗,即欄位的樣本累積分布函數是否為齊次的均勻分布、正態分布、泊松分布或指數分布。
2.4、比較中位數和假設中位數(Wilcoxon符號秩檢驗)。Wilcoxon符號秩檢驗可以應用到連續欄位。這將生成一個欄位中位數值的單樣本檢驗。指定一個數字作為假設中位數。
2.5、檢驗隨機序列(遊程檢驗)。遊程檢驗可以應用到所有欄位。這將生成一個單樣本檢驗,即對分欄位的值序列是否為隨機序列。
四、二項式檢驗(分析-非參數統計-單樣本-設置-選擇檢驗-自定義檢驗-二項式檢驗)
二項式檢驗適用於標記欄位(只有兩個類別的分類欄位),但可通過使用定義「成功」的規則應用到所有欄位。在生活中有很多數據的取值是二值的,例如,人群可以分成男性和女性,產品可以分成合格和不合格,學生可以分成三好學生和非三好學生,投擲硬幣實驗的結果可以分成出現正面和出現反面等。通常將這樣的二值分別用1或0表示。如果進行n次相同的實驗,則出現兩類(1或0)的次數可以用離散型隨機變數X來描述。如果隨機變數X為1的概率設為P,則隨機變數X值為0的概率Q便等於1-P,形成二項分布。SPSS的二項分布檢驗正是要通過樣本數據檢驗樣本來自的總體是否服從指定的概率為P的二項分布,其原假設是:樣本來自的總體與指定的二項分布無顯著差異。
1、假設比例。這指定了定義為「成功」的記錄的期望比例,或p。指定一個大於0且
小於1的值。默認值為0.5。
2、置信區間。可以使用以下方法計算二分類數據的置信區間:◎Clopper-Pearson(精確)。基於累積二項式分布的精確區間。◎Jeffreys。基於p的後驗分布且應用Jeffreys先驗的Bayesian區間。◎似然比。基於p的似然函數的區間。
3、定義分類欄位的成功。這可以指定如何為分類欄位定義對照假設比例檢驗數據值的「成功」。◎使用在數據中找到的第一個類別將使用在樣本中找到的第一個定義「成功」的值執行二項式檢驗。此選項僅適用於只有兩個值的名義或有序欄位;如果使用了此選項,則在「欄位」選項卡中指定的所有其他分類欄位都不會檢驗。這是默認值。◎指定成功值將使用指定以定義「成功」的值列表來執行二項式檢驗。可以指定字元串或數值列表。列表中的值不需要在樣本中出現。
4、定義連續欄位的成功值。這可以指定如何為連續欄位定義對照檢驗值檢驗數據值的「成功」。成功被定義為等於或小於割點的值。◎樣本中點在最小值和最大值的平均值上設置割點。◎自定義割點允許您為割點指定一個值。
五、卡方檢驗(分析-非參數統計-單樣本-設置-選擇檢驗-自定義檢驗-卡方檢驗)
卡方檢驗方法可以根據樣本數據,推斷總體分布與期望分布或某一理論分布是否存在顯著差異,是一種吻合性檢驗,通常適於對有多項分類值的總體分布的分析。它的原假設是:樣本來自的總體分布與期望分布或某一理論分布無差異。
1、所有類別具有相等的概率。這將在樣本中的所有類別間生成均等的頻率。這是默認值。
2、自定義期望可能性。這允許您為指定的類別列表指定不相等的頻率。可以指定字元串或數值列表。列表中的值不需要在樣本中出現。在類別列中,指定類別值。在相對頻率列中,為每個類別指定一個大於0的值。自定義的頻率被視為比率,例如,指定頻率1、2和3等同於指定頻率10、20和30,兩者均指定了期望1/6的記錄屬於第一個類別,1/3的記錄屬於第二個類別,1/2的記錄屬於第三個類別。在指定自定義期望可能性時,自定義類別值必須包括數據中的所有欄位值;否則將不對該欄位執行檢驗。
六、單樣本K-S檢驗(分析-非參數統計-單樣本-設置-選擇檢驗-自定義檢驗-K-S檢驗)
K-S檢驗方法能夠利用樣本數據推斷樣本來自的總體是否服從某一理論分布,是一種擬合優度的檢驗方法,適用於探索連續型隨機變數的分布。例如,收集一批周歲兒童身高的數據,需利用樣本數據推斷周歲兒童總體的身高是否服從正態分布。再例如,利用收集的住房狀況調查的樣本數據,分析家庭人均住房面積是否服從正態分布。單樣本K-S檢驗的原假設是:樣本來自的總體與指定的理論分布無顯著差異,SPSS的理論分布主要包括正態分布、均勻分布、指數分布和泊松分布等。
1、正態。使用樣本數據使用觀察到的均值和標准差;自定義允許您指定值。
2、均勻。使用樣本數據使用觀察到的最小值和最大值;自定義允許您指定值。
3、指數分布。樣本均值使用觀察到的均值;自定義允許您指定值。
4、泊松。樣本均值使用觀察到的均值;自定義允許您指定值。
七、遊程檢驗(分析-非參數統計-單樣本-設置-選擇檢驗-自定義檢驗-遊程檢驗)
變數值隨機性檢驗通過對樣本變數值的分析,實現對總體的變數值出現是否隨機進行檢驗。它的原假設是:總體變數值出現是隨機的。變數隨機性檢驗的重要依據是遊程。所謂遊程是樣本序列中連續出現相同的變數值的次數。可以直接理解,如果硬幣的正反面出現是隨機的,那麼在數據序列中,許多個1或許多個0連續出現的可能性將不太大,同時,1和0頻繁交叉出現的可能性也會較小。因此,遊程數太大或太小都將表明變數值存在不隨機的現象。
遊程檢驗適用於標記欄位(只有兩個類別的分類欄位),但可通過使用定義組的規則
應用到所有欄位。
1、定義分類欄位的組◎樣本中僅有2個類別使用在定義組的樣本中找到的值來執行遊程檢驗。此選項僅適用於只有兩個值的名義或有序欄位;如果使用了此選項,則在「欄位」選項卡中指定的所有其他分類欄位都不會檢驗。◎將數據重新編碼為2個類別使用指定以定義某個組的值列表來執行遊程檢驗。樣本中的所有其他值定義其他組。列表中的值不需要在樣本中出現,但每個組中必須至少有一條記錄。
2、定義連續欄位的割點。這可以指定如何為連續欄位定義組。第一組定義為等於或小於割點的值。◎樣本中位數在樣本中位數處設置割點。◎樣本均值在樣本均值處設置割點。◎自定義允許您為割點指定一個值。

㈣ 非參數檢驗的檢驗方法

兩獨立樣本的非參數檢驗
兩獨立樣本的非參數檢驗是在對總體分布不甚了解的情況下,通過對兩組獨立樣本的分析來推斷樣本來自的兩個總體的分布等是否存在顯著差異的方法。獨立樣本是指在一個總體中隨機抽樣對在另一個總體中隨機抽樣沒有影響的情況下所獲得的樣本。
SPSS中提供了多種兩獨立樣本的非參數檢驗方法,其中包括曼-惠特尼U檢驗、K-S檢驗、W-W遊程檢驗、極端反應檢驗等。
某工廠用甲乙兩種不同的工藝生產同一種產品。如果希望檢驗兩種工藝下產品的使用是否存在顯著差異,可從兩種工藝生產出的產品中隨機抽樣,得到各自的使用壽命數據。
甲工藝:675 682 692 679 669 661 693
乙工藝:662 649 672 663 650 651 646 652
曼-惠特尼U檢驗
兩獨立樣本的曼-惠特尼U檢驗可用於對兩總體分布的比例判斷。其原假設:兩組獨立樣本來自的兩總體分布無顯著差異。曼-惠特尼U檢驗通過對兩組樣本平均秩的研究來實現判斷。秩簡單說就是變數值排序的名次,可以將數據按升序排列,每個變數值都會有一個在整個變數值序列中的位置或名次,這個位置或名次就是變數值的秩。
K-S檢驗
K-S檢驗不僅能夠檢驗單個總體是否服從某一理論分布,還能夠檢驗兩總體分布是否存在顯著差異。其原假設是:兩組獨立樣本來自的兩總體的分布無顯著差異。
這里是以變數值的秩作為分析對象,而非變數值本身。
遊程檢驗
單樣本遊程檢驗是用來檢驗變數值的出現是否隨機,而兩獨立變數的遊程檢驗則是用來檢驗兩獨立樣本來自的兩總體的分布是否存在顯著差異。其原假設是:兩組獨立樣本來自的兩總體的分布無顯著差異。
兩獨立樣本的遊程檢驗與單樣本遊程檢驗的思想基本相同,不同的是計算遊程數的方法。兩獨立樣本的遊程檢驗中,遊程數依賴於變數的秩。
極端反應檢驗
極端反應檢驗從另一個角度檢驗兩獨立樣本所來自的兩總體分布是否存在顯著差異。其原假設是:兩獨立樣本來自的兩總體的分布無顯著差異。
基本思想是:將一組樣本作為控制樣本,另一組樣本作為實驗樣本。以控制樣本作為對照,檢驗實驗樣本相對於控制樣本是否出現了極端反應。如果實驗樣本沒有出現極端反應,則認為兩總體分布無顯著差異,相反則認為存在顯著差異。
多獨立樣本的非參數檢驗
多獨立樣本的非參數檢驗是通過分析多組獨立樣本數據,推斷樣本來自的多個總體的中位數或分布是否存在顯著差異。多組獨立樣本是指按獨立抽樣方式獲得的多組樣本。
SPSS提供的多獨立樣本非參數檢驗的方法主要包括中位數檢驗、Kruskal-Wallis檢驗、Jonckheere-Terpstra檢驗。
例:希望對北京、上海、成都、廣州四個城市的周歲兒童的身高進行比較分析。採用獨立抽樣方式獲得四組獨立樣本。
中位數檢驗
中位數檢驗通過對多組獨立樣本的分析,檢驗它們來自的總體的中位數是否存在顯著差異。其原假設是:多個獨立樣本來自的多個總體的中位數無顯著差異。
基本思想是:如果多個總體的中位數無顯著差異,或者說多個總體有共同的中位數,那麼這個共同的中位數應在各樣本組中均處在中間位置上。於是,每組樣本中大於該中位數或小於該中位數的樣本數目應大致相同。
Kruskal-Wallis檢驗
Kruskal-Wallis檢驗實質是兩獨立樣本的曼-惠特尼U檢驗在多個樣本下的推廣,也用於檢驗多個總體的分布是否存在顯著差異。其原假設是:多個獨立樣本來自的多個總體的分布無顯著差異。
基本思想是:首先,將多組樣本數據混合並按升序排序,求出各變數值的秩;然後,考察各組秩的均值是否存在顯著差異。容易理解:如果各組秩的均值不存在顯著差異,則是多組數據充分混合,數值相差不大的結果,可以認為多個總體的分布無顯著差異;反之,如果各組秩的均值存在顯著差異,則是多組數據無法混合,某些組的數值普遍偏大,另一些組的數值普遍偏小的結果,可以認為多個總體的分布有顯著差異。
Jonckheere-Terpstra檢驗
Jonckheere-Terpstra檢驗也是用於檢驗多個獨立樣本來自的多個總體的分布是否存在顯著差異的非參數檢驗方法,其原假設是:多個獨立樣本來自的多個總體的分布無顯著差異。
基本思想與兩獨立樣本的曼-惠特尼U檢驗類似,也是計算一組樣本的觀察值小於其他組樣本的觀察值的個數。
兩配對樣本的非參數檢驗
兩配對樣本的非參數檢驗是對總體分布不甚了解的情況下,通過對兩組配對樣本的分析,推斷樣本來自的兩個總體的分布是否存在顯著差異的方法。
SPSS提供的兩配對樣本非參數檢驗的方法主要包括McNemar檢驗、符號檢驗、Wilcoxon符號秩檢驗等。
例:要檢驗一種新的訓練方法是否對提高跳遠運動員的成績有顯著效果,可以收集一批跳遠運動員在使用新訓練方法前後的跳遠最好成績,這樣的兩組樣本便是配對的。再例如,分析不同廣告形式是否對商品的銷售產生顯著影響,可以比較幾種不同商品在不同廣告形式下的銷售額數據(其他條件保持基本穩定)。這里不同廣告形式下的若干組商品銷售額樣本便是配對樣本。可見,配對樣本的樣本數是相同的,且各樣本值的先後次序是不能隨意更改的。
McNemar檢驗
是一種變化顯著性檢驗,它將研究對象自身作為對照者檢驗其「前後」的變化是否顯著。其原假設是:兩配對樣本來自的兩總體的分布無顯著差異。
分析學生在學習「統計學」課程前後對統計學重要性的認知程度是否發生了顯著改變,可以隨機收集一批學生在學習「統計學」之前以及學完以後認為統計學是否重要的樣本數據(0表示「不重要」,1表示「重要」)。
應該看到:兩配對樣本的McNemar檢驗分析的變數是二值變數。因此,在實際應用中,如果變數不是二值變數,應首先進行數據轉換後方可採用該方法,因而它在應用范圍方面有一定的局限性。
符號檢驗
符號檢驗也是用來檢驗兩配對樣本所來自的總體的分布是否存在顯著差異的非參數方法。其原假設是:兩配對樣本來自的兩總體的分布無顯著差異。
首先,分別用第二組樣本的各個觀察值減去第一組對應樣本的觀察值。差值為正則記為正號,差值為負則記為負號。然後,將正號的個數與負號的個數進行比較,容易理解:如果正號個數和負號個數大致相當,則可以認為第二組樣本大於第一組樣本變數值的個數,與第二組樣本小於第一組樣本的變數值個數是大致相當的,從總體上講,這兩個組配對樣本的數據分布差距較小;相反,如果正號個數和負號個數相差較多,則可以認為兩個配對樣本的數據分布差距較大。
應該看到:配對樣本的符號檢驗注重對變化方向的分析,只考慮數據變化的性質,即是變大了還是變小了,但沒有考慮變化幅度,即大了多少,小了多少,因而對數據利用是不充分的。
Wilcoxon符號秩檢驗
Wilcoxon符號秩檢驗也是通過分析兩配對樣本,對樣本來自的兩總體的分布是否存在差異進行判斷。其原假設是:兩配對樣本來自的兩總體的分布無顯著差異。
基本思想是:首先,按照符號檢驗的方法,分布用第二組樣本的各個觀察值減去第一組對應樣本的觀察值。差值為正則記為正號,為負則記為負號,並同時保存差值數據;然後,將差值變數按升序排序,並求出差值變數的秩;最後,分布計算正號秩總和W+和負號秩和W-。
多配對樣本的非參數檢驗
多配對樣本的非參數檢驗是通過分析多組配對樣本數據,推斷樣本來自的多個總體的中位數或分布是否存在顯著差異。
例如,收集乘客對多家航空公司是否滿意的數據,分析航空公司的服務水平是否存在顯著差異;再例如,收集不同促銷形式下若干種商品的銷售額數據,分析比較不同促銷形式的效果,再如,收集多名評委對同一批歌手比賽打分的數據,分析評委的打分標準是否一致,等等。
這些問題都可以通過多配對樣本非參數檢驗方法進行分析。SPSS中的多配對樣本的非參數檢驗方法主要包括Friedman檢驗、Cochran Q檢驗、Kendall協同系數檢驗等。
Friedman檢驗
Friedman檢驗是利用秩實現對多個總體分布是否存在顯著差異的非參數檢驗方法,其原假設是:多個配對樣本來自的多個總體分布無顯著差異。
SPSS將自動計算Friedman統計量和對應的概率P值。如果概率P值小於給定的顯著性水平0.05,則拒絕原假設,認為各組樣本的秩存在顯著差異,多個配對樣本來自的多個總體的分布有顯著差異;反之,則不能拒絕原假設,可以認為各組樣本的秩不存在顯著性差異。
基於上述基本思路,多配對樣本的Friedman檢驗時,首先以行為單位將數據按升序排序,並求得各變數值在各自行中的秩;然後,分別計算各組樣本下的秩總和與平均秩。多配對樣本的Friedman檢驗適於對定距型數據的分析。
Cochran Q檢驗
通過對多個配對樣本的分析,推斷樣本來自的多個總體的分布是否存在顯著差異。其原假設是:多個配對樣本來自的多個總體的分布無顯著差異。
Cochran Q檢驗適合對二值品質型數據的分析。如二分的評價:1代表滿意,0代表不滿意。
Kendall協同系數檢驗
它也是一種對多配對樣本進行檢驗的非參數檢驗方法,與第一種檢驗方法向結合,可方便地實現對評判者的評判標準是否一致的分析。其原假設是:評判者的評判標准不一致。
有6名歌手參加比賽,4名評委進行評判打分,現在需要根據數據推斷這4個評委的評判標準是否一致。(見下頁具體分析)
如果將每個被評判者對象的分數看做來自多個總體的配對樣本,那麼該問題就能夠轉化為多配對樣本的非參數檢驗問題,仍可採用Friedman檢驗,於是相應的原假設便轉化為:多個配對樣本來自的多個總體的分布無顯著差異。但對該問題的分析是需要繼續延伸的,並非站在對6名歌手的演唱水平是否存在顯著差異的角度進行分析,而是在認定他們存在差異的前提下繼續判斷4個評委的打分標準是否一致。
如果利用Friedman檢驗出各總體的分布不存在顯著差異,即各個歌手的秩不存在顯著差異,則意味著評委的打分存在隨意性,評分標准不一致。原因在於:如果各個評委的評判標準是一致的,那麼對於某個歌手來說將獲得一致的分數,也就是說,評委給出的若干個評分的秩應完全相同,這就必然會導致各歌手評分的秩有較大的差異

㈤ 非參數統計的統計方法

重要的非參數統計方法秩方法是基於秩統計量(見統計量)的一類重要的非參數統計方法。設有樣本X1,X2,…,Xn,把它們由小到大排列,若Xi在這個次序中占第Ri個位置(最小的占第1個位置),則稱Xi的秩為Ri(i=1,2,…,n)。1945年F.威爾科克森提出的兩樣本秩和檢驗是一個有代表性的例子。設X1,X2,…,Xm和Y1,Y2,…,Yn分別是從分布為 F(x)和 F(x-θ)的總體中抽出的樣本,F連續但未知,θ也未知,檢驗假設 H:θ=0,備擇假設為θ>0(見假設檢驗)。記Yi在混合樣本(X1,X2,…,Xm,Y1,Y2,…,Yn)中的秩為Ri,且為諸秩的和,當W >C時,否定假設H,這里C決定於檢驗的水平。這是一個性能良好的檢驗。秩方法的一個早期結果是C.斯皮爾曼於1904年提出的秩相關系數。設(X1,Y1),(X2,Y2),…,(Xn,Yn)是從二維總體(X,Y)中抽出的樣本,Ri為Xi在(X1,X2,…,Xn)中的秩,Qi為Yi在(Y1,Y2,…,Yn)中的秩,定義秩相關系數為(Ri,Qi)(i=1,2,…n)的通常的相關系數(見相關分析)。它可以作為X、Y之間相關程度的度量,也可用於檢驗關於X、Y獨立性的假設。
次序統計量和U 統計量在非參數統計中也有重要應用。前者可用於估計總體分布的分位數(見概率分布)、檢驗兩總體有相同的分布及構造連續總體分布的容忍限和容忍區間(見區間估計)等。後者主要用於構造總體分布的數字特徵的一致最小方差無偏估計(見點估計)及基於這種估計的假設檢驗。
蘇聯數學家Α.Η.柯爾莫哥洛夫和Β.И.斯米爾諾夫在20世紀30年代的工作開辟了非參數統計的一個方面,他們的方法基於樣本X1,X2,…,Xn的經驗分布函數Fn(x)(見樣本)。柯爾莫哥洛夫考察 Fn(x)與理論分布F(x)的最大偏差墹n,當墹n超過一定限度時,否定這個理論分布F(x)。這就是柯爾莫哥洛夫檢驗。斯米爾諾夫則考察由兩個分布為F(x)和g(x)的總體中抽出的樣本X1,X2,…,Xm和Y1,Y2,…,Yn計算其經驗分布Fm(x)和gn(x)的最大偏差墹mn,當墹mn超過一定限度時,否定「F與g相等」這個假設。這就是斯米爾諾夫檢驗。
在非參數性估計方面,有關於估計分布的對稱中心、概率密度函數和回歸函數等比較重要的成果。

㈥ 常用非參數假設檢驗方法有哪些

1、秩和檢驗法的主要思想是把原始數據轉化成秩,利用秩構造統計量來比較不同樣本的分布。在這里每個樣本的秩是指把原始數據按從大到小的順序排列,該數據值在原始數據中的位置。

例如:

原始數據:A組(5,7),B組(3,2)

對應的秩:A組(3,4),B組(2,1)

A組的秩和為7,B組的秩和為3,每組的秩和被用來檢驗兩組數據是否相同。

2、中位數評分檢驗法的主要思想是將原始數據轉換成中位數評分,利用中位數評分構造統計量比較不同樣本的分布。當計算中位數評分時,如果數據值小於等於該組數據的中位數,則中位數評分為0,如果數據值大於該組數據的中位數,則中位數評分為1。

(6)非參數檢驗的計算方法擴展閱讀

非參數檢驗的作用:

在以前的均值T檢驗中,我們分析的都是連續型隨機變數,並且前提條件是樣本滿足正態性條件。當分析不再是連續型或者不再是正態性條件時,則應當使用非參數的方法對均值和方差進行假設檢驗。

在數據分析過程中,由於種種原因,人們往往無法對總體分布形態作簡單假定,此時參數檢驗的方法就不再適用了。

非參數檢驗正是一類基於這種考慮,在總體方差未知或知道甚少的情況下,利用樣本數據對總體分布形態等進行推斷的方法。由於非參數檢驗方法在推斷過程中不涉及有關總體分布的參數,因而得名為「非參數」檢驗。

㈦ 如何利用SPSS做非參數檢驗

如何利用SPSS做非參數檢驗

非參數檢驗是一個相當宏大的命題。由於實際情況的復雜多變,因此非參數檢驗包括了許多的各種各樣的檢驗方法。之前我們提過,參數檢驗的使用條件是被檢驗的樣本總體服從正態分布,而非參數檢驗的使用條件自然就是總體不服從或不確定是否服從正態分布。(實際上,這里要特別說明一下,盡管非參數檢驗的使用條件更寬松,但是考慮到精確性,不是特殊要求的話,我們還是盡可能的使用均值檢驗。)

比較常見的單樣本非參數檢驗包括遊程檢驗和單樣本K-S檢驗。

遊程檢驗:

它通常用於檢測兩個不同的觀測值出現的次序是否具有隨機性。舉個例子,假如我們想知道每天來門診就診的人是否生病的次序是否隨機,那麼我們就使用遊程檢驗。我們記錄下來個案依次是否生病,比如是為1,否為0。然後我們就有了一個由0和1構成的變數列,

我們選擇分析——非參數檢驗——舊對話框——遊程,在主面板的檢驗變數列表裡選入我們的0,1變數列。選項卡里邊選擇描述性,其他默認。割點可以全選。

輸出結果看p值就可以了(我真的不想再重復怎麼看p值了)。

單樣本K-S檢驗;

這個就比較重要了。這個檢驗的目的在於觀測樣本的分布。哦,想想也知道很重要。只要我們想做相關和回歸,那我們就最好用K-S檢驗來檢查一下樣本的分布。畢竟pearson相關系數有效的一個重要條件就是樣本服從正態分布。

我們選擇分析——非參數檢驗——舊對話框——1樣本K-S,在主對話框的檢驗變數列表裡邊選入我們想檢驗分布的變數(比如一群病號的血細胞數),選項卡里勾選描述性和四分位數,其他默認。在檢驗分布的下邊有四個供勾選的框框,這個要注意一下,常規指的就是正態分布,相等則是指均勻分布,勾選你想檢驗的分布(一般是正態分布)。確定以後就可以看結果了。

描述性統計量表會給你一些基本指標,幫助你感受這些數據。K-S檢驗表的p值會告訴你樣本是否服從指定的分布,如果是的話,表裡邊還有一些其他的指標可以參考。

單樣本非參數檢驗已經結束了(怎麼這么少?),下邊我們說一下獨立樣本非參數檢驗。

兩獨立樣本非參數檢驗:

打開菜單分析——非參數檢驗——舊對話框——2個獨立樣本,在主面板里邊檢驗變數選入檢驗變數,分組變數選入分組變數,選項卡中選入描述性,四分位數,其他默認。在檢驗類型里邊有四個供勾選的框框,我們一一學習。

Mann-whitney檢驗:

就是大名鼎鼎的秩和檢驗。

這個檢驗利用樣本觀察值得秩來推斷兩樣本所在總體的分布是否相同(不曉得什麼是秩的回去翻一遍你們的高數課本)。這是一個最常用的檢驗。舉例,假設我們知道一組患病的人和不患病的人的血細胞數,想檢查是否具有差異,那麼我們就使用秩和檢驗,我保證沒舉錯例子,這個例子確實也可以用獨立樣本t檢驗來做(希望大家還記得什麼叫獨立樣本t檢驗),當然也可以用秩和檢驗來做。

它會給出描述性統計量,秩表,檢驗統計量表。在最後的一個表裡邊我們通過p值判斷差異是否顯著。

Moses極端反應檢驗:

它適用於實驗條件導致兩個不同方向的極端反應情況(多用於醫學,比如有的葯物會導致一部分病人好轉的同時也會導致一部分病人惡化)。

它通過比較實驗組和觀察組,會告訴你是否產生了極端反應。(很神奇是不是?)

兩樣本K-S檢驗:

這個檢驗用來判斷兩個樣本的分布是否相同。也是看p值哈。

Waldwolfowit遊程檢驗:

用來檢驗兩樣本是否來自相同的總體。

注意:K-S檢驗適用於數值變數資料或者有序分類資料。

多個獨立樣本非參數檢驗:

打開菜單分析——非參數檢驗——舊對話框——K獨立檢驗,在主面板的檢驗變數選入想檢驗的變數,分組變數選入分組變數。

檢驗類型有三種

K-W檢驗:

用來判斷各樣本分別代表的總體是否一致,(相當於單因素方差分析),適用於數值變數和有序分類變數。結果會給出秩,檢驗統計量。通過p值判斷差異性。若想在進行兩兩比較,那就要用到上邊介紹的秩和檢驗來進行比較了。

中位數:

適用於數值變數資料。用來檢驗樣本代表的總體中位數是不是相等。這個用途還是比較廣泛的。

Jonckheere-Terpstra檢驗:

這個檢驗用來處理完全隨機的資料,比如研究隨著年齡增加,學習成績是否也增加?這種有序分組的變數就用這個檢驗來檢驗。(我真有點懶得介紹這么冷門的檢驗的沖動,不過為了完整還是寫一下吧。)

兩相關樣本非參數檢驗:

打開兩個關聯樣本檢驗主面板,檢驗對里邊選擇兩個相關變數,檢驗類型有四種。

Wilcoxon:

它用來檢驗兩個變數的分布是否有差異。比較常用。比如一種葯物治療前和治療後是否有差別?就用這個檢驗。

符號檢驗和wilcoxon差不多,也是檢查差值的。

Mcnemar檢驗:

上邊兩個都是數值型的連續性資料,這個檢驗則用於配對計數資料,將兩組人進行配對,觀察他們的某個指標是否有差異。

邊際同質性檢驗是mcnemar檢驗的一般化和擴展,用於多分類配對計數資料。比如檢驗甲觀察的分類結果和乙觀察的分類結果是否有差異。(分好多類)

多個相關樣本非參數檢驗:

打開多個相關樣本檢驗主面板,選入檢驗變數,檢驗類型一共有三種。

Friedman檢驗:

用於檢驗多個相關樣本是否來自同一總體,是wilcoxon的擴展。

KendallW檢驗:

檢驗樣本的一致性的好壞(不考慮分布的形狀,僅考慮分布是否一致)。

CochranQ檢驗:

用於二分數據時,是mcnemar檢驗的延伸,可以比較多個二分變數的比例的差異是否顯著。

非參數檢驗大概就是這些內容了。和參數檢驗一樣,這些檢驗的操作操作並不復雜,結果也不難判斷,學習的難點在於記住這些不同的檢驗方法的適用的不同范圍。需要多做一些練習,才可以鞏固掌握住非參數檢驗的內容。

以上是小編為大家分享的關於如何利用SPSS做非參數檢驗的相關內容,更多信息可以關注環球青藤分享更多干貨

㈧ 參數檢驗和非參數檢驗是什麼意思

參數檢驗是針對參數做的假設,非參數檢驗是針對總體分布情況做的假設,這個是區分參數檢驗和非參數檢驗的一個重要特徵。

參數檢驗和非參數檢驗的本質區別:

1.參數檢驗要利用到總體的信息(總體分布、總體的一些參數特徵如方差),以總體分布和樣本信息對總體參數作出推斷;非參數檢驗不需要利用總體的信息(總體分布、總體的一些參數特徵如方差),以樣本信息對總體分布作出推斷。

2.參數檢驗只能用於等距數據和比例數據,非參數檢驗主要用於記數數據。也可用於等距和比例數據,但精確性就會降低。

(8)非參數檢驗的計算方法擴展閱讀:

參數檢驗與非參數檢驗的優缺點。

1)參數檢驗:優點是符合條件時,檢驗效率高;其缺點是對資料要求嚴格,如等級數據、非確定數據(>50mg)不能使用參數檢驗,而且要求資料的分布型已知和總體方差相等。

2)非參數檢驗:優點是應用范圍廣、簡便、易掌握;缺點是若對符合參數檢驗條件的資料用非參數檢驗,則檢驗效率低於參數檢驗。如無效假設是正確的,非參數法與參數法一樣好,但如果無效假設是錯誤的,則非參數檢驗效果較差,如需檢驗出同樣大小的差異的差異往往需要較多的資料。

另一點是非參數檢驗統計量是近似服從某一部分,檢驗的界值表也是有近似的(如配對秩和檢驗)因此其結果有一定近似性。

1、提出檢驗假設又稱無效假設,符號是H0;備擇假設的符號是H1。

H0:樣本與總體或樣本與樣本間的差異是由抽樣誤差引起的;

H1:樣本與總體或樣本與樣本間存在本質差異;

預先設定的檢驗水準為0.05;當檢驗假設為真,但被錯誤地拒絕的概率,記作α,通常取α=0.05或α=0.01。

2、選定統計方法,由樣本觀察值按相應的公式計算出統計量的大小,如X2值、t值等。根據資料的類型和特點,可分別選用Z檢驗,T檢驗,秩和檢驗和卡方檢驗等。

3、根據統計量的大小及其分布確定檢驗假設成立的可能性P的大小並判斷結果。若P>α,結論為按α所取水準不顯著,不拒絕H0,即認為差別很可能是由於抽樣誤差造成的,在統計上不成立。

如果P≤α,結論為按所取α水準顯著,拒絕H0,接受H1,則認為此差別不大可能僅由抽樣誤差所致,很可能是實驗因素不同造成的,故在統計上成立。P值的大小一般可通過查閱相應的界值表得到。

兩獨立樣本的非參數檢驗是在對總體分布不甚了解的情況下,通過對兩組獨立樣本的分析來推斷樣本來自的兩個總體的分布等是否存在顯著差異的方法。獨立樣本是指在一個總體中隨機抽樣對在另一個總體中隨機抽樣沒有影響的情況下所獲得的樣本。

SPSS中提供了多種兩獨立樣本的非參數檢驗方法,其中包括曼-惠特尼U檢驗、K-S檢驗、W-W遊程檢驗、極端反應檢驗等。

某工廠用甲乙兩種不同的工藝生產同一種產品。如果希望檢驗兩種工藝下產品的使用是否存在顯著差異,可從兩種工藝生產出的產品中隨機抽樣,得到各自的使用壽命數據。

閱讀全文

與非參數檢驗的計算方法相關的資料

熱點內容
電腦快速補齊溫濕度方法 瀏覽:174
血管炎的治療方法 瀏覽:190
食用酒精勾兌白灑方法 瀏覽:503
檢測nacl的方法 瀏覽:808
coolpad3G手機解鎖方法 瀏覽:54
心理各學派研究方法 瀏覽:862
臨床測定排卵方法有哪些 瀏覽:386
萬年高效過濾器安裝方法 瀏覽:467
氨氮分析儀檢測方法 瀏覽:979
636減去197的簡便方法 瀏覽:419
考起清華北大有哪些方法 瀏覽:714
電瓶充電線和插座連接方法 瀏覽:721
薏米紅豆代餐餅的食用方法 瀏覽:332
重慶偏癱自我訓練方法有哪些 瀏覽:593
老公幫小孩吸奶有什麼方法 瀏覽:249
電流導入儀使用方法 瀏覽:498
提拔領導的正確方法 瀏覽:630
成本核算方法應用研究 瀏覽:688
博美犬減肥方法技巧有哪些 瀏覽:498
用什麼方法去老年斑 瀏覽:599