A. 常用非參數假設檢驗方法有哪些
1、秩和檢驗法的主要思想是把原始數據轉化成秩,利用秩構造統計量來比較不同樣本的分布。在這里每個樣本的秩是指把原始數據按從大到小的順序排列,該數據值在原始數據中的位置。
例如:
原始數據:A組(5,7),B組(3,2)
對應的秩:A組(3,4),B組(2,1)
A組的秩和為7,B組的秩和為3,每組的秩和被用來檢驗兩組數據是否相同。
2、中位數評分檢驗法的主要思想是將原始數據轉換成中位數評分,利用中位數評分構造統計量比較不同樣本的分布。當計算中位數評分時,如果數據值小於等於該組數據的中位數,則中位數評分為0,如果數據值大於該組數據的中位數,則中位數評分為1。
(1)非參數方法分析樣本數據擴展閱讀
非參數檢驗的作用:
在以前的均值T檢驗中,我們分析的都是連續型隨機變數,並且前提條件是樣本滿足正態性條件。當分析不再是連續型或者不再是正態性條件時,則應當使用非參數的方法對均值和方差進行假設檢驗。
在數據分析過程中,由於種種原因,人們往往無法對總體分布形態作簡單假定,此時參數檢驗的方法就不再適用了。
非參數檢驗正是一類基於這種考慮,在總體方差未知或知道甚少的情況下,利用樣本數據對總體分布形態等進行推斷的方法。由於非參數檢驗方法在推斷過程中不涉及有關總體分布的參數,因而得名為「非參數」檢驗。
B. SPSS非參數檢驗 單樣本
SPSS非參數檢驗:單樣本
一、概念:
單樣本非參數檢驗使用一個或多個非參數檢驗識別單個欄位中的差別。非參數檢驗不假定您的數據呈正態分布。非參數檢驗(Nonparametrictests)是統計分析方法的重要組成部分,它與參數檢驗共同構成統計推斷的基本內容。參數檢驗是在總體分布形式已知的情況下,對總體分布的參數如均值、方差等進行推斷的方法。但是,在數據分析過程中,由於種種原因,人們往往無法對總體分布形態作簡單假定,此時參數檢驗的方法就不再適用了。非參數檢驗正是一類基於這種考慮,在總體方差未知或知道甚少的情況下,利用樣本數據對總體分布形態等進行推斷的方法。由於非參數檢驗方法在推斷過程中不涉及有關總體分布的參數,因而得名為「非參數」檢驗。
二、目標(分析-非參數檢驗-單樣本-目標)
您的目標是什麼?目標允許您快速指定常用的不同檢驗設置。
2.1、自動比較觀察數據和假設數據。該目標對僅具有兩個類別的分類欄位應用二項式檢驗,對所有其他分類欄位應用卡方檢驗,對連續欄位應用Kolmogorov-Smirnov檢驗。
2.2、檢驗隨機序列。該目標使用遊程檢驗來檢驗觀察到的隨機數據值序列。
2.3、自定義分析。當您希望手動修改「設置」選項卡上的檢驗設置時,選中此選項。注意,如果您隨後在「設置」選項卡上更改了與當前選定目標不一致的選項,則會自動選擇該設置。
三、選擇檢驗(分析-非參數統計-單樣本-設置-選擇檢驗)
1、根據數據自動選擇檢驗。該設置對僅具有兩個有效(非缺失)類別的分類欄位應用二項式檢驗,對所有其他分類欄位應用卡方檢驗,對連續欄位應用Kolmogorov-Smirnov檢驗。
2、自定義檢驗。這些設置允許您選擇要執行的特定檢驗。
2.1、比較觀察二分類可能性和假設二分類可能性(二項式檢驗)。二項式檢驗可以應用到所有欄位。這將生成一個單樣本檢驗,可以檢驗標記欄位(只有兩個類別的分類欄位)的觀察分布是否與指定的二項式分布期望相同。此外,您還可以請求置信區間。
2.2、比較觀察可能性和假設可能性(卡方檢驗)。卡方檢驗可以應用到名義和有序欄位。這將生成一個單樣本檢驗,它可以根據欄位類別的觀察和期望頻率間的差異來計算卡方統計量。
2.3、檢驗觀察分布和假設分布(Kolmogorov-Smirnov檢驗)。Kolmogorov-Smirnov檢驗可以應用到連續欄位。這將生成一個單樣本檢驗,即欄位的樣本累積分布函數是否為齊次的均勻分布、正態分布、泊松分布或指數分布。
2.4、比較中位數和假設中位數(Wilcoxon符號秩檢驗)。Wilcoxon符號秩檢驗可以應用到連續欄位。這將生成一個欄位中位數值的單樣本檢驗。指定一個數字作為假設中位數。
2.5、檢驗隨機序列(遊程檢驗)。遊程檢驗可以應用到所有欄位。這將生成一個單樣本檢驗,即對分欄位的值序列是否為隨機序列。
四、二項式檢驗(分析-非參數統計-單樣本-設置-選擇檢驗-自定義檢驗-二項式檢驗)
二項式檢驗適用於標記欄位(只有兩個類別的分類欄位),但可通過使用定義「成功」的規則應用到所有欄位。在生活中有很多數據的取值是二值的,例如,人群可以分成男性和女性,產品可以分成合格和不合格,學生可以分成三好學生和非三好學生,投擲硬幣實驗的結果可以分成出現正面和出現反面等。通常將這樣的二值分別用1或0表示。如果進行n次相同的實驗,則出現兩類(1或0)的次數可以用離散型隨機變數X來描述。如果隨機變數X為1的概率設為P,則隨機變數X值為0的概率Q便等於1-P,形成二項分布。SPSS的二項分布檢驗正是要通過樣本數據檢驗樣本來自的總體是否服從指定的概率為P的二項分布,其原假設是:樣本來自的總體與指定的二項分布無顯著差異。
1、假設比例。這指定了定義為「成功」的記錄的期望比例,或p。指定一個大於0且
小於1的值。默認值為0.5。
2、置信區間。可以使用以下方法計算二分類數據的置信區間:◎Clopper-Pearson(精確)。基於累積二項式分布的精確區間。◎Jeffreys。基於p的後驗分布且應用Jeffreys先驗的Bayesian區間。◎似然比。基於p的似然函數的區間。
3、定義分類欄位的成功。這可以指定如何為分類欄位定義對照假設比例檢驗數據值的「成功」。◎使用在數據中找到的第一個類別將使用在樣本中找到的第一個定義「成功」的值執行二項式檢驗。此選項僅適用於只有兩個值的名義或有序欄位;如果使用了此選項,則在「欄位」選項卡中指定的所有其他分類欄位都不會檢驗。這是默認值。◎指定成功值將使用指定以定義「成功」的值列表來執行二項式檢驗。可以指定字元串或數值列表。列表中的值不需要在樣本中出現。
4、定義連續欄位的成功值。這可以指定如何為連續欄位定義對照檢驗值檢驗數據值的「成功」。成功被定義為等於或小於割點的值。◎樣本中點在最小值和最大值的平均值上設置割點。◎自定義割點允許您為割點指定一個值。
五、卡方檢驗(分析-非參數統計-單樣本-設置-選擇檢驗-自定義檢驗-卡方檢驗)
卡方檢驗方法可以根據樣本數據,推斷總體分布與期望分布或某一理論分布是否存在顯著差異,是一種吻合性檢驗,通常適於對有多項分類值的總體分布的分析。它的原假設是:樣本來自的總體分布與期望分布或某一理論分布無差異。
1、所有類別具有相等的概率。這將在樣本中的所有類別間生成均等的頻率。這是默認值。
2、自定義期望可能性。這允許您為指定的類別列表指定不相等的頻率。可以指定字元串或數值列表。列表中的值不需要在樣本中出現。在類別列中,指定類別值。在相對頻率列中,為每個類別指定一個大於0的值。自定義的頻率被視為比率,例如,指定頻率1、2和3等同於指定頻率10、20和30,兩者均指定了期望1/6的記錄屬於第一個類別,1/3的記錄屬於第二個類別,1/2的記錄屬於第三個類別。在指定自定義期望可能性時,自定義類別值必須包括數據中的所有欄位值;否則將不對該欄位執行檢驗。
六、單樣本K-S檢驗(分析-非參數統計-單樣本-設置-選擇檢驗-自定義檢驗-K-S檢驗)
K-S檢驗方法能夠利用樣本數據推斷樣本來自的總體是否服從某一理論分布,是一種擬合優度的檢驗方法,適用於探索連續型隨機變數的分布。例如,收集一批周歲兒童身高的數據,需利用樣本數據推斷周歲兒童總體的身高是否服從正態分布。再例如,利用收集的住房狀況調查的樣本數據,分析家庭人均住房面積是否服從正態分布。單樣本K-S檢驗的原假設是:樣本來自的總體與指定的理論分布無顯著差異,SPSS的理論分布主要包括正態分布、均勻分布、指數分布和泊松分布等。
1、正態。使用樣本數據使用觀察到的均值和標准差;自定義允許您指定值。
2、均勻。使用樣本數據使用觀察到的最小值和最大值;自定義允許您指定值。
3、指數分布。樣本均值使用觀察到的均值;自定義允許您指定值。
4、泊松。樣本均值使用觀察到的均值;自定義允許您指定值。
七、遊程檢驗(分析-非參數統計-單樣本-設置-選擇檢驗-自定義檢驗-遊程檢驗)
變數值隨機性檢驗通過對樣本變數值的分析,實現對總體的變數值出現是否隨機進行檢驗。它的原假設是:總體變數值出現是隨機的。變數隨機性檢驗的重要依據是遊程。所謂遊程是樣本序列中連續出現相同的變數值的次數。可以直接理解,如果硬幣的正反面出現是隨機的,那麼在數據序列中,許多個1或許多個0連續出現的可能性將不太大,同時,1和0頻繁交叉出現的可能性也會較小。因此,遊程數太大或太小都將表明變數值存在不隨機的現象。
遊程檢驗適用於標記欄位(只有兩個類別的分類欄位),但可通過使用定義組的規則
應用到所有欄位。
1、定義分類欄位的組◎樣本中僅有2個類別使用在定義組的樣本中找到的值來執行遊程檢驗。此選項僅適用於只有兩個值的名義或有序欄位;如果使用了此選項,則在「欄位」選項卡中指定的所有其他分類欄位都不會檢驗。◎將數據重新編碼為2個類別使用指定以定義某個組的值列表來執行遊程檢驗。樣本中的所有其他值定義其他組。列表中的值不需要在樣本中出現,但每個組中必須至少有一條記錄。
2、定義連續欄位的割點。這可以指定如何為連續欄位定義組。第一組定義為等於或小於割點的值。◎樣本中位數在樣本中位數處設置割點。◎樣本均值在樣本均值處設置割點。◎自定義允許您為割點指定一個值。
C. 參數檢驗和非參數檢驗有什麼相同之處
參數檢驗和非參數檢驗的相同之處是計量資料一般都可以採用。但是對於能使用參數檢驗的,首選參數檢驗,對不能滿足條件的才選用非參數檢驗。
因為參數檢驗能充分利用提供的信息,統計分析的效率較高。而非參數檢驗不直接分析原始測量值,從而有可能會降低它的檢驗效率。滿足參數檢驗要求的資料分析時應首選參數檢驗方法。不滿足參數檢驗要求的資料應選非參數檢驗。
(3)非參數方法分析樣本數據擴展閱讀:
參數檢驗和非參數檢驗的區別:
1、參數檢驗是針對參數做的假設,非參數檢驗是針對總體分布情況做的假設,這個是區分參數檢驗和非參數檢驗的一個重要特徵。
2、參數檢驗和非參數檢驗根本區別在於參數檢驗要利用到總體的信息(總體的分布、總體的一些參數特徵,如方差),以總體分布和樣本信息對總體參數做出推斷;
3、參數檢驗只能用於等距數據和比例數據,非參數檢驗主要用於記數數據.也可用於等距和比例數據,但精確性就會降低。
D. 參數檢驗和非參數檢驗是什麼意思
參數檢驗是針對參數做的假設,非參數檢驗是針對總體分布情況做的假設,這個是區分參數檢驗和非參數檢驗的一個重要特徵。
參數檢驗和非參數檢驗的本質區別:
1.參數檢驗要利用到總體的信息(總體分布、總體的一些參數特徵如方差),以總體分布和樣本信息對總體參數作出推斷;非參數檢驗不需要利用總體的信息(總體分布、總體的一些參數特徵如方差),以樣本信息對總體分布作出推斷。
2.參數檢驗只能用於等距數據和比例數據,非參數檢驗主要用於記數數據。也可用於等距和比例數據,但精確性就會降低。
(4)非參數方法分析樣本數據擴展閱讀:
參數檢驗與非參數檢驗的優缺點。
1)參數檢驗:優點是符合條件時,檢驗效率高;其缺點是對資料要求嚴格,如等級數據、非確定數據(>50mg)不能使用參數檢驗,而且要求資料的分布型已知和總體方差相等。
2)非參數檢驗:優點是應用范圍廣、簡便、易掌握;缺點是若對符合參數檢驗條件的資料用非參數檢驗,則檢驗效率低於參數檢驗。如無效假設是正確的,非參數法與參數法一樣好,但如果無效假設是錯誤的,則非參數檢驗效果較差,如需檢驗出同樣大小的差異的差異往往需要較多的資料。
另一點是非參數檢驗統計量是近似服從某一部分,檢驗的界值表也是有近似的(如配對秩和檢驗)因此其結果有一定近似性。
1、提出檢驗假設又稱無效假設,符號是H0;備擇假設的符號是H1。
H0:樣本與總體或樣本與樣本間的差異是由抽樣誤差引起的;
H1:樣本與總體或樣本與樣本間存在本質差異;
預先設定的檢驗水準為0.05;當檢驗假設為真,但被錯誤地拒絕的概率,記作α,通常取α=0.05或α=0.01。
2、選定統計方法,由樣本觀察值按相應的公式計算出統計量的大小,如X2值、t值等。根據資料的類型和特點,可分別選用Z檢驗,T檢驗,秩和檢驗和卡方檢驗等。
3、根據統計量的大小及其分布確定檢驗假設成立的可能性P的大小並判斷結果。若P>α,結論為按α所取水準不顯著,不拒絕H0,即認為差別很可能是由於抽樣誤差造成的,在統計上不成立。
如果P≤α,結論為按所取α水準顯著,拒絕H0,接受H1,則認為此差別不大可能僅由抽樣誤差所致,很可能是實驗因素不同造成的,故在統計上成立。P值的大小一般可通過查閱相應的界值表得到。
兩獨立樣本的非參數檢驗是在對總體分布不甚了解的情況下,通過對兩組獨立樣本的分析來推斷樣本來自的兩個總體的分布等是否存在顯著差異的方法。獨立樣本是指在一個總體中隨機抽樣對在另一個總體中隨機抽樣沒有影響的情況下所獲得的樣本。
SPSS中提供了多種兩獨立樣本的非參數檢驗方法,其中包括曼-惠特尼U檢驗、K-S檢驗、W-W遊程檢驗、極端反應檢驗等。
某工廠用甲乙兩種不同的工藝生產同一種產品。如果希望檢驗兩種工藝下產品的使用是否存在顯著差異,可從兩種工藝生產出的產品中隨機抽樣,得到各自的使用壽命數據。
E. 非參數檢驗適用於哪些類型資料的統計分析
1、不滿足參數檢驗的資料,如偏態分布資料。
2、分布不明的資料。
3、等級資料或開口資料。
非參數檢驗不需要知道原始數據的數值大小,只需要知道數據的位次即可進行分析。非參數檢驗對資料的要求低,適用范圍廣,計算簡便,易掌握,但對符合參數檢驗條件的資料用非參數檢驗,檢驗效能略低於參數檢驗。
(5)非參數方法分析樣本數據擴展閱讀:
注意事項:
每個記錄對應於有兩個或兩個以上相關測量值存儲在數據集中單獨欄位中的給定受試人,如果每個受試人的體重以定期間隔測量並存儲在如節食前體重、中間體重和節食後體重這樣的欄位中,那麼可使用樣本相關非參數檢驗分析節食計劃的有效性研究。這些欄位為相關。
自動比較實測的數據與假設數據:指定了 2 個欄位時,此目標對分類數據應用麥克尼馬爾檢驗,指定了 2 個以上變數時,對分類數據應用 Cochran's Q 檢驗。
指定了 2 個變數時,對連續數據應用威爾科克森配對符號秩檢驗,指定了 2 個以上變數時,對連續數據應用傅萊德曼雙因素 ANOVA 秩檢驗。
F. 如何利用SPSS做非參數檢驗
如何利用SPSS做非參數檢驗
非參數檢驗是一個相當宏大的命題。由於實際情況的復雜多變,因此非參數檢驗包括了許多的各種各樣的檢驗方法。之前我們提過,參數檢驗的使用條件是被檢驗的樣本總體服從正態分布,而非參數檢驗的使用條件自然就是總體不服從或不確定是否服從正態分布。(實際上,這里要特別說明一下,盡管非參數檢驗的使用條件更寬松,但是考慮到精確性,不是特殊要求的話,我們還是盡可能的使用均值檢驗。)
比較常見的單樣本非參數檢驗包括遊程檢驗和單樣本K-S檢驗。
遊程檢驗:
它通常用於檢測兩個不同的觀測值出現的次序是否具有隨機性。舉個例子,假如我們想知道每天來門診就診的人是否生病的次序是否隨機,那麼我們就使用遊程檢驗。我們記錄下來個案依次是否生病,比如是為1,否為0。然後我們就有了一個由0和1構成的變數列,
我們選擇分析——非參數檢驗——舊對話框——遊程,在主面板的檢驗變數列表裡選入我們的0,1變數列。選項卡里邊選擇描述性,其他默認。割點可以全選。
輸出結果看p值就可以了(我真的不想再重復怎麼看p值了)。
單樣本K-S檢驗;
這個就比較重要了。這個檢驗的目的在於觀測樣本的分布。哦,想想也知道很重要。只要我們想做相關和回歸,那我們就最好用K-S檢驗來檢查一下樣本的分布。畢竟pearson相關系數有效的一個重要條件就是樣本服從正態分布。
我們選擇分析——非參數檢驗——舊對話框——1樣本K-S,在主對話框的檢驗變數列表裡邊選入我們想檢驗分布的變數(比如一群病號的血細胞數),選項卡里勾選描述性和四分位數,其他默認。在檢驗分布的下邊有四個供勾選的框框,這個要注意一下,常規指的就是正態分布,相等則是指均勻分布,勾選你想檢驗的分布(一般是正態分布)。確定以後就可以看結果了。
描述性統計量表會給你一些基本指標,幫助你感受這些數據。K-S檢驗表的p值會告訴你樣本是否服從指定的分布,如果是的話,表裡邊還有一些其他的指標可以參考。
單樣本非參數檢驗已經結束了(怎麼這么少?),下邊我們說一下獨立樣本非參數檢驗。
兩獨立樣本非參數檢驗:
打開菜單分析——非參數檢驗——舊對話框——2個獨立樣本,在主面板里邊檢驗變數選入檢驗變數,分組變數選入分組變數,選項卡中選入描述性,四分位數,其他默認。在檢驗類型里邊有四個供勾選的框框,我們一一學習。
Mann-whitney檢驗:
就是大名鼎鼎的秩和檢驗。
這個檢驗利用樣本觀察值得秩來推斷兩樣本所在總體的分布是否相同(不曉得什麼是秩的回去翻一遍你們的高數課本)。這是一個最常用的檢驗。舉例,假設我們知道一組患病的人和不患病的人的血細胞數,想檢查是否具有差異,那麼我們就使用秩和檢驗,我保證沒舉錯例子,這個例子確實也可以用獨立樣本t檢驗來做(希望大家還記得什麼叫獨立樣本t檢驗),當然也可以用秩和檢驗來做。
它會給出描述性統計量,秩表,檢驗統計量表。在最後的一個表裡邊我們通過p值判斷差異是否顯著。
Moses極端反應檢驗:
它適用於實驗條件導致兩個不同方向的極端反應情況(多用於醫學,比如有的葯物會導致一部分病人好轉的同時也會導致一部分病人惡化)。
它通過比較實驗組和觀察組,會告訴你是否產生了極端反應。(很神奇是不是?)
兩樣本K-S檢驗:
這個檢驗用來判斷兩個樣本的分布是否相同。也是看p值哈。
Waldwolfowit遊程檢驗:
用來檢驗兩樣本是否來自相同的總體。
注意:K-S檢驗適用於數值變數資料或者有序分類資料。
多個獨立樣本非參數檢驗:
打開菜單分析——非參數檢驗——舊對話框——K獨立檢驗,在主面板的檢驗變數選入想檢驗的變數,分組變數選入分組變數。
檢驗類型有三種
K-W檢驗:
用來判斷各樣本分別代表的總體是否一致,(相當於單因素方差分析),適用於數值變數和有序分類變數。結果會給出秩,檢驗統計量。通過p值判斷差異性。若想在進行兩兩比較,那就要用到上邊介紹的秩和檢驗來進行比較了。
中位數:
適用於數值變數資料。用來檢驗樣本代表的總體中位數是不是相等。這個用途還是比較廣泛的。
Jonckheere-Terpstra檢驗:
這個檢驗用來處理完全隨機的資料,比如研究隨著年齡增加,學習成績是否也增加?這種有序分組的變數就用這個檢驗來檢驗。(我真有點懶得介紹這么冷門的檢驗的沖動,不過為了完整還是寫一下吧。)
兩相關樣本非參數檢驗:
打開兩個關聯樣本檢驗主面板,檢驗對里邊選擇兩個相關變數,檢驗類型有四種。
Wilcoxon:
它用來檢驗兩個變數的分布是否有差異。比較常用。比如一種葯物治療前和治療後是否有差別?就用這個檢驗。
符號檢驗和wilcoxon差不多,也是檢查差值的。
Mcnemar檢驗:
上邊兩個都是數值型的連續性資料,這個檢驗則用於配對計數資料,將兩組人進行配對,觀察他們的某個指標是否有差異。
邊際同質性檢驗是mcnemar檢驗的一般化和擴展,用於多分類配對計數資料。比如檢驗甲觀察的分類結果和乙觀察的分類結果是否有差異。(分好多類)
多個相關樣本非參數檢驗:
打開多個相關樣本檢驗主面板,選入檢驗變數,檢驗類型一共有三種。
Friedman檢驗:
用於檢驗多個相關樣本是否來自同一總體,是wilcoxon的擴展。
KendallW檢驗:
檢驗樣本的一致性的好壞(不考慮分布的形狀,僅考慮分布是否一致)。
CochranQ檢驗:
用於二分數據時,是mcnemar檢驗的延伸,可以比較多個二分變數的比例的差異是否顯著。
非參數檢驗大概就是這些內容了。和參數檢驗一樣,這些檢驗的操作操作並不復雜,結果也不難判斷,學習的難點在於記住這些不同的檢驗方法的適用的不同范圍。需要多做一些練習,才可以鞏固掌握住非參數檢驗的內容。
以上是小編為大家分享的關於如何利用SPSS做非參數檢驗的相關內容,更多信息可以關注環球青藤分享更多干貨
G. 參數檢驗和非參數檢驗的區別
參數檢驗和非參數檢驗的區別:
1、定義不同:
參數檢驗:假定數據服從某分布(一般為正態分布),通過樣本參數的估計量(x±s)對總體參數(μ)進行檢驗,比如t檢驗、u檢驗、方差分析。
非參數檢驗:不需要假定總體分布形式,直接對數據的分布進行檢驗。由於不涉及總體分布的參數,故名「非參數」檢驗。比如,卡方檢驗。
2、參數檢驗的集中趨勢的衡量為均值,而非參數檢驗為中位數。
3、參數檢驗需要關於總體分布的信息;非參數檢驗不需要關於總體的信息。
4、參數檢驗只適用於變數,而非參數檢驗同時適用於變數和屬性。
5、測量兩個定量變數之間的相關程度,參數檢驗用Pearson相關系數,非參數檢驗用Spearman秩相關。
簡而言之,若可以假定樣本數據來自具有特定分布的總體,則使用參數檢驗。如果不能對數據集作出必要的假設,則使用非參數檢驗。
(7)非參數方法分析樣本數據擴展閱讀:
非參數檢驗的常見方法:
1、Wilcoxon Signed Ranks test:也稱配對符號秩檢驗,適用於連續型資料,用來檢驗配對資料的差值是否來自於中位數為0的總體,也可推斷總體中位數是否等於某個指定值,該方法利用配對資料差值大小的信息,檢驗效率高於符號檢驗。
2、Sign test:也稱差數秩檢驗,根據配對資料差值正負號檢驗其效果有無差異,由於檢驗效能較低,當配對設計資料不滿足非參數檢驗時可考慮使用。
3、McNemar test:在卡方檢驗時學習過,該方法適用於計數資料,指標變數為二分類,可用來檢驗配對設計資料處理前後的結果是否存在差異或者配對組之間的頻率有無差異。
4、Marginal Homogeneity test:McNemar檢驗的擴展,適用於指標變數為多分類的有序或無序資料,即平方表格資料(R×R列聯表資料)。
H. SPSS非參數檢驗 獨立樣本
SPSS非參數檢驗:獨立樣本
一、概念:
獨立樣本的非參數檢驗是在對總體分布不甚了解的情況下,通過對兩組或多組獨立樣本的分析來推斷樣本來自的總體的分布等是否存在顯著差異的方法。獨立樣本是指在一個總體中隨機抽樣對在另一個總體中隨機抽樣沒有影響的情況下所獲得的樣本。
二、選擇檢驗(分析-非參數檢驗-獨立樣本-設置-選擇檢驗)
1、根據數據自動選擇檢驗。該設置將對具有兩個組的數據應用Mann-Whitney U檢驗,或對具有k個組的數據應用Kruskal-Wallis單因素ANOVA檢驗。
2、自定義檢驗。這些設置允許您選擇要執行的特定檢驗。
2.1、比較不同組間的分布。這些將生成獨立樣本檢驗,即樣本是否來自同一總體。◎Mann-Whitney U(二樣本)使用每個個案的秩來檢驗組是否抽取自同一總體。分組欄位中按升序排列的第一個值定義第一個組,第二個值定義第二個組。如果分組欄位有兩個以上的值,則不生成此檢驗。◎Kolmogorov-Smirnov(二樣本)對兩個分布間中位數、離散、偏度等的任何差異很敏感。如果分組欄位有兩個以上的值,則不生成此檢驗。◎檢驗隨機序列(二樣本Wald-Wolfowitz)生成一個以組成員關系為准則的遊程檢驗。如果分組欄位有兩個以上的值,則不生成此檢驗。◎Kruskal-Wallis單因素ANOVA(k樣本)是Mann-Whitney U檢驗的擴展,它也是單因素方差分析的非參數模擬。您可以根據需要請求對k樣本的多重比較,即所有成對多重比較或逐步降低比較。◎有序選項檢驗(k樣本Jonckheere-Terpstra)可作為比Kruskal-Wallis功能更強大的選項,但前提是k樣本需具有自然順序。例如,k個總體可能代表k個上升的溫度。「不同的溫度產生相同的響應分布」這一假設是針對「溫度升高,則響應的幅度增加」這一選擇進行檢驗的。此處備選假設已排序,因此,Jonckheere-Terpstra是最適用的檢驗。指定其他假設的順序;從最小到最大規定其他假設:第一組的位置參數不等於第二組,第二組又不等於第三組,依此類推;從最大到最小規定其他假設:最後一組的位置參數不等於倒數第二組,倒數第二組又不等於倒數第三組,依此類推。您可以根據需要請求對k樣本的多重比較,即所有成對多重比較或逐步降低比較。
2.2、比較不同組間的范圍。這可以生成一個獨立樣本檢驗,即樣本是否具有相同范圍。◎Moses極端反應(二樣本)檢驗控制組與比較組。分組欄位中按升序排列的第一個值定義控制組,第二個值定義比較組。如果分組欄位有兩個以上的值,則不生成此檢驗。
2.3、比較不同組間的中位數。這可以生成一個獨立樣本檢驗,即樣本是否具有相同中位數。◎中位數檢驗(k樣本)可以使用匯聚樣本中位數(從數據集所有記錄中計算)或自定義值作為假設中位數。您可以根據需要請求對k樣本的多重比較,即所有成對多重比較或逐步降低比較。
2.4、估計不同組間的置信區間。Hodges-Lehman估計(二樣本)可以為兩個組的中位數差異生成一個獨立樣本估計和置信區間。如果分組欄位有兩個以上的值,則不生成此檢驗。
三、方法:
1、曼-惠特尼U檢驗:兩獨立樣本的曼-惠特尼U檢驗可用於對兩總體分布的比例判斷。其原假設:兩組獨立樣本來自的兩總體分布無顯著差異。曼-惠特尼U檢驗通過對兩組樣本平均秩的研究來實現判斷。秩簡單說就是變數值排序的名次,可以將數據按升序排列,每個變數值都會有一個在整個變數值序列中的位置或名次,這個位置或名次就是變數值的秩。
2、K-S檢驗:K-S檢驗不僅能夠檢驗單個總體是否服從某一理論分布,還能夠檢驗兩總體分布是否存在顯著差異。其原假設是:兩組獨立樣本來自的兩總體的分布無顯著差異。這里是以變數值的秩作為分析對象,而非變數值本身。
3、遊程檢驗:單樣本遊程檢驗是用來檢驗變數值的出現是否隨機,而兩獨立變數的遊程檢驗則是用來檢驗兩獨立樣本來自的兩總體的分布是否存在顯著差異。其原假設是:兩組獨立樣本來自的兩總體的分布無顯著差異。兩獨立樣本的遊程檢驗與單樣本遊程檢驗的思想基本相同,不同的是計算遊程數的方法。兩獨立樣本的遊程檢驗中,遊程數依賴於變數的秩。
4、極端反應檢驗:極端反應檢驗從另一個角度檢驗兩獨立樣本所來自的兩總體分布是否存在顯著差異。其原假設是:兩獨立樣本來自的兩總體的分布無顯著差異。
基本思想是:將一組樣本作為控制樣本,另一組樣本作為實驗樣本。以控制樣本作為對照,檢驗實驗樣本相對於控制樣本是否出現了極端反應。如果實驗樣本沒有出現極端反應,則認為兩總體分布無顯著差異,相反則認為存在顯著差異。
5、中位數檢驗:中位數檢驗通過對多組獨立樣本的分析,檢驗它們來自的總體的中位數是否存在顯著差異。其原假設是:多個獨立樣本來自的多個總體的中位數無顯著差異。
基本思想是:如果多個總體的中位數無顯著差異,或者說多個總體有共同的中位數,那麼這個共同的中位數應在各樣本組中均處在中間位置上。於是,每組樣本中大於該中位數或小於該中位數的樣本數目應大致相同。
6、Kruskal-Wallis檢驗:Kruskal-Wallis檢驗實質是兩獨立樣本的曼-惠特尼U檢驗在多個樣本下的推廣,也用於檢驗多個總體的分布是否存在顯著差異。其原假設是:多個獨立樣本來自的多個總體的分布無顯著差異。
基本思想是:首先,將多組樣本數據混合並按升序排序,求出各變數值的秩;然後,考察各組秩的均值是否存在顯著差異。容易理解:如果各組秩的均值不存在顯著差異,則是多組數據充分混合,數值相差不大的結果,可以認為多個總體的分布無顯著差異;反之,如果各組秩的均值存在顯著差異,則是多組數據無法混合,某些組的數值普遍偏大,另一些組的數值普遍偏小的結果,可以認為多個總體的分布有顯著差異。
7、Jonckheere-Terpstra檢驗:Jonckheere-Terpstra檢驗也是用於檢驗多個獨立樣本來自的多個總體的分布是否存在顯著差異的非參數檢驗方法,其原假設是:多個獨立樣本來自的多個總體的分布無顯著差異。
基本思想與兩獨立樣本的曼-惠特尼U檢驗類似,也是計算一組樣本的觀察值小於其他組樣本的觀察值的個數。
I. 多個獨立樣本非參數檢驗怎麼兩兩比較
在線SPSS「SPSSAU」提供多種非參數檢驗的兩兩比較方法,直接選擇即可自動出結果及智能分析。