導航:首頁 > 解決方法 > 卡方檢測計算方法意義

卡方檢測計算方法意義

發布時間:2022-06-01 13:05:45

『壹』 關於卡方檢驗P值的意義,P值恰好等於0.05,請問這樣可以說明有統計學意義嗎

如果確實是這樣,應該是接受原假設(也就是沒有統計學意義),因為不管那本參考書或統計軟體都是說小於a (不包括等於a ,例如a=0.05)就拒絕原假設。不過,如果你是使用統計軟體的話,應該不存在這個問題,因為統計軟體計算的P值可以高達十幾位小數點,不可能出現你說的情況。

原因很簡單,在統計學領域,P小於a(不包括等於a )就拒絕原假設是一直以來的通用約定。也就是說,對於包不包括等於a這一點,並不存在一個科學的定義,僅僅是依據統計學領域的約定俗成。就像a值到底應該是多少才算小概率事件,這也沒有一個科學的絕對定義,也只是根據各專業領域的約定俗成(也是有科學依據的,不能隨意確定,但也不存在絕對的界限),大多數定為0.05,而有些定為0.1,0.01也是可以的。

如果你的領域制定的規則是在等於a 時也拒絕原假設,這也是完全沒有問題的,只要規則是預先訂好的,而不是得出結果後臨時定的,就不會違反隨機原則,也是有道理的。

『貳』 怎麼用spss軟體的卡方檢驗分析不同年齡組的患病率差異有無統計學意義求大神指教

卡方檢驗是一種用途很廣的計數資料的假設檢驗方法。它屬於非參數檢驗的范疇,主要是比較兩個及兩個以上樣本率( 構成比)以及兩個分類變數的關聯性分析。其根本思想就是在於比較理論頻數和實際頻數的吻合程度或擬合優度問題。

卡方檢驗是以 χ2 分布為基礎的一種常用假設檢驗方法,它的假設檢驗為:

H0:觀察頻數與期望頻數沒有差別。H1:觀察頻數與期望頻數有差別。

卡方檢驗的基本思想是:首先假設 H0 成立,基於此前提計算出 χ2 值,它表示觀察值與理論值之間的偏離程度。根據 χ2 分布及自由度可以確定在H0 假設成立的情況下獲得當前統計量及更極端情況的概率P。

如果 P 值很小,說明觀察值與理論值偏離程度太大,應當拒絕無效假設,表示比較資料之間有顯著差異;否則就不能拒絕無效假設,尚不能認為樣本所代表的實際情況和理論假設有差別。

適用於四格表應用條件:
兩個獨立樣本比較可以分以下3種情況:(1) 所有的理論數 T≥5 並且總樣本量 n≥40,用 Pearson 卡方進行檢驗。(2) 如果理論數 T<5 但 T≥1,並且 n≥40,用連續性校正的卡方進行檢驗。(3) 如果有理論數 T<1 或 n<40,則用 Fisher』s 檢驗。

R×C表卡方檢驗應用條件:

(1) R×C表中理論數小於5的格子不能超過1/5;(2) 不能有小於1的理論數;不滿足 (1) 或 (2) 時,均採用 Fisher』s 檢驗。如果實驗中有不符合R×C表的卡方檢驗,可以通過增加樣本數、列合並來實現。

列聯表的資料大致分為以下 10 類:

成組設計橫斷面研究四格表資料統計分析

成組設計隊列研究四格表資料統計分析

成組設計病例對照研究四格表資料統計分析

成組設計結果變數為多值有序變數的2XC表資料統計分析

『叄』 卡方檢驗研究的方法

1、處理四格表數據時不考慮樣本量和最小理論頻數而直接採用卡方檢驗
處理四格表數據是卡方檢驗最為常見的用途之一,其目的在於分析「構成比」或者「率」上的差異是否具有統計學意義。對於四格表數據,使用卡方檢驗的條件為樣本量大於 40,且最小理論頻數應大於 5。對於某些小樣本的、或者指標陽性率較低的研究,總樣本量可能小於 40,最小理論頻數也可能小於 5,此時應該採用 Fisher 確切概率法進行分析。
比如某研究需比較小細胞肺癌和非小細胞肺癌內某個基因的表達情況的差異是否有統計學意義,得出如下四格表:

該研究的樣本量僅為 30 個,且最小理論頻數為(12×9)/30=3.6,所以應該採用 Fisher 確切概率法進行分析。實際上,從理論上講,若要分析四格表數據中的構成比或者率之間的差異是否有統計學意義,Fisher 確切概率法的結果是最可靠的。若是使用軟體對數據進行分析,不論樣本量和最小理論頻數,均可採用 Fisher 確切概率法。
2、不考慮分析目的、設計類型而盲目套用卡方檢驗
有的四格表資料本身是配對的,且研究的目的主要是回答「一致性」或者「不一致性」的問題,此時就不應該用卡方檢驗對數據進行分析。比如:某研究者發明了一種新的 HIV 檢測法,並且用該法和免疫印跡法(檢測 HIV 感染的「金標准」)同時檢測了 100 份血清,得到如下四格表數據:

該研究在設計上與表 1 中的研究最大的區別在於「配對」,即同一樣本分別接受了新方法檢測和免疫印跡法(金標准)的檢測。研究者最關心的問題應該是「新方法和金標准之間的一致性」問題,若採用卡方檢驗進行分析,得出的結論是「免疫印跡法檢測結果的頻數分布在新方法陽性組和陰性組中是不同的」,這一結論顯然並無多大專業價值。
對於此類研究,可以採用兩種方法進行統計,一是採用 Mcnemar χ2 檢驗公式計算兩種方法不一致的部分是否具有統計學意義;二是採用 Kappa 檢驗分析兩種結果之間的一致性。
需要說明的是,此類研究中的一種方法必須是金標准,否則研究可能沒有價值。以表 2 中的數據為例,若免疫印跡法並非檢測 HIV 感染的金標准,兩種方法的一致性即使好得一塌糊塗,也可能無濟於事。
因為一個顯而易見的問題是:這兩種方法可能都是錯誤的檢測方法。比如:採用金標准對 100 份血清進行檢測後,其中 90 例為陽性,而不論是新方法還是免疫印跡法,均僅僅檢測出了 55 個陽性樣本,漏檢率顯然太高。
3、誤用卡方檢驗處理等級資料
等級資料的表示方法與分類資料相似,因此受「定式思維」的影響,部分同行「習慣性」地採用卡方檢驗對等級資料進行處理,這也是醫學期刊上最常見的濫(亂)用卡方檢驗的行為。卡方檢驗回答的問題僅僅是「構成比」或者「率」上的差異是否具有統計學意義,而不能回答效應指標的強度高低問題。比如某研究比較了兩類人群胰腺癌分期的分布狀況,如下表所示:

此類數據的一個顯著特點是胰腺癌的分期(Ⅰ、Ⅱ、Ⅲ、Ⅳ期)是一個等級資料,研究者的研究目的是分析甲乙兩群人胰腺癌的分期是否有差別,是一個強度「分期早晚」的問題,而不是「構成比」的差異。若用卡方檢驗處理此類數據,得出的結論就是「甲乙兩類人群胰腺癌分期構成比上的差異是否具有統計學意義」,而無法明確「孰高孰低」的問題。
以上述表格為例,卡方檢驗結果顯示有統計學意義,但問題在於:根據表中數據,人群甲以Ⅰ期和Ⅳ期為主,人群乙以Ⅱ期和Ⅲ期為主,讓人完全無法判斷兩類人群的疾病分期「孰早孰晚」的問題。
處理此類數據的一般方法是將分期進行秩轉換,然後以秩和檢驗進行統計分析,也可以直接採用 Riddit 分析進行統計。
4、對於多組資料反復使用卡方檢驗進行比較
又是研究者面對的數據可能有多行或者多列(R×C 資料),研究者需要逐一比較各組數據的差異是否有統計學意義。比如某研究者對不同血型的個體患乙型肝炎的情況進行了調查,得出如下數據:

這是一個率的比較問題,研究目的主要在於分析各個血型的人群 HBV 感染的發病率是否相同。處理此類數據,一般是直接採用卡方檢驗從整體上分析各組人群率(構成比)上的差異是否具有統計學意義;若具有統計學意義,則根據研究目的進一步覺得是否進行組間的比較。
以本研究為例,研究者可能還需要逐一比較各組 HBV 感染的發病率之間的差異是否具有統計學意義。處理此類數據時,最容易犯的一類錯誤就是將表格進行拆分成六個四格表反復採用卡方檢驗進行統計分析。實際上,這種錯誤的統計學方法類似於「反復使用 t 檢驗比較多組資料」,會增大Ⅰ類誤差的概率。正確的做法應該是採用卡方分割法,通過改校正驗水準的方式來進行兩兩比較。
需要說明的是,在整體比較之後是否需要進行兩兩比較,如何進行兩兩比較在很大程度上取決於專業需要,或者說研究目的,特別是分組因素的「屬性」是否相同。比如某研究欲分析了基因 A 在類風濕性關節炎中的表達情況(基因表達情況以陽性和陰性進行描述),除了健康對照外,研究者還設立了疾病對照組,包括系統性紅斑狼瘡和乾燥綜合症。

『肆』 卡方檢驗中卡方值代表什麼,意義上什麼

是卡方檢驗的 統計量,用來計算P

『伍』 卡方檢驗具體怎麼計算

卡方檢驗計算方法

(1)提出原假設:

H0:總體X的分布函數為F(x).

如果總體分布為離散型,則假設具體為

H0:總體X的分布律為P{X=xi}=pi, i=1,2,...

(2)將總體X的取值范圍分成k個互不相交的小區間A1,A2,A3,…,Ak,如可取

A1=(a0,a1],A2=(a1,a2],...,Ak=(ak-1,ak),

其中a0可取-∞,ak可取+∞,區間的劃分視具體情況而定,但要使每個小區間所含的樣本值個數不小於5,而區間個數k不要太大也不要太小。

(3)把落入第i個小區間的Ai的樣本值的個數記作fi,成為組頻數(真實值),所有組頻數之和f1+f2+...+fk等於樣本容量n。

(4)當H0為真時,根據所假設的總體理論分布,可算出總體X的值落入第i 個小區間Ai的概率pi,於是,npi就是落入第i個小區間Ai的樣本值的理論頻數(理論值)。

(5)當H0為真時,n次試驗中樣本值落入第i個小區間Ai的頻率fi/n與概率pi應很接近,當H0不真時,則fi/n與pi相差很大。基於這種思想,皮爾遜引進如下檢驗統計量

(5)卡方檢測計算方法意義擴展閱讀

卡方檢驗是用途非常廣的一種假設檢驗方法,它在分類資料統計推斷中的應用,包括:兩個率或兩個構成比比較的卡方檢驗;多個率或多個構成比比較的卡方檢驗以及分類資料的相關分析等。

基本原理:

卡方檢驗就是統計樣本的實際觀測值與理論推斷值之間的偏離程度,實際觀測值與理論推斷值之間的偏離程度就決定卡方值的大小,卡方值越大,越不符合;卡方值越小,偏差越小,越趨於符合,若兩個值完全相等時,卡方值就為0,表明理論值完全符合。

注意:卡方檢驗針對分類變數。

『陸』 卡方檢驗的應用條件是什麼

卡方檢驗的應用條件:

1、一是隨機樣本數據。

2、二是卡方檢驗的理論頻數不能太小,要求每個格子中的理論頻數T均大於5或1。

卡方檢驗用於推斷兩個及兩個以上總體率或構成比是否有差別,兩個分類變數間有無相關關系,多個率的趨勢檢驗,以及兩個率的等效檢驗等。此外,也用於頻數分布的擬合優度檢驗。

卡方檢驗的特點

卡方檢驗的實際觀測值與理論推斷值之間的偏離程度就決定卡方值的大小,如果卡方值越大,二者偏差程度越大;反之,二者偏差越小;若兩個值完全相等時,卡方值就為0,表明理論值完全符合。

卡方檢驗在分類資料統計推斷中的應用,包括:兩個率或兩個構成比比較的卡方檢驗;多個率或多個構成比比較的卡方檢驗以及分類資料的相關分析等。

多個樣本率(或構成比)比較的檢驗時,結論為拒絕無效假設時,只能認為各總體率(或總體構成比)之間總的說來有差別,但不能說明它們彼此之間都有差別,或某兩者間有差別。若想進一步了解哪兩者的差別有統計學意義,可用分割法。

『柒』 卡方分析的目的是什麼

卡方分析檢驗的目的就是統計樣本的實際觀測值與理論推斷值之間的偏離程度,實際觀測值與理論推斷值之間的偏離程度就決定卡方值的大小。

如果卡方值越大,二者偏差程度越大;反之,二者偏差越小;若兩個值完全相等時,卡方值就為0,表明理論值完全符合。

卡方檢驗使用場景:

卡方檢驗可是一位重量級選手,凡是涉及到計數資料分布的比較都需要他的幫忙。其實卡方檢驗是英文Chi-Square Test 的諧音。在大數據運營場景中,通常用在某個變數(或特徵)值是不是和應變數有顯著關系。

卡方檢驗是用途非常廣的一種假設檢驗方法,它在分類資料統計推斷中的應用,包括:兩個率或兩個構成比比較的卡方檢驗;多個率或多個構成比比較的卡方檢驗以及分類資料的相關分析等。

『捌』 卡方檢驗中的t代表什麼,如何計算

T代表每個格子中的理論頻數。

計算方法:

卡方檢驗的統計量是卡方值,它是每個格子實際頻數A與理論頻數T差值平方與理論頻數之比的累計和。

每個格子中的理論頻數T是在假定兩組的發癌率相等(均等於兩組合計的發癌率)的情況下計算出來的,如第一行第一列的理論頻數為71*(91/113)=57.18,故卡方值越大,說明實際頻數與理論頻數的差別越明顯,兩組發癌率不同的可能性越大。

卡方檢驗要求:

最好是大樣本數據。一般每個個案最好出現一次,四分之一的個案至少出現五次。如果數據不符合要求,就要應用校正卡方。

利用統計學軟體分析結果如下:

data kafang;

input row column number @@;

cards;

1 1 52

1 2 19

2 1 39

2 2 3

;

run;

proc freq;

tables row*column/chisq;

weight number;

run;

(8)卡方檢測計算方法意義擴展閱讀

一、卡方檢驗的基本思想

卡方檢驗是以χ2分布為基礎的一種常用假設檢驗方法,它的無效假設H0是:觀察頻數與期望頻數沒有差別。

該檢驗的基本思想是:首先假設H0成立,基於此前提計算出χ2值,它表示觀察值與理論值之間的偏離程度。根據χ2分布及自由度可以確定在H0假設成立的情況下獲得當前統計量及更極端情況的概率P。

如果P值很小,說明觀察值與理論值偏離程度太大,應當拒絕無效假設,表示比較資料之間有顯著差異;否則就不能拒絕無效假設,尚不能認為樣本所代表的實際情況和理論假設有差別。

二、卡方值的計算與意義

χ2值表示觀察值與理論值之問的偏離程度。計算這種偏離程度的基本思路如下。

1、設A代表某個類別的觀察頻數,E代表基於解析失敗 (PNG 轉換失敗; 請檢查是否正確安裝了 latex, dvips, gs 和 convert): H_0 計算出的期望頻數,A與E之差稱為殘差。

2、顯然,殘差可以表示某一個類別觀察值和理論值的偏離程度,但如果將殘差簡單相加以表示各類別觀察頻數與期望頻數的差別,則有一定的不足之處。因為殘差有正有負,相加後會彼此抵消,總和仍然為0,為此可以將殘差平方後求和。

3、另一方面,殘差大小是一個相對的概念,相對於期望頻數為10時,期望頻數為20的殘差非常大,但相對於期望頻數為1 000時20的殘差就很小了。考慮到這一點,人們又將殘差平方除以期望頻數再求和,以估計觀察頻數與期望頻數的差別。

『玖』 卡方檢驗p值意義

卡方值僅僅只是一個中間過程,通過卡方值計算出p值,p值才是我們最重要需要的。p小於0.05意味著存在顯著差異。

閱讀全文

與卡方檢測計算方法意義相關的資料

熱點內容
如何寫作文的方法和技巧四年級 瀏覽:874
六樓防護窗安裝方法 瀏覽:942
49x25簡便方法計算 瀏覽:731
簡單小發明製作方法大全 瀏覽:698
鍛煉小腿肚什麼方法最好 瀏覽:627
基礎會計實驗報告實驗方法與步驟 瀏覽:729
萬能表阻值測量的常用方法 瀏覽:645
手指不直怎麼矯正方法 瀏覽:390
萵筍核病的治療方法 瀏覽:170
黑眼圈最快的治療方法圖片 瀏覽:923
怎麼樣淹咸鴨蛋的方法 瀏覽:697
貓吃鼠的正確方法視頻 瀏覽:749
煮生鮮牛奶的正確方法 瀏覽:335
要件分析方法司法三段論 瀏覽:235
快速增加崗位方法 瀏覽:622
火燒雲課文教學方法有哪些 瀏覽:771
如何快速走紅的方法 瀏覽:561
白術雞內金最佳服用方法 瀏覽:535
胃竇潰瘍怎麼治療方法新聞 瀏覽:973
豬飼料的食用方法 瀏覽:828