1. 醫學統計方法該如何選擇
醫學統計方法該如何選擇
基本的醫學統計方法有很多,如樣本均數與已知樣本均數比較、兩樣本均數比較、多個樣本均數的比較、兩個樣本率的比較、多個樣本率的比較、兩組或多組構成比的比較、非參數檢驗、多因素桐困轎資料的方差分析等。如果對於統計方法沒有一個整體的把握和認識,可能就會局肆出現誤用濫用統計方法的情況。下面是我為大家帶來的.關於醫學統計方法該如何選擇的知識,歡迎閱讀。
統計學的基本概念
1、小概率事件
如果事先假定發生概率最多為0.05的事件為小概率事件,那麼根據小概率事件原理,即“小概率事件在一次隨機試驗中幾乎不可能發生”。假設檢驗就是根據小概率事件原理對該假設進行推斷。
2、非參數統計
統計學上,對總體的分布不做假設或僅作非常一般性假設條件下的統計推斷方法稱為“非參數統計”。非參數統計方法很多,應用較多的包括
配對設計資料的Wilcoxon符號秩和檢驗、單樣本的Wilcoxon符號秩和檢驗、完全隨機設計兩獨立樣本的Wilcoxon符號秩和檢驗、完全隨機設計多個獨立樣本的Kruskal-Wallis秩和檢驗和隨機化區組設計資料的Friedman秩和檢驗。
3、實驗研究三要素
實驗研究三要素包括:處理因素、實驗對象、實驗效應。處理因素有單因素、多因素;實驗對象的設計方式有完全隨機、配對或隨機區組;實驗效應通過觀察指標來表達,而觀察指標又可分為計量、計數或等級資料。這三者的不同組合決定了選用不同的統計方法。
單變數統計方法選擇的一般原則
1.影響因素是單因素還是多因素
2.判斷擬分析的資料屬尺豎於哪種類型:計量、計數還是等級資料
3.資料是單一樣本、兩組樣本還是多組樣本
4.判斷資料所屬的設計方式,是完全隨機、配對還是隨機區組
5.判斷資料是否符合擬採用的統計分析方法的應用條件,必要時可考慮變數變換
多變數統計方法的選擇
在醫學研究中,特別是在臨床研究中,每個觀察對象記錄的觀察指標往往不止1個,即有多個反應變數。分析變數間的相互關系是探索疾病病因的重要途徑,多參數統計方法常用於這類研究問題的分析。
在醫學科研中,常用的多參數統計方法有3種:多元線性回歸、Logistic回歸分析和生存分析。
多元線性回歸要求應變數是連續型變數,但是在醫學研究中經常遇到的應變數為非連續的分類變數,如某種疾病的患病與否,器官移植之後是生存還是死亡。
研究分類應變數與諸多自變數間的相互關系,進行疾病的病因分析常選用Logistic回歸分析。
在醫學隨訪研究中,不僅要看是否出現了某種結局(如器官移植後是否死亡),還要考慮出現這些結局所經歷的時間長短。生存分析就是將觀察結局和出現這一結局所經歷的時間結合起來分析的一種統計分析方法。
;2. 如何正確選擇統計方法(to be continued)
資料類型設計方案實驗分組檢驗條件
單變數資料差異比較的分析方法小結
11種形式的列聯表
雙變數(多變數)資料的關聯性分析方法小結
二、計量資料分析常見的統計問題
2.1 忽視t檢驗的前提條件
文題:重症急性胰腺炎並發肝功能不全的臨床研究。實驗數據見表5。原文作者用t檢驗分析此資料。請問:這樣做正確嗎?
辨析:
1.對表5數據進行方差齊性檢驗,可發現兩組患者的血清澱粉酶和肌酐指標不能滿足方差齊性的要求,故不能採用t檢驗進行分析。
正確的做法:採用變數變換使數據服從正態分布且方差齊,然後進行t檢驗,否則,採用非參數檢驗。
2.給出確切的統計量和P值。
2.2 誤用成組設計資料的t檢驗分析配對設計資料
辯析: 1.考慮到對數據進行變換是正確的。但是如果採用成組t檢驗,還需要兩總體方差齊性。 但本研究是配對設計,如果採用成組t檢驗,會降低檢驗效率。應該採用配對t檢驗進行分析。注意配對t檢驗的條件:要對每對數據的差值(d)進行正態性檢驗。如果不滿足,改用Wilcoxon符號秩檢驗。2.應給出確切的統計量和P值。
2.3 忽視方差分析的前提條件
文題:姜黃素抑制晶狀體上皮細胞增殖的信號轉導機制。
問題:作者取健康小牛眼晶狀體的混合消化液消化後,收集細胞,進行傳代培養,取第三代細胞進行實驗。
實驗分3組:空白對照組、模型組、姜黃素組,每組設6個樣本。
請問:採用方差分析正確嗎?
辨析:此實驗分3組,應為單因素三水平設計定量資料,應首先進行「獨立性」、「正態性」和「方差齊性」檢驗,如果滿足方差分析的3個前提條件則用方差分析;如果不滿足,則採用變數變換或秩和檢驗。如果P<0.05,則進行多組均數間的多重比較。
給出確切的統計量和P值。
2.4 誤用t檢驗分析等級資料
文題:止痛如神湯保留灌腸治療CNUP:雙盲隨機安慰劑對照試驗
表4 兩組臨床主要症狀和結腸鏡腸粘膜病變評分
※:與對照組(G2)比較,P>0.05,組間差異無統計學意義;△:與治療前比較,P<0.05,組內差異有統計學意義;▲:與對照組(G2)比較,P<0.05,組間差異有統計學意義。
辨析:
對於腹痛、腹瀉、膿血便、下墜感、充血、水腫、粘膜糜爛、粘膜潰瘍的單項評分組間比較,不宜用t檢驗。因為每項評分為1、2、3等不連續的賦值,數據資料不服從正態分布。應將數據整理成分組無序指標有序的等級資料,宜採用秩和檢驗。
分析「總評分」時,應對數據進行正態性和方差齊性檢驗後,決定選用t檢驗或秩和檢驗。
與對照組(G2)比較,P>0.05,組間差異無統計學意義,不必在備注中表示。
應寫出確切的統計量和P值
2.5 誤用t檢驗處理重復測量的兩因素試驗設計
文題:益氣活血法預防老年患者髖部術後下肢深靜脈血栓形成
統計學處理:採用SPSS10.0統計軟體,兩組間計量資料比較用t檢驗。
辨析:本研究設計類型為:兩因素(處理和時間)重復測量設計資料。
在資料滿足「獨立性」、「正態性」和「方差齊性」的前提條件下,及進行球對稱檢驗,應選用兩因素設計的重復測量的方差分析,選用t檢驗分析該資料是不妥的。
文題:復方苦參注射液對惡性腫瘤患者伽瑪刀放射治療後T淋巴細胞亞群的影響。
設計:作者選取60例惡性腫瘤患者,隨機分成2組。試驗組在伽瑪刀放射治療的同時給予復方苦參注射液20ml加入生理鹽水500ml,靜脈滴注,1次/d,10d為1個療程;對照組僅給予伽瑪刀放射治療。試驗結果見表7。
請問:統計分析方法選用t檢驗正確嗎?
辨析:
1.統計分析錯誤
本試驗中,每位受試者在試驗前、後兩個不同的時間點上被重復測量了同一個指標的數值,試驗前與試驗後的數據並不相互獨立,這種試驗設計類型屬於具有重復測量的試驗設計,時間是一個與重復測量有關的試驗因素。原作者用t檢驗進行兩兩比較,則割裂了整體設計,不能准確地估計和控制誤差,因而不能得到可靠的結論。
正確的做法:應將表7的形式改成重復測量試驗設計的標准形式,採用與之對應的方差分析進行數據處理。
2.6 誤用配對設計資料的t檢驗處理單因素k(k>3)水平設計的資料
原文題目:「莪術對大鼠在體子宮肌電活動的影響及其機制研究」,文章為觀察莪術水煎劑對未孕大鼠子宮肌電活動的影響,40隻大鼠被隨機分成4組,對照組:按10ml/kg鼠重灌服生理鹽水,莪術組:按10ml/kg鼠重分別灌服25% 、50% 、100%莪術水煎液分成3組。觀察每個大鼠子宮肌電爆發波的峰面積、持續時間和個數。原作者應用配對設計定量資料的t檢驗進行統計處理,資料見表4。
表 莪術水煎劑對大鼠子宮肌電活動的影響(均數±標准差)
辨析:
沒有交待將大鼠按體重等重要的非實驗因素作為配伍條件進行隨機區組。
本資料有四個劑量,屬於單因素四水平設計的定量資料,不可以用成組設計或配對設計的t檢驗。
措施:如果滿足正態性和方差齊性兩個前提條件,應用單因素四水平設計定量資料的方差分析,在得出有統計學意義的結論後,還可進一步採用Dunnett t檢驗或LSD檢驗。
如果在專業上有必要對3項指標同時進行考察,還應選用該設計的定量資料的三元方差分析對資料進行處理。
三、計數資料分析方法的常見問題
3.1 計算相對數時分母太小
文題:疏肝利膽中葯防治膽固醇結石形成的實驗研究。實驗數據見表4。請問:在表達資料方面有何不妥之處?
辨析:
計算相對數時,分母過小,相對數很不穩定,易失真,不但不能正確反映事實真相,還往往會造成錯覺。
在表4中,各組樣本例數都小於20,樣本例數偏小,不宜計算率,直接給出例數就可以。
3.2 誤用χ2 檢驗分析結果變數為有序變數的資料
某醫生用A、B兩葯治療某病各240例,其療效分為四個等級:痊癒、顯效、好轉、無效,見表4。經R×C表χ2檢驗,χ2=53.33 ,P <0.01 ,認為兩組療效之間的差異有統計學意義。
辨析:
本資料屬於單項有序的R×C表,臨床療效有等級之分,對於等級資料可採用Ridit分析或秩和檢驗。而不應用R×C的χ2檢驗,R×C表χ2 檢驗只能檢驗兩組內部構成是否相同或頻數的分布是否相同,不能檢驗療效有無差別。不難看出,若對表4資料任意兩列數字進行對換,可以清楚地發現,χ2值仍為53.33,不會有改變。
3.3 誤用χ2檢驗回答相關性問題
表 不同年齡冠狀動脈粥樣硬化程度的分布
上述資料用χ2檢驗得:χ2 =163.01,P<0.005,結論為:可認為冠狀動脈硬化的程度與年齡有關,結合本資料可見冠狀動脈硬化等級有隨年齡增高而增加的趨勢。
問:處理此資料所用的統計分析方法以及所得出的結論有何不妥之處?
辨析1:
本資料為「雙向有序且屬性不同的二維列聯表資料」,處理這種資料有3個目的,因此,就對應著3套不同的統計分析方法。
分析不同年齡組患者冠狀動脈硬化等級之間有無差別:看作單向有序資料,選用秩和檢驗。
分析年齡與冠脈硬化等級間有無相關關系:選用等級相關。
分析兩者間是否存在線性變化趨勢則應用線性趨勢檢驗。
作者欲考察「兩個有序變數之間是否呈相關關系」,而χ2檢驗結果是P<0.05,說明冠狀動脈硬化患者在不同年齡組的人數分布是不同的。
事實上,若將表中任何兩行的頻數互換或將任何兩列的頻數互換,所得的χ2檢驗的統計量數值是不會變化的,說明χ2檢驗用於處理有序變數形成的二維列聯表資料是不合適的。
辨析2:
欲考察「兩個有序變數之間是否呈相關關系」,應選用分析定性資料的相關分析方法,如:Spearman秩相關分析,Kendall秩相關分析或典型相關分析。
本例採用Spearman秩相關分析,得:rs=0.53215,P<0.0001。
結論為:表中兩個有序變數之間呈正相關關系,即隨著年齡的增加冠狀動脈硬化等級也逐漸增大,兩者之間的相關關系具有統計學意義。
3.4 多值有序變數的高維列聯表資料
3.5 不滿足連續性χ2檢驗條件時未做校正
3.6 十一種形式的列聯表
3.7 誤用χ2檢驗取代Fisher精確檢驗
3.8 對R×C表直接分割進行兩兩比較
四、統計分析方法表述問題
(1)在統計學方法中註明「採用SPSS軟體進行統計學處理」。此表述正確嗎?
辨析:
從該表述中只能得知原作者採用了什麼統計分析軟體處理數據,沒有交代清楚軟體的版本和序列號;更未體現出文中資料所對應的實驗設計類型和所採用的具體統計分析方法。
(2)在統計學方法中註明「計量資料採用方差分析」。請問:此表述正確嗎?
辨析:
從該表述中只能得知作者處理定量資料用了方差分析,至於這些統計分析方法的選用是否正確,則不得而知。
通常情況下,比較各平均值之間的差別是否具有統計學意義,可能會用到的t檢驗有3種,方差分析有10種之多,他們之間的本質區別體現在定量資料所對應的「實驗設計類型」上。
在表述統計學方法時,應將所用方法寫完整,即在統計分析方法前冠以實驗設計名稱,如配對設計定量資料的t檢驗、成組(或單因素兩水平)設計定量資料的t檢驗或兩因素析因設計定量資料的方差分析。
(3)定性資料一律採用χ2檢驗,對嗎?
辨析:
事實上,定性資料通常可以編製成11種形式的列聯表。在進行統計分析時,應針對不同形式的列聯表、統計分析目的和資料實際具備的前提條件,選用相應的統計分析方法,不可隨意盲目選用,更不應將χ2檢驗視為處理定性資料的萬能工具。
(4)許多論文中,當統計數據經假設檢驗後,P值僅僅列出P >0.05或P<0.05 、P<0.01便稱結果無顯著差異,或結果非常顯著。
假設檢驗結果正確的表達方法是:
應寫出描述性統計量,如樣本均數、率、相關系數、回歸系數、相對危險度、半數效量等,及其可信區間、檢驗統計量,如χ2、t、u、F 值等)、P值;然後根據P值大小作出統計學推斷,並作出相應的醫學專業結論。
舉例:
SPSS實現多組率的兩兩比較
pearson卡方
SPSS對原始數據是頻數表的,需進行加權處理(讓軟體橫著看數據)後卡方檢驗。
條件:(1)pearson卡方要求總例數大於40;(2)0 個單元格 (0.0%) 的期望計數小於 5。最小期望計數為 15.25。
資料收集整理來自網路文庫
3. 醫學論文用SPSS分析數據如何選擇方法,醫學數據如何錄入到SPSS分析統計軟體!
SPSS分析,醫學數據錄入與方法選擇,是許多醫學論文撰寫過程中的關鍵環節。在面臨數據分析難題時,SPSS以其全面的功能和用戶友好的界面,成為了數據統計和分析的首選工具。本文旨在提供一個詳細指南,幫助讀者了解如何有效利用SPSS進行醫學數據處理,以及如何在眾多分析方法中做出合適的選擇。
首先,理解SPSS分析的基本概念至關重要。SPSS(Statistical Package for the Social Sciences)是一款廣泛應用於統計分析、數據挖掘和預測分析的專業軟體,因其適用范圍廣、操作界面友好、功能全面而受到眾多用戶的青睞。從數據的錄入到整理,再到深度分析與結果展示,SPSS提供了從數據處理到報告生成的全方位支持。
SPSS分析軟體的特點包括但不限於:
多語言界面:SPSS支持多國語言,其中中文界面清晰友好,滿足了國內用戶在操作過程中對本土語言的需求。
全面的數據分析功能:覆蓋數據採集、管理、准備、分析以及報告等多個階段,支持廣泛的統計分析方法。
便捷的數據准備:SPSS提供了高效的數據管理工具,能夠同時打開多個數據集,方便進行數據比較分析和轉換。
統計技術的綜合運用:除了基本的統計分析方法,SPSS還提供了廣義線性模型、廣義估計方程等高級分析工具,以及多種回歸分析方法。
專業的圖形系統:SPSS具有強大的圖表生成能力,能夠自定義和優化圖表,以直觀的方式展示分析結果。
了解了SPSS的基本功能和特點後,接下來是如何選擇適合的分析方法。方法的選擇主要依據數據類型和研究目的。數據類型主要分為定類、定序和定量三大類,分析方法則分為差異關系、相關關系和影響關系三類。例如,當研究目標在於比較不同分類變數之間的差異時,可以選擇卡方分析或T檢驗;而研究兩個定量變數之間的線性關系時,則應採用相關分析,如皮爾遜相關分析。
在醫學論文撰寫過程中,數據的准確錄入尤為關鍵。對於小型數據集,可以直接在SPSS中錄入數據;對於大型數據集或已有Excel等格式的數據,則可通過導入功能將數據集成至SPSS中。確保數據的完整性、准確性和一致性是成功進行統計分析的前提。
總結而言,SPSS為醫學數據處理提供了強大的工具和便利性。選擇合適的分析方法需要基於數據特性和研究目標。掌握SPSS的基本操作和分析方法,結合醫學專業知識,將有助於提升論文的質量和研究的深度。同時,統計之光提供的進一步指導與服務,可為醫學研究者提供更專業的支持和提升空間。
4. 醫學科研中常用的統計學方法有哪些
正確的統計學分析一定要建立在明確的研究目的和研究設計的基礎之上,那些事先沒有研究目的和研究設計,事後找來一堆數據進行統計分析都是不可取的。 在醫學論文的撰、編、審、讀過程中經常遇到的問題是研究的題目與課題設計、論文內容不符,包括文章的方法解決不了論文的目的、文章的結果說明不了論文的題目、文章的討論偏離了論文的主題;還有是目的不明確、設計不合理。如題目過小,論文不夠字數,而一些無關緊要的變數指標或結果被分析被討論;又如題目過大,論文的全部內容不足以說明研究的目的,使論文的論點難以立足。 所以,合理明確的論文題目或目的以及研究設計方案是撰、編、審、讀者應當關注的首要問題。此外,樣本含量是否滿足,抽樣是否隨機,偏倚是否控制等,也是不可忽視的問題。
2、建好分析用的資料庫
建好資料庫是正確統計分析的前提和基礎,甚至決定了論文分析結果的成敗。對於編、審、讀者來講,一般由於篇幅的限制,往往得不到資料庫數據,而只有作者在資料庫數據基礎上經統計描述計算後給出的諸如各指標均數 x、標准差 s 或中位數 M、百分位數 Px 的「二手」數據,或將研究對象小或特徵屬性分組,清點各組觀察單位出現的個數或頻數的頻數表數據等。 無論是否能夠得到資料庫數據,作者在統計分析過程中一定依據資料庫數據進行計算,得出結果。如果對「二手」數據或頻數表數據的結果等存在疑惑,編輯、審稿專家或讀者有權要求作者提供資料庫數據以檢查其完整性、准確性和真實性,確保研究數據的質量。假若在投稿須知中對資料庫數據作出必要的要求,無疑對於保證刊物的發表質量有著積極的意義
5. 什麼是統計檢驗怎麼選擇統計檢驗方法
統計檢驗亦稱「假設檢驗」。根據抽樣結果,在一定可靠性程度上對一個或多個總體分布的原假設作出拒絕還是不拒絕(予以接受)結論的程序。決定常取決於樣本統計量的數值與所假設的總體參數是否有顯著差異。這時稱差異顯著性檢驗。檢驗的推理邏輯為具有概率性質的反證法。
選擇
顯著性水平和否定域
有了與問題相關的抽樣分布,我們便可以把所有可能的結果分成兩類:一類是不大可能的結果;另一類人們預料這些結果很可能發生。既然如此,如果我們在一次實際抽樣中得到的結果恰好屬於第一類,我們就有理由對概率分布的前提假設產生懷疑。
在統計檢驗中,這些不大可能的結果稱為否定域。如果這類結果真的發生了,我們將否定假設;反之就不否定假設。概率分布的具體形式是由假設決定的,假設肯定不止一個。在統計檢驗中,通常把被檢驗的那個假設稱為零假設(或稱原假設,用符號H0表示),並用它和其他備擇假設(用符號H1表示)相對比。
值得注意的是,假設只能被檢驗,從來不能加以證明。統計檢驗可以幫助我們否定一個假設,卻不能幫助我們肯定一個假設。為了使檢驗更嚴格、更科學,還需要更多的東西。首先,我們必須確定冒犯第一類和第二類錯誤的風險的程度;其次,要確定否定域是否要包含抽樣分布的兩端。
第一類錯誤是,零假設H0實際上是正確的,卻被否定了。第二類錯誤則是,H0實際上是錯的,卻沒有被否定。第二類錯誤是,零假設H0實際上是錯誤的,卻沒有被否定。遺憾的是,不管我們如何選擇否定域,都不可能完全避免第一類錯誤和第二類錯誤,也不可能同時把犯兩類錯誤的危險壓縮到最小。
對任何一個給定的檢驗而言,第一類錯誤的危險越小,第二類錯誤的概率就越大;反之亦然。一般來講,不可能具體估計出第二類錯誤的概率值。第一類錯誤則不然,犯第一類錯誤的概率是否定域內各種結果的概率之和。
由於犯第一類錯誤的危險和犯第二類錯誤的危險呈相背趨向,所以統計檢驗時,我們必須事先在冒多大第一類錯誤的風險和多大第二類錯誤的風險之間作出權衡。被我們事先選定的可以犯第一類錯誤的概率,叫做檢驗的顯著性水平(用α表示),它決定了否定域的大小。
如果抽樣分布是連續的,否定域可以建立在想要建立的任何水平上,否定域的大小可以和顯著性水平的要求一致起來(後面的正態檢驗就如此)。如果抽樣分布是非連續的,就要用累計概率的方法找出一組構成否定域的結果。
即在已知概率分布表上,從兩端可能性最小的概率開始向中心累計,直至概率之和略小於選定的顯著性水平為止。在許多場合,我們能預測偏差的方向,或只對一個方向的偏差感興趣。每當方向能被預測的時候,在同樣顯著性水平的條件下,單側檢驗比雙側檢驗更合適。
因為否定域被集中到抽樣分布更合適的一側,可以得到一個比較大的尾端。這樣做,可以在犯第一類錯誤的危險不變的情況下,減少了犯第二類錯誤的危險。
(5)如何選擇醫學統計方法擴展閱讀
選擇統計檢驗程序的方法時需考慮以下條件:
1、看總體分布是否已知。如果已知,看是不是正態分布。如果已知樣本分布為常態分布就可以選擇參數檢驗法,如果總體分布未知就用非參數檢驗法。
2、在參數檢驗中,如果總體分布為正態,總體方差已知,兩樣本獨立或相關都可以採用Z檢驗;如果總體方差未知,根據樣本方差,採取不同的t檢驗。如果總體分布非正態,總體方差已知,根據樣本獨立或相關採取Z』檢驗;如果總體方差未知,根據獨立和相關採取不同的Z『檢驗。
3、根據題目考慮用單側還是雙側檢驗。
4、在非參數檢驗中,按照兩個樣本相關和不相關、精度與容量等,可以採用符號檢驗、秩和檢驗等方法。