1. 医学统计方法该如何选择
医学统计方法该如何选择
基本的医学统计方法有很多,如样本均数与已知样本均数比较、两样本均数比较、多个样本均数的比较、两个样本率的比较、多个样本率的比较、两组或多组构成比的比较、非参数检验、多因素桐困轿资料的方差分析等。如果对于统计方法没有一个整体的把握和认识,可能就会局肆出现误用滥用统计方法的情况。下面是我为大家带来的.关于医学统计方法该如何选择的知识,欢迎阅读。
统计学的基本概念
1、小概率事件
如果事先假定发生概率最多为0.05的事件为小概率事件,那么根据小概率事件原理,即“小概率事件在一次随机试验中几乎不可能发生”。假设检验就是根据小概率事件原理对该假设进行推断。
2、非参数统计
统计学上,对总体的分布不做假设或仅作非常一般性假设条件下的统计推断方法称为“非参数统计”。非参数统计方法很多,应用较多的包括
配对设计资料的Wilcoxon符号秩和检验、单样本的Wilcoxon符号秩和检验、完全随机设计两独立样本的Wilcoxon符号秩和检验、完全随机设计多个独立样本的Kruskal-Wallis秩和检验和随机化区组设计资料的Friedman秩和检验。
3、实验研究三要素
实验研究三要素包括:处理因素、实验对象、实验效应。处理因素有单因素、多因素;实验对象的设计方式有完全随机、配对或随机区组;实验效应通过观察指标来表达,而观察指标又可分为计量、计数或等级资料。这三者的不同组合决定了选用不同的统计方法。
单变量统计方法选择的一般原则
1.影响因素是单因素还是多因素
2.判断拟分析的资料属尺竖于哪种类型:计量、计数还是等级资料
3.资料是单一样本、两组样本还是多组样本
4.判断资料所属的设计方式,是完全随机、配对还是随机区组
5.判断资料是否符合拟采用的统计分析方法的应用条件,必要时可考虑变量变换
多变量统计方法的选择
在医学研究中,特别是在临床研究中,每个观察对象记录的观察指标往往不止1个,即有多个反应变量。分析变量间的相互关系是探索疾病病因的重要途径,多参数统计方法常用于这类研究问题的分析。
在医学科研中,常用的多参数统计方法有3种:多元线性回归、Logistic回归分析和生存分析。
多元线性回归要求应变量是连续型变量,但是在医学研究中经常遇到的应变量为非连续的分类变量,如某种疾病的患病与否,器官移植之后是生存还是死亡。
研究分类应变量与诸多自变量间的相互关系,进行疾病的病因分析常选用Logistic回归分析。
在医学随访研究中,不仅要看是否出现了某种结局(如器官移植后是否死亡),还要考虑出现这些结局所经历的时间长短。生存分析就是将观察结局和出现这一结局所经历的时间结合起来分析的一种统计分析方法。
;2. 如何正确选择统计方法(to be continued)
资料类型设计方案实验分组检验条件
单变量资料差异比较的分析方法小结
11种形式的列联表
双变量(多变量)资料的关联性分析方法小结
二、计量资料分析常见的统计问题
2.1 忽视t检验的前提条件
文题:重症急性胰腺炎并发肝功能不全的临床研究。实验数据见表5。原文作者用t检验分析此资料。请问:这样做正确吗?
辨析:
1.对表5数据进行方差齐性检验,可发现两组患者的血清淀粉酶和肌酐指标不能满足方差齐性的要求,故不能采用t检验进行分析。
正确的做法:采用变量变换使数据服从正态分布且方差齐,然后进行t检验,否则,采用非参数检验。
2.给出确切的统计量和P值。
2.2 误用成组设计资料的t检验分析配对设计资料
辩析: 1.考虑到对数据进行变换是正确的。但是如果采用成组t检验,还需要两总体方差齐性。 但本研究是配对设计,如果采用成组t检验,会降低检验效率。应该采用配对t检验进行分析。注意配对t检验的条件:要对每对数据的差值(d)进行正态性检验。如果不满足,改用Wilcoxon符号秩检验。2.应给出确切的统计量和P值。
2.3 忽视方差分析的前提条件
文题:姜黄素抑制晶状体上皮细胞增殖的信号转导机制。
问题:作者取健康小牛眼晶状体的混合消化液消化后,收集细胞,进行传代培养,取第三代细胞进行实验。
实验分3组:空白对照组、模型组、姜黄素组,每组设6个样本。
请问:采用方差分析正确吗?
辨析:此实验分3组,应为单因素三水平设计定量资料,应首先进行“独立性”、“正态性”和“方差齐性”检验,如果满足方差分析的3个前提条件则用方差分析;如果不满足,则采用变量变换或秩和检验。如果P<0.05,则进行多组均数间的多重比较。
给出确切的统计量和P值。
2.4 误用t检验分析等级资料
文题:止痛如神汤保留灌肠治疗CNUP:双盲随机安慰剂对照试验
表4 两组临床主要症状和结肠镜肠粘膜病变评分
※:与对照组(G2)比较,P>0.05,组间差异无统计学意义;△:与治疗前比较,P<0.05,组内差异有统计学意义;▲:与对照组(G2)比较,P<0.05,组间差异有统计学意义。
辨析:
对于腹痛、腹泻、脓血便、下坠感、充血、水肿、粘膜糜烂、粘膜溃疡的单项评分组间比较,不宜用t检验。因为每项评分为1、2、3等不连续的赋值,数据资料不服从正态分布。应将数据整理成分组无序指标有序的等级资料,宜采用秩和检验。
分析“总评分”时,应对数据进行正态性和方差齐性检验后,决定选用t检验或秩和检验。
与对照组(G2)比较,P>0.05,组间差异无统计学意义,不必在备注中表示。
应写出确切的统计量和P值
2.5 误用t检验处理重复测量的两因素试验设计
文题:益气活血法预防老年患者髋部术后下肢深静脉血栓形成
统计学处理:采用SPSS10.0统计软件,两组间计量资料比较用t检验。
辨析:本研究设计类型为:两因素(处理和时间)重复测量设计资料。
在资料满足“独立性”、“正态性”和“方差齐性”的前提条件下,及进行球对称检验,应选用两因素设计的重复测量的方差分析,选用t检验分析该资料是不妥的。
文题:复方苦参注射液对恶性肿瘤患者伽玛刀放射治疗后T淋巴细胞亚群的影响。
设计:作者选取60例恶性肿瘤患者,随机分成2组。试验组在伽玛刀放射治疗的同时给予复方苦参注射液20ml加入生理盐水500ml,静脉滴注,1次/d,10d为1个疗程;对照组仅给予伽玛刀放射治疗。试验结果见表7。
请问:统计分析方法选用t检验正确吗?
辨析:
1.统计分析错误
本试验中,每位受试者在试验前、后两个不同的时间点上被重复测量了同一个指标的数值,试验前与试验后的数据并不相互独立,这种试验设计类型属于具有重复测量的试验设计,时间是一个与重复测量有关的试验因素。原作者用t检验进行两两比较,则割裂了整体设计,不能准确地估计和控制误差,因而不能得到可靠的结论。
正确的做法:应将表7的形式改成重复测量试验设计的标准形式,采用与之对应的方差分析进行数据处理。
2.6 误用配对设计资料的t检验处理单因素k(k>3)水平设计的资料
原文题目:“莪术对大鼠在体子宫肌电活动的影响及其机制研究”,文章为观察莪术水煎剂对未孕大鼠子宫肌电活动的影响,40只大鼠被随机分成4组,对照组:按10ml/kg鼠重灌服生理盐水,莪术组:按10ml/kg鼠重分别灌服25% 、50% 、100%莪术水煎液分成3组。观察每个大鼠子宫肌电爆发波的峰面积、持续时间和个数。原作者应用配对设计定量资料的t检验进行统计处理,资料见表4。
表 莪术水煎剂对大鼠子宫肌电活动的影响(均数±标准差)
辨析:
没有交待将大鼠按体重等重要的非实验因素作为配伍条件进行随机区组。
本资料有四个剂量,属于单因素四水平设计的定量资料,不可以用成组设计或配对设计的t检验。
措施:如果满足正态性和方差齐性两个前提条件,应用单因素四水平设计定量资料的方差分析,在得出有统计学意义的结论后,还可进一步采用Dunnett t检验或LSD检验。
如果在专业上有必要对3项指标同时进行考察,还应选用该设计的定量资料的三元方差分析对资料进行处理。
三、计数资料分析方法的常见问题
3.1 计算相对数时分母太小
文题:疏肝利胆中药防治胆固醇结石形成的实验研究。实验数据见表4。请问:在表达资料方面有何不妥之处?
辨析:
计算相对数时,分母过小,相对数很不稳定,易失真,不但不能正确反映事实真相,还往往会造成错觉。
在表4中,各组样本例数都小于20,样本例数偏小,不宜计算率,直接给出例数就可以。
3.2 误用χ2 检验分析结果变量为有序变量的资料
某医生用A、B两药治疗某病各240例,其疗效分为四个等级:痊愈、显效、好转、无效,见表4。经R×C表χ2检验,χ2=53.33 ,P <0.01 ,认为两组疗效之间的差异有统计学意义。
辨析:
本资料属于单项有序的R×C表,临床疗效有等级之分,对于等级资料可采用Ridit分析或秩和检验。而不应用R×C的χ2检验,R×C表χ2 检验只能检验两组内部构成是否相同或频数的分布是否相同,不能检验疗效有无差别。不难看出,若对表4资料任意两列数字进行对换,可以清楚地发现,χ2值仍为53.33,不会有改变。
3.3 误用χ2检验回答相关性问题
表 不同年龄冠状动脉粥样硬化程度的分布
上述资料用χ2检验得:χ2 =163.01,P<0.005,结论为:可认为冠状动脉硬化的程度与年龄有关,结合本资料可见冠状动脉硬化等级有随年龄增高而增加的趋势。
问:处理此资料所用的统计分析方法以及所得出的结论有何不妥之处?
辨析1:
本资料为“双向有序且属性不同的二维列联表资料”,处理这种资料有3个目的,因此,就对应着3套不同的统计分析方法。
分析不同年龄组患者冠状动脉硬化等级之间有无差别:看作单向有序资料,选用秩和检验。
分析年龄与冠脉硬化等级间有无相关关系:选用等级相关。
分析两者间是否存在线性变化趋势则应用线性趋势检验。
作者欲考察“两个有序变量之间是否呈相关关系”,而χ2检验结果是P<0.05,说明冠状动脉硬化患者在不同年龄组的人数分布是不同的。
事实上,若将表中任何两行的频数互换或将任何两列的频数互换,所得的χ2检验的统计量数值是不会变化的,说明χ2检验用于处理有序变量形成的二维列联表资料是不合适的。
辨析2:
欲考察“两个有序变量之间是否呈相关关系”,应选用分析定性资料的相关分析方法,如:Spearman秩相关分析,Kendall秩相关分析或典型相关分析。
本例采用Spearman秩相关分析,得:rs=0.53215,P<0.0001。
结论为:表中两个有序变量之间呈正相关关系,即随着年龄的增加冠状动脉硬化等级也逐渐增大,两者之间的相关关系具有统计学意义。
3.4 多值有序变量的高维列联表资料
3.5 不满足连续性χ2检验条件时未做校正
3.6 十一种形式的列联表
3.7 误用χ2检验取代Fisher精确检验
3.8 对R×C表直接分割进行两两比较
四、统计分析方法表述问题
(1)在统计学方法中注明“采用SPSS软件进行统计学处理”。此表述正确吗?
辨析:
从该表述中只能得知原作者采用了什么统计分析软件处理数据,没有交代清楚软件的版本和序列号;更未体现出文中资料所对应的实验设计类型和所采用的具体统计分析方法。
(2)在统计学方法中注明“计量资料采用方差分析”。请问:此表述正确吗?
辨析:
从该表述中只能得知作者处理定量资料用了方差分析,至于这些统计分析方法的选用是否正确,则不得而知。
通常情况下,比较各平均值之间的差别是否具有统计学意义,可能会用到的t检验有3种,方差分析有10种之多,他们之间的本质区别体现在定量资料所对应的“实验设计类型”上。
在表述统计学方法时,应将所用方法写完整,即在统计分析方法前冠以实验设计名称,如配对设计定量资料的t检验、成组(或单因素两水平)设计定量资料的t检验或两因素析因设计定量资料的方差分析。
(3)定性资料一律采用χ2检验,对吗?
辨析:
事实上,定性资料通常可以编制成11种形式的列联表。在进行统计分析时,应针对不同形式的列联表、统计分析目的和资料实际具备的前提条件,选用相应的统计分析方法,不可随意盲目选用,更不应将χ2检验视为处理定性资料的万能工具。
(4)许多论文中,当统计数据经假设检验后,P值仅仅列出P >0.05或P<0.05 、P<0.01便称结果无显着差异,或结果非常显着。
假设检验结果正确的表达方法是:
应写出描述性统计量,如样本均数、率、相关系数、回归系数、相对危险度、半数效量等,及其可信区间、检验统计量,如χ2、t、u、F 值等)、P值;然后根据P值大小作出统计学推断,并作出相应的医学专业结论。
举例:
SPSS实现多组率的两两比较
pearson卡方
SPSS对原始数据是频数表的,需进行加权处理(让软件横着看数据)后卡方检验。
条件:(1)pearson卡方要求总例数大于40;(2)0 个单元格 (0.0%) 的期望计数小于 5。最小期望计数为 15.25。
资料收集整理来自网络文库
3. 医学论文用SPSS分析数据如何选择方法,医学数据如何录入到SPSS分析统计软件!
SPSS分析,医学数据录入与方法选择,是许多医学论文撰写过程中的关键环节。在面临数据分析难题时,SPSS以其全面的功能和用户友好的界面,成为了数据统计和分析的首选工具。本文旨在提供一个详细指南,帮助读者了解如何有效利用SPSS进行医学数据处理,以及如何在众多分析方法中做出合适的选择。
首先,理解SPSS分析的基本概念至关重要。SPSS(Statistical Package for the Social Sciences)是一款广泛应用于统计分析、数据挖掘和预测分析的专业软件,因其适用范围广、操作界面友好、功能全面而受到众多用户的青睐。从数据的录入到整理,再到深度分析与结果展示,SPSS提供了从数据处理到报告生成的全方位支持。
SPSS分析软件的特点包括但不限于:
多语言界面:SPSS支持多国语言,其中中文界面清晰友好,满足了国内用户在操作过程中对本土语言的需求。
全面的数据分析功能:覆盖数据采集、管理、准备、分析以及报告等多个阶段,支持广泛的统计分析方法。
便捷的数据准备:SPSS提供了高效的数据管理工具,能够同时打开多个数据集,方便进行数据比较分析和转换。
统计技术的综合运用:除了基本的统计分析方法,SPSS还提供了广义线性模型、广义估计方程等高级分析工具,以及多种回归分析方法。
专业的图形系统:SPSS具有强大的图表生成能力,能够自定义和优化图表,以直观的方式展示分析结果。
了解了SPSS的基本功能和特点后,接下来是如何选择适合的分析方法。方法的选择主要依据数据类型和研究目的。数据类型主要分为定类、定序和定量三大类,分析方法则分为差异关系、相关关系和影响关系三类。例如,当研究目标在于比较不同分类变量之间的差异时,可以选择卡方分析或T检验;而研究两个定量变量之间的线性关系时,则应采用相关分析,如皮尔逊相关分析。
在医学论文撰写过程中,数据的准确录入尤为关键。对于小型数据集,可以直接在SPSS中录入数据;对于大型数据集或已有Excel等格式的数据,则可通过导入功能将数据集成至SPSS中。确保数据的完整性、准确性和一致性是成功进行统计分析的前提。
总结而言,SPSS为医学数据处理提供了强大的工具和便利性。选择合适的分析方法需要基于数据特性和研究目标。掌握SPSS的基本操作和分析方法,结合医学专业知识,将有助于提升论文的质量和研究的深度。同时,统计之光提供的进一步指导与服务,可为医学研究者提供更专业的支持和提升空间。
4. 医学科研中常用的统计学方法有哪些
正确的统计学分析一定要建立在明确的研究目的和研究设计的基础之上,那些事先没有研究目的和研究设计,事后找来一堆数据进行统计分析都是不可取的。 在医学论文的撰、编、审、读过程中经常遇到的问题是研究的题目与课题设计、论文内容不符,包括文章的方法解决不了论文的目的、文章的结果说明不了论文的题目、文章的讨论偏离了论文的主题;还有是目的不明确、设计不合理。如题目过小,论文不够字数,而一些无关紧要的变量指标或结果被分析被讨论;又如题目过大,论文的全部内容不足以说明研究的目的,使论文的论点难以立足。 所以,合理明确的论文题目或目的以及研究设计方案是撰、编、审、读者应当关注的首要问题。此外,样本含量是否满足,抽样是否随机,偏倚是否控制等,也是不可忽视的问题。
2、建好分析用的数据库
建好数据库是正确统计分析的前提和基础,甚至决定了论文分析结果的成败。对于编、审、读者来讲,一般由于篇幅的限制,往往得不到数据库数据,而只有作者在数据库数据基础上经统计描述计算后给出的诸如各指标均数 x、标准差 s 或中位数 M、百分位数 Px 的“二手”数据,或将研究对象小或特征属性分组,清点各组观察单位出现的个数或频数的频数表数据等。 无论是否能够得到数据库数据,作者在统计分析过程中一定依据数据库数据进行计算,得出结果。如果对“二手”数据或频数表数据的结果等存在疑惑,编辑、审稿专家或读者有权要求作者提供数据库数据以检查其完整性、准确性和真实性,确保研究数据的质量。假若在投稿须知中对数据库数据作出必要的要求,无疑对于保证刊物的发表质量有着积极的意义
5. 什么是统计检验怎么选择统计检验方法
统计检验亦称“假设检验”。根据抽样结果,在一定可靠性程度上对一个或多个总体分布的原假设作出拒绝还是不拒绝(予以接受)结论的程序。决定常取决于样本统计量的数值与所假设的总体参数是否有显着差异。这时称差异显着性检验。检验的推理逻辑为具有概率性质的反证法。
选择
显着性水平和否定域
有了与问题相关的抽样分布,我们便可以把所有可能的结果分成两类:一类是不大可能的结果;另一类人们预料这些结果很可能发生。既然如此,如果我们在一次实际抽样中得到的结果恰好属于第一类,我们就有理由对概率分布的前提假设产生怀疑。
在统计检验中,这些不大可能的结果称为否定域。如果这类结果真的发生了,我们将否定假设;反之就不否定假设。概率分布的具体形式是由假设决定的,假设肯定不止一个。在统计检验中,通常把被检验的那个假设称为零假设(或称原假设,用符号H0表示),并用它和其他备择假设(用符号H1表示)相对比。
值得注意的是,假设只能被检验,从来不能加以证明。统计检验可以帮助我们否定一个假设,却不能帮助我们肯定一个假设。为了使检验更严格、更科学,还需要更多的东西。首先,我们必须确定冒犯第一类和第二类错误的风险的程度;其次,要确定否定域是否要包含抽样分布的两端。
第一类错误是,零假设H0实际上是正确的,却被否定了。第二类错误则是,H0实际上是错的,却没有被否定。第二类错误是,零假设H0实际上是错误的,却没有被否定。遗憾的是,不管我们如何选择否定域,都不可能完全避免第一类错误和第二类错误,也不可能同时把犯两类错误的危险压缩到最小。
对任何一个给定的检验而言,第一类错误的危险越小,第二类错误的概率就越大;反之亦然。一般来讲,不可能具体估计出第二类错误的概率值。第一类错误则不然,犯第一类错误的概率是否定域内各种结果的概率之和。
由于犯第一类错误的危险和犯第二类错误的危险呈相背趋向,所以统计检验时,我们必须事先在冒多大第一类错误的风险和多大第二类错误的风险之间作出权衡。被我们事先选定的可以犯第一类错误的概率,叫做检验的显着性水平(用α表示),它决定了否定域的大小。
如果抽样分布是连续的,否定域可以建立在想要建立的任何水平上,否定域的大小可以和显着性水平的要求一致起来(后面的正态检验就如此)。如果抽样分布是非连续的,就要用累计概率的方法找出一组构成否定域的结果。
即在已知概率分布表上,从两端可能性最小的概率开始向中心累计,直至概率之和略小于选定的显着性水平为止。在许多场合,我们能预测偏差的方向,或只对一个方向的偏差感兴趣。每当方向能被预测的时候,在同样显着性水平的条件下,单侧检验比双侧检验更合适。
因为否定域被集中到抽样分布更合适的一侧,可以得到一个比较大的尾端。这样做,可以在犯第一类错误的危险不变的情况下,减少了犯第二类错误的危险。
(5)如何选择医学统计方法扩展阅读
选择统计检验程序的方法时需考虑以下条件:
1、看总体分布是否已知。如果已知,看是不是正态分布。如果已知样本分布为常态分布就可以选择参数检验法,如果总体分布未知就用非参数检验法。
2、在参数检验中,如果总体分布为正态,总体方差已知,两样本独立或相关都可以采用Z检验;如果总体方差未知,根据样本方差,采取不同的t检验。如果总体分布非正态,总体方差已知,根据样本独立或相关采取Z’检验;如果总体方差未知,根据独立和相关采取不同的Z‘检验。
3、根据题目考虑用单侧还是双侧检验。
4、在非参数检验中,按照两个样本相关和不相关、精度与容量等,可以采用符号检验、秩和检验等方法。