如何选择正确的统计方法(待续)
单变量数据差异比较分析方法综述
11表列联表
二元(多元)数据相关分析方法综述
二、计量数据分析中常见的统计问题
2.1忽略了t检验的前提条件
题目:重症急性胰腺炎并发肝功能不全的临床研究。实验数据如表5所示。原作者用t检验来分析这个数据。请问:这样对吗?
歧视:
1.对表5中的数据进行方差齐性检验,发现两组的血清淀粉酶和肌酐指标均不能满足方差齐性的要求,因此不能用t检验进行分析。
正确的做法:用变量变换使数据服从正态分布且方差齐次,然后进行t检验,否则用非参数检验。
2.给出准确的统计数据和p值。
2.2通过T检验分析和配对设计数据误用分组设计数据
论证:1。考虑到数据转换是正确的。但是,如果使用组T检验,则需要两个总体方差齐性。但本研究是成对设计,如果采用组T检验,会降低检验效率。应使用配对t检验进行分析。注意配对t检验的条件:每对数据的差异(d)要进行正态性检验。如果不是,则使用Wilcoxon符号秩检验。2.应给出准确的统计数据和p值。
2.3忽略方差分析的前提条件
题目:姜黄素抑制晶状体上皮细胞增殖的信号转导机制。
问题:作者消化健康小牛晶状体的混合消化液,收集细胞,传代培养,取第三代细胞做实验。
实验分为三组:空白对照组、模型组和姜黄素组,每组6个样品。
请问:用方差分析正确吗?
判别:本实验分为三组,单因素三水平设计定量数据。首先要检验方差的独立性、正态性和齐性,如果满足方差分析的三个前提条件,就要进行方差分析。如果不是,则使用变量变换或秩和检验。如果p
给出准确的统计数据和p值。
2.4检验分析等级数据的误用
标题:止痛乳参汤保留灌肠治疗CNUP:一项双盲随机安慰剂对照试验。
表4两组主要临床症状及肠黏膜病变肠镜评分
※与对照组(G2)比较,P & gt0.05,两组无显著差异;△:与治疗前相比,P
歧视:
t检验不适用于腹痛、腹泻、脓血便、坠感、充血、水肿、粘膜糜烂、粘膜溃疡的组间比较。因为每个分数都是1,2,3等不连续赋值,所以数据不服从正态分布。将数据整理成分组无序、指标有序的分层数据,采用秩和检验。
在分析“总分”时,应对数据进行正态性和方差齐性检验,然后选择t检验或秩和检验。
与对照组(G2)比较,P & gt0.05,组间差异无统计学意义,无需在备注中表述。
应写出准确的统计数据和p值。
2.5误用T检验处理双因素实验设计的重复测量
题目:益气活血法预防老年髋部手术后下肢深静脉血栓形成
统计处理:采用SPSS10.0统计软件,两组间计量资料比较采用t检验。
判别:本研究的设计类型是:两个因素(加工和时间)重复测量设计数据。
在数据满足“独立性”、“正态性”和“方差齐性”要求的前提下,球面对称的检验,应选择双因素设计的重复测量的方差分析,不宜选择t检验分析数据。
标题:复方苦参注射液对恶性肿瘤患者伽玛刀放疗后T淋巴细胞亚群的影响。
设计:将60例恶性肿瘤患者随机分为两组。实验组在伽玛刀放疗的同时给予复方苦参注射液20ml和生理盐水500ml,静脉滴注1次/d,10天为1个疗程;对照组仅接受伽玛刀放疗。测试结果如表7所示。
请问:统计分析选择T检验是否正确?
歧视:
1.统计分析误差
?在本实验中,每个被试在实验前后两个不同的时间点重复测量同一指标的值,实验前后的数据并不是相互独立的。这种实验设计属于重复测量的实验设计,时间是与重复测量相关的一个检验因素。原作者用t检验的比较割裂了整个设计,无法准确估计和控制误差,所以无法得到可靠的结论。
正确做法:应将表7的表格改为重复测量试验设计的标准表格,并采用相应的方差分析进行数据处理。
2.6误用成对设计数据t检验处理单因素k(k >);3)平面设计数据
原标题:“莪术对在体大鼠子宫肌电活动的影响及其机制研究”。为观察莪术水煎剂对孕鼠子宫肌电活动的影响,将40只大鼠随机分为4组:对照组:给予生理盐水65438±00ml/kg,莪术组:分别给予25%、50%和65438±00ml/kg。观察每只大鼠子宫肌电爆发的峰面积、持续时间和次数。原作者采用配对设计定量资料的T检验进行统计处理,数据见表4。
表莪术汤对大鼠子宫肌电活动的影响(均数±标准差)
歧视:
没有说明大鼠是按照体重等重要的非实验因素作为配伍条件随机分组的。
本数据中有四个剂量,属于单因素四水平设计的定量数据,不能用于成组设计或配对设计的t检验。
措施:在满足正态性和方差齐性两个前提条件的情况下,定量资料的方差分析采用单因素四水平设计,得出有统计学意义的结论后可进一步采用Dunnett检验或LSD检验。
如果在专业上需要同时调查三个指标,还应选择本设计的定量数据的三向方差分析进行数据处理。
三、计数数据分析方法的常见问题
3.1分母在计算相对数时太小。
标题:疏肝利胆中药防治胆固醇结石形成的实验研究。实验数据如表4所示。请问:表达信息怎么了?
歧视:
在计算相对数时,分母太小,相对数不稳定,容易失真,不仅不能正确反映真实情况,而且往往会产生错觉。
在表4中,每组的样本数都小于20,这对于计算比率来说太小了。直接给样品号就行了。
3.2对有序变量的数据误用变量的χ2检验分析结果。
某医生用A、B两种药物治疗某疾病240例,疗效分为治愈、显效、好转、无效四个等级,见表4。R×C表χ2检验显示χ 2 = 53.33,P
歧视:
这个数据属于有序R×C表,临床疗效分级。对于分级数据,可以使用Ridit分析或秩和检验。R×C表χ2检验不是用R×C的χ2检验,而是r×C表χ2检验只能检验两组内部成分是否相同或频数分布是否相同,不能检验疗效是否不同。不难看出,如果将表4中任意两列数字反过来,可以清楚地发现χ2值仍然是53.33,不会发生变化。
3.3误用χ2检验回答相关问题
表1显示了冠状动脉粥样硬化在不同年龄的分布。
以上数据经χ2检验:χ 2 = 163.05438+0,P < 0.005,结论是冠状动脉粥样硬化程度与年龄有关,结合此数据可以看出,冠状动脉粥样硬化程度有随年龄增长而加重的趋势。
问:用于处理这些数据的统计分析方法和得出的结论有什么问题?
1的区分度:
这个数据就是“双向有序、不同属性的二维列联表数据”。处理这些数据有三个目的,所以有三套不同的统计分析方法。
分析不同年龄组患者冠状动脉粥样硬化程度是否存在差异:作为单向有序资料,选择秩和检验。
分析年龄与冠状动脉粥样硬化分级是否存在相关性:选择分级相关性。
线性趋势检验用于分析它们之间是否存在线性趋势。
笔者想考察两个有序变量之间是否存在相关性,χ2检验的结果为P
事实上,如果交换表中任意两行的频率或任意两列的频率,χ2检验的统计值都不会发生变化,这说明χ2检验不适合处理由有序变量构成的二维列联表数据。
歧视2:
为了考察两个有序变量之间是否存在相关性,我们应该选择相关分析方法来分析定性数据,如Spearman秩相关分析、Kendall秩相关分析或典型相关分析。
本例采用Spearman等级相关分析,结果为:rs=0.53215,P
结论是表中两个有序变量之间存在正相关关系,即随着年龄的增长,冠状动脉粥样硬化程度也逐渐增加,两者之间的相关性具有统计学意义。
3.4多值有序变量的高维列联表数据
3.5当不满足连续性χ2测试条件时,不进行校正。
3.6十一种形式的列联表
3.7误用χ2检验代替Fisher精确检验
3.8对R×C表的直接分段进行两两比较。
四、统计分析方法的表达
(1)在统计方法中,注明“使用SPSS软件进行统计处理”。这种说法正确吗?
歧视:
?从这份声明中,我们只能知道原作者使用了什么统计分析软件对数据进行处理,而没有说明清楚软件的版本和序列号;而且也没有反映出本文数据所采用的实验设计类型和具体的统计分析方法。
(2)在统计方法中,注明“计量资料采用方差分析”。请问:这种说法正确吗?
歧视:
从这种说法只能知道作者使用了方差分析来处理定量数据,但这些统计分析方法的选择是否正确不得而知。
一般来说,有三种T检验和10种方差分析可以用来比较平均值之间的差异。两者的本质区别体现在定量数据对应的“实验设计类型”上。
在描述统计方法时,应完整地写出所用的方法,即在实验设计名称前加上统计分析方法,如成对设计定量资料的T检验、成组(或单因素两水平)设计定量资料的T检验或双因素析因设计定量资料的方差分析。
(3)所有定性数据都用χ2检验,对吗?
歧视:
?事实上,定性数据通常可以编制成11列联表。在统计分析中,要根据列联表的不同形式、统计分析的目的和数据的实际前提条件,选择相应的统计分析方法,不能随意盲目选择,更不能把χ2检验作为处理定性数据的通用工具。
(4)在很多论文中,统计数据进行假设检验时,P值只列出P >;0.05或p
假设测试结果正确,表达式为:
?应写描述性统计,如样本均值、比率、相关系数、回归系数、相对风险、中位数效应等。,及其置信区间,检验统计量,如χ2,t,u,f等。)和p值;然后根据P值的大小进行统计推断,做出相应的医学专业结论。
例如:
用SPSS实现多组比率的两两比较
皮尔逊卡方检验
SPSS是原始数据的频率表,需要加权(让软件横向看数据),然后进行卡方检验。
条件:(1)皮尔逊卡方要求病例总数大于40;(2)0个单元格(0.0%)的预期计数小于5。最小预期计数是15.25。
数据收集来自百度文库。