医学论文中定量资料统计分析方面的错误辨析与释疑

时间:2020-10-08 17:34:07 药学毕业论文 我要投稿

医学论文中定量资料统计分析方面的错误辨析与释疑

【关键词】 统计学; 医学; 论文; 统计分析; 非参数统计
  1 问题的提出

  在医学论文或稿件中,若观测结果是定量资料,常需要在不同实验条件下比较其平均值之间的差别是否具有统计学意义,此时,称为定量资料的统计分析。如何才能正确地实现定量资料的统计分析呢?关键是两点:其一,检查定量资料是否满足参数检验的前提条件;其二,正确辨析定量资料所对应的实验设计类型。第一点常可通过统计软件来实现,而第二点则需要分析资料的人具有这方面知识,才有可能合理选择统计分析方法。然而,只要科研课题涉及到两个或两个以上因素时,实际工作者能正确判定其实验设计类型的场合少得可怜,因此,在医学论文或稿件中,这方面的错误不计其数。概括起来说,不外乎有以下两类错误:(1)当定量资料不满足参数检验的前提条件(独立性、正态性和方差齐性)时,盲目套用参数检验方法(通常为特定设计下定量资料的t检验或方差分析);(2)不管定量资料对应的实验设计类型是什么,一律套用单因素两水平(或叫成组)设计定量资料的检验方法(如t检验或秩和检验)或单因素多水平设计定量资料的分析方法(如单因素多水平设计定量资料的方差分析或秩和检验)。其结果是所得出的结论可信度低,甚至是错误的[1,2]。
  2 中西医结合治疗实例

  例1 某临床医生收集了如下的资料(表1),在各组内进行配对设计定量资料的t检验,在任何两组之间,用差量进行成组设计定量资料的t检验。请问:错在哪?正确的做法是什么?

  对差错的辨析与释疑 原作者的做法是错误的!因为这样做割裂了整体设计,每次分析时,仅用了部分数据,数据的利用低,自由度小,结论的可信度低;无法分析药物种类与测定时间之间的交互作用。正确的做法是:先检查资料是否具备参数检验的前提条件,然后正确判定资料所对应的实验设计类型。假定本例中的定量资料满足参数检验的前提条件,而实验设计类型表面上看是“4个自身配对设计”同时存在,应叫做“具有一个重复测量的两因素设计(其中,测定时间因素与重复测量有关,除此因素之外,还有一个‘药物种类’因素)”。正确的统计分析方法为“具有一个重复测量的两因素设计定量资料的方差分析”。对本例而言,更合适的分析策略是:将“治疗前”视为“协变量”,即设法使各药物组治疗前尽可能取相等的平均水平,从而推算出治疗后的平均测定结果(称为校正的平均值),提高各药物组之间的可比性,其统计分析方法叫做“单因素4水平设计定量资料的一元协方差分析”(每次只分析一个定量指标);若每次需要同时分析3个定量观测指标,其统计分析方法可叫做“带有一个协变量的单因素4水平设计定量资料3元方差分析”。
  表1 各组治疗前后肝功能检测结果比较(略)
  例2 很多人用成组设计定量资料的t检验和单因素多水平设计定量资料的方差分析处理表2资料。请辨析:这样做错在哪里?为什么?正确的统计分析方法是什么?
  表2 两组不同组织类型的NSCLC肺部ROI的Max SUV和Mean SUV比较(略)
  对差错的辨析与释疑 表2中最后两列为两个定量的观测指标,原则上,当实验中涉及两个或两个以上定量指标时,看专业上是否需要同时考察它们的变化,若不需要,就视为两个一元定量资料;若需要,就视为一个二元定量资料。关键是检查资料的前提条件(此处从略)和正确判定定量资料所对应的实验设计类型,以下就不再赘述了。原作者所用的两种统计分析方法都属于分析单因素设计定量资料的统计分析方法,是不正确的。属于未正确辨析实验设计类型,就盲目套用统计分析方法的一种坏习惯,其结论是不可信的。该定量资料中涉及两个实验因素,一个是中医上的分型(非血瘀证与血瘀证),另一个是癌细胞类型。两个因素共有6种水平组合,各组合下都有一组独立的患者,两个因素同时出现在实验中,尚无专业知识保证它们对观测指标的影响谁是主要或次要,故这个定量资料所对应的实验设计类型应叫做两因素析因设计或叫2×3析因设计,当定量资料满足参数检验的前提条件时,以选用相应设计定量资料的方差分析处理为宜。例3 很多人用成组设计定量资料的t检验和单因素多水平设计定量资料的方差分析处理表3资料。请辨析:这样做错在哪里?为什么?正确的统计分析方法是什么?