一文学会P trend计算,掌握趋势性分析

  • 2023-03-29 14:10:31
  • 来源:医学论文与统计分析

趋势性分析,是近年来热门的方法,我也挺喜欢。它给一篇论文带来的锦上添花的效果很受用。

网络上教程很多,但大多数只介绍其形而无里,还可能误导研究者开展分析。因此本文我拟借助一篇非常典型的趋势性研究论文,来帮大家从技术层面真正学习到趋势性检验方法。


(相关资料图)

一、什么是P trend?

P trend是一个P值。

该P值是统计学中趋势性检验的结果。医学中的趋势性是事物的结局指标随着原因指标水平改变而发生的线性趋势性改变,反映的是剂量反应关系或者剂量效应关系。

说通俗一些,趋势性反映的是结局变量和原因变量是否存在着线性相关性。但是,趋势性分析常用于当暴露指标或者处理因素变量为有序多分类的情况。在回归分析中,一般要求自变量是有序多分类数据。

趋势性检验,即对这种线性趋势性是否存在着作统计学假设检验,计算P值。如果P<0.05,则说明趋势性成立。

在女性卵巢癌和子宫内膜癌的案例里,运动锻炼时间变量分为<1.5h、1.6-6.0h、6.1-12.0 h、12.1-21.5 h,>21.5 h /week;与<1.5h相比,随运动时间的上升一个等级,研究对象子宫内膜癌的发病相对风险HR值分别为1.0、0.94、0.91、0.91、0.84,HR下降的趋势明显,因此P trend=0.06,提示该下降趋势具有统计学有统计学差异,说明卵巢癌的发病风险有随着运动量增加而减少的趋势。

同时对于卵巢癌来说,其HR值分别是1.0、1.21、1.10、1.22、1.10,P trend=0.44,趋势不明显。

P trend有什么意义?

P trend 主要发挥辅助性的作用,同时增加文章的内容与深度。特别是,在其它主要研究结局未取得统计学意义时,趋势性检验结果可能会带来额外的信息。

同样以子宫内膜癌与运动锻炼时间为例。以不锻炼为对照,其它各组均无统计学意义,但P trend有统计学意义,这也能弥补部分分析的遗憾。

二、什么时候需要开展趋势性检验

趋势性检验在高分SCI论文较为常见。一般来说,无论结局指标是均数、中位数、率、OR值、RR值、HR值,均可以开展趋势性检验

对于自变量或者原因变量而言,一般情况下,趋势性检验发生于原因指标是定量数据或者等级数据的情况下:

1.对于等级变量,根据上述趋势性介绍内容,开展趋势性检验非常常见

2.对于定量变量,同样需要开展趋势性检验,但是,一般都需要现将定量数据转为等级数据,再进行趋势性检验

三、文献解读

这篇论文是欧洲流行病学发表的文章,探讨的是可可类饮食(包括巧克力)能否预防高血压!具体文章下载请见文末。

首先介绍下这篇文章。该文章目的是基于法国的一个前瞻性队列研究,评估从各种食物来源摄入的可可类食物是否与突发性高血压有关。研究调查了45,653名女性,根据208项饮食问卷和24小时回忆法可可类食物摄入量,并使用详细的食物成分表估可可摄入量。研究分析了可可摄入量与高血压发病的关系。

研究可可摄入量与高血压发病的关系采用生存分析,依靠Cox回归来分析可可摄入量能否延缓高血压发病。

在Cox回归中,可可摄入量是定量自变量,关于定量自变量的分析,我在上一文已经介绍(),若怀疑自变量与应变量线性关系不明确,可以考虑采用设置哑变量的方法。就是这样操作的。

Cox proportional hazard models with age as thetimeline and cocoa intake as the exposure variable, considering the lowest consumer group as the reference, were used toassess the risk of incident hypertension.

可可摄入量按照四分位数法,分为四分类数据:

研究基于Cox回归,以Q1为对照,进行了3次回归分析(分别建立纳入不同混杂因素建立了M1、M2、M3三个模型),结果发现,整个队列中的可可消耗中位数在基线时为2.3克/天。可可粉消费量Q3、Q4组,与Q1组相比,可以预防高血压发生(危险比HR Q3 0.93 [0.88:0.98],HR Q4 0.98[0.93:1.03]。此外,作者进行了趋势性检验,结果显示,所有Cox回归模型,均存在着趋势性,也就是说,整体而言,可可消耗量越大,高血压风险越低。

因此,作者对于自变量是定量数据的可可粉,采用了哑变量设置与趋势性检验相结合的方法,应该说,这是一种常见的统计分析方法。

那么如何实现趋势性检验呢?有一些需要注意的事情。在这里,我通过系统的讲解,帮助大家来学习和掌握。

四、如何利用回归进行趋势性分析

对于观察性研究,一般可利用线性、logistic、Cox回归来进行趋势性检验,而且一般和哑变量设置分析结合一起。具体过程如下:

第一步,将定量自变量转为分类变量。在本例,可可摄入根据P25、P50、P75界值转为四分类数据Q1-Q4(产生新变量coco1,数据库赋值1、2、3、4),是为等级自变量。

第二步,分类变量分析,可以设置哑变量分析。因此,可以将Q1组作为对照组,开展哑变量分析(对新变量coco1进行操作)。关于哑变量设置的方法,我在之前文章已经详细介绍了()

第三步,趋势性检验关键一步。很多人开展所谓趋势性检验,就是把等级变量不设哑变量直接纳入回归统计分析,得到的P值被认为就是趋势性检验的结果。不是的!!!趋势性检验不是直接对等级变量进行分析,而是要进一步指定每一个等级的组中值!一般情况下,组中值推荐中位数。比如可可摄入量四组数据组中值分别是0.12、1.26、3.57、9.47,所以产生新的变量Coco2。

所以我们可以在原文的数据结果中发现这么一列(红框):

所以数据库中,Coco2变量不再是1、2、3、4,而是不等距的四个数字。

第四步,建立Cox回归。Coco2不设哑变量,纳入回归直接开展统计分析。最终得到我们上文的回归分析结果。

关于可可类食物与高血压发病的关系,诸位可以下载原文进行学习,具体下载方式见文末。

四、基于案例学习

1

分析案例

例1:研究究高血压患者血压与性别、年龄、身高、体重、户籍等变量的关系,随机测量了32名40岁以上的血压y、年龄X1、体重指数X2、性别X3,户籍X4试建立多重线性回归方程。数据文件见reg.sav。

本例中年龄和体重指数是连续型变量,本文针对体重指数BMI开展分析。 2

趋势性分析数据库构建

对于BMI指数,我们都知道可以分为四类,<18,18.5-24,24-28,>28;所以第一步是转为四分类数据,第二步根据各组数据分布计算中位数。 第一步,转为四分类数据,产生新变量bmi_1。如果用SPSS进行转换,则操作界面在“转换--重新编码为不同变量”。 第二步,分别得到四组数据后,要分别开展中位数的计算。具体操作在,“分析-描述统计-探索”,得到四个组的中位数分别是,17.89,21.00,26.68,31.16。各位可以看出中位数并不是处于中间的值,比如18.5-24这一组别,中位数是21.00。 第三步,对bmi_1进行重新赋值,产生bmi_2。这样数据库就形成了。 3

利用回归方法趋势性检验。

利用回归方法进行趋势性检验,在方法方面比较简单。采用线性回归,直接纳入bmi_1,即可。 结果显示,BMI与血压的趋势性关系,成立,P<0.001.

当然,必须要说明,对于具有原始定量数据的研究,如果我们直接拿bmi原始数据开展线性回归分析,结果是基本一致的。因此对于定量数据的趋势性,无论是bmi_2,还是bmi变量均可以。

趋势性检验不能直接拿等级变量bmi_1(分为1、2、3、4四个)等级来进行分析。为什么?因为bmi四分组之间,是不等距的。若纳入bmi_1作为自变量进行分析,则视为等距的趋势性分析。这样的结果不准确。

五、小结

对于观察性

1. 为什么定量数据不是直接拿出来开展做线性回归,而要进行类化哑变量设置,再进行趋势性检验?

很多时候当自变量以连续型变量的形式引入模型时,其意义解释为该自变量每增加1个单位,所引起的因变量Y的变化(β),但实际上这种变化效应有时是很微弱的,并没有太大的临床意义,因此需要对连续型变量进行适当的转化。

此外,如果直接将原始的连续型变量带入到回归模型中,其前提是已经假定该连续型自变量与因变量之间存在着一定的线性关系。但是,当自变量与因变量之间的相互变化关系不明确时,以连续型变量带入模型可能会不太准确。

2. 分组后做趋势和直接做趋势性各有什么优缺点?

分组后的趋势性检验,往往基于组中值,比如基于各分组的中位数值进行趋势性分析,其实结果与拿原始值进行趋势性分析相似,但它可以避免异常值极端值对结果造成影响。缺点是损失了部分信息。

3.对于无原始数据的区间等级数据或者等级数据,趋势性分析一定要谨慎

比如BMI指数,只有<18,18.5-24,24-28,>28,而没有BMI原始数据,在这种情况下,趋势性检验是按照1、2、3、4四个等距分组进行分析的。其结论能否说明BMI与血压线性趋势成立呢?这很难说清楚。比如以下的趋势性分析结果,如果作者未进行组中值的设置,将饮酒(Alcohol)、体育锻炼(Physical ativty)、BMI作为等级变量直接进行趋势性分析,则下结论需要谨慎

同样另外一个例子,对阴性、低、中、高的的分趋势性分析结果,同样谨慎看待。

因此,等级数据直接开展趋势性一定谨慎。如果有条件,应该取区间中间值代替1、2、3、4。如果等级资料不等距,且无法取中间值,则不应该开展趋势性分析。

4. 除了回归进行趋势性分析,还有什么方法?

还有利用方差分析开展的趋势性检验,和利用卡方检验、利用秩相关进行的趋势性检验。详细可以见本人的另外一篇推文:

关键词:

Copyright  @  2015-2022 太平洋包装网  版权所有  备案号: 豫ICP备2022016495号-17   联系邮箱:93 96 74 66 9@qq.com