当前位置: 首页 >> 期刊导航 >> 医药卫生 >> 护理学 >> 《中西医结合护理》 >> 中西医结合护理2023年9期 >> 实例分析二元Logistic回归中变量的筛选与方法的选择一例

中西医结合护理2023年9期

  • 学科:
  • 刊期:
  • 收录:
  • 地区:
  • 主管单位:
  • 主办单位:
  • 主编:
内容简介

实例分析二元Logistic回归中变量的筛选与方法的选择一例

2023-08-24 01:08:15 中西医结合护理2023年9期 阚啸亮 伍春妍
资料简介

摘要:

武汉亚心总医院湖北省 武汉市 430056【摘要】目的 探索logistic回归分析变量的筛选与方法的选择。方法 收集某医院3年收治的141例A型主动脉夹层患者术前12小时内最近一次血常规及凝血检查为自变量,以成人心脏手术围术期出血通用定义4级大量出血为终点事件,采用全变量及单因素分析筛选变量,

实例分析二元Logistic回归中变量的筛选与方法的选择一例

阚啸亮 伍春妍

武汉亚心总医院  湖北省  武汉市  430056

 【摘要】目的 探索logistic回归分析变量的筛选与方法的选择。方法 收集某医院3年收治的141例A型主动脉夹层患者术前12小时内最近一次血常规及凝血检查为自变量,以成人心脏手术围术期出血通用定义4级大量出血为终点事件,采用全变量及单因素分析筛选变量,分别纳入Enter法及6种逐步回归法进行二元logistic回归分析,比较不同方法的分析结果,从本研究目的出发,选择结果变量在实际医疗过程中与研究目的最为密切的方法得出的结果。结果 全变量-Enter法的预测模型综合检验系数(χ2=39.343)与AUC(0.810)最高,全变量-Enter法与全变量-向后逐步回归法假阴性率最小(58.3),但结合医学文献[1,2]显示向后逐步回归法的得出结果凝血酶时间、纤维蛋白原、血小板与研究目的出血关系更密切,故选择该结果。结论 多因素二元Logistic回归分析在实际医学研究中的情况复杂,纳入的变量不能只选择单因素分析有意义的变量,应行全变量统计;而回归检验应选择逐步回归法,各步骤应结合实际研究的目的及生理学机制等专业知识进行综合分析,才能得出合理的分析结果。

【关键词】logistic回归;变量筛选;逐步回归法

 

二元logistic回归分析是医学常用的统计学分析方法,用于分析出危险因素以便制定早期预防策略。然而因为纳入自变量之间产生校正关系、选择逐步回归方法不一致,得出结果也常不一致。本研究通过实际数据分析,探索多因素二元logistic回归分析的变量筛选与方法的选择。

一般资料 搜集某医院3年内141例A型主动脉夹层患者,其中术后大量出血48例,非大量出血93例,搜集性别、年龄、身高、体重、BMI、手术开始前12小时内最近一次血常规、血小板计数及压积、红细胞计数及压积、INR、部分凝血活酶时间、纤维蛋白原、凝血酶时间、血浆凝血酶原时间、凝血酶原活动度、血浆抗凝血酶活性、因子Ⅷ活性、D-二聚体共18个自变量因素,使用近似的麻醉及体外循环用药及管理方法、手术及缝合方式,术者是一名20余年经验的心血管主任医师,以成人心脏手术围术期出血通用定义4级大量出血为终点事件。

统计方法 计量变量采用单样本K-S检验,正态分布的变量行独立样本t检验,非正态分布的变量采用非参数秩和检验;计数变量采用四格表Pearson χ2检验。以P<0.1筛选出具有统计学意义的变量。行二元Logistic回归检验分别纳入全部变量与筛选的变量,方法使用Enter、向前-条件、向前-LR、向前-Wald、向后-条件、向后-LR、向后-Wald共7种方法,比较14个预测模型拟合优度、AUC、假阴性率等。

结果 选择全变量逐步回归法的结果,凝血酶时间为本研究的危险因素,纤维蛋白原与血小板计数为保护因素,身高、BMI为影响因素;向前逐步回归法结果最差,向后逐步回归法与Enter法结果接近,尚需在具体研究上区别分析;尚不能发现条件、LR、wald三种方法的区别;若只纳入单因素分析有统计学意义的变量进行回归检验,会导致身高的变量被忽略;若只看重回归分析数据,不结合专业知识,会导致血小板计数的变量遗漏。

讨论

行Logistic回归检验前,多数研究均对纳入变量先行单因素分析,对无意义的变量不纳入分析,本研究单因素分析身高和BMI,p分别为0.387和0.025,只纳入单因素分析有意义的变量行Logistic分析,身高就没机会进入回归模型,从而影响结果,而根据文献[2]研究,身高和BMI是本研究的危险因素。因此,不应随意舍弃单因素分析无意义的变量,避免漏掉重要的危险因素。

本研究中全变量-Enter法、筛选变量-Enter法及全变量-向后逐步回归法,模型综合检验系数分别是39.94、33.77、32.63,拟合优度分别为6.28、12.59、12.14,AUC分别为0.81、0.79、0.75,模型预测能力分别为74.5、70.2、75.2,均有各自优势点。高灵敏度能帮助研究者准确预测结果,本研究预测模型里即更早准备血制品及止血药物,处理围术期大出血的发生并避免不良预后的发展,而低假阴性率能帮助研究者尽可能少地碰到出现围术期出血而需要紧急制备血制品,避免因血制品解冻时间延搁、大量出血进一步加重导致其他并发症发生的患者出现。故本研究从实际工作效果出发,认为假阴性率较灵敏度更重要。本研究假阳性率显示全变量-Enter法和全变量-向后逐步回归法相同为58.3%最小。而根据文献[1]表明,血小板计数与本研究关系紧密,不能被舍弃。

综上所述,Logistic回归分析应纳入全变量分析;向前逐步回归法结果最差;向后逐步回归法与Enter法结果接近,尚需在具体研究上区别分析。Logistic回归分析应结合专业知识与实际研究目的来确定危险因素。

 

[1] 万学红, 卢雪峰. 诊断学.第9版[M]. 人民卫生出版社, 2018.

[2] Petrou A, Tzimas P, Siminelakis S. Massive bleeding in cardiac surgery. Definitions, predictors and challenges. Hippokratia. 2016 Jul-Sep;20(3):179-186.