邱海龙1,2,3 , 岑坚正1,2,3 , 庄建1,2,3
1. 南方医科大学附属广东省人民医院(广东省医学科学院)
2. 广东省心血管病研究所
3. 华南结构性心脏病重点实验室 心血管人工智能与三维技术实验室
基于本中心肺动脉闭锁合并室间隔缺损和粗大主肺侧支血管(PA-VSD-MAPCAs)病例的术前真实世界数据,利用机器学习模型筛选有效的预测因子,并建立根治预测模型和生存分析。
纳入2010年1月至2018年10月在本中心被诊断为PA-VSD-MAPCAs且首次接受外科手术的患者(经过纳排标准筛选后入组70例),统计基本情况、实验室检查、心脏超声和CT等指标;将70例数据随机分为训练组(40例)和测试组(30例);使用LASSO logistic回归进行特征选择,利用4种机器学习模型建立根治预测模型,包括逻辑回归(LR),支持向量机(SVM),朴素贝叶斯(NB)和随机森林(RF)。
对于根治预测,使用LASSO logistic回归筛选出了2个预测因子,红细胞比容(HCT)和右固有肺动脉直径(d_RPA)。在根治组中,HCT更小,d_RPA更大。结果显示,LR在训练组和测试组的综合表现最好,AUC分别为0.887(95% CI : 0.783-0.992)和0.790(95% CI : 0.633-0.947),SVM次之,NB排第三,RF在训练组的表现呈现出明显的过拟合,导致其在测试组的表现最差。对于生存分析,使用预测根治结局的风险评分对生存进行预测,首先使用最大选择等级统计法确定最佳分界值,然后基于该阈值将患者分为高分组和低分组。K-M曲线分析发现,高分组比低分组的预后明显更好的预后(五年生存率,100% vs 77.6%,log-rank检验p=0.046)。
基于HCT和d_RPA的风险评分是可以有效预测PA-VSD-MAPCAs患者的根治与术后生存,HCT越低和d_RPA越大,根治和术后生存的可能性越大。基于LR模型建立的预测模型综合性能最好,可以作为辅助工具,为医师术前决策和预后评估提供了一定的参考价值。