李柘黄 , 张鹏 , 王鑫 , 王家强 , 姚伟涛
河南省肿瘤医院
基于单中心350例脊柱转移瘤患者数据对目前学术界报道的对脊柱转移瘤预后有影响的化验指标进行验证评价。尝试单纯以化验指标为变量,使用机器学习方法,构建脊柱转移瘤生存预测模型。
以我科前期建立的2017年至2021年350例接受手术治疗的脊柱转移瘤患者数据库为数据来源。评估验证的化验指标包含血红蛋白,白细胞数,淋巴细胞数,中性粒细胞数,血小板数,血小板-淋巴细胞比值,中性粒-淋巴细胞比值,总胆红素,白蛋白,碱性磷酸酶,血钙,肌酐,凝血国际标准化比值。采用的机器学习模型包括K最近比邻(KNN),朴素贝叶斯,支持向量机,随机森林,XGBoost,神经网络。使用R语言,在mlr3和RSNNS框架下建立机器学习模型。预测结局为术后3月生存概率及术后1年生存概率。350例患者按2:1比例随机分为训练集和验证集。使用训练集样本建立预测模型,并用验证集进行验证评价。使用受试者工作特征(Receiver Operating Characteristic,ROC)曲线下面积(Area Under Curve,AUC)评估模型区分度,AUC大于0.7提示模型预测能力优良;使用校准曲线评估模型校准度;使用决策曲线(Decision Curve Analysis,DCA)评估临床获益。并将构建的基于化验指标的预测模型与Tomita评分,改良Tokuhashi评分,改良Bauer评分,SORG机器学习模型进行对比。
备选模型中神经网络模型对术后3个月和1年生存率的预测能力最佳。术后3月生存率预测,神经网络模型AUC为0.705 (0.672-0.738),Tomita评分为0.595 (0.494-0.687),改良Tokuhashi评分为0.650 (0.548-0.745),改良Bauer评分为0.618 (0.518-0.708),SORG机器学习为0.743 (0.666-0.817)。术后1年生存率预测,神经网络模型AUC为0.790 (0.695-0.885),Tomita评分为0.620 (0.552-0.689),改良Tokuhashi评分为0.702 (0.637-0.767),改良Bauer评分为0.646 (0.575-0.708),SORG机器学习为0.787 (0.730-0.838)。校准曲线和DCA曲线显示神经网络模型的校准度和临床适用性理想。
对于脊柱转移瘤手术患者,单纯以常规化验指标为变量进行数据挖掘并使用机器学习方法构建预测模型是可行的,与目前广泛应用的预测模型比较,准确性优于传统模型,与最新的SORG机器学习模型接近。以化验指标构建模型的优点包括:数据客观、标准,可以最大限度减少观察者间不一致性;不同中心间差异性小;可以便捷地进行回顾性模型验证,进行评估校准;由于数据单纯来源于LIS系统,有望在未来开发便捷的高危患者自动化预警系统,提高目前单一化验指标危急值报告制度的敏感性。
COA2023