何欣 , 黄小华 , 张丽 , 沈梦伊 , 张丁懿
川北医学院医学院附属医院 四川省 南充市
目的:探讨基于磁共振动态增强(DCE-MRI)序列影像组学中不同机器学习模型在术前预测三阴性乳腺癌效能。
方法:回顾性分析2021年4月至2022年12月的术前行磁共振检查202例浸润性乳腺癌患者的临床资料和DCE-MRI影像图像。按免疫组化结果分成三阴性乳腺癌31例、非三阴性乳腺癌171例。在DCE-MRI第2期影像图像由两名放射科医生使用3D slicer软件提取1223影像组学特征,选取ICC>0.750的特征。采用合成少数类过采样技术(synthetic minority oversampling technique,SMOTE)进行数据均衡处理。使用方差阈值、K最佳和LASSO回归筛选最优的影像组学特征,然后分别通过建立支持向量机(Support Vector Machine,SVM)、逻辑回归(Logistic Regression,LR)、K近邻(K Nearest Neighbor,KNN)和随机森林(Random Forest,RF)共4种机器学习模型来预测三阴乳腺癌与非三阴性浸润性乳腺癌。采用受试者工作特征曲线下面积(Area Under the Curve,AUC)并计算准确率和F1度量值评估4种模型在术前预测三阴性乳腺癌效能效能,利用DeLong检验比较模型间的差异性。
结果:在基于DCE-MRI提取的13个特征下,4种模型的预测性能相对较好,其中K近邻模型的整体性能最优,AUC、准确率和F1度量值在训练集分别为0.974、0.824、0.790,在测试集分别为0.903、0.825、0.795。DeLong检验显示,K近邻与逻辑回归模型有统计学差异(P<0.05),与其余2个模型无统计学差异。
结论:基于磁共振DCE-MRI序列影像组学特征的4种机器学习模型,尤其是K近邻模型可作为术前预测三阴性乳腺癌的辅助手段,该方法有望为临床医生对乳腺癌患者治疗方案的决策提供依据。