曹之乐
中国人民解放军陆军特色医学中心 重庆市
目的:在胶质母细胞瘤MGMT 基因的甲基化状态被用作预测的治疗反应和预后因素。本文根据多参数的磁共振影像资料,提出一种集成学习模型,准确预测胶质母细胞瘤MGMT 基因的甲基化状态。方法: (1)病例采集:采集UCSF-PDGM 数据集,其中胶质母细胞瘤385例,包含阳性例数280例,阴性例数107例。影像数据组成包括,ADC图、FA图、T2_Flair图、SWI图、增强后T1WI图像5种序列图像及肿瘤区域的分割图。(2)影像特征提取:对全部数据进行影像组学特征提取,采用Python语言,通过使用Radiomics特征提取函数库,每种序列采集特征114个,总计特征570个。通过互信息统计(Mutual Information Statistics)来进行特征选择。这种方法通过合理选择和计算互信息,可以更好地理解数据中的关系,提升模型的性能。(3)构建集成模型:同样采用Python语言编程实现,首先构建10个基出模型作为投票者,包含有随机森林分类器、K近邻分类器、支持向量机、多层感知机、AbaBoost分类器、梯度提升分类器、极端随机树分类器、逻辑回归分类器、XGBoost分类器、CatBoost分类器。而后通过构建两种集成模型,硬投票分类器(每个基础模型对每个类别进行投票,最终的分类结果是投票最多的类别)和软投票分类器(每个基础模型输出类别的概率,最终的分类结果是所有分类器预测概率的平均值,概率最大的类别被选为最终结果),两种投票分类器都将10个基准模型纳入其中。(4)模型评价:采用交叉验证来评价集成模型,可以提供对模型泛化能力的更可靠估计。结果:硬投票模型的精确率为73.04%,召回率为99.85%,准确率为73.61% f1分数为84.42%,而相应的软投票模型中精确率为72.17%,召回率为98.85%,准确率为73.24% f1分数为83.41%。结论:基于集成模型的方法,尤其是其中的软投票模型可以准确的检出胶质母细胞瘤MTMG基因的甲基化状态,为临床对胶质母细胞瘤的诊断和治疗提供有力帮助。