宋剑1,2 , 粟日3 , 汪政3 , 毛奕韬4 , 贺楚峰1,2 , 蔡鑫章1,2 , 梅凌云1,2 , 侯木舟3 , 吴学文 1,2
1. 中南大学湘雅医院耳鼻咽喉头颈外科
2. 湖南省耳鼻咽喉重大疾病研究实验室
3. 中南大学数学与统计学学院
4. 中南大学湘雅医院医学影像科
慢性中耳疾病(Chronic middle ear disease, CMED)是一类以中耳(和/或乳突腔)内持续性病变为特征的耳科疾病。颞骨HRCT可准确显示中耳腔内软组织病灶的分布、形态及听小骨、周围重要标志性骨性结构的破坏情况, 对于中耳疾病的诊断及术前评估中有重要价值。本研究主要目的是开发一套基于卷积神经网络的人工智能辅助诊断平台框架,通过对患者中耳颞骨HRCT影像学图像的特征的自动提取、分析和技术处理,进行CMED的智能诊断分类。
收集本科室2019年1月至2020年12月期间因CMED住院患者病例及影像学资料数据。共计499名患者(998例单侧耳)纳入本次研究。以术后最终病理诊断为标准,对所有耳实施分组标记为:中耳胆脂瘤(108侧耳)、慢性化脓性中耳炎(622侧耳)、正常(268侧耳)三类。将该框架设计为两个深度学习网络模块:1. 从CT影像中提取感兴趣区域的自动搜索网络; 2. 基于所提取区域的CMED自动诊断分类网络。
通过常规感兴趣区域(region of interest, ROI)搜索算法网络自动搜索颞骨HRCT中耳区域影像,进行图像标记和对比学习;选择VGG16作为网络骨架,完成分类诊断。 在进一步优化阶段中,对CT数据重新实施标记并优化算法,在同张CT影像数据输入时生成双边中耳的特征图,提高采集效率;插入轻量级孪生网络用于与预设的特殊位置图像进行对比,筛选出具有结构性特点的中耳特征图;将所获得的中耳结构图拼接成“3D信息块”,并使用3D卷积神经网络进行自动分析判类。经优化后的深度学习网络框架,ROI搜索网络的使用受试者工作特征曲线下的面积值(Area under the receiver operating characteristic curve, AUC)值为0.99,孪生网络AUC值为0.939,分类诊断网络AUC值为0.99,最终分类诊断精确度为94.1%。以上实验结果表明,框架内各部分在现有数据集的基础上表现稳定,呈现出高精确度的结果,与既往文献报道(AUC值为0.92,精确度为76.7%)相比具有更高的精确度与稳定性。
本研究提出了一种基于患者颞骨HRCT影像中自动提取感兴趣区域,进而对慢性中耳疾病分类诊断的人工智能深度学习框架,并证实了其有效性。以上研究结果提示了人工智能通过影像学资料在中耳疾病诊断中具有良好的临床应用前景。