江旭1,2 , 胡煜奇3 , 李波1 , 陈泓宇2 , 阚天佑2 , 张志磊1 , 严孟宁2 , 高梁斌1 , 张立箎3 , 胡旭民1 , 王燎2
1. 中山大学孙逸仙纪念医院
2. 上海交通大学医学院附属第九人民医院
3. 上海交通大学生物医学工程学院
准确评估下肢冠状位力线参数是合理治疗的前提,目前仍然依赖于骨科亚专科医生的专业判断。本研究的目的是建立并验证一款多任务深度学习(Deep-learning, DL)模型,在站立位下肢全长X线正位片(long-leg anteroposterior radiographs, LLRs)上自动评估冠状位力线参数和畸形位置。
本回顾性研究收集了两个中心的4台X光设备的 LLRs数据。将来自其中三个X光设备的LLRs数据按60% (n=186)、20% (n=62)和20% (n=61)的比例随机分成训练、验证和测试数据集,剩余LLRs数据(n=75)归为外部验证数据集。一名高级专家进行标注和测量,两次测量的平均值作为金标准。我们根据标注数据,利用YOLOv5算法开发了一款多任务DL模型,比较了低年资医生和DL模型的测量误差和效率,并在测试和外部验证数据集中对模型性能进行了评估。
DL模型预测的解剖标志点与标注点的误差在0.7~1.3 mm之间。低年资医生测量结果与金标准之间的组内相关系数(intra-class correlation coeffcient,ICC)在0.871 ~ 0.997之间;DL模型预测结果与金标准之间的ICCs范围在0.925 ~ 0.999之间。在测试数据集上,DL模型在关节线汇聚角-1 (joint line convergence angle-1,JLCA1)测量中的失败率显著低于低年资医生(p=0.003);在外部验证数据集上,DL模型在负重线百分比(Weight-bearing line ratio,WBLR)、JLCA1和膝关节线导向(Knee joint line orientation,KJLO)测量中的失败率显著低于低年资医生(p值:<0.001、0.025和0.032)。在测试和外部验证数据集中,DL模型分析每张LLR平均花费的时间分别为22.1±2.4s和24.3±0.7s,明显少于人工测量,比专科医生少89%,比低年资医生少91% (p<0.001)。在测试数据集上,DL模型评估髋-膝-踝角(hip-knee-ankle angle,HKAA)、 机械股骨远端外侧角(mechanical lateral distal femoral angle,mLDFA)、JLCA1、JLCA2、机械胫骨近端内侧角-1 (mechanical medial proximal tibial angle-1,mMPTA1)和mMPTA2畸形的准确性分别为:99.18%、95.08%、78.69%、81.15%、86.89%和87.70%。在外部验证数据集上,DL模型评估HKAA、mLDFA、JLCA1、JLCA2、mMPTA1和mMPTA2畸形的准确性分别为98.00%、96.67%、82.00%、93.33%、96.00%和96.00%。
本多任务DL模型可准确评估下肢冠状位力线参数和畸形情况,可媲美专科医生手动测量,有潜力提升下肢力线参数评估的效率和准确性。