武俊英 , 李雪莲
中国医科大学
目的:人乳头瘤病毒(Human papillomavirus, HPV)感染与头颈鳞癌的发生、发展及预后密切相关,但HPV感染对头颈鳞癌影响的机制尚未完全明确。本研究通过对头颈鳞癌预后的影响因素分析进一步明确HPV感染对头颈鳞癌患者预后的影响,同时筛选出HPV感染的关键基因并进行验证,尝试探索HPV感染对头颈鳞癌影响的内在机制。
方法:从公共数据库高通量基因表达数据库(Gene Expression Omnibus, GEO)及癌症基因组图谱数据库(The Cancer Genome Atlas, TCGA)收集所有含有HPV感染信息的头颈鳞癌患者的临床数据和基因表达数据,并进行整理和数据预处理。比较不同HPV感染状态头颈鳞癌(head and neck squamous cell carcinoma, HNSCC)患者的生存率及生存曲线,并利用单因素、多因素生存分析探索HPV感染状态对HNSCC预后的影响。同时利用最小绝对收缩和选择算子(the least absolute shrinkage and selection operator, LASSO)和支持向量机递归特征消除(support vector machine recursive feature elimination, SVM-RFE)两种机器学习的方法筛选HPV感染的关键基因,并对关键基因进行表达、诊断效能、免疫、预后、临床性状等方面进行验证。
结果:1.不同数据集中不同HPV感染状态HNSCC患者生存率存在差异,HPV阳性组生存优于HPV阴性组;2.HPV感染、年龄、肿瘤分期、肿瘤类型、饮酒等是头颈鳞癌的预后影响因素;3.不同HPV感染状态组间的差异基因分析,共获得1453个差异基因,其中698个基因表达下调,755个基因表达上调,差异基因主要富集在细胞间粘附调控、细胞因子正向调控、T细胞激活调控等信号通路;4. 机器算法筛选关键基因:LASSO算法共筛出27个基因,SVM-RFE算法共筛选出15个基因,两种机器学习方法的交集基因共有13个;5. 诊断效能验证结果显示基因PTHLH、KLRB1、SLC7A5、CD36、CXCL14、ITGA5诊断效能较高;6.在头颈部鳞癌HPV阴性感染组和HPV阳性感染组CD8+T细胞、辅助滤泡T细胞以及激活巨大细胞浸润有差异;基因CD36、ITGA5、CXCL14、PTHLH、SLC7A5与激活的树突状细胞、激活的CD8+T细胞、激活的CD4+T细胞等呈负相关,基因KLRB1与上述细胞呈正相关;7.在HPV阴性HNSCC患者中基因CXCL14、PTHLH、SLC7A5高表达与良好预后有关,基因ITGA5、KLRB1、CD36低表达与良好预后有关;在HPV阳性HNSCC中,基因CXCL14、SLC7A5、PTHLH、CD36低表达与良好预后有关,基因KLRB1高表达与良好预后有关;8.关键基因的表达与临床特征的相关性在不同HPV感染状态组间表现不一致;9.基因PTHLH和ITGA5与多数药物的半抑制浓度(half maximal inhibitory concentration, IC50)呈正相关,基因CD36和KLRB1与多数药物的IC50呈负相关;10.免疫组化的结果也显示相对于HPV阴性组,基因ITGA5在HPV阳性组高表达。
结论: HPV阳性的头颈鳞癌患者生存优于HPV感染阴性的患者,HPV感染、年龄、饮酒、肿瘤分期、肿瘤类型等均是头颈鳞癌预后的影响因素。利用LASSO和SVM-RFE两种机器学习的方法筛选出6个关键基因,其与免疫细胞浸润、预后、肿瘤分期、分级等临床特征及药物敏感性关系密切,免疫组化提示基因ITGA5及PTHLH在HPV阳性组高表达。