肺肠型腺癌DNA甲基化辅助诊断模型,诊断准确率超95%!

  • A+
所属分类:EGFR基因突变

导读

肺肠型腺癌(pulmonary enteric adenocarcinoma, PEAC)是一种罕见的原发浸润性肺腺癌亚型,约占肺腺癌总数的0.6%。直到2021年,WHO才提出相对明确的肺肠型腺癌病理诊断定义。尽管如此,由于肺肠型腺癌表现出肠道形态及组织病理特征,其在临床上十分容易与结直肠癌肺转移(lung metastatic colorectal cancer, lmCRC)混淆,给两种疾病的鉴别诊断带来极大的挑战。如何从多组学层面深入认识肺肠型腺癌,对于肺肠型腺癌的鉴别诊断和挖掘其潜在精准治疗靶点具有重要意义。

近日,中国医科院肿瘤医院王洁教授团队与世和基因合作,通过全基因组测序(WES)和靶向甲基化测序(Targeted BS),全面探究了肺肠型腺癌基因组和表观遗传特征,并使用机器学习模型建立了基于8个差异甲基化区域(DMR)的简洁诊断模型,可以有效区分肺肠型腺癌和结直肠癌肺转移。研究成果发表于《柳叶刀》子刊eBioMedicine (IF=11.205)。文章的第一作者为中国医科院肿瘤医院左影医生、仲佳教授和白桦教授、及武汉人民医院肿瘤中心许斌教授。通讯作者为中国医科院肿瘤医院王洁教授、段建春教授、及武汉人民医院肿瘤中心宋启斌教授。

研究亮点

1、本研究是迄今为止最大的PEAC多组学队列研究 。对PEAC和lmCRC的遗传或表观遗传特征进行了深入的分析,并与人群匹配的公共肺腺癌数据进行了比较,深入阐述了PEAC亚型的分子特征。

2、研究使用机器学习算法,建立了一个基于8个DMRs的诊断模型,准确率达到训练集100%,内部测试队列95%,外部验证队列100%。

3、本研究建立的诊断模型及对PEAC分子特征的分析,对于PEAC的鉴别诊断和其潜在精准治疗靶点的挖掘显示出巨大的潜力,对PEAC的临床决策起到重要提示作用。

研究方法

本研究纳入32例PEAC和30例lmCRC进行WES和Targeted BS测序,分析体细胞突变、拷贝数改变和DNA甲基化特征图谱,以探究两种疾病的分子差异。通过机器学习方法来选择最佳标志物组合,最终建立了一个由8个DMRs组成的诊断模型。并在独立前瞻性招募的共24例外部验证队列中验证了该诊断模型的性能(图1)。

图1:研究设计及分析流程

研究结果

肺肠型腺癌和结直肠癌肺转移临床诊断困难,分子特征存在差异

研究者首先对比了两种癌症类型的临床特征,发现PEAC患者中吸烟者明显多于lmCRC患者,而TTF-1虽然是肺癌的主要IHC标志物,仍有2例lmCRC患者呈现TTF-1弱阳性;同时,虽然另一个经典肺腺癌标志物CK7在所有lmCRC患者中均为阴性,但在PEAC患者中也有1例呈阴性,提示采用IHC标记的病理学临床诊断仍有模糊地带(图2a)。

接下来,研究对比了PEAC和lmCRC的基因组变异特征,发现作为肺腺癌的亚型之一,EGFR仍是PEAC的关键驱动突变,但其发生率显著低于典型肺腺癌,突变频率仅约16%(图2c);此外,ERBB2和KRAS突变在PEAC中也较经典肺腺癌更为常见(图2d)。相反,在对比PEAC和lmCRC时,研究者依然发现KRAS和APC突变在lmCRC中显著富集(图2c)。在染色体臂水平上, PEAC主要表现出14q和18p扩增,而lmCRC则更常发生13q及20q扩增,以及14q和18p缺失(图2b)。

肺肠型腺癌DNA甲基化辅助诊断模型,诊断准确率超95%!

图2 PEAC和lmCRC样本分子变异图谱

肺肠型腺癌鉴别诊断模型的开发

DNA甲基化是基因作为表观遗传学修饰方式之一,与癌症的发生发展密切相关。而不同肿瘤呈现的组织特异性DNA甲基化特征,也可用于识别未知来源或病理相似的肿瘤亚型。因此,研究者通过Targeted BS测序评估了两种疾病的甲基化水平,并通过比较差异甲基化区域(DMRs),得到与PEAC相关的204个DMRs,作为分类模型的候选特征。研究进一步使用基于随机森林的递归特征消除方法(RFE)以及最小绝对收缩和选择算子回归方式 (LASSO)两种特征选择方法对204个DMR特征进一步筛选,以去除冗余特征,得到最佳DMR组合。最终以两种方法交叠的8个DMR作为鉴别PEAC和lmCRC的特征甲基化标志物。以此建立的诊断模型表现出优异性能:在训练队列整体准确率达到100%(敏感性和特异性均为100%);而内部测试队列敏感性100%、特异性90%,达到95%的整体准确率。(图3)

图3 (上)基于8个DMRs的无监督聚类,可以将PEAC和lmCRC区分开

(下) 临床诊断模型在训练集及内部测试集当中的表现优异

肺肠型腺癌鉴别诊断模型的验证

一个临床诊断模型是否能经得住外部数据的考验,对评估模型的广泛应用价值至关重要。为了进一步评估模型的性能,研究团队首先前瞻性地收集了来自中国多个中心的样本进行外部验证,包括17例PEAC和7例lmCRC患者。验证结果令人惊喜——所有病例的分类结果100%符合其临床诊断(图4上)。公共数据库中缺乏肠型腺癌的甲基化测序数据,仅有一项研究基于甲基化芯片检测结果,对比14例肠型腺癌与4例肠癌肺转移,研究者进一步评估了模型在区分这部分患者中的性能。尽管甲基化检测平台不同,该诊断模型用到的DMR仍然可以较好地抓取肺肠型腺癌的特征:模型准确鉴定了所有肺肠型腺癌样本,而仅1例lmCRC被误分类为PEAC,准确率达到94.4% (灵敏度100%,特异性75%,AUC=0.964)图4 下)

图4(上)诊断模型性能验证在前瞻性外部验证队列中表现优异

(下)诊断模型性能验证在公共数据中表现优异

结语

肺肠型腺癌与结直肠癌肺转移的鉴别诊断,一直是困扰临床医生和病理医生的难题之一。大多数肺肠型腺癌分期偏早,有可能通过手术达到根治;而肠癌肺转移作为晚期肿瘤,以姑息治疗为主。准确地区分两种疾病对于制定精准治疗方案,延长患者生存率有重要意义。本研究是迄今针对肺肠型腺癌的最大队列多组学研究,为深入了解这一罕见肺腺癌亚型的遗传或表观遗传特征提供了可靠的证据。而基于DNA甲基化标志物的诊断模型展现出的优异性能,在未来辅助肺肠型腺癌的精准鉴别诊断方面也具有极大的临床应用价值。

参考文献:

Ying Zuo, Jia Zhong, Hua Bai, Bin Xu, Zhijie Wang, Weihua Li, Yedan Chen, Shi Jin, Shuhang Wang, Xin Wang, Rui Wan, Jiachen Xu, Kailun Fei, Jiefei Han, Zhenlin Yang, Hua Bao, Yang Shao, Jianming Ying, Qibin Song, Jianchun Duan, Jie Wang, Genomic and epigenomic profiles distinguish pulmonary enteric adenocarcinoma from lung metastatic colorectal cancer,eBioMedicine, Volume 82,2022,104165,ISSN 2352-3964, https://doi.org/10.1016/j.ebiom.2022.104165.

 

本篇文章来源于微信公众号: 世和基因