所有文章 > 正文

新突破:一次抽血可识别 50 多种癌症,误检率不到 1%

作者: 学术君

时间: 2020-04-05 17:24

一直以来,人类对抗癌症就有两条最有效的路线,一是早发现,二是早治疗。多数癌症如果能在病发早期阶段就被诊断出来,并积极开展治疗,那么病患存活率将会极大提升。

为更好实现早发现早治疗的目标,世界各地的科学家们都在寻找新的癌症早筛技术,去年,英美多家机构还专门成立了 “癌症早期检测国际联盟”,以开发新方法和技术提升早期癌症诊断能力,提高病患存活率。

检测肿瘤释放进入血液中的游离 DNA(cfDNA,cell-free DNA),是近年来一种极具潜力的癌症检测方法。在肿瘤中,DNA 甲基化水平会发生显著的变化,通过检测 cfDNA 的甲基化水平,来进行癌症检测也成为科学家们的一个重要研究方向。

3 月 31 日,在国际经典肿瘤学临床期刊《肿瘤学年鉴》(Annals of Oncology)发表的一篇论文中,研究人员开发出一种针对癌症的血液检测方法,可以一次性准确检测出 50 多种癌症类型,并且可以在患者没有任何临床症状之前,识别出癌症病灶。

202004050101.jpg

研究人员表明,该检测方法最终可用于国家癌症筛查计划,其癌症检测的假阳性率为 0.7%,这意味着癌症患者使用该技术的误检率还不到 1%。

相比之下,在当前的乳腺癌筛查计划中,大约有 10% 的女性会被错误地鉴定为癌症患者。

而且,这种检测方法能够预测 96% 的样本中癌症起源的组织,准确率达 93%。

机器学习识别 DNA 甲基化

肿瘤会将 DNA 释放到血液中,从而形成游离 DNA(cfDNA)。但是,由于血液中的 cfDNA 也可能来自其他类型的细胞,因此也就很难精确地找到哪些 cfDNA 来自肿瘤。

在这项研究报告中,研究人员在血液检测过程中分析了 cfDNA 的 “甲基化” 化学变化。DNA “甲基化” 通常会抑制基因表达,异常的甲基化模式和由此导致的基因表达的变化,将促进肿瘤的生长,因此 cfDNA 中甲基化的特征信号,具有检测和定位癌症的潜力。

在该研究中,血液检测的目标是针对人类基因组中 3000 万个甲基化位点中的大约 100 万个,根据分析肿瘤释放的 cfDNA 的甲基化模式,使用机器学习分类器算法,来预测癌症的存在与否及其类型。

202004050102.jpg

从一次抽血中识别出超过 50 种癌症类型的癌症状态,以及细胞癌变的起源组织。从未患癌症(上部流程)或患癌症(下部流程)的血液样本中分离出游离 DNA,并进行靶向甲基化测序分析。识别甲基化(红色)或未甲基化(蓝色)CpG 区域的测序结果,作为输入变量输入一个机器学习模型,来识别癌症的存在与否,并识别癌变组织的来源。

研究使用的机器学习模型,通过一个含有 cfDNA 癌症和非癌症信号的甲基化数据库进行训练,这一数据库被认为是目前世界上最大的甲基化数据库,它属于参与这项研究的美国加利福尼亚州 GRAIL 公司。

该论文的通讯作者、美国德克萨斯州美国肿瘤学(US Oncology)负责人 Michael Seiden 博士说:“我们早期的研究表明,甲基化方法在检测所有临床阶段的多种致死性癌症类型,和识别癌症起源组织方面,都优于全基因组和靶向测序。这种方法允许我们识别基因组中信息最丰富的区域,而这些区域恰好是该研究进行精确甲基化测序的目标。”

来自 6689 位未经治疗的参与者的血液样本被分为训练集和验证集,包括 2482 例癌症患者和 4207 例未患癌症的参与者。其中,有 4316 名参与者的结果可供分析:训练集 3052 位参与者中,癌症患者 1531 位,未患癌症的参与者 1521 位;验证集 1264 位参与者中,癌症患者 654 位,未患癌症的参与者 610 位。超过 50 中癌症类型包含其中。

该研究使用的机器学习模型通过分析参与者的血液样本,来识别 DNA 甲基化变化,并将样本数据分类为癌症或非癌症两类,来识别癌症起源的组织。

研究人员发现,分类器在训练集和验证集中的检测性能都是一致的,在验证集中的假阳性率为 0.7%。在最致命的肛门癌、膀胱癌、肠癌、食道癌、胃癌、头颈癌、肝胆管癌、肺癌、卵巢癌和胰腺癌、淋巴瘤和白细胞癌(例如多发性骨髓瘤)12 种癌症中,整个临床 I、II 和 III 期的真阳性率为 67.3%。在所有 50 多种癌症中,临床 I、II、III和IV 期的真阳性率分别为 18%、43%、81%和 93%。

开发易于操作的筛查工具的第一步

Seiden 博士说:“这些数据支持了这种靶向甲基化检测的能力,有效地满足了我们认为可以用于广泛人群筛查的多癌症早期血液检测的基本要求,其中包括:通过一项假阳性率极低的单一检测方法来检测多种致命癌症类型的能力;准确识别癌症在体内位置的能力。这些将为卫生保健人员提供下一步诊断和护理步骤的指导。”

“考虑到一直以来癌症为整个社会带来的沉重负担,我们将继续探索这种检测可能在早期阶段筛查癌症的可能性,并通过扩展研究,潜在地减少患者因无法进行筛查或筛查不良而死于癌症的可能性。据我们所知,这是针对有或没有癌症的参与者进行的最大旨在开发和验证一种用于早期发现多种癌症血液检测方法的临床基因组学研究。”

202004050103.jpg

这项研究由血液检测制造商 GRAIL 公司资助,研究人员正继续在美国(STRIVE 和 PATHFINDER 研究)和英国(SUMMIT 研究)的大型前瞻性研究中验证该检测方法,并检查其筛查人群的可行性。

循环游离基因组图谱研究(CCGA)研究的优势在于,它包括来自北美 142 家诊所的 15,000 多名参与者,从而确保结果可推广到不同人群。

不过,研究人员也承认,CCGA 研究的局限性包括:所有癌症参与者均已被诊断出癌症;并非所有患者均已随访一年,这是确保非癌症参与者准确性所必需的条件之一;并且在检测由人类乳头瘤病毒(HPV)驱动的癌症起源组织方面出现了一些错误,例如子宫颈癌、肛门癌和头颈癌。

《肿瘤学年鉴》主编、法国维勒瑞夫古斯塔夫・鲁西研究所研究主任 Annals of Oncology 表示:“这是一项具有里程碑意义的研究,也是开发易于操作的筛查工具的第一步 。尽早发现超过 50%的癌症,每年就可以在全球范围内挽救数百万人的生命。”

参考资料:

"Sensitive and specific multi-cancer detection and localization using methylation signatures in cell-free DNA", by M.C. Liu et al. Annals of Oncology. doi: https://doi.org/10.1016/j.annonc.2020.02.011

ClinicalTrials.gov numbers: NCT03085888, NCT03934866, NCT04241796.

https://www.eurekalert.org/emb_releases/2020-03/esfm-bta032720.php

https://www.newscientist.com/article/2239011-blood-test-shows-promise-for-detecting-the-deadliest-cancers-early/

往期回顾:

机器学习如何寻找越南战争中未爆炸的炸弹

疫情知识 |李兰娟、仝小林、王辰等院士团队的最新新闻和疫情进展

Science:神操作!用人工蛋白质做逻辑门电路,把细胞变成计算机!

[关于转载]:本文为“AMiner”官网文章。转载本文请联系原作者获取授权,转载仅限全文转载并保留文章标题及内容,不得删改、添加内容绕开原创保护,且文章开头必须注明:转自“AMiner”官网。谢谢您的合作。

二维码 扫码微信阅读
推荐阅读 更多